Professional Documents
Culture Documents
Data Sciences Lap 2
Data Sciences Lap 2
وتحول الوقت في الساعات والدقائق الى دقائق فقطstring دالة تاخذ قيم نوع
datatime الىstring يحتوي على تاريخ وتحول منstring دالة تاخذ قيم نوع
m/d/y في حال كان الفورمات
pd.to_datetime(date_str, format='%m/%d/%Y')
تصفية القيم داخل االعمده
df["Do_Not_Contact"] = df["Do_Not_Contact"].str.replace('Yes','Y')
for i in df.index:
if حذف كل الصفوف التي تكون
(df.loc[i,'age']<lower_bound)|(df.loc[i,'age']>
upper_bound):
outliers خارج نطاق
df.drop(i,inplace=True)
df
outliers التعامل مع القيم
علىZ-Scores تطبيق المعادلة
df['z_scores']=zscore(df['purchase_amount’]) العمود المطلوب عبر مكتبه جاهزه
from scipy.stats import zscore
for i in df.index:
if (df.loc[i,'z_scores']<-3) |
((df.loc[i,'z_scores']>3)): حذف كل الصفوف التي تكون
df.drop(i,inplace=True) outliers خارج نطاق
df
Thank you