Professional Documents
Culture Documents
DATA Cleaning in Pandas
DATA Cleaning in Pandas
dùng để chuyển các giá trị trong DATA frame đang là oblect về "str"
data["Ten_Cột"].apply(lambda x : str(x))
hoặc
data['Cột_A'] = data['Cột_A'].astype(str)
để định dạng như só điện thoại hoặc chuyển hóa một cái gì đó về một kiểu có dấu -
khi 3 số
data["Tên_cột"].apply(lambda x : x[0:3] + '-' + x[3:6] + '-' + [6:10])
nhưng trong trường hợp Na thì nó sẽ thêm Na--
thì mình dùng
data['Tên_cột'].str.replace('nan--','')
dùng để xóa nan-- và thay bằng ''