DATA Cleaning in Pandas

Uploaded by

Linh Phạm Văn

0% found this document useful (0 votes)

3 views1 page

Copyright

Available Formats

TXT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as txt, pdf, or txt

0% found this document useful (0 votes)

3 views1 page

DATA Cleaning in Pandas

Uploaded by

Linh Phạm Văn

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as txt, pdf, or txt

Jump to Page

You are on page 1of 1

Search inside document

DATA Cleaning in Pandas

Dùng để xóa các dữ liệu bị trùng lặp trong bộ data

"drop_duplicates"

Xóa các kí tự đặc biệt hoặc dư thừa trong bộ data

ls là ở đầu phần chữ
rs là ở cuối phần chữ
s dùng cho tất cả trong chuỗi
Data['tên_cột'].str.lstrip("...") xóa ... ở trước
Data['tên_cột'].str.lstrip("/") xóa / ở trước
Data['tên_cột'].str.rstrip("_") xóa _ ở sau
hoặc dùng
Data['tên_cột'].str.strip("123._/") dùng để xóa tất cả kí tự trong cột này
Lưu ý
không được dùng
Data['tên_cột'].str.lstrip(["..." ,"_"])

Xóa các chữ cái a-z , A-Z , 0-9 hoặc ^

df['tên_cột'].str.replace('[^a-zA-Z0-9]' , '')

dùng để chuyển các giá trị trong DATA frame đang là oblect về "str"
data["Ten_Cột"].apply(lambda x : str(x))
hoặc
data['Cột_A'] = data['Cột_A'].astype(str)

để định dạng như só điện thoại hoặc chuyển hóa một cái gì đó về một kiểu có dấu -
khi 3 số
data["Tên_cột"].apply(lambda x : x[0:3] + '-' + x[3:6] + '-' + [6:10])
nhưng trong trường hợp Na thì nó sẽ thêm Na--
thì mình dùng
data['Tên_cột'].str.replace('nan--','')
dùng để xóa nan-- và thay bằng ''

split để tách một chuỗi dài thành từng phần

vd name = ['Pham van linh'] => result name = ['Phạm' , 'Văn' , 'Linh']
khi dùng name.split(", ")

lời giải bt py
Document6 pages
lời giải bt py
Ngọc Tịnh
No ratings yet
Nhap Mon KHDL K58 - 04
Document30 pages
Nhap Mon KHDL K58 - 04
khanpmsg26
No ratings yet
Lab 06
Document8 pages
Lab 06
Sun Pear
No ratings yet
Jesse Handbook
Document160 pages
Jesse Handbook
KiềuTuyến
No ratings yet
Nhap Mon KHDL - 04
Document30 pages
Nhap Mon KHDL - 04
k60.2114110097
No ratings yet
C2 3 Python String List
Document29 pages
C2 3 Python String List
Chính Tâm
No ratings yet
02 NentangJava Mang-Chuoi
Document44 pages
02 NentangJava Mang-Chuoi
nguyenthanhngoc31102003
No ratings yet
Thống Kê Tính Toán
Document6 pages
Thống Kê Tính Toán
Trần Hoàng Danh
No ratings yet
Python 05
Document28 pages
Python 05
34Nguyễn Trần Thủy Tiên
No ratings yet
python.2023.04 - tuần tự - chuỗi
Document24 pages
python.2023.04 - tuần tự - chuỗi
Hương Phạm
No ratings yet
Cleaning in Python
Document1 page
Cleaning in Python
Lân Hồ Nguyễn
No ratings yet
Python 04
Document25 pages
Python 04
34Nguyễn Trần Thủy Tiên
No ratings yet
Python 05
Document28 pages
Python 05
Thanh Tuyến
No ratings yet
Lat Vat C#
Document4 pages
Lat Vat C#
Vo Hoai Nam
No ratings yet
Chương 1 - Tiếp Theo - Kiểu Dữ Liệu
Document47 pages
Chương 1 - Tiếp Theo - Kiểu Dữ Liệu
Hồ Thị Như Phương
No ratings yet
Hàm Python
Document1 page
Hàm Python
Sông Nguyễn Văn
No ratings yet
Stata Phan 3
Document36 pages
Stata Phan 3
NguyenNgoc
No ratings yet
Python 2 List Set Tuple Dictionary
Document114 pages
Python 2 List Set Tuple Dictionary
HÙNG GAMER CHANEL
No ratings yet
MOB1013-Slide 6 - Chuoi Va Bieu Thuc Chinh Qui
Document20 pages
MOB1013-Slide 6 - Chuoi Va Bieu Thuc Chinh Qui
hoapham472012
No ratings yet
STRING
Document21 pages
STRING
vanessa.rainy271024
No ratings yet
Thaokv Python
Document12 pages
Thaokv Python
abc
No ratings yet
Nhap Mon KHDL - 05
Document22 pages
Nhap Mon KHDL - 05
k60.2114110097
No ratings yet
Python notes
Document36 pages
Python notes
thailqhe181201
No ratings yet
STL - Set - Map. GuiSV T Nghiên C U
Document41 pages
STL - Set - Map. GuiSV T Nghiên C U
08 - Nguyễn Võ Đại Dương
No ratings yet
Nhap Mon KHDL K58 - 05
Document22 pages
Nhap Mon KHDL K58 - 05
khanpmsg26
No ratings yet
DanhSach LIST Python
Document8 pages
DanhSach LIST Python
Dat Huynh
No ratings yet
Slide 6 - Chuoi Va Bieu Thuc Chinh Qui
Document23 pages
Slide 6 - Chuoi Va Bieu Thuc Chinh Qui
huynhthang292004
No ratings yet
Các Hàm X Lý Chu I Trong Vb6
Document4 pages
Các Hàm X Lý Chu I Trong Vb6
tech456
No ratings yet
C3 SQL-ThaoTacDL
Document147 pages
C3 SQL-ThaoTacDL
nguyenvanduy1310
No ratings yet
Chuoi
Document11 pages
Chuoi
Nguyen An Ninh K15 HCM
No ratings yet
Dear
Document10 pages
Dear
Kio Zenx
No ratings yet
Chương 2 - Thư Viện Pandas
Document40 pages
Chương 2 - Thư Viện Pandas
Hồ Thị Như Phương
No ratings yet
Python Learning
Document22 pages
Python Learning
Hau Nguyen
No ratings yet
D Chuong7 List Tuple Range
Document63 pages
D Chuong7 List Tuple Range
Hiền
No ratings yet
Slide 6 - Chuoi Va Bieu Thuc Chinh Qui
Document23 pages
Slide 6 - Chuoi Va Bieu Thuc Chinh Qui
Vương Nguyên Trung
No ratings yet
Chuong 2 - Ky Thuat Xu Ly Chuoi
Document13 pages
Chuong 2 - Ky Thuat Xu Ly Chuoi
Tài Nguyễn
No ratings yet
Python 8 Tuples
Document18 pages
Python 8 Tuples
thaidv
No ratings yet
String R
Document2 pages
String R
vankhieu
No ratings yet
Chương 4
Document74 pages
Chương 4
Nguyễn Công Chí
No ratings yet
Bai 6
Document42 pages
Bai 6
Anh Lê
No ratings yet
Atomicity (Tính toàn vẹn), Consistency (Tính đồng nhất), Isolation (Tính độc lập), và Durability (Tính bền vững)
Document6 pages
Atomicity (Tính toàn vẹn), Consistency (Tính đồng nhất), Isolation (Tính độc lập), và Durability (Tính bền vững)
nguyengialuatace
No ratings yet
Bài tập SQL Trong CSDL Oracle
Document12 pages
Bài tập SQL Trong CSDL Oracle
Thi Thi
No ratings yet
Cautrucdulieu
Document36 pages
Cautrucdulieu
Phạm Long Vũ 12a1
No ratings yet
Structure Query Language
Document14 pages
Structure Query Language
thailqhe181201
No ratings yet
Slide 6 - Chuoi Va Bieu Thuc Chinh Qui
Document23 pages
Slide 6 - Chuoi Va Bieu Thuc Chinh Qui
Amo Ny mus
No ratings yet
Nhap Mon KHDL k58 - 09
Document39 pages
Nhap Mon KHDL k58 - 09
haikyna
No ratings yet
In04 - Mảng - Chuỗi
Document31 pages
In04 - Mảng - Chuỗi
Nguyen Duy
No ratings yet
CLang Lect12
Document24 pages
CLang Lect12
Phúc Dương
No ratings yet
Regular Expression
Document7 pages
Regular Expression
Tà Đông
No ratings yet
Tai Lieu Python
Document11 pages
Tai Lieu Python
Ngoc Anh
No ratings yet
Chương 2 - SQL
Document27 pages
Chương 2 - SQL
Hồng Sơn Phạm
No ratings yet
GT QLCSDL - B3-4
Document38 pages
GT QLCSDL - B3-4
Phamphi Psj
No ratings yet
Bài 06 - Tìm hiểu về String - Date - Math - JSON - Regex và Handling Error
Document21 pages
Bài 06 - Tìm hiểu về String - Date - Math - JSON - Regex và Handling Error
kienmanhnguyen29
No ratings yet
Biểu Thức Chính Quy Thường Dùng
Document8 pages
Biểu Thức Chính Quy Thường Dùng
Hồng Nguyễn
No ratings yet
Chuong 2 - PYTHON - String
Document20 pages
Chuong 2 - PYTHON - String
35Nguyễn Quốc Trung
No ratings yet
DATABASE Basic
Document18 pages
DATABASE Basic
hoàng cao
No ratings yet
Chuong 2 - PYTHON - String
Document20 pages
Chuong 2 - PYTHON - String
doubieakacool
No ratings yet
Chapter 03 Basic Coding C++ in Vietnamese
Document62 pages
Chapter 03 Basic Coding C++ in Vietnamese
clone64209
No ratings yet