Professional Documents
Culture Documents
Chuong 3 - Quản lý dữ liệu và file dữ liệu
Chuong 3 - Quản lý dữ liệu và file dữ liệu
Chương 3: Quản lý
dữ liệu và file dữ
liệu
PGS.TS Hoàng Thu Hương
TS. Đào Thúy Hằng
1
2/13/2023
2
2/13/2023
3
2/13/2023
Mã hóa biến số
Làm việc trên Variable View
Xác định loại biến số trong bảng hỏi và tiến hành mã hóa
• Đặt tên biến: Cột Name
• Đặt nhãn biến: Cột Label
• Gán giá trị cho biến: Cột Value
• Mã hóa dữ liệu định tính
• Missing: xác định giá trị trống
• Measure: xác định loại thang đo
4
2/13/2023
Ví dụ
Ví dụ 1: Câu hỏi đóng lựa chọn Biến số (01 biến số) Giá trị
Câu hỏi: Ông/bà cho biết tình trạng
1= “độc thân”
hôn nhân hiện nay của mình?
1. Độc thân 2 = “đang có vợ/chồng”
2. Đang có vợ/chồng Tình trạng hôn nhân
3. Ly thân/ly hôn
3= “ly thân/ly hôn”
4. Goá
4= “goá”
Ví dụ
Câu hỏi Mã hóa
Ví dụ 2: Câu hỏi đóng tuỳ chọn Biến số (04 biến số) Giá trị
Câu hỏi: Ông/bà cho biết lý do vì sao lựa chọn
1. Chất lượng khám, 1= “có”, 0
cơ sở khám chữa bệnh này? (có thể lựa chọn
chữa bệnh =”không”
nhiều phương án)
1. Chất lượng khám, chữa bệnh
2. Đội ngũ y-bác sĩ 1= “có”, 0 =”không”
2. Đội ngũ y-bác sĩ 3. Cơ sở vật chất khám, 1= “có”, 0 =”không”
3. Cơ sở vật chất khám, chữa bệnh chữa bệnh
4. Gần nơi sinh sống 4. Gần nơi sinh sống 1= “có”, 0 =”không”
10
5
2/13/2023
Giá trị trống được • Do kỹ thuật xây dựng bảng hỏi: không có đáp
hiểu là giá trị không án phù hợp cho người trả lời, câu hỏi có điều
xác định hoặc không kiện/câu hỏi lọc liên quan tới câu hỏi trước
được xác định trong đó,…
dữ liệu. Có nhiều • Do khâu thu thập dữ liệu: người trả lời từ
nguyên nhân khác chối trả lời, phỏng vấn viên bỏ sót câu hỏi,…
nhau dẫn tới giá trị • Do khâu xử lý dữ liệu: quên không nhập dữ
trống trong dữ liệu: liệu,…
11
• Ví dụ như các giá trị trống nằm ở các câu hỏi mở, không có dự định xử lý định lượng hoặc mã hoá lại thì có
thể giữ nguyên giá trị trống
• Nếu trong dữ liệu có những quan sát (/bảng hỏi) có quá nhiều giá trị trống thì nên cân nhắc xoá những quan
sát này bởi các quan sát này sẽ làm ảnh hưởng đến độ tin cậy của mẫu nói chung, và thực tế chúng cũng
không cung cấp nhiều thông tin cho nghiên cứu.
• Thay thế bằng giá trị trung bình của biến: Transform Replace Missing Values Đưa biến số cần gán giá trị
OK
• cách này chỉ sử dụng được với các biến định lượng. Đối với các biến định tính thì cách này không phù hợp
Xác định các giá trị trống bằng việc mã hoá các giá trị này
12
6
2/13/2023
Xác định các giá trị trống bằng việc mã hoá các giá trị này
13
14
7
2/13/2023
Nhập dữ liệu
1 2 3
Nhập dữ liệu trong Mỗi bảng hỏi là 1 đơn Nhập các giá trị của
từng trường hợp/bảng vị quan sát, tương ứng từng biến số theo quy
hỏi vào file dữ liệu đã với 1 hàng ước trong file mã hóa
mã hóa
15
16
8
2/13/2023
17
Chuyển đổi một số định dạng file dữ liệu có sẵn sang file sử dụng được
trong SPSS: File à Import Data à chọn loại định dạng file cần chuyển đổi
Mã hoá là việc đưa các dữ liệu thô từ bảng hỏi, khảo sát vào phần mềm
SPSS ở dưới dạng dữ liệu mà SPSS có thể đọc được.
Một số nội Việc mã hóa biến số được thực hiện trong cửa sổ Variable View
dung cơ bản Cách mã hóa một số loại câu hỏi trong bảng hỏi
cần ghi nhớ • Câu hỏi đóng tùy chọn: mỗi phương án trả lời tương ứng với một biến số
• Câu hỏi đóng lựa chọn: mỗi phương án trả lời là một giá trị của biến số
18
9
2/13/2023
19
10