Download as pdf or txt
Download as pdf or txt
You are on page 1of 28

Phương pháp làm sạch

dữ liệu trong SPSS


GIẢNG VIÊN: LÊ TRẦN PHƯỚC MAI HOÀNG (PH.D.)

1
Kết quả bài học
•Hiểu được sự cần thiết của việc làm sạch dữ liệu.
•Thiết kế được một bảng khảo sát tốt.
•Hiểu được các khái niệm cơ bản trong thiết kế một bảng khảo sát
tốt.
•Nắm được các phương pháp cở bản để làm sạch dữ liệu.
•Phân tích các trường hợp lỗi trong 1 bộ dữ liệu
•Có khả năng sử dụng SPSS để làm sạch dữ liệu.

2
Nội dung bài học:
1. Tầm quan trọng của việc làm sạch dữ liệu
2. Các bước thiết kế một bảng khảo sát tốt
3. Các phương pháp làm sạch dữ liệu

3
1. Tầm quan trọng của
việc làm sạch dữ liệu

4
Tại sao cần làm sạch dữ liệu?
Ẩn chứa các giá trị, các quan sát không phù hợp để đưa vào phân tích.
=> Kết quả sai
=> Ảnh hưởng kết quả nghiên cứu/ quá trình phân tích dữ liệu.

5
Nguyên nhân:
 Chất lượng của việc khảo sát:
+ Hiểu sai câu hỏi
+ Trả lời qua loa cho xong,
+ Không hoàn thành đầy đủ phiếu khảo sát,
+ Ghi chép nhầm,…
 Lỗi nhập liệu:
+ Thiếu
+ Thừa
+ Sai

6
2. Các bước thiết kế một
bảng khảo sát tốt

7
Thiết kế bộ dữ liệu tốt
• Bảng khảo sát: rõ ràng  tham khảo ý kiến, đánh giá (chuyên gia, giảng viên hướng dẫn, đối tượng
nghiên cứu) (pre-test).
• Sử dụng phương pháp dịch ngược (translation-back) để kiểm tra độ sai lệch của bảng dịch và bảng
gốc.
• Sử dụng “câu hỏi gài” và “câu hỏi đảo ngược đáp án”  khảo sát kém chất lượng, trả lời qua loa.
• Các câu hỏi khảo sát cần phải dễ hiểu, nêu ra 1 ý kiến (không sử dung nhiều ý trong cùng 1 câu)
• Thực hiện khảo sát sơ bộ (pilot test)  điều chỉnh cần thiết  khảo sát quy mô lớn.
• Lựa chọn người trả lời một cách chọn lọc (không có thái độ hỗ trợ, không nằm trong nhóm đối
tượng khảo sát  đánh giá không phù hợp, làm sai lệch kết quả so với thực tế) (sampling method)
•Bảng khảo sát sau khi thu về, cần phải được rà soát lỗi, chỉnh sửa trước khi tiến hành nhập liệu.

8
Ví dụ: Câu hỏi gài (Thang Likert-5, 1- không đồng ý  5 đồng ý)
Mã Hình ảnh thương hiệu 1 2 3 4 5

BI1 Thương hiệu thời trang này được thiết lập tốt (bền vững, tồn tại
trong một thời gian dài)

BI2 Thương hiệu thời trang này có hình ảnh trong sạch

BI3 Hình ảnh của thương hiệu thời trang này khác biệt với các
thương hiệu thời trang đối thủ.

Thông tin cá nhân:


Câu 1: Vui lòng cho biết giới tính của bạn
1.  Nam
2.  Nữ
Câu 2: Anh chị có nghĩ thương hiệu này có hình ảnh tốt không?
1.  Có 2.  Không

9
Ví dụ: Câu hỏi đảo ngược
Mã Hình ảnh thương hiệu 1 2 3 4 5

BI1 Thương hiệu thời trang này thì được thiết lập tốt (bền
vững, tồn tại trong một thời gian dài)

BI2 Thương hiệu thời trang này có hình ảnh trong sạch

BI3 Hình ảnh của thương hiệu thời trang này khác biệt với các
thương hiệu thời trang đối thủ.

BI4 Nhìn chung hình ảnh của thương hiệu này rất tệ

10
Ví dụ: Câu hỏi mang nhiều hàm ý
Mã Hình ảnh thương hiệu 1 2 3 4 5

BI1 Thương hiệu thời trang này thì được thiết lập tốt (đứng
vững, tồn tại trong một thời gian dài)

BI2 Thương hiệu thời trang này có hình ảnh trong sạch và thân
thiện với môi trường.

BI3 Hình ảnh của thương hiệu thời trang này khác biệt với các
thương hiệu thời trang đối thủ.

11
Khảo sát sơ bộ (Pilot test)
- Kích thước mẫu: n ≤ 100
- Các phân tích sơ bộ:
◦ Kiểm tra độ tin cậy Cronbach’s alpha (α > 0.7)
◦ Phân tích nhân tố khám phá (Exploratory Factor Analysis)

12
3. Phương pháp làm
sạch dữ liệu

13
3.1. Làm sạch dữ liệu trên excel:
Bước 1: Kiểm tra các giá trị khảo sát có cùng đáp án cho cùng 1 câu hỏi không?
=> tính giá trị trung bình cho tất cả các khảo sát trong bảng hỏi, trừ câu hỏi sàng lọc và câu hỏi
nhân khẩu học)
=> Loại các đáp án có giá trị giống nhau cho tất cả các câu trả lời về biến khảo sát.
Bước 2: Kiểm tra thời gian hoàn thành khảo sát
=> Lấy thời gian hoàn thành trừ thời gian bắt đầu làm khảo sát
=> Loại các khảo sát có thời gian hoàn thành quá ngắn.
Bước 3: Sau khi loại các khảo sát không tốt, nhập file dữ liệu đã được làm sạch vào SPSS.

14
3.2. Làm sạch dữ liệu trên SPSS – Tìm giá
trị khuyết:
Bước 1: Trên file dữ liệu SPSS, chọn Analyze  Descriptive Statistics  Frequency

15
3.2. Làm sạch dữ liệu trên SPSS – Tìm giá
trị khuyết:
Bước 2: Chọn tất cả các biến quan sát vào ô “Variables”  Bỏ chọn ô “Dislay frequency Tables”
 Click ok

16
3.2. Làm sạch dữ liệu trên SPSS – Tìm giá
trị khuyết:
Bước 3: Kiểm tra Output view

Bước 4: Kiểm tra lại file dữ liệu gốc hoặc bảng khảo sát

17
3.2. Làm sạch dữ liệu trên SPSS – dùng
bảng tần số:
Bước 1: Trên file dữ liệu SPSS, chọn Analyze  Descriptive Statistics  Frequency

18
3.2. Làm sạch dữ liệu trên SPSS – dùng
bảng tần số:
Bước 2: Chọn tất cả các biến quan sát vào ô “Variables”  Bỏ chọn ô “Dislay frequency Tables”
 Click ok

19
3.2. Làm sạch dữ liệu trên SPSS – dùng
bảng tần số:
Bước 3: Kiểm tra Output view

20
3.3. Làm sạch dữ liệu trên SPSS – dùng
bảng tần số:
Bước 4.1: Dùng hàm Ctrl + F (Edit  Find  Nhập giá trị cần tìm  Nhấn “Find next”

21
3.3. Làm sạch dữ liệu trên SPSS – dùng
bảng tần số:
Bước 4.2: Data  Sort cases  Chọn kiểu sắp xếp phù hợp (Ascending hoặc Descending, để sắp
xếp thứ tự từ thấp đến cao hay ngược lại). Bấm OK để sắp xếp lại dữ liệu.

22
3.4. Làm sạch dữ liệu trên SPSS – dùng
bảng kết hợp:
Bước 1: Analyze  Descri[tive statistics  Crosstabs  chọn giá trị cho column và row  nhấn ok.

23
3.4. Làm sạch dữ liệu trên SPSS – dùng
bảng kết hợp:
Bước 2: Kiểm tra Output view

24
3.4. Làm sạch dữ liệu trên SPSS – dùng
bảng kết hợp:
Bước 3: Data  Select cases  Chọn “If condition is satisfied”  Bấm “If”  Gõ hàm để chọn trường
hợp mình muốn tìm  Bấm Continue  Bấm ok

25
3.4. Làm sạch dữ liệu trên SPSS – dùng
bảng kết hợp:

Bước 4:
• Ô bị gạch là trường hợp
không thỏa điều kiện
• Ô không bị gạch là trường
hợp cần tìm
• Nếu muốn trở lại, quay về
Select cases, chọn all cases

26
Tài liệu trích dẫn
Xulydinhluong. (n.a.) Retrieved from https://xulydinhluong.com/ (accessed on
Jul 14, 2023)

27
FOR MORE DETAILS: PLEASE CONTACT ME AT
LTPMHOANG@HCMIU.EDU.VN
MS TEAM

You might also like