Professional Documents
Culture Documents
Nhap Mon SPSS
Nhap Mon SPSS
Nhap Mon SPSS
B. File dữ liệu
Dữ liệu được lưu vào file có đuôi là sav.
Save
Đặt tên file
Bấm nút Save
Đóng
File
Close
2. Cửa sổ biến
Dùng để định nghĩa các biến (tên biến, kiểu là số hay chữ…).
Bấm chuột vào Variable View ở dưới
Tên biến là Cau1, Label là Gioi tinh Tên biến là Cau2, Label là Tuoi
Trong hình trên ta biết Ma bn [id] là kiểu số. Dia chi [diachi] là kiểu chuỗi.
Ví dụ chuỗi có giá trị là 8 thì người nhập không gõ tiếp được chữ số thứ 9 nếu số chữ đã gõ đã
đến 8.
1. System missing
Nếu không nhập thì ô bị trống (có dấu chấm nếu là số).
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
2. User missing
Biến nhận giá trị nhưng ta cho là missing.
Ví dụ:
Câu 10: Theo Anh, Chị chương trình học là:
1- Quá nặng 2-Vừa phải 3- Rất nhẹ 4-Không trả lời.
Có hai kiểu missing xảy ra:
Câu này không được ghi nhận (không nhập liệu, vì không đánh dấu vào lựa chọn nào cả); tức
là xem như bỏ sót câu này. Đây là system missing
Người được phỏng vấn từ chối trả lời và lựa chọn 4 được ghi nhận.
Khi phân tích ta có thể xem 4 là giá trị missing. Đây là user missing.
Biến có kiểu số chưa chắc là Scale, đó là các trường hợp dùng cách mã hóa. Chẳng
hạn nếu quy ước 1 là nam 2 là nữ, thì biến sẽ nhận giá trị 1, 2. Nhưng biến này là
kiểu Nominal (định danh không thứ bậc), nói cách khác ở đây ta không thể cho là 2
lớn hơn 1 và ngược lại không thể cho là 1 nhỏ hơn 2.
Có một loại gọi là Dischotomous (nhị nguyên) chỉ nhận hai giá trị, là 0 và 1. Loại
biến này hay gặp để diễn tả một tính chất chỉ có hai giá trị (có bệnh hay không có
bệnh, nam hay nữ, có gia đình hay không có gia đình)…
A. Nhập
Nhập vào ô,
Bấm enter hoặc bấm nút mũi tên.
B. Sửa
Chọn ô muốn sửa.
Bấm F2 và sửa.
Phân biệt giữa việc sửa và nhập:
Khi nhập thì giá trị cũ của ô sẽ biến mất.
Khi sửa thì giá trị cũ của ô còn đó, ta chỉ sửa mà thôi.
D. Chọn các ô
Nhấn phím Shift.
Bấm phím mũi tên theo chiều thích hợp.
E. Chọn cả cột
Đưa chuột lên đầu cột
Bấm chuột
F. Chọn cả hàng
Đưa chuột ra đầu hàng.
Bấm chuột.
G. Xóa dữ liệu
Chọn ô (hoặc nhiều ô) muốn xóa.
Bấm phím Delete.
J. Copy dữ liệu
Chọn ô (hoặc nhiều ô) muốn copy.
Bấm Ctrl + C
Bấm chuột vào ô muốn chép.
Bấm Ctrl + V
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
K. Cắt dữ liệu
Chọn ô (hoặc nhiều ô) muốn cắt.
Bấm Ctrl + X (dữ liệu sẽ biến mất).
Bấm chuột vào ô muốn chép.
Bấm Ctrl + V
Ghi chú:
Động tác này được xem như chuyển chỗ.
Ghi chú:
Có thể thực hiện việc này ở cửa sổ Data View nhưng lúc này lại chọn cả cột và kéo qua trái
hoặc phải.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
Redo một lần: lấy lại thao tác mới hủy, tức thao tác nhập 9, kết quả là:
Redo lần nữa: lấy lại thao tác đã hủy tiếp đó tức là thao tác nhập 10, kết quả là
D. Câu hỏi
E. Bài tập:
1) Chạy SPSS
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
Bấm nút mũi tên, biến DiaChi[cau3] xuất hiện bên phải.
Bấm nút Add thì ở khung Old New có dòng ‘Duy Xuye’ ‘DX’ cho biết giá trị cũ Duy
Xuye sẽ thành giá trị mới DX.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
Nếu không muốn tiến hành đổi một giá trị nào đó thì bấm ở khung Old New và chọn
Remove.
Sau khi xác định các giá trị cần đổi. Bấm Continue.
Bấm OK
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
Chọn Tuoi[cau2]
Bấm nút mũi tên
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
Trong Output Variable (biến đầu ra) gõ DoTuoi. Bấm nút Change.
Lúc này dòng cau2 ? sẽ trở thành cau2 Dotuoi, nghĩa là dữ liệu (độ tuổi) sẽ được vào
biến mới là Dotuoi
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
Trong khung Old New ta có dòng 1 thru 20 1 có nghĩa là các giá trị 1 đến 20 ở biến
Cau2 sẽ được chuyển thành 1 ở biến Dotuoi.
v.v…
Tiếp tục làm như vậy cho các nhóm khác
Bấm Continue.
Bấm OK.
Lưu ý: Khi recode xong thì hai biến không còn liên hệ gì với nhau. Ví dụ ban đầu tuổi bệnh
nhân (biến Tuoi) là 30, ta ra lệnh recode qua biến DoTuoi là nhóm 3. Thì sau này nếu có sửa
tuổi thành 50 (DoTuoi là 5) thì phải Recode lại. Kinh nghiệm cho thấy là các lệnh Recode nên
lưu lại trong file syntax để sau này chạy lại cho nhanh.
Xem mục Lặp lại lệnh.
1. Đổi 1 giá trị Old Value cụ thể thành 1 giá trị New Value
Recode giá trị 1 (old value) ở biến X thành 2 (new value) ở biến Y
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
2. Đổi các giá trị Old Value trong một giới hạn thành 1 giá trị New Value.
Recode các giá trị từ 10 đến 20 (old value) ở biến X thành 3 (new value) ở biến Y
3. Đổi các giá trị Old Value nhỏ hơn một giới hạn thành 1 giá trị New
Value
Recode các giá trị nhỏ hơn hoặc bằng 30 (old value) ở biến X thành 7 (new value) ở biến Y
4. Đổi các giá trị Old Value từ một giới hạn trở lên thành 1 giá trị New
Value
Recode các giá trị từ 70 (old value) trở lên ở biến X thành 9 (new value) ở biến Y
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
5. Đổi tất cả các giá trị Old Value còn lại thành 1 giá trị New Value.
Ví dụ: Ta có các huyện (biến DiaChi) sau: TM, TP, TK, DX, DL
Ta quan tâm đến 2 vùng miền núi và đồng bằng.
Cách nhanh nhất là Recode vào biến Vung bằng cách:
Đổi TM, TP thành MN.
Các giá trị còn lại là DB
Bài tập 2:
1) Chạy SPSS
2) Mở file Cao huyet ap
3) Recode lại dữ liêu của biến cau3 thành các tên tắt của Huyện cho vào biến diachi1
4) Xóa biến diachi1.
5) Đổi tên biến diachi1 thành cau3.
6) Phân các nhóm tuổi thành 2 loại cho vào biến Tuoi1 với quy định dưới 50 là nhóm 0 và
từ 50 trở lên là nhóm 1.
7) Chuyển vị trí biến Tuoi1 cho nằm bên cạnh biến cau2.
8) Phân các nhóm tuổi thành các loại cho vào biến Tuoi2 với quy định sau:
Dưới 20 gộp thành nhóm có tên ‘Duoi 20’
20-29 gộp thành nhóm có tên là ‘20 den 29’
30-39 gộp thành nhóm có tên là ‘30 den 39’
40-49 gộp thành nhóm có tên là ‘40 den 49’
50-59 gộp thành nhóm có tên là ‘50 den 59’
60-69 gộp thành nhóm có tên là ‘60 den 69’
70 trở lên gộp thành nhóm có tên là ’70 tro len’
9) Lưu file và thoát SPSS
Gõ OK.
Ví dụ 2: Tạo biến mới là CaoHA với quy định
CaoHA là 1 nếu HA tối đa (cau7) >140 hoặc HA tối thiểu (cau8) >90
Numeric Expression cho CaoHA là
Cau7>140 | Cau8>90
Biểu thức trên gọi là biểu thức logic hoặc. Biểu thức này cho giá trị 1 khi nó đúng. 0 khi nó
sai.
Biểu thức logic hoặc này đúng khi chỉ cần 1 trong 2 phép so sánh Cau7>140 hoặc Cau8>90
đúng.
Ví dụ 3: Tạo biến mới là CaoTT (chỉ cao HA tâm thu, tâm trương bình thường) với quy định
CaoTT là 1 nếu HA tối đa (cau7) >140 và HA tối thiểu (cau8) <= 90
Numeric Expression cho CaoHA là
Cau7>140 & Cau8>90
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
Biểu thức trên gọi là biểu thức logic và. Biểu thức này cho giá trị 1 khi nó đúng. 0 khi nó sai.
Phép và này chỉ đúng khi cả 2 phép so sánh Cau7>140 và Cau8>90 là đúng.
Sau đó chọn tiếp HA tam thu (cau7) bấm qua. Chọn Descending.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
Bấm OK thì SPSS sẽ xếp theo tuổi từ nhỏ đến lớn, nếu cùng tuổi thì xếp theo HA tâm thu (từ
lớn xuống).
Ban đầu ta thấy dấu All cases được chọn, nghĩa là tới lúc này tất cả các trường hợp đều được
tính đến.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
Bấm chọn If condition is satisfied (nếu điều kiện được thỏa mãn)
Gõ biểu thức.
Bấm Continue.
Lúc này cửa sổ Select Cases bên cạnh nút if có ghi biểu thức trên.
Bấm OK.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
Các trường hợp dưới 40 tuổi đã được chọn, số thứ tự không bị gạch chéo, các trường hợp bị
gạch chéo sẽ được xem như không có trong dữ liệu.
B. Hủy chọn
Data
Select Cases…
Chọn lại All Cases.
A. Nhắc lại
Là số lần xuất hiện của các giá trị
Mã Giới tính
01 Nam
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
02 Nu
03 Nam
04 Nam
05 Nu
06 Nu
07 Nu
Frequency của Giới tính:
Nam: 3
Nu: 4
B. Thực hiện
Analyze
Tables
Tables of frenquency
Chọn Count Display (để hiển thị số lượng), chọn Percents Display (để hiển thị %)
Bấm Continue.
Bấm OK.
Kết quả:
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
Ghi chú: Có thể tính tần suất của nhiều biến cùng một lần.
Kết quả:
Hiện ra danh sách các lệnh đã dùng. Chọn lệnh muốn thực hiện lại.
Nếu muốn chạy lệnh này thì ta bấm vào nút mũi tên.
X. Kiểm định tỉ lệ
Mục đích: Xác định tỉ lệ của các nhóm có bằng nhau hay không hay phù hợp với các tỉ lệ đã
định trước hay không.
Giả thiết H0 : các nhóm trong một biến có tỉ lệ bằng nhau
Tiến hành Chi-square test.
Căn cứ vào Asym. Sig (p-value) nếu nhỏ hơn 0.05 : bác bỏ H0- nếu lớn hơn có thể kết
luận tỉ lệ các nhóm là bằng nhau
Ví dụ 1 : Khảo sát 100 học sinh ta có 58 nam, 42 nữ. Số nam lớn hơn số nữ (trong mẫu của
chúng ta); nhưng kết luận này có ý nghĩa thống kê hay không ?
H0 : tỉ lệ nam bằng tỉ lệ nữ (hoặc tỉ lệ nam :nữ là 50 :50)
Ví dụ 2 : Theo một lý thuyết, bài kiểm tra nên có 25% học sinh đạt điểm kém, 50% đạt điểm
trung bình và 25% đạt điểm giỏi. Khảo sát của chúng ta trên một bài kiểm tra cụ thể có 10 học
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
sinh đạt điểm kém, 17 học sinh đạt điểm trung bình và 9 học sinh đạt điểm giỏi. Kết quả này
có phù hợp với lý thuyết hay không ?
H0 : Tỉ lệ điểm trong khảo sát của ta theo cơ cấu 25 :50 : 25
Kết quả :
Nghe nghiep
Test Statistics
Nghe nghiep
Chi-Square(a) 3.160
Df 3
Asymp. Sig. .368
Diễn giải:
Observed N: số lượng quan sát
Expected N: tần suất mong đợi (tần suất theo giả thiết H0)
Chi-Square: thống kê Chi-Square.
Df: bậc tự do.
Asymp. Sig: giá trị p-value: xác suất để giả thiết đúng
Giả thiết H0 : tỉ lệ các nghề nghiệp là bằng nhau.
Asymp. Sig: xác suất để giả thiết đúng là 0.368 khá lớn (lớn hơn 0.05), nói cách khác:
- có nhiều khả năng tỉ lệ các nghề nghiệp là bằng nhau hoặc:
- các nghề nghiệp khác nhau không có ý nghĩa thống kê.
Nếu Asymp. Sig nhỏ hơn 0.05 ta kết luận là tỉ lệ nghề nghiệp khác nhau có ý nghĩa thống kê.
Test Statistics
MACBENH
Chi-
378.125
Square(a)
Df 1
Asymp. Sig. .000
a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 40.0.
XI. Kiểm định mối liên hệ của hai biến định tính
Mục đích : Xem hai biến (hai yếu tố) có liên hệ như thế nào: có độc lập hay có ảnh hưởng
nhau?
Ví dụ : Nhóm tuổi có ảnh hưởng đến việc mắc bệnh hay không.
Nghề nghiệp có ảnh hưởng đến việc mắc bệnh hay không.
Ta sẽ dùng bảng cross-tab (bảng chéo) và các kiểm định Chi-square.
Giả sử ta muốn xem giới tính có độc lập với việc mắc bệnh cao huyết áp hay không.
Giả thiết H0 : Giới tính độc lập với việc mắc bệnh cao huyết áp
Analyze
Descriptive
Crosstabs
Kết quả :
Gioi tinh * CAOHA Crosstabulation
Count
CAOHA
.00 1.00 Total
Gioi Nu 19 47 66
tinh Nam 25 109 134
Total 44 156 200
Chi-Square Tests
Diễn giải: mức ý nghĩa Asymp. Sig. là 0.104 nên ta không bác bỏ được H0, nghĩa là có thể kết
luận giới tính và bệnh cao huyết áp độc lập với nhau.
Nếu kết quả càng gần 1 : hai biến càng có tương quan tỉ lệ thuận, biến này tăng thì biến kia
cũng tăng.
Nếu kết quả càng gần -1 : hai biến càng có tương quan tỉ lệ nghịch, biến này tăng thì biến kia
giảm.
Với bất kỳ kết quả nào, hệ số tương quan phải được xét với mức ý nghĩa (sig. = significance)
Mức ý nghĩa càng thấp thì hệ số tương quan càng có giá trị (không lớn hơn 0.05)
Hệ số tương quan dù gần -1 hoặc 1 nhưng có mức ý nghĩa thấp cũng không đủ kết luận.
Ví dụ : Chiều cao và cân nặng có hệ số tương quan như thế nào ?
Analyze
Correlate
Bivariate
OK
Kết quả:
Correlations
Correlation
Sig. (2-tailed) . .011
N 200 200
Can nang Pearson
-.179(*) 1
Correlation
Sig. (2-tailed) .011 .
N 200 200
* Correlation is significant at the 0.05 level (2-tailed).
Diễn giải
Pearson Correlation là 1 với mức ý nghĩa Sig. là 0.011 (nhỏ).
Ta kết luận hai biến này có mối tương quan tuyến tính thuận có ý nghĩa thống kê.
XIII. So sánh trị trung bình của một mẫu với một giá trị- One
sample T-test
Mục đích: Xem giá trị trung bình của một biến có sai khác với một giá trị nào đó?
Ví dụ: Ta đo chiều cao một mẫu 200 thanh niên từ 20-30 tuổi ở một địa phương và xét xem có
thể kết luận chiều cao trung bình của họ có sai khác với chiều cao trung bình của thanh niên ở
độ tuổi 20-30 được công bố là 160 (cm) hay không?
Biến được xem xét phải là biến định lượng (scale) vì trị trung bình của biến định danh
(phân loại) là vô nghĩa, ví dụ trung bình của giới tính (!?)
H0: Trung bình của mẫu không sai khác với giá trị cho trước.
Analyze
Compare Means
One-Sample T Test
Kết quả:
One-Sample Test
Giả thiết H0: Chiều cao trung bình của mẫu bằng 160.
Mức ý nghĩa 0.183 không cho phép ta bác bỏ H0.
Bây giờ giả sử ta so sánh với chiều cao l0 là 170.
Giả thiết H0: Chiều cao trung của mẫu bằng 170.
Kết quả:
One-Sample Test
Mức ý nghĩa .000 cho phép ta kết luận chiều cao trung bình của các thanh niên mà ta khảo sát
không bằng 170.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam
Khoảng sai khác 95% Confidence Interval of the Difference đi từ -12.75 đến -9.47 đều dưới 0,
nên ta kết luận là chiều cao trung bình của mẫu đã khảo sát thấp hơn 170 (với mức ý nghĩa
<0.01)
XIV. So sánh trung bình của hai mẫu độc lập – Independent
Samples T-Test
Mục đích: Ta có hai nhóm độc lập. Ta kiểm định trung bình của một tính chất (biến) của hai
nhóm đó có khác nhau không,
Ví dụ hai mẫu độc lập nam và nữ, ta kiểm định