Download as pdf or txt
Download as pdf or txt
You are on page 1of 4

Sắp số: dãy chẵn cộng 2 số/2, lẻ lấy luôn

13. Yếu vị

tab1 bien (coi số quan sát)

1. Xem lại giá trị được dán (VD: giới) tab1 gioi tab1 biến,sort
2. Lưu save “tên file số liệu”
3. Lưu kết quả phân tích ở cửa sổ result 14. Sai số chuẩn, khoảng tin cậy 95% số liệu

Lưu kết quả dạng text: log using tênfile, text replace. ci means dinhluong

Kết thúc quá trình lưu: log close 15. khoảng tin cậy 99% số liệu

4. Hợp file ci means dinhluong, level(99)


- Hợp file cùng biến số, khác quan sát
16. Tính ktc 95% của trung bình
Use “filesốliệu1”
append using “filesốliệu2” cii means sốqs tb đlc

- Quan sát trong file dữ liệu 1 khớp chính xác, 1 quan sát trong file dữ liệu 17. Tính KTC 95% của tỷ lệ

use “filesốliệu1” Cii prop soqs tanso, wald


merge 1:1 bienchung using “filesốliệu2”
18. Đổi tên
5. Xem sơ lược lại dữ liệu: Kiểm tra xem biến số, mã hóa biến, biến có giá trị missing,... Des
6. Xem sơ lược lại dữ liệu rename tencu tenmoi
tdic maso tuoime cha tuoithai gioi tlsosinh nghenghiep 19. Dán nhãn biến số
7. Xóa bỏ biến số drop các biếnsố label var tenbien “ten nhan”
8. Xóa bỏ biến số có điều kiện drop if điềukiện
9. Xóa hàng drop in hàng (10/15) 20. Tạo dãn giá trị và dán nhãn giá trị
10. Thay thế giá trị biến số
replace biếnsố=giátrịthaythế if biếnsố==giátrịcũ label define tennhan 1 “nam” 2 “nữ”

Thống kê mô tả và vẽ biểu đồ label value tenbien (edditor) tênnhan

11. Tính trung bình và độ lệch chuẩn, phương sai = đlc^2, phạm vi số liệu Stata có 3 dữ liệu: dạng số (đen), dạng chuỗi (đỏ), dạng số được dán nhãn (xanh dương)

sum dinhluong 21. Hỏi khi có bảng số liệu, tạo biến số mới

sum biendl if bien ==1 (= ghép, == nói nó bằng 1, != khác) - Có bao nhiêu người lớn hơn 50 tuổi??

12. Trung vị, Tứ phân vị gen bienmoi = dieukienbiencu

Sum dinhluong, detail (50%, 25% và 75%) gen tuoi = 2024 – namsinh
tạo biến mới trong editor gen nt = tuoi > 50 Biến định tính: mô tả bằng tần suất, tỷ lệ.

tab1 nt Ứng dụng kiểm định T, ANOVA, phi tham số.

- Có bao nhiêu người thừa cân B1: đặt gt H0

gen bmi = cn/(cc/100)^2 - Tham số là như nhau giữa các nhóm (TB)
- Biến số phụ thuộc (Y) không liên quan biến số độc lập (X)
gen tc=bmi >=23
B2: chọn kiểm định
tab1 bmi
Độ tự do = qs -1
- Có bao nhiêu người cha?
Trung bình 1 = Trung bình 2
gen cha = hamax >=140 | (hoặc) hamin>=90
 Kiểm định T: so sánh 2 tb
tab1 cha
Nhiều TB
22. tạo biến số mới, phức tạp
 Kiểm định ANOVA: so sánh > 2TB
recode dieukien biensocu, generate (biénsômoi)
B3: Tính giá trị thống kê
recode tuoithai (min/36.99=1 “< 37tuan”) (37/max=0 ">=37 tuan"), generate(sinhnon) Kiểm định t -> thống kê t
Kiểm định ANOVA -> thống kê F

Bước 4: Tính xác suất xảy ra thống kê (giá trị p của kiểm định)
Vẽ tổ chức đồ
Bước 5: Kết luận
hist dinhluong, normal
Chấp nhận H0
Xem biểu đồ này có pp chuẩn không, trung bình nằm giữa đường cong, đường cong cân xứng đều 2
bên quanh trung bình. Bác bỏ H0

Vẽ biểu đồ hình hộp I. Kiểm định t

graph box dinhluong - t đơn (so sánh với dân số chung)

trung vị chia hộp thành 2 phần bằng nhau là pp chuẩn ttesti qs tb đlc tb-mẫu Đã nhập ttest dinhluong = tb mẫu

Biểu đồ hình bánh cho biến định tính 0.0000000 -> kl < 1/1000

graph pie, over(dinh tinh) - t bắt căp 1 mẫu mà trước và sau Nc

Biểu đồ hình thành GT: tb trước và sau nc không đổi

Grap bar, over(dinhtinh) hiệu tb = 0

Định tính: hình bánh, hình tron, hình thanh. ttest dl1 = dl2
- t không bắt cặp so sánh tb 2 nhóm độc lập 3. Kiểm định phi tham số

Đầu tiên phải kiểm tra phương sai 1. Mann whitney (wilcoxon tổng sắp hạng)
- Thay thế kiểm định t không bắt cặp khi biến định lượng phân phối bị lệch
sdtest dinluong, by(dinhtinh) H0 biến định lượng nhóm1 = biến đl nhóm 2 không nhận xét trung bình
Sắp xếp biến định lượng nhóm 1 tương tự như nhóm số 2
phương sai đồng nhất Khi các gía trị cùng thì lấy hangj giữa

H0: tb1=tb2. Nhập liệu 1 cột là sl 2 nhóm, 1 cột thuộc nhóm nào

Hiệu 2 tb bằng 0 ranksum dl, by(nhigia)

ttesti qs1 tb1 đlc1 qs2 tb2 đlc2 2. Wilcoxon sắp hạng có dấu
- Thay thế kiểm định t bắp cặp khi biến định lượng phân phối lệch.
ttest dl, by(dinhtinh) - Số giờ nhóm dùng thuốc khác với nhóm dùng giả dược (1 nhóm)

phương sai không đồng nhất Nhập liệu 2 nhóm bt.


ttest dl, by(đt) unequal signrank dinhluong1 = dinhluong2
H0: số giờ ngủ nhóm dùng thuốc = số giờ ngủ nhóm dùng gd
II. Kiểm định ANOVA (phân tích nhiều phương sai) 3. Kiểm đinh Kruskall – wallis

SSw: tổng bình phương nội bộ Thay thế kiểm định ANOVA khi biến định lượng phân phối lệch hoặc phương sai các nhóm khác nhau.

Kwallis dinhluong, by (dinhtinh)


SSb: Tổng bp giữa các nhóm
Biến đl có yếu vị đọc p dưới, không yếu vị đọc p trên
MSw: trung bình bp nội bộ
Kiểm định chi bình phương, FISHẺR
MSb: trung bình bp giữa các nhóm B1: giả thuyết ho

F: tỉ số trung bình bp Tham số (tỷ lệ) giữa các nhóm như nhau

Bs định tính X (X là biến độc lập, biến nguyên nhân) không liên quan bs định tính Y (Biến y là phụ thuộc, kết cuộc)
Độ tự do giữa các nhóm: số nhóm-1 (cột)
B2: chọn kiểm định chi bình phương
Độ tự do giữa nội bộ nhóm: qs-nhóm (hàng)
B3: tính giá trị thống kê
H0: tb các nhóm như nhau. Vọng trị = tổng hàng x tổng cột/ tổng chung => a b c d

Định tính không lq định lượng Bước 4: tính xác suất

Độ tự do = (số hàng_ -1 ) x (số cột – 1)= 1


Điều kiện: Thi cho pp. Phương sai tự kiểm
Giá trị chi bp càng lớn thì xác suất xảy ra thống kê càng nhỏ.
- Biến số phụ thuộc có pp bt.
Bước 5: KL
- Phương sai biến đl phải đồng nhất.
Lệnh chưa nhập liệu:
Chưa nhập aovsum, n() m() sd()
tabi a b \ c d, row co exp chi (cách ra)
nhập rôi oneway dl dt, tab Chi bình phương – (độ tự do) – p
Điều kiện: csi a c b d (bảng cột bệnh không bênh, hàng pn không pn)

Vọng trị < 5 chiếm <20% và không có vọng trị < 1 => FISHER lệnh thêm exact => đọc p 2 đuôi cs biếnphụthuộc biến sốđộclập

BT. Sinh non và gt có lq không? KL: 0.9-1.1 (không liên quan)

1.Có bao nhiêu trẻ sinh non?

gen sinhnon = tt<37 2.OR tỉ số chênh (NC bệnh chứng, cắt ngang)

tab1 sinhnon Odd: mong đợi/ không mong đợi (có UTP, có HTL/ có HTL không UTP)

2.GT và SN Tương tự không hút thuốc lá

tab1 gioi cci a c b d (bảng cột bệnh không bênh, hàng pn không pn)

lệnh tab dinhtinh1 dinhtinh2, exp chi cc biếnphụthuộc biếnđộclập

BT: tính tỷ lệ đầu 3.PR tỉ lệ hiên mắc (NC cắt ngang)

% theo hàng tab địnhtinh1 đinhtinh2, row Giống RR

% theo cột tab địnhtinh1 đinhtinh2, co csi a c b d

cs biếnphụthuộc biến sốđộclập

Phân tán đồ - phương trình hồi quy – hệ số tương quan r KL: cao gấp

B1: vẽ phân tán đồ 4. Hồi quy logistic

B2: Hệ số tương quan có tương quan không, mức độ? logit nhecan tuoithai

pwcorr dl1 dl2, sig star(5)  Viết phương trình

Tính ra r ở trên p ở dưới Logistic biếnphụthuộc biếnđộclập

Giá trị p < 0.001: hệ số tương quan khác 0 có ý nghĩa thống kê  OR=

Hệ số tương quan Spearman: predict pr_nhecan (tính xác suất nhẹ cân ở từng tuổi thai)

spearman tuoithai tlsosinh, stats(rho p)

B3: câu hỏi giải thích cái này thay đổi theo cái kia

phương trình hồi quy tuyến tính: y = a + bx

regress biếnphụthuộc biếnđộclập

dl1 = cons + dl2

b=r*Si(đlc phuthuoc)/Sx

RR/OR/PR – Hồi quy logistic

1.RR tỉ số nguy cơ nc đoàn hệ

RR= R phơinhiễm/ R khôngphơinhiễm.

You might also like