Tóm-tắt BG7 HQTQ YR22

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 33

Xác suất thống kê y học

TS.GVC. Trần Thúy Hiền


Bộ môn Toán Tin, Khoa Cơ bản,
ĐH Y Dược Huế
Bài 7. Hồi qui và Tương quan

Mục tiêu:
7.1. Xác định mô hình hồi qui tuyến tính mẫu
với tập dữ liệu, hệ số tương quan, hệ số xác
định
7.2. Giải thích hay đọc kết quả của thủ tục
kiểm định sự phù hợp của mô hình hồi qui mẫu
7.3. Giải thích mức độ dự đoán biến kết cục
dựa vào biến dự đoán
7.4. Dự đoán giá trị biến kết cục (trong một
giới hạn nào đó) bởi biến dự đoán ứng dụng
trong chẩn đoán, điều trị cho bệnh nhân
Trần Thuý Hiền
I. Phân tích Hồi qui

Nội dung:
1. Khái niệm mô hình hồi qui, hồi qui tuyến tính
2. Hàm hồi qui mẫu
3. Sự phù hợp của mô hình hồi qui: Thủ tục
kiểm định sự phù hợp của mô hình hồi qui
4. Hệ số xác định R2 đánh giá mức độ phù hợp
của hàm hồi qui mẫu
5. Phân tích hồi qui với hỗ trợ SPSS

Trần Thuý Hiền


6.1.2. Phân tích Hồi qui
ü Hồi qui (Regression) là phương pháp thống kê
nhằm mô tả và đánh giá mối liên hệ giữa hai
hay nhiều biến.
ü Phân tích hồi qui nhằm xác định dạng thức toán
học mô tả mối liên hệ giữa các biến, nó giải
quyết các vấn đề cơ bản sau:
- Ước lượng giá trị trung bình của một biến theo
giá trị của một hay nhiều biến.
- Kiểm định bản chất của mối liên hệ đó.
- Dự đoán giá trị trung bình của một biến ứng
Trần Thuý Hiền
với giá trị đã cho của biến khác.
ü Phân tích hồi qui là phân tích các mô hình
thống kê. Mô hình thống kê là tập những biểu
thức toán học và các giả thiết mô tả cho một
hiện tượng thực tế.
ü Một số mô hình hồi qui:
PHÂN TÍCH HỒI QUI

HỒI QUI TUYẾN TÍNH HỒI QUI LOGISTIC

Đơn Đa biến Đơn Đa biến


Trần Thuý Hiền
biến biến
1.1. Phân tích hồi qui tuyến tính
Ø Phương pháp phân tích mối liên hệ giữa các biến liên
tục Y và X; Y và X1, X2 , …, Xk
Y: biến phụ thuộc hay biến đáp ứng (có nhiều nhân
tố tác động đến)
X, X1, X2 , …, Xk : biến độc lập hay biến giải thích
X, X1, X2 , …, Xk : dễ dàng đo lường, kiểm soát trực
tiếp (tuổi, huyết áp, nồng độ các chất trong nước
tiểu, chiều cao bụng của sản phụ,...)
Y: khó khăn, tốn kém hơn khi đo lường, thường muốn
tiên đoán (thể tích hộp sọ, diện tích da, nồng độ các
chất trong máu, trọng lượng thai,...)
Trần Thuý Hiền
Ø Hàm hồi qui tuyến tính:
Hàm hồi qui tuyến tính đơn biến: Y = a + b. X
Hàm hồi qui tuyến tính đa biến:
Y = b 0 + b1. X 1 + b 2 . X 2 + ... + b k . X k
a, b; b 0 , b1 , b 2 , ... , b k : Tham số của Hàm hồi qui
Ø Mô hình hồi qui tuyến tính:
Mô hình hồi qui tuyến tính đơn biến:
Yi = a + b. X i + U i ; i = 1; n
Mô hình hồi qui tuyến tính đa biến:
Yi = b 0 + b1. X i1 + b 2 . X i 2 + ... + b k . X ik + U i ; i = 1; n
U i gọi là Sai số ngẫu nhiên tại Xi (đại diện cho các
tác nhân bên ngoài ảnh hưởng đến quá trình xây dựng
mô hình) Trần Thuý Hiền
Ø Các giả thiết của mô hình hồi qui tuyến tính:
GT1. Các biến giải thích X, X1, X2 , …, Xk là biến cố
định, không có yếu tố ngẫu nhiên (không có sai sót
ngẫu nhiên trong đo lường)
GT2. Các biến ngẫu nhiên Yi là độc lập với nhau.
GT3. Sai số ngẫu nhiên U i là các biến ngẫu nhiên có
phân phối chuẩn.
GT4. Sai số ngẫu nhiên U i có trung bình bằng 0,
phương sai bằng nhau.
Ø Hàm hồi qui mẫu: là hàm ước lượng cho hàm hồi
qui tổng thể từ mẫu, bằng cách ước lượng các tham số
của mô hình hồi qui:
Yˆ = aˆ + bˆ. X ; Yˆ = bˆ + bˆ . X + bˆ . X + ... + bˆ . X
0 1 1 2 2Trần Thuý Hiền
k k
Ø Mô hình hồi qui tuyến tính mẫu:
Mô hình hồi qui tuyến tính mẫu đơn biến:
Yˆi = aˆ + bˆ. X i + e i ; i = 1; n
Mô hình hồi qui tuyến tính mẫu đa biến:
Yˆi = bˆ0 + bˆ1. X i1 + bˆ2 . X i 2 + ... + bˆk . X ik + e i ; i = 1; n
ei gọi là Phần dư (Residual): Sai số giữa dữ liệu
quan sát và hàm ước lượng

Trần Thuý Hiền


Mô hình ước lượng càng tốt nếu hàm hồi qui mẫu
càng gần với các giá trị của tập dữ liệu, nghĩa là
n

åi
e 2

i =1
càng bé

Ø Đánh giá sự phù hợp của mô hình:


Thông qua thủ tục kiểm định - Hệ số xác định
Hệ số xác định R2: Cho biết trong 100% của toàn bộ
các sai lệch thì có bao nhiêu % là do biến X hay X1, X2 ,
…, Xk giải thích, số % còn lại là do sai số ngẫu nhiên và
do các yếu tố khác (nếu có) mà chưa đưa vào mô hình.
Trần Thuý Hiền
THỰC HIỆN PHÂN TÍCH HỒI QUI
1 2 3 4

Ước lượng Đánh giá sự Ước lượng


Xác định
và kiểm phù hợp của trung bình
Hàm hồi
định về các mô hình hồi hay dự báo
qui mẫu
tham số hồi qui (Hệ số giá trị của
qui xác định R2, Y theo các
kiểm định biến giải
sự phù hợp thích
của mô
hình)

Chú ý: Kiểm tra 4 giả thiết của mô hình


hồi qui tuyến tính
Trần Thuý Hiền
Ví dụ 6.2. Phân tích hồi qui giữa Số vi khuẩn (triệu
con) sinh sản theo Thời gian (giờ).

X 1 2 3 4 5 6 7 8 9

Y 3,0 3,2 3,5 4,0 4,8 5,2 5,8 6,2 6,9

Trần Thuý Hiền


Regression/ Linear (Hồi qui)

Trần Thuý Hiền


Regression/ Linear (Hồi qui)

Phân tích hồi qui tuyến tính đơn biến:

Số vi khuẩn = 0,507 * Thời gian + 2,2


Trần Thuý Hiền
Ví dụ 6.3. Đo bề dày lớp Nội trung mạc động mạch
cảnh trên siêu âm ở 100 bệnh nhân điều trị tại khoa
tim mạch.

Phân tích hồi qui tuyến tính đa biến:

cho phép xác định mức độ ảnh hưởng của nhiều yếu tố
lên bề dày lớp Nội trung mạc động mạch cảnh.

Trần Thuý Hiền


Phân tích hồi qui tuyến tính đa biến:

BedayNTM = -0,108 + 0,01.Tuổi + 0,002. Huyetaptt +


0,008. Glucose + 0,038. Cholesterol Trần Thuý Hiền
II. Phân tích Tương quan

Nội dung:
1. Hệ số tương quan và ý nghĩa
2. Hệ số tương quan mẫu
3. Kiểm định ý nghĩa tương quan
4. Phân tích tương quan với hỗ trợ của SPSS

Trần Thuý Hiền


Phân tích Tương quan
ü Phân tích tương quan nhằm mục đích đánh giá
mức độ liên quan giữa 2 biến ngẫu nhiên X, Y.
ü Trong phân tích tương quan không phân biệt
biến độc lập, biến phụ thuộc.
ü Tương quan giữa 2 biến đánh giá mối quan hệ
tuyến tính giữa chúng và được đặc trưng bởi
hệ số tương quan.

Trần Thuý Hiền


(1) Hệ số tương quan và ý nghĩa
Hệ số tương quan , đo mức độ tương quan, phụ
thuộc tuyến tính giữa 2 biến ngẫu nhiên X, Y.
Nhận giá trị [-1;1]
Nếu càng lớn thì sự phụ thuộc tuyến tính càng chặt
chẽ.
: tương quan thuận
: tương quan nghịch
: không tương quan
càng gần 1: tương quan càng mạnh
Trần Thuý Hiền
càng gần 0: tương quan càng yếu
(2) Hệ số tương quan mẫu
Hệ số tương quan được ước lượng từ hệ số tương
quan mẫu r của tập hợp dữ liệu thực nghiệm.
- Hệ số tương quan Pearson nếu X, Y thỏa mãn
phân phối chuẩn.
- Hệ số tương quan hạng Spearman hay Kendall
nếu X, Y không thỏa mãn phân phối chuẩn
Hệ số tương quan mẫu r Ý nghĩa
r < 0,3 Mối tương quan yếu
0,3 £ r £ 0, 7 Mối tương quan bình thường
r > 0, 7 Mối tương quan mạnh
Trần Thuý Hiền
Hệ số tương quan mẫu r Ý nghĩa
±0,01 đến ±0,1 Mối tương quan quá thấp,
không đáng kể
±0,2 đến ±0,3 Mối tương quan thấp
±0,4 đến ±0,5 Mối tương quan trung bình
±0,6 đến ±0,7 Mối tương quan cao
±0,8 trở lên Mối tương quan rất cao

Trần Thuý Hiền


(3) Kiểm định ý nghĩa hệ số tương quan
Lập H0:
H1:
Thống kê kiểm định:

n-2
K = r. ! tn - 2
1- r 2

Trần Thuý Hiền


Ví dụ 6.1. Phân tích tương quan giữa chỉ số BMI và HATT

BMI HATT BMI HATT

1 21,7 106 6 23,2 85

2 33,1 114 7 24,1 90

3 26,9 112 8 26,9 120

4 20,6 67 9 21,5 78

5 18,1 84 10 24,5 94
Trần Thuý Hiền
Explore/Plots/Normality plots with tests

Trần Thuý Hiền


Correlate/Bivariate (Tương quan 2 biến)

Trần Thuý Hiền


Ví dụ 6.2. Phân tích tương quan giữa Số vi khuẩn (triệu
con) sinh sản theo Thời gian (giờ).

X 1 2 3 4 5 6 7 8 9

Y 3,0 3,2 3,5 4,0 4,8 5,2 5,8 6,2 6,9

Trần Thuý Hiền


Explore/Plots/Normality plots with tests

Trần Thuý Hiền


Correlate/Bivariate (Tương quan 2 biến)

Trần Thuý Hiền


Regression/ Linear (Hồi qui)

Trần Thuý Hiền


Regression/ Linear (Hồi qui)

Phân tích hồi qui tuyến tính đơn biến:

Số vi khuẩn = 0,507 * Thời gian + 2,2


Trần Thuý Hiền
Ví dụ 6.3. Đo bề dày lớp NTM động mạch cảnh trên
siêu âm ở 100 bệnh nhân điều trị tại khoa tim mạch.

Phân tích hồi qui tuyến tính đa biến:

cho phép xác định mức độ ảnh hưởng của nhiều yếu tố
lên bề dày lớp NTM động mạch cảnh.

Trần Thuý Hiền


Phân tích hồi qui tuyến tính đa biến:

BedayNTM = -0,108 + 0,01.Tuổi + 0,002. Huyetaptt +


0,008. Glucose + 0,038. Cholesterol Trần Thuý Hiền
Trần Thuý Hiền
Curve Estimation

You might also like