Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 7

TRƯỜNG ĐẠI HỌC BÁCH KHOA

KHOA ĐIỆN – ĐIỆN TỬ

--oOo—

BÀI TẬP LỚN


XÁC SUẤT THỐNG KÊ

GVHD:
Lớp: AN01
Nhóm: 1
Thành viên:
- Nguyễn Duy Phúc
- Trịnh Quốc Thành
- Tăng Phú Thiên Thánh
- Trần Đức Huy
- Trần Trung Hiếu
Mục lục
ĐỀ BÀI...................................................................................
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT....................................
I. Phân tích hồi quy
1. Định nghĩa.............................................................................
2. Công thức..............................................................................
3. Kiểm tra dữ liệu.....................................................................
4. Các bước thiện hiện...............................................................
II. Mô hình hồi quy logistic..........................................................
1. Định nghĩa.............................................................................
2. Công thức..............................................................................
3. Ưu và Nhược điểm................................................................
4. Ứng dụng...............................................................................

CHƯƠNG 2: SỬ LÝ SỐ LIỆU............................................
1. Đọc dữ liệu............................................................................
2. Làm sạch dữ liệu............................................................
CHƯƠNG 1: CƠ SỞ DỮ LIỆU
I. Phân tích hồi quy
1. Định nghĩa

Hồi quy tuyến tính là một phương pháp thống kê được sử dụng
để mô hình hóa mối quan hệ giữa một biến phụ thuộc và một
hoặc nhiều biến độc lập. Nó hoạt động bằng cách tìm một đường
thẳng, mặt phẳng hoặc siêu mặt phẳng tuyến tính tốt nhất để dự
đoán dữ liệu.
2. Công thức
Mô hình hồi quy tuyến tính đơn giản có dạng:
y=a+bx+e
Trong đó:
 y là biến phụ thuộc.
 x là biến độc lập.
 a và b là các hệ số mà chúng ta cần ước lượng.
 e là sai số ngẫu nhiên.
3. Kiểm tra số liệu
Có một số giả định quan trọng cần được kiểm tra khi sử dụng
hồi quy tuyến tính:
1. Tính tuyến tính: Mối quan hệ giữa biến phụ thuộc và biến
độc lập phải là tuyến tính.
2. Độc lập: Các sai số (hoặc các giá trị của biến phụ thuộc)
phải độc lập với nhau.
3. Phương sai không đổi: Phương sai của sai số phải không
đổi.
4. Chuẩn: Sai số phải tuân theo phân phối chuẩn.
4. Phân tích Hồi quy tuyến tính
Phân tích hồi quy tuyến tính bao gồm việc ước lượng các hệ số
của mô hình và kiểm tra các giả định của mô hình. Các bước cụ
thể có thể bao gồm:
1. Thu thập dữ liệu: Dữ liệu cho biến phụ thuộc và biến độc
lập cần được thu thập.
2. Ước lượng hệ số: Sử dụng phương pháp nhỏ nhất bình
phương để ước lượng hệ số.
3. Kiểm tra giả định: Sử dụng các phân tích như biểu đồ còn
lại và kiểm định F để kiểm tra các giả định của mô hình.
4. Dự đoán: Sử dụng mô hình đã được ước lượng để dự đoán
giá trị của biến phụ thuộc dựa trên giá trị của biến độc lập.
II. Mô hình hồi quy logistic
Giới thiệu

Mô hình hồi quy logistic là một phương pháp thống kê được sử dụng để
dự đoán một biến phụ thuộc nhị phân. Mô hình này hoạt động tốt khi
biến phụ thuộc là một biến nhị phân và các biến độc lập có thể là liên tục
hoặc phân loại.

Công thức

Mô hình hồi quy logistic sử dụng hàm logistic để biến đổi xác suất của
một sự kiện thành một hàm tuyến tính của các biến độc lập. Công thức
của nó như sau:
1
P(Y =1∣ X )= −(β 0 ​+ β 1 ​X )
1+ e

Trong đó:

 P(Y=1∣X) là xác suất của sự kiện Y=1 xảy ra, với điều kiện biến
độc lập X.
 β0 và β1 là các hệ số hồi quy cần được ước lượng từ dữ liệu.

Ưu điểm và nhược điểm

Mô hình hồi quy logistic có nhiều ưu điểm, bao gồm khả năng xử lý các
biến độc lập liên tục và phân loại, cũng như khả năng ước lượng xác suất
của một sự kiện. Tuy nhiên, nó cũng có một số nhược điểm, chẳng hạn
như giả định về mối quan hệ tuyến tính giữa logit của xác suất và các
biến độc lập, và yêu cầu một lượng lớn dữ liệu để ước lượng đúng các hệ
số hồi quy.

Ứng dụng
Mô hình hồi quy logistic được sử dụng rộng rãi trong nhiều lĩnh vực,
bao gồm y học, kinh tế, xã hội học và học máy, để dự đoán xác suất của
một sự kiện nhất định.

Cách ước lượng các hệ số hồi quy

Các hệ số hồi quy trong mô hình hồi quy logistic thường được ước
lượng bằng phương pháp maximum likelihood estimation (MLE). MLE
là một phương pháp tối ưu hóa được sử dụng để tìm các hệ số hồi quy
sao cho xác suất của dữ liệu quan sát được là lớn nhất.

Kiểm định giả thuyết trong mô hình hồi quy logistic

Có một số phương pháp kiểm định giả thuyết được sử dụng trong mô
hình hồi quy logistic, bao gồm kiểm định Wald và kiểm định likelihood
ratio. Cả hai phương pháp này đều được sử dụng để kiểm tra xem một
biến độc lập có ảnh hưởng đáng kể đến biến phụ thuộc hay không.

You might also like