Professional Documents
Culture Documents
C02 6 PhanTichHoiQuyTuyenTinh
C02 6 PhanTichHoiQuyTuyenTinh
C02 6 PhanTichHoiQuyTuyenTinh
1. Đặt vấn đề
2. Giới thiệu
3. Một số khái niệm cần chú ý
4. Phương trình hồi quy tuyến tính đơn giản
5. Phương trình hồi quy tuyến tính bội
6. Ước lượng các hệ số hồi quy
14/10/2023 2
Giới thiệu phân tích hồi quy
Phân tích hồi quy là một phương pháp đơn giản về mặt khái niệm để
nghiên cứu các mối quan hệ giữa các biến.
Mối quan hệ được thể hiện dưới dạng một phương trình hoặc mô
hình kết nối biến phản hồi (response) hoặc biến phụ thuộc
(dependent) và một hoặc nhiều biến giải thích (explanatory) hoặc dự
đoán (predictor)
Mô hình hồi quy
3
Giới thiệu phân tích hồi quy
Ví dụ về mô hình hồi quy tuyến tính:
4
Các bước trong phân tích hồi quy
5
GIỚI THIỆU HỒI QUY TUYẾN TÍNH
Hồi quy tuyến tính đơn giản cố gắng vẽ một đồ thị đường giữa hai biến dữ liệu, x và y. Là biến
độc lập, x được vẽ dọc theo trục hoành. Các biến độc lập còn được gọi là biến giải thích hoặc
biến dự báo. Biến phụ thuộc, y, được vẽ trên trục tung.
Các bước trong hồi quy tuyến tính
Để có cái nhìn tổng quan, hãy xem xét dạng đơn giản nhất của phương trình đồ thị đường giữa y
và x; y=c*x+m, trong đó c và m là hằng số cho tất cả các giá trị có thể có của x và y. Vì vậy, chẳng
hạn giả sử rằng tập dữ liệu đầu vào cho (x,y) là (1,5), (2,8), và (3,11). Để xác định phương pháp
hồi quy tuyến tính, bạn sẽ thực hiện các bước sau:
1. Vẽ một đường thẳng và đo lường mối tương quan giữa 1 và 5.
2. Tiếp tục thay đổi hướng của đường thẳng cho các giá trị mới (2,8) và (3,11) cho đến khi tất cả
các giá trị đều phù hợp.
3. Xác định phương trình hồi quy tuyến tính là y=3*x+2.
4. Ngoại suy hoặc dự đoán y là 14 khi x là
Ví dụ
Điều tra thu nhập và chi tiêu của người lao
động tại địa phương như bên dưới. Hãy cho
biết mối liên hệ chi tiêu dựa theo thu nhập
hàng tháng
Thu nhập (USD) 80 100 120 140 160 180 200 220 240 260
Chi tiêu (USD) 61 79 90 100 115 125 139 150 160 175
Nếu f là hàm một biến thì ta gọi là hàm hồi quy tuyến tính đơn giản,
nếu f là hàm nhiều biến thì ta gọi là hàm hồi quy tuyến tính bội.
X, Y được gọi là biến, trong đó:
X được gọi là biến giải thích
Y được gọi là biến phụ thuộc
10
Covariance và Correlation Coefficient
11
Covariance và Correlation Coefficient
Hiệp phương sai và hệ số tương quan
X tăng Y cũng tăng: các điểm nằm ở vùng thứ 1 và thứ 3.
X tăng Y giảm: các điểm nằm ở vùng thứ 2 và thứ 4.
12
Covariance và Correlation Coefficient
Hiệp phương sai và hệ số tương quan
Covariance giữa Y và X thể hiện hướng của mối quan hệ tuyến tính giữa Y
và X.
Cov(Y, X) không cho ta biết độ mạnh của mối quan hệ giữa Y và X
Cor(Y,X): cho ta biết hướng và độ mạnh mối quan hệ giữa X và Y
13
Covariance và Correlation Coefficient
Ví dụ: dữ liệu sửa chữa máy tính
Ví dụ: xem xét trường hợp của một công ty tiếp thị và sửa chữa
máy tính nhỏ.
Để nghiên cứu mối quan hệ giữa thời gian của một cuộc gọi đến dịch
vụ và số lượng linh kiện điện tử trong máy tính phải được sửa chữa
hoặc thay thế, dữ liệu mẫu của các cuộc gọi đến được lưu lại như
sau:
15
Ví dụ: dữ liệu sửa chữa máy tính
Dữ liệu bao gồm thời gian của cuộc gọi tính bằng phút (biến
response) và số lượng linh kiện sửa chữa (biến predictor)
16
Ví dụ: dữ liệu sửa chữa máy tính
There is a
strong
positive
relationship
between
repair time
and units
repaired
17
Ví dụ: dữ liệu sửa chữa máy tính
Mối quan hệ giữa biến phản hồi Y và biến dự đoán X được quy
định bởi mô hình tuyến tính:
Trong đó β0 và β1: hệ số tương quan hồi quy của mô hình hay còn
gọi là các tham số.
Dependent variable
: random disturbance or error
Β1: slope
Β0: intercept
(y)
Independent variable (x) 21
Hồi quy tuyến tính đơn biến
Đường hồi quy là được xác nhận nếu các điều kiện giả định cho bài toán hồi
quy được thỏa mãn
Kiểm định giả thuyết
Kiểm định giả thuyết về tham số hồi quy β0 ,β1.
Kiểm định giả thuyết β0= 0 (không có mối quan hệ tuyến
tính nào giữa Y và X): dùng scatter plot.
Kiểm định giả thuyết
hoặc
Kiểm định giả thuyết
Ví dụ: giả sử rằng ban quản lý dự kiến việc tăng thời gian phục vụ cho mỗi
đơn vị bổ sung sẽ được sửa chữa là 12 phút.
Thực hiện kiểm định sau:
H0: β1= 12
H1: β1# 12
t(n-2, /2)= t(12, 0.025)=2.18
(xem bảng sau)
Thời gian gia tăng cần thiết cho mỗi đơn vị linh kiện bị hỏng
là từ 14 đến 17 phút.
Dự đoán
Phương trình hồi quy đơn giản có thể được sử dụng để dự đoán
giá trị của biến phản hồi (response) bằng các giá trị cụ thể của
biến dự đoán (predictor)
Giá trị dự đoán là tương ứng với x0 theo công thức sau:
66.2 2.18*5.67
Phương trình hồi quy tuyến tính bội
Hệ số xác định đã điều chỉnh R2 (adjusted
– R2)
TÍNH CHẤT
Kiểm định ý nghĩa thống kê của mô hình
Phân tích phương sai hồi quy (Kiểm định F): Mục tiêu là kiểm định giả thuyết
về sự tồn tại của mối liên hệ tuyến tính giữa X và Y.
Kiểm định các giả thuyết của mô hình
Kiểm định t: Mục đích là xem xét giả thuyết về sự tồn tại của mối liên hệ
tuyến tính giữa biến Xi và Y.
Ước lượng các hệ số hồi quy
Kiểm định phần dư phân phối chuẩn
Jarque-Bera
Kiểm định JB sẽ xem xét hệ số bất đối xứng
(skewness = 0 là đối xứng, nếu > 0 hoặc < 0 là lệch
phải, lệch trái) và hệ số nhọn (kurtosis = 3 là cân, > 3
hoặc < 3 là tù hay nhọn).
Cặp giả thuyết với mức ý nghĩa 5%
Ho: Phân phối là chuẩn (skewness = 0, kurtosis = 3)
H1: Phân phối là không chuẩn (skewness # 0, kurtosis
# 3)
P-value > 5% bác bỏ Ho.
Ví dụ
Số liệu về doanh thu, khoản phải thu và lợi nhuận của một công ty trong
5 năm được cho trong bảng sau (ĐVT: triệu đồng)
Bài tập
Có số liệu về sản lượng sản xuất và giá thành đơn vị sản phẩm bình gốm của DN X qua
các tháng như sau:
Yêu cầu:
◦ Tính hệ số tương quan tuyến tính ?
◦ Viết pt hồi quy tuyến tính, giải thích ý nghĩa của hệ số góc của pt.
◦ Hệ số góc của pt hồi quy có ý nghĩa thống kê hay không? (chọn mức ý nghĩa 5%)
◦ Nếu trong một tháng DN sản xuất 150.000 bình, thì giá thành đơn vị sản phẩm của công ty có
thể đạt là bao nhiêu?
14/10/2023 44