Professional Documents
Culture Documents
Chuong 7 - Du Bao
Chuong 7 - Du Bao
5
I. KHÁI NIỆM, PHÂN LOẠI DỰ BÁO
1. Khái niệm
Kiểu dữ liệu
- Chuỗi thời gian: Dữ liệu được thu thập đều đặn
qua các thời điểm đơn như giờ, ngày, tuần, tháng,
quý, năm
- Dữ liệu chéo: Không xét đến yếu tố thời gian, khi
xử lý thì xem tất cả được thu thập ở cùng một thời
điểm
Nguồn thu thập
- Dữ liệu sơ cấp: Dữ liệu được thu thập lần đầu.
- Dữ liệu thứ cấp: DL được thu thập từ những
nguồn sẵn có
IV. PHƯƠNG PHÁP DỰ BÁO
Dự báo dựa trên mô hình biểu Dự báo dựa vào việc phân tích
diễn mối quan hệ giữa biến các thay đổi trong cách vận động
của dữ liệu
độc lập và biến phụ thuộc
l Dự báo thô
• Hồi quy đơn l Trung bình
• Hồi quy bội l Hàm mũ
l Phân tích dãy số thời gian
l Arima
Phương pháp hồi quy
Phương trình hồi qui tuyến 0nh đơn giản có dạng như
sau:
Y = a + bX
Trong đó:
• X: là biến số độc lập hay còn gọi là 6êu thức nguyên
nhân
• Y: là biến số phụ thuộc hay còn gọi là 6êu thức kết quả
• a, b là các thông số (hệ số của phương trình),
• a: là hệ số tung độ gốc hay nút chặn;
• b: là hệ số độ dốc hay hệ số góc.
Phương pháp hồi qui đơn biến
å X Y - n. X .Y
i i
b= i =1
( )
n
åX
2
i
2
- n. X
i =1
a = Y - b. X
Phương pháp hồi qui đơn biến
i - X Yi - Y
b= i =1
å (X )
n
2
i -X
i =1
• Sau khi đã xác định được các thông số theo công thức trên,
ta đưa về công thức dự đoán, trong đó Y là mục tiêu dự đoán,
tương ứng với X biến động.
• Công thức dự đoán:
Ŷ = a + bXi
• Lưu ý: Khi sử dụng công thức dự đoán này ta phải chú ý tới
phạm vi biến động của X. Công thức này có độ chính xác
cao khi X biến động trong một phạm vi nhất định. Khi X
vượt khỏi phạm vi này thì sai số của dự đoán sẽ tăng cao.
Phương pháp hồi qui bội
• Phân 0ch hồi qui bội, còn gọi là phương pháp hồi
qui đa biến, là sự mở rộng của mô hình phân 0ch
hồi qui đơn, nó cho phép ta thành lập một mô hình
có nhiều biến số độc lập tác động ảnh hưởng đến 1
biến số phụ thuộc.
• Phương trình hồi qui bội có dạng tuyến 0nh có thể
tổng quát như sau:
• Trong đó:
• Y: là biến số phụ thuộc (chỉ 6êu nghiên cứu) cần dự đoán
• X1, X2 .... ,Xn: là các biến số độc lập (các nhân tố ảnh hưởng)
• b1, b2, ... ,bn: là các hệ số của các biến số độc lập,
• a: là phần cố định hay còn gọi là tung độ góc.
• Do công việc xây dựng công thức và ^nh toán hàm hồi qui bội
tương đối phức tạp, bên cạnh đó với sự phát triển mạnh mẽ của
công nghiệp máy ^nh và các phần mềm bảng ^nh điện tử, nên
hiện nay chúng ta thường dùng máy ^nh để xử lý các bài toán
phân ^ch hồi qui này.
Phương pháp hồi qui
Y 1270 1490 1060 1626 1020 1800 1610 1280 1390 1440 1590 1380
X 100 106 60 160 70 170 140 120 116 120 140 150
Để có thể ước lượng được doanh thu kỳ vọng của doanh nghiệp trên cơ sở chi phí
chào hàng, người ta xây dựng hàm hồi qui tuyến tính Y theo X. Có thể lập bảng tính
các trị số cơ sở để tính toán thống kê. Sau đó áp dụng công thức (*) để xác định giá
trị của các tham số a, b và lập nên hàm hồi qui để ước lượng giá trị của Y theo X.
Ví dụ: dự báo
(X - X )
N Xi Yi XiYi X i2 Xi - X Yi - Y
i
´ (Y - Y )
(X i -X )
2
(Y
i -Y )
2
Tính giá trị trung bình của các biến số X, Y với 12 quan sát:
X = 1.452 = 121
12
Y = 16.956 = 1.413
12
Theo số liệu đã cho ở ví dụ trên và bảng tính trị số cơ sở, ta tính được hệ số tương quan R:
77.064
R= = 0,8968
12.500 ´ 590.748
Như vậy, cường độ tương quan tuyến tính giữa 2 biến số X và Y trong ví dụ là rất mạnh
Ví dụ: dự báo
Thay các trị số đã tính toán được trong bảng vào công thức (*), ta tính được:
åX Y
i =1
i i - n. X .Y
2128740 - 12.121.1413
b= = = 6,16
( ) 188192 - 12.(121) 2
n
åX
2
i
2
- n. X
i =1
Y = 667,02 + 6,16X
Dự báo trên máy tính:
• Cách thức tiến hành như sau: trước hết, nhập dữ liệu Y, X vào bảng tính
EXCEL theo dạng cột. Sau đó dùng công cụ Data Analysis để tính toán, cụ thể:
click chuột vào mục Tools à Data Analysis à Regression
• Trong hộp thoại Regression, thực hiện các thao tác sau:
• Click vào khung Input Y range, nhập địa chỉ khối chữa dữ liệu Y (doanh thu).
• Click vào khung Input X range, nhập địa chỉ khối chữa dữ liệu X (Chi phí
chào hàng).
Regression Statistics
Multiple R 0,89679961
R Square 0,80424954
Adjusted R Square 0,78467449
Standard Error 107,535665
Observations 12
ANOVA
df SS MS F Significance F
Regression 1 475108,8077 475108,81 41,08545 7,73E-05
Residual 10 115639,1923 11563,919
Total 11 590748
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,89679961
R Square 0,80424954
Adjusted R Square 0,78467449
Standard Error 107,535665
Observations 12
ANOVA
df SS MS F Significance F
Regression 1 475108,8077 475108,81 41,08545 7,73E-05
Residual 10 115639,1923 11563,919
Total 11 590748