Professional Documents
Culture Documents
Thkudktkd c7 Chuoi Thoi Gian
Thkudktkd c7 Chuoi Thoi Gian
CHƯƠNG 7
Mục lục chương 7
7.1 Chuỗi thời gian, các khái niệm cơ bản ........................................................... 114
7.2 Các phương pháp dự báo đơn giản ............................................................... 118
7.3 Các phương pháp làm trơn ........................................................................... 119
Biểu diễn cho dữ liệu được sắp xếp theo thứ tự thời gian, dạng tổng quát như sau
t t1 t2 … tn
Y Y1 Y2 … Yn
Trong đó : t i là thời gian thứ i và Yi là giá trị lượng biếnquan sát được ở thời gian t i . i 1; n
Căn cứ vào đặc điểm biến động về quy mô của hiện tượng thời gian, chuỗi thời gian được chia ra
làm hai trường hợp
Chuỗi thời kỳ : biểu hiện giá trị lượng biến quan sát thu được trong từng khoảng thời gian
nhất định. Các giá trị của lượng biến có thế cộng dồn với nhau tạo thành giá trị của lượng
biến trong khoảng thời gian dài hơn.
Ví dụ 7.1 Sản lượng xuất khẩu cà phê của Việt Nam từ 2001 đến 2005:
Năm 2001 2002 2003 2004 2005
Sản lượng (ngàn tấn) 931,1 722,2 794,4 976,2 892,4
Chuỗi thời điểm : biểu hiện giá trị lượng biến quan sát tại các thời điểm quan sát nhất định,
và giá trị của lượng biến khi cộng dồn thì không có ý nghĩa.
Ví dụ 7.2 Giá vàng SJC tại TPHCM trong tuần cuối tháng 7 năm 2017:
Ngày 23/7 24/7 25/7 26/7 27/7 28/7
Ngàn đồng/chỉ 1317,0 1316,5 1310,0 1307,5 1294,0 1294,0
Các phương pháp dự báo chuỗi thời gian được chia thành hai loại:
Phương pháp dự báo, tính toán cho các giá trị tương lai dựa trên toàn bộ các quan sát có
được trong quá khứ.
Phương pháp dự báo dựa trên nguyên nhân kết quả của các dữ liệu.
CHƯƠNG 7: CHUỖI THỜI GIAN; DỰ BÁO CHUỖI THỜI GIAN 115
Ví dụ 7.3 Cho bảng số liệu về số lượng tủ lạnh một chuỗi siêu thị điện máy bán trong 8 năm, số
liệu khảo sát theo từng quý (đơn vị : ngàn cái).
Q1-2005 Q2-2005 Q3-2005 Q4-2005 Q1-2006 Q2-2006 Q3-2006 Q4-2006 Q1-2007
1317 1615 1662 1295 1271 1555 1639 1238 1277
Q2-2007 Q3-2007 Q4-2007 Q1-2008 Q2-2008 Q3-2008 Q4-2008 Q1-2009 Q2-2009
1258 1417 1185 1196 1410 1417 919 943 1175
Q3-2009 Q4-2009 Q1-2010 Q2-2010 Q3-2010 Q4-2010 Q1-2011 Q2-2011 Q3-2011
1269 973 1102 1344 1641 1225 1429 1699 1749
Q4-2011 Q1-2012 Q2-2012 Q3-2012 Q4-2012
1117 1242 1684 1764 1328
1800 Q3-2011 Q3-2012
Q2-2011 Q2-2012
Q3-2005 Q3-2006 Q3-2010
1700 Q2-2005
1600 Q2-2006
1500 Q3-2007Q2-2008
Q3-2008 Q1-2011
1400 Q1-2005 Q2-2010 Q4-2012
Q4-2005
Q1-2006 Q1-2007
Q2-2007 Q3-2009
1300 Q4-2006 Q4-2010 Q1-2012
Q1-2008
Q4-2007 Q2-2009
1200 Q4-2011
Q1-2010
1100
Q4-2009
1000 Q1-2009
Q4-2008
900
800
0 5 10 15 20 25 30 35
116
Biểu đồ trên cho thấy số lượng tủ lạnh bán được tăng giảm đều đặn, điều này thể hiện biến động
theo mùa, cụ thể trong 1 năm số lượng tủ lạnh tăng mạnh từ quý 1 lên quý 2 và giảm mạnh từ quý
3 xuống quý 4.
1 Y i
Y Y1 Y2 ... Yn i 1
n n
Trong đó : Y : mức độ trung bình của chuỗi.
Yi : Giá trị lượng biến chuỗi thời kỳ
Trung bình chuỗi thời gian, đối với chuỗi thời điểm, khoảng cách giữa thời điểm bằng nhau:
1 Y1 Y2 Y2 Y3 Y Y 1 1 1
Y ... n1 n Y1 Y2 ... Yn
n1 2 2 2 n1 2 2
Trong đó : Y : mức độ trung bình của chuỗi.
Yi : Giá trị lượng biến chuỗi thời kỳ
Ví dụ 7.4 Khảo sát lượng lao động của một doanh nghiệp tại các thời điểm thu được bảng số liệu
sau:
Vậy trung bình lượng lao động trong khoảng thời gian 3 tháng là:
Vậy trung bình doanh nghiệp này có bình quân 369 lao động từ 15/5 đến 15/8.
Trung bình chuỗi thời gian, đối với chuỗi thời điểm, khoảng cách giữa thời điểm không bằng nhau:
n
Đầu tháng 5 : có 380 lao động. Ngày 10/5 nhận thêm 5 lao động, tối 15/5 nhận thêm 3 lao động.
Ngày 21/5 sa thải 4 lao động, và giữ nguyên cho đến 30/5.
Y t
i 1
i i
11513
Vậy số lao động trung bình trong tháng là : Y n
383,77 (người)
30
t
i 1
i
1 n 1 Y Y
i n 1 Y2 Y1 Y3 Y2 ... Yn Yn 1 nn 11
n 1 i 2
Lưu ý : đại lượng này chỉ có ý nghĩa thống kê khi lượng tăng (giảm) tuyệt đối liên hoàn xấp xỉ nhau,
nếu không vô tình lượng tăng giảm tuyệt đối sẽ đánh giá sai nguyên nhân gây ra sự biến động của
chuỗi thời gian.
Yi
ti
Yi 1
i 2, n
Tốc độ phát triển định gốc : thể hiện tốc độ thay đổi của lượng biến ở mốc thời gian bất kỳ so với
lượng biến quan sát chọn làm gốc (thường được chọn là lượng biến quan sát đầu tiên)
Yi
Ti
Y1
i 2, n
Tốc độ phát triển trung bình : thể hiện nhịp độ phát triển bình quân giữa 2 lượng biến quan sát
liên tiếp nhau trong suốt thời gian, được tính bằng trung bình nhân của tất cả tốc độ phát triển
liên hoàn.
118
n
Y2 Y3 Yn Y
t n 1 t i n 1 . ... n 1 n
i 2 Y1 Y2 Yn1 Y1
Lưu ý : Cũng giống như lượng tăng giảm tuyệt đối trung bình, tốc độ phát triển trung bình chỉ
mang ý nghĩa khi các tốc độ phát triển liên hoàn xấp xỉ nhau trong suốt thời kỳ nghiên cứu.
Yi Yi 1 i
ai
Yi 1
t 1
Yi 1 i
i 2,n
Tốc độ tăng giảm định gốc : đánh giá tốc độ thay đổi tương đối của một lượng biến ở một mốc thời
gian bất kỳ so với lượng biến quan sát chọn làm gốc (thường được chọn là lượng biến quan sát
đầu tiên)
Yi Y1 i
Ai
Y1
Yi
Ti 1 i 2,n
Tốc độ tăng giảm trung bình :
a t 1
Ví dụ 7.6 Cho doanh thu của một công ty qua các năm (từ 2012 đến 2017) theo bảng số liệu dưới
đây.:
Y n L Yn .L
Trong đó : Y n L : là giá trị dự báo tại thời điểm n L .
CHƯƠNG 7: CHUỖI THỜI GIAN; DỰ BÁO CHUỖI THỜI GIAN 119
Yn : là giá trị quan sát tại thời điểm thứ n (thời điểm cuối)
: là lượng tăng giảm tuyệt đối trung bình.
L : tầm xa dự đoán.
Ví dụ 7.7 Quan sát lượng xe đạp của một doanh nghiệp Yi (đơn vị nghìn chiếc) bán qua các
năm t i cho bởi bảng số liệu sau:
Yi 1 2 3 4 5 6 7 8 9 10
ti 21.6 22.9 25.5 21.9 23.9 27.5 31.5 29.7 28.6 31.4
Dự báo cho lượng xe đạp mà doanh nghiệp sẽ bán được trong năm tiếp theo là
Y Y 31,4 21,6
Y 11 Y10 .1 Y10 10 1 .1 31,4 32,48 (nghìn chiếc)
9 9
Hoặc dự báo cho cách 2 năm sau:
Y Y 31,4 21,6
Y 12 Y10 .2 Y10 10 1 .2 31,4 .2 33,57 (nghìn chiếc)
9 9
7.2.2 Dự báo bằng tốc độ phát triển trung bình.
Phương pháp thường dùng khi dãy lượng biến theo thời gian biến động với nhịp độ ổn định, nghĩa
là tốc độ phát triển liên hoàn xấp xỉ bằng nhau
L
Y n L Yn . t
Trong đó : Y n L : là giá trị dự báo tại thời điểm n L .
Yn : là giá trị quan sát tại thời điểm thứ n (thời điểm cuối)
t : là tốc độ phát triển trung bình.
L : tầm xa dự đoán.
Ví dụ 7.8 Quan sát lượng xe đạp của một doanh nghiệp Yi (đơn vị nghìn chiếc) bán qua các
năm t i cho bởi bảng số liệu sau:
Yi 1 2 3 4 5 6 7 8 9 10
ti 21.6 22.9 25.5 21.9 23.9 27.5 31.5 29.7 28.6 31.4
Dự báo cho lượng xe đạp mà doanh nghiệp sẽ bán được trong năm tiếp theo là
1 31,4
Y 11 Y10 t
31,4 9 32,7328 (nghìn chiếc)
21,6
Hoặc dự báo cho cách 2 năm sau:
2
2 31,4
Y 12 Y10 t
31,4 9 34,1221 (nghìn chiếc)
21,6
Lưu ý : Nhược điểm của phương pháp dự báo đơn giản là chỉ quan tâm tới giá trị quan sát kỳ đầu
và kỳ cuối để đưa ra dự báo mới nhất, và như vậy vô tình đã bỏ qua các biến động bất thường của
các dữ liệu ở giữa nên nếu dữ liệu có nhiều biến động thì phương pháp dự báo đơn giản có độ
chính xác thấp.
Khác với dự báo lượng tăng giảm tuyệt đối và tốc độ phát triển trung bình là dùng số liệu mới nhất
để dự báo cho mốc thời gian kê tiếp. Phương pháp trung bình trượt sẽ dùng nhiều hơn 3 số liệu
mới nhất để dự báo.
Y Y ... Yi k 1
Y i 1 i i 1
k
Trong đó : Y i 1 : là giá trị dự báo tại thời điểm t 1 .
Yi ;Yi 1 ;...;Yi k 1 : là k giá trị quan sát thực tế tới thời điểm t .
k : khoảng trượt k 3 .
Ưu điểm của phương pháp thể hiện rõ khi dữ liệu chuỗi thời gian có sự biến động nhiều, khi đó
trung bình trượt sẽ bình quân những nguyên nhân gây ra dao động bất thường của dữ liệu, để đưa
về quy luật biến động chung nhất của dữ liệu.
Khoảng trượt k là yếu tố ảnh hưởng rất lớn đến sai số dự báo, nên k được chọn sao cho thỏa
mãn các tiêu chí sai số tốt nhất. Với Y và Y lần lượt là giá trị quan sát thực tế và giá trị dự báo
i i
tại thời điểm i và ei Yi Yi là sai số tại mỗi thời điểm, ta có các tiêu chí đánh giá sai số:
1 n
MAE ei : sai số tuyệt đối trung bình (Mean Absolute Error)
n i 1
1 n ei
MAPE .100% : sai số phần trăm tuyệt đối trung bình (Mean Absolute Percent
n i 1 Yi
Error)
1 n 2
MSE ei : sai số bình phương trung bình (Mean Square Error)
n i 1
RMSE MSE : căn bậc hai sai số bình phương trung bình (Root Mean Square Error)
Về mặt thực tế RMSE và MAE có cung đơn vị với đơn vị lượng biến, nhưng RMSE thông dụng hơn
vì về mặt công thức thì RMSE dễ xử lý hơn.
Ví dụ 7.9 Cho một chuỗi thời gian với lượng biến quan sát là Yi trong 12 tuần, bảng sau đưa ra
dự báo bằng phương pháp trung bình trượt với khoảng trượt k 3 và k 5 ;
2 2
Tuần Yi Yi ; k 3 Y Y
i i Yi ; k 5 Y Y
i i
1 17
2 21
3 19
4 23 19 16
5 18 21 9
6 16 20 16 19.6 12.96
7 20 19 1 19.4 0.36
8 18 18 0 19.2 1.44
9 22 18 16 19 9
10 20 20 0 18.8 1.44
11 15 20 25 19.2 17.64
12 22 19 9 19 9
MSE 10,22 MSE 7,45
CHƯƠNG 7: CHUỖI THỜI GIAN; DỰ BÁO CHUỖI THỜI GIAN 121
Vì tiêu chuẩn MSEk 3 10,22 và MSEk 5 7,45 nên trong tình huống này , ta sẽ chọn khoảng trượt
k 5.
24
23
22
21
20
Dữ liệu
quan sát 19
K=3
18
k=5 17
16
15
14
-1 1 3 5 7 9 11 13
Y i 1 Y i Yi Y i
Trong đó : Y i 1 ;Y i : là giá trị dự báo tại thời điểm i ; i 1 .
Yi : là giá trị quan sát thực tế tại thời điểm i .
: là hệ số làm trơn.
Lưu ý : Hệ số làm trơn nhận giá trị 0;1
Một dạng khai triển khác của phương pháp san bằng mũ
Y i 1 1 Y i Y i
i 1 Y1 Y1
i 2 Y 2 1 Y 1 Y1 Y1
Y 4 1 Y 3 Y3 1 Y1 1 Y2 Y3
2
i 4
Y 5 1 Y 4 Y4 1 Y1 1 Y2 1 Y3 Y4
3 2
i 5
Nên phương pháp san bằng mũ có thể xem là tương đương với phương pháp trung bình trượt có
trọng số.
Về mặt ý nghĩa giá trị dự báo mới Y bằng giá trị dự báo cũ Y cộng thêm một lượng điều
i 1
i
Khi 0 thì dự báo mới cộng một lượng điều chỉnh tối thiểu, và ta chỉ nên chọn 0
khi dữ liệu quan sát thực tế có nhiều thay đổi bất thường.
Và cũng giống như phương pháp trung bình trượt, để lựa chọn hệ số làm trơn tốt nhất, ta có thể
dựa trên các tiêu chí đánh giá sai số.
Ví dụ 7.10 Sử dụng bảng số liệu của Ví dụ 7.9
2 2
Tuần Yi 0.2 Y Y
i i
0.3 Y Y
i i
1 17 17 0 17 0
2 21 17 16 18.2 7.84
3 19 17.8 1.44 18.16 0.7056
4 23 18.04 24.6016 19.528 12.05478
5 18 19.032 1.065024 18.7224 0.521862
6 16 18.8256 7.984015 17.97792 3.912168
7 20 18.26048 3.02593 18.78234 1.482706
8 18 18.60838 0.370131 18.42587 0.181364
9 22 18.48671 12.34323 19.5407 6.048181
10 20 19.18937 0.657128 19.43256 0.321993
11 15 19.35149 18.93549 18.04604 9.278389
12 22 18.48119 12.382 19.53684 6.067178
MSE 9.98 MSE 4.40
Do MSE 0,2 MSE 0,3 nên ta sẽ dùng 0,3 để làm trơn và dự báo.
23
22
21
20
Quan sát
19
thực tế
18 alpha=0.2
17
alpha=0.3
16
15
14
0 2 4 6 8 10 12 14
Yi
t
1 2 i
Thực tế về mặt giá trị, thì giá trị lượng biến quan sát thực tế Yi và giá trị dự báo bằng mô hình
Y sẽ không trùng nhau tại tất cả các mốc quan sát, mà hai đại lượng này sẽ có sự chênh lệch là
i
sai số ei với i 1,n .
ei Yi Yi
Bản chất sai số ei là do về mặt thực tế có rất nhiều yếu tố ảnh hưởng đến sự biến động của lượng
biến quan sát Yi , nhưng trong mô hình thì ta chỉ chọn đại diện để giải thích cho sự biến động
này là thời gian t i .
Hệ số hồi quy 1 ; 2 trong mô hình được xác định bằng phương pháp bình phương tối thiểu (OSL:
ordianary squared least). Nguyên tắc của phương pháp bình phương tối thiểu là tổng bình phương
sai số tại tất cả quan sát phải đạt giá trị nhỏ nhất.
n
E 1 ;
e 2 Min
2 i
i 1
Hàm E 1 ;
là một mặt bậc hai, do đó giá trị nhỏ nhất của hàm xảy ra tại điểm tới hạn thỏa :
2
n
E ˆ ˆ n ˆ ˆ
n
1 i 1
ˆ 2 Yi 1 2t i 0
t i 2 n 1 Yi
i 1 i 1
n
E 2 t Y ˆ ˆ t 0
n n n
t 2 ˆ t ˆ t Y
ˆ i i 1
2 i i
i 1 2 i
i 1
1
i 1
i i
2 i 1
n
t iYi ntY
ˆ
2 ni 1
t i 2 nt .
2
i 1
1 Y ˆ2 t
ˆ
Vậy các hệ số trong hàm xu thế tuyến tính được ước lượng theo công thức:
124
t Y ntYi i
ˆ2 i 1
n
và ˆ1 Y ˆ2 t
2 2
t
i 1
i nt
Ví dụ 7.11 Một khảo sát về mối quan hệ giữa lượng xe đạp ( Yi nghìn chiếc) của một cửa hàng bán
được theo từng năm thu được bảng số liệu sau
t Y Yi t i t i2
1 21.6 21.6 1
2 22.9 45.8 4
3 25.5 76.5 9
4 21.9 87.6 16
5 23.9 119.5 25
6 27.5 165 36
7 31.5 220.5 49
8 29.7 237.6 64
9 28.6 257.4 81
10 31.4 314 100
t i 55 Y i 264,5 tiYi 1545,5 t i2 385
34
32
y = 1.1x + 20.4
30
28
26
24
22
20
0 2 4 6 8 10 12
t Y ntY
i i
1545,5 10.5,5.26,45
Hệ số góc : 2 i 1
n
1,1
2 2 385 10.5,52
t
i 1
i nt
Nghĩa là qua một năm, trung bình lượng xe đạp của cửa hàng này bán tăng trung bình 1,1 ngàn
chiếc.
2
ti Yi Yi Y Y
i i