Download as pdf or txt
Download as pdf or txt
You are on page 1of 12

114

CHƯƠNG 7
Mục lục chương 7

7.1 Chuỗi thời gian, các khái niệm cơ bản ........................................................... 114
7.2 Các phương pháp dự báo đơn giản ............................................................... 118
7.3 Các phương pháp làm trơn ........................................................................... 119

7.1 CHUỖI THỜI GIAN, CÁC KHÁI NIỆM CƠ BẢN

7.1.1 Khái niệm chuỗi thời gian.


Chuỗi thời gian là tập hợp các dữ liệu có sự phụ thuộc của các giá trị quan sát được thu thập qua
thời gian. Với mục tiêu là dùng các dữ liệu trong quá khứ để phân tích và dự báo cho dữ liệu trong
tương lai.

Biểu diễn cho dữ liệu được sắp xếp theo thứ tự thời gian, dạng tổng quát như sau
t t1 t2 … tn
Y Y1 Y2 … Yn
Trong đó : t i là thời gian thứ i và Yi là giá trị lượng biếnquan sát được ở thời gian t i . i  1; n  
Căn cứ vào đặc điểm biến động về quy mô của hiện tượng thời gian, chuỗi thời gian được chia ra
làm hai trường hợp
 Chuỗi thời kỳ : biểu hiện giá trị lượng biến quan sát thu được trong từng khoảng thời gian
nhất định. Các giá trị của lượng biến có thế cộng dồn với nhau tạo thành giá trị của lượng
biến trong khoảng thời gian dài hơn.
Ví dụ 7.1 Sản lượng xuất khẩu cà phê của Việt Nam từ 2001 đến 2005:
Năm 2001 2002 2003 2004 2005
Sản lượng (ngàn tấn) 931,1 722,2 794,4 976,2 892,4
 Chuỗi thời điểm : biểu hiện giá trị lượng biến quan sát tại các thời điểm quan sát nhất định,
và giá trị của lượng biến khi cộng dồn thì không có ý nghĩa.
Ví dụ 7.2 Giá vàng SJC tại TPHCM trong tuần cuối tháng 7 năm 2017:
Ngày 23/7 24/7 25/7 26/7 27/7 28/7
Ngàn đồng/chỉ 1317,0 1316,5 1310,0 1307,5 1294,0 1294,0

Các phương pháp dự báo chuỗi thời gian được chia thành hai loại:
 Phương pháp dự báo, tính toán cho các giá trị tương lai dựa trên toàn bộ các quan sát có
được trong quá khứ.
 Phương pháp dự báo dựa trên nguyên nhân kết quả của các dữ liệu.
CHƯƠNG 7: CHUỖI THỜI GIAN; DỰ BÁO CHUỖI THỜI GIAN 115

7.1.2 Các thành phần chuỗi thời gian.


i. Thành phần xu hướng.
Thành phần xu hướng là thành phần thể hiện mức tăng giảm của lượng biến quan sát theo một
quy luật nào đó trong một khoảng thời gian đủ dài. Nguyên nhân của thành phần xu hướng là do
những thay đổi về dân số, thay đổi về xã hội, thay đổi về công nghệ, thay đổi về nhu cầu, sở thích…

ii. Thành phần chu kỳ.


Mặc dù chuỗi thời gian có thể biểu hiện tính xu hướng qua thời kỳ dài, nhưng không phải tất cả
các giá trị lượng biến sẽ quan sát trong tương lai sẽ nằm trên đường xu hướng. Thực tế dữ liệu
khi quan sát trong một khoảng thời gian dài với tần suất tính bằng năm thì ta nhận ra có sự thay
đổi luân phiên lên xuống của lượng biến xung quanh đường xu hướng, nguyên nhân là do thành
phần chu kỳ trong chuỗi thời gian.

iii. Thành phần mùa.


Trong khi thành phần xu hướng và thành phần chu lỳ của chuỗi thời gian được xác định bằng cách
phân tích chuỗi thời gian kéo dài qua nhiều năm, thì nhiều chuỗi thời gian cho thấy có những kiểu
biến thiên lặp lại theo tần suất theo quý , theo mùa,…, biến động của lượng biến tuân theo một quy
luật nào đó giữa các thời điểm trong năm và lặp lại trong các năm kế tiếp

iv. Thành phần bất thường.


Ngoài các yếu tố xu hướng , chu kỳ, và mùa, thực tế giá trị lượng biến quan sát còn chịu sự chi phối
của các yếu tố ngẫu nhiên, các yếu tố bất thường ngắn hạn không chịu sự liên kết với thành phần
khác như mùa, chu kỳ, xu thế.

Ví dụ 7.3 Cho bảng số liệu về số lượng tủ lạnh một chuỗi siêu thị điện máy bán trong 8 năm, số
liệu khảo sát theo từng quý (đơn vị : ngàn cái).
Q1-2005 Q2-2005 Q3-2005 Q4-2005 Q1-2006 Q2-2006 Q3-2006 Q4-2006 Q1-2007
1317 1615 1662 1295 1271 1555 1639 1238 1277
Q2-2007 Q3-2007 Q4-2007 Q1-2008 Q2-2008 Q3-2008 Q4-2008 Q1-2009 Q2-2009
1258 1417 1185 1196 1410 1417 919 943 1175
Q3-2009 Q4-2009 Q1-2010 Q2-2010 Q3-2010 Q4-2010 Q1-2011 Q2-2011 Q3-2011
1269 973 1102 1344 1641 1225 1429 1699 1749
Q4-2011 Q1-2012 Q2-2012 Q3-2012 Q4-2012
1117 1242 1684 1764 1328
1800 Q3-2011 Q3-2012
Q2-2011 Q2-2012
Q3-2005 Q3-2006 Q3-2010
1700 Q2-2005
1600 Q2-2006

1500 Q3-2007Q2-2008
Q3-2008 Q1-2011
1400 Q1-2005 Q2-2010 Q4-2012
Q4-2005
Q1-2006 Q1-2007
Q2-2007 Q3-2009
1300 Q4-2006 Q4-2010 Q1-2012
Q1-2008
Q4-2007 Q2-2009
1200 Q4-2011
Q1-2010
1100
Q4-2009
1000 Q1-2009
Q4-2008
900

800
0 5 10 15 20 25 30 35
116

Biểu đồ trên cho thấy số lượng tủ lạnh bán được tăng giảm đều đặn, điều này thể hiện biến động
theo mùa, cụ thể trong 1 năm số lượng tủ lạnh tăng mạnh từ quý 1 lên quý 2 và giảm mạnh từ quý
3 xuống quý 4.

7.1.3 Các đại lượng mô tả chuỗi thời gian.


i. Mức độ trung bình theo thời gian
Trung bình chuỗi thời gian, đối với chuỗi thời kỳ.
n

1 Y i
Y Y1  Y2  ...  Yn   i 1
n n
Trong đó : Y : mức độ trung bình của chuỗi.
Yi : Giá trị lượng biến chuỗi thời kỳ

Trung bình chuỗi thời gian, đối với chuỗi thời điểm, khoảng cách giữa thời điểm bằng nhau:
1  Y1  Y2 Y2  Y3 Y Y  1 1 1 
Y    ...  n1 n    Y1  Y2  ...  Yn 
n1  2 2 2  n1  2 2 
Trong đó : Y : mức độ trung bình của chuỗi.
Yi : Giá trị lượng biến chuỗi thời kỳ
Ví dụ 7.4 Khảo sát lượng lao động của một doanh nghiệp tại các thời điểm thu được bảng số liệu
sau:

Ngày 15/5/2018 15/6/2018 15/7/2018 15/8/2018


Số lao động 350 370 370 380
Y  Y 350  370
Giữa hai thời điểm giữa tháng 5 và 6, ta có số lao động trung bình là 1 2 
2 2
Tương tự cho các khoảng thời gian còn lại.

Vậy trung bình lượng lao động trong khoảng thời gian 3 tháng là:

1  350  370 370  370 370  380 


Y      368,33
3 2 2 2 

Vậy trung bình doanh nghiệp này có bình quân 369 lao động từ 15/5 đến 15/8.

Trung bình chuỗi thời gian, đối với chuỗi thời điểm, khoảng cách giữa thời điểm không bằng nhau:
n

Y1t 1  Y2t 2  ...  Ynt n Y t


i 1
i i
Y  n
t 1  t2  ...  t n
t
i 1
i

Trong đó : Y : mức độ trung bình của chuỗi.


Yi : Giá trị lượng biến chuỗi thời kỳ
t i : độ dài thời gian tương ứng mức độ thứ i .
Ví dụ 7.5 Ghi nhận về số lao động, ghi nhận trong tháng 5 thay đổi như sau

Ngày 1/5/2018 10/5/2018 15/5/2018 21/5/2018


Số lao động 380 385 388 384
CHƯƠNG 7: CHUỖI THỜI GIAN; DỰ BÁO CHUỖI THỜI GIAN 117

Đầu tháng 5 : có 380 lao động. Ngày 10/5 nhận thêm 5 lao động, tối 15/5 nhận thêm 3 lao động.
Ngày 21/5 sa thải 4 lao động, và giữ nguyên cho đến 30/5.

Ngày Số lao động Khoảng thời gian Yi t i


1 380 9 3420
10 385 5 1925
15 388 6 2328
21 384 10 3840
30 384 t i  30 t Y
i i  11513
n

Y t
i 1
i i
11513
Vậy số lao động trung bình trong tháng là : Y  n
  383,77 (người)
30
t
i 1
i

ii. Lượng tăng giảm tuyệt đối.


Lượng tăng giảm tuyệt đối liên hoàn: thể hiện mức chênh lệch tuyệt đối của lượng biến quan sát
ở hai mốc thời gian liên tiếp nhau.
 i  Yi  Yi 1  i  2, n
Lượng tăng giảm tuyệt đối định gốc: thể hiện mức chênh lệch tuyệt đối giữa lượng biến ở mốc thời
gian bất kỳ so với lượng biến quan sát chọn làm gốc (thường được chọn là lượng biến quan sát
đầu tiên)
 i  Yi  Y1 i  2, n
Lượng tăng giảm tuyệt đối trung bình: là trung bình cộng các lượng tăng giảm tuyệt đối liên hoàn
qua tất cả các mốc thời gian.

1 n 1 Y Y
   i  n  1 Y2  Y1  Y3  Y2  ...  Yn  Yn 1   nn  11
n  1 i 2

Lưu ý : đại lượng này chỉ có ý nghĩa thống kê khi lượng tăng (giảm) tuyệt đối liên hoàn xấp xỉ nhau,
nếu không vô tình lượng tăng giảm tuyệt đối sẽ đánh giá sai nguyên nhân gây ra sự biến động của
chuỗi thời gian.

iii. Tốc độ phát triển.


Tốc độ phát triển liên hoàn: thể hiện tốc độ thay đổi của 2 lượng biến quan sát ở hai mốc thời gian
liên tiếp nhau.

Yi
ti 
Yi 1
i  2, n
Tốc độ phát triển định gốc : thể hiện tốc độ thay đổi của lượng biến ở mốc thời gian bất kỳ so với
lượng biến quan sát chọn làm gốc (thường được chọn là lượng biến quan sát đầu tiên)

Yi
Ti 
Y1
i  2, n 
Tốc độ phát triển trung bình : thể hiện nhịp độ phát triển bình quân giữa 2 lượng biến quan sát
liên tiếp nhau trong suốt thời gian, được tính bằng trung bình nhân của tất cả tốc độ phát triển
liên hoàn.
118

n
Y2 Y3 Yn Y
t  n 1  t i  n 1 . ...  n 1 n
i 2 Y1 Y2 Yn1 Y1

Lưu ý : Cũng giống như lượng tăng giảm tuyệt đối trung bình, tốc độ phát triển trung bình chỉ
mang ý nghĩa khi các tốc độ phát triển liên hoàn xấp xỉ nhau trong suốt thời kỳ nghiên cứu.

iv. Tốc độ tăng giảm.


Tốc độ tăng giảm liên hoàn : đánh giá tốc độ thay đổi tương đối của 2 lượng biến quan sát ở hai
mốc thời gian liên tiếp nhau.

Yi  Yi 1  i
ai 
Yi 1
  t 1
Yi 1 i
 i  2,n 
Tốc độ tăng giảm định gốc : đánh giá tốc độ thay đổi tương đối của một lượng biến ở một mốc thời
gian bất kỳ so với lượng biến quan sát chọn làm gốc (thường được chọn là lượng biến quan sát
đầu tiên)

Yi  Y1  i
Ai 
Y1

Yi
 Ti  1 i  2,n 
Tốc độ tăng giảm trung bình :

a  t 1

Ví dụ 7.6 Cho doanh thu của một công ty qua các năm (từ 2012 đến 2017) theo bảng số liệu dưới
đây.:

Chỉ tiêu 2011 2012 2013 2014 2015 2016 2017


1. Doanh thu (tỷ VNĐ) 50
2. Lượng tăng tuyệt đối liên hoàn (tỷ VNĐ) 25 20
3.Tốc độ phát triển liên hoàn (%) 115 125
4.Tốc độ tăng giảm liên hoàn (%) 10
5. Giá trị tuyệt đối của 1% của tốc độ tăng
(tỷ VNĐ)
0,98

Chỉ tiêu 2011 2012 2013 2014 2015 2016 2017


1. Doanh thu (tỷ VNĐ) 50 75 82,5 94,875 98 122,5 142,5
2. Lượng tăng tuyệt đối liên hoàn (tỷ VNĐ) 25 20
3.Tốc độ phát triển liên hoàn (%) 115 125
4.Tốc độ tăng giảm liên hoàn (%) 10
5. Giá trị tuyệt đối của 1% của tốc độ tăng
0,98
(tỷ VNĐ)

7.2 CÁC PHƯƠNG PHÁP DỰ BÁO ĐƠN GIẢN

7.2.1 Dự báo bằng lượng tăng (giảm) tuyệt đối.


Phương pháp thường dụng khi dãy lượng biến theo thời gian có biến động ít, nghĩa là lượng tăng
(giảm) tuyệt đối liên hoàn xấp xỉ nhau.

Y n L  Yn   .L
Trong đó : Y n L : là giá trị dự báo tại thời điểm n  L .
CHƯƠNG 7: CHUỖI THỜI GIAN; DỰ BÁO CHUỖI THỜI GIAN 119

Yn : là giá trị quan sát tại thời điểm thứ n (thời điểm cuối)
 : là lượng tăng giảm tuyệt đối trung bình.
L : tầm xa dự đoán.
Ví dụ 7.7 Quan sát lượng xe đạp của một doanh nghiệp Yi  (đơn vị nghìn chiếc) bán qua các
năm  t i  cho bởi bảng số liệu sau:
Yi 1 2 3 4 5 6 7 8 9 10
ti 21.6 22.9 25.5 21.9 23.9 27.5 31.5 29.7 28.6 31.4
Dự báo cho lượng xe đạp mà doanh nghiệp sẽ bán được trong năm tiếp theo là
Y Y 31,4  21,6
Y 11  Y10   .1  Y10  10 1 .1  31,4   32,48 (nghìn chiếc)
9 9
Hoặc dự báo cho cách 2 năm sau:
Y Y 31,4  21,6
Y 12  Y10   .2  Y10  10 1 .2  31,4  .2  33,57 (nghìn chiếc)
9 9
7.2.2 Dự báo bằng tốc độ phát triển trung bình.
Phương pháp thường dùng khi dãy lượng biến theo thời gian biến động với nhịp độ ổn định, nghĩa
là tốc độ phát triển liên hoàn xấp xỉ bằng nhau
L
Y n  L  Yn . t

Trong đó : Y n L : là giá trị dự báo tại thời điểm n  L .
Yn : là giá trị quan sát tại thời điểm thứ n (thời điểm cuối)
t : là tốc độ phát triển trung bình.
L : tầm xa dự đoán.
Ví dụ 7.8 Quan sát lượng xe đạp của một doanh nghiệp Yi  (đơn vị nghìn chiếc) bán qua các
năm  t i  cho bởi bảng số liệu sau:
Yi 1 2 3 4 5 6 7 8 9 10
ti 21.6 22.9 25.5 21.9 23.9 27.5 31.5 29.7 28.6 31.4
Dự báo cho lượng xe đạp mà doanh nghiệp sẽ bán được trong năm tiếp theo là
1  31,4 
Y 11  Y10 t
 31,4   9  32,7328 (nghìn chiếc)
 21,6 
 
Hoặc dự báo cho cách 2 năm sau:
2
2  31,4 
Y 12  Y10 t
  31,4   9  34,1221 (nghìn chiếc)
 21,6 
 

Lưu ý : Nhược điểm của phương pháp dự báo đơn giản là chỉ quan tâm tới giá trị quan sát kỳ đầu
và kỳ cuối để đưa ra dự báo mới nhất, và như vậy vô tình đã bỏ qua các biến động bất thường của
các dữ liệu ở giữa nên nếu dữ liệu có nhiều biến động thì phương pháp dự báo đơn giản có độ
chính xác thấp.

7.3 CÁC PHƯƠNG PHÁP LÀM TRƠN

7.3.1 Dự báo bằng phương pháp trung bình trượt.


120

Khác với dự báo lượng tăng giảm tuyệt đối và tốc độ phát triển trung bình là dùng số liệu mới nhất
để dự báo cho mốc thời gian kê tiếp. Phương pháp trung bình trượt sẽ dùng nhiều hơn 3 số liệu
mới nhất để dự báo.

Y  Y  ...  Yi k 1
Y i 1  i i 1
k
Trong đó : Y i 1 : là giá trị dự báo tại thời điểm t  1 .
Yi ;Yi 1 ;...;Yi k 1 : là k giá trị quan sát thực tế tới thời điểm t .
k : khoảng trượt  k  3  .

Ưu điểm của phương pháp thể hiện rõ khi dữ liệu chuỗi thời gian có sự biến động nhiều, khi đó
trung bình trượt sẽ bình quân những nguyên nhân gây ra dao động bất thường của dữ liệu, để đưa
về quy luật biến động chung nhất của dữ liệu.

Khoảng trượt k là yếu tố ảnh hưởng rất lớn đến sai số dự báo, nên k được chọn sao cho thỏa
mãn các tiêu chí sai số tốt nhất. Với Y và Y lần lượt là giá trị quan sát thực tế và giá trị dự báo
i i

tại thời điểm i và ei  Yi  Yi là sai số tại mỗi thời điểm, ta có các tiêu chí đánh giá sai số:

1 n
 MAE   ei : sai số tuyệt đối trung bình (Mean Absolute Error)
n i 1
1 n ei
 MAPE   .100% : sai số phần trăm tuyệt đối trung bình (Mean Absolute Percent
n i 1 Yi
Error)
1 n 2
 MSE   ei : sai số bình phương trung bình (Mean Square Error)
n i 1
 RMSE  MSE : căn bậc hai sai số bình phương trung bình (Root Mean Square Error)

Về mặt thực tế RMSE và MAE có cung đơn vị với đơn vị lượng biến, nhưng RMSE thông dụng hơn
vì về mặt công thức thì RMSE dễ xử lý hơn.
Ví dụ 7.9 Cho một chuỗi thời gian với lượng biến quan sát là Yi trong 12 tuần, bảng sau đưa ra
dự báo bằng phương pháp trung bình trượt với khoảng trượt k  3 và k  5 ;
2 2
Tuần Yi Yi ; k  3 Y  Y 
i i Yi ; k  5 Y  Y 
i i

1 17
2 21
3 19
4 23 19 16
5 18 21 9
6 16 20 16 19.6 12.96
7 20 19 1 19.4 0.36
8 18 18 0 19.2 1.44
9 22 18 16 19 9
10 20 20 0 18.8 1.44
11 15 20 25 19.2 17.64
12 22 19 9 19 9
MSE  10,22 MSE  7,45
CHƯƠNG 7: CHUỖI THỜI GIAN; DỰ BÁO CHUỖI THỜI GIAN 121

Vì tiêu chuẩn MSEk 3  10,22 và MSEk 5  7,45 nên trong tình huống này , ta sẽ chọn khoảng trượt
k 5.

24
23

22
21
20
Dữ liệu
quan sát 19
K=3
18
k=5 17
16
15
14
-1 1 3 5 7 9 11 13

7.3.2 Dự báo bằng phương pháp san bằng hàm mũ.


Phương pháp san bằng mũ hay làm trơn bằng hàm mũ là phương pháp dùng giá trị dự báo ở thời
điểm trước và điều chỉnh một lượng sai số dự báo để tạo ra giá trị dự báo mới.

Y i 1  Y i   Yi  Y i
 
Trong đó : Y i 1 ;Y i : là giá trị dự báo tại thời điểm i ; i  1 .
Yi : là giá trị quan sát thực tế tại thời điểm i .
 : là hệ số làm trơn.
Lưu ý : Hệ số làm trơn  nhận giá trị    0;1
Một dạng khai triển khác của phương pháp san bằng mũ
Y i 1  1   Y i  Y i

i 1 Y1  Y1
i 2 Y 2  1    Y 1   Y1  Y1

i 3 Y 3  1   Y 2  Y2  1   Y1   Y2

Y 4  1   Y 3   Y3   1    Y1  1    Y2   Y3
2
i 4
Y 5  1   Y 4   Y4  1    Y1  1    Y2  1    Y3  Y4
3 2
i 5

Tổng quát : Y i  1  1    Y1  1    Y2  1    Y3  ....  1    Yi 1   Yi


i 1 i 2 i 3

Nên phương pháp san bằng mũ có thể xem là tương đương với phương pháp trung bình trượt có
trọng số.
Về mặt ý nghĩa giá trị dự báo mới Y bằng giá trị dự báo cũ Y cộng thêm một lượng điều
 
i 1  
i

chỉnh liên quan sai số ở lần dự báo cũ.


 Khi   1 thì dự báo mới cộng một lượng điều chỉnh tối đa, và ta chỉ nên chọn   1 khi
dữ liệu quan sát thực tế ít có thay đổi bất thường.
122

 Khi   0 thì dự báo mới cộng một lượng điều chỉnh tối thiểu, và ta chỉ nên chọn   0
khi dữ liệu quan sát thực tế có nhiều thay đổi bất thường.
Và cũng giống như phương pháp trung bình trượt, để lựa chọn hệ số làm trơn tốt nhất, ta có thể
dựa trên các tiêu chí đánh giá sai số.
Ví dụ 7.10 Sử dụng bảng số liệu của Ví dụ 7.9
2 2
Tuần Yi   0.2 Y  Y 
i i
  0.3 Y  Y 
i i

1 17 17 0 17 0
2 21 17 16 18.2 7.84
3 19 17.8 1.44 18.16 0.7056
4 23 18.04 24.6016 19.528 12.05478
5 18 19.032 1.065024 18.7224 0.521862
6 16 18.8256 7.984015 17.97792 3.912168
7 20 18.26048 3.02593 18.78234 1.482706
8 18 18.60838 0.370131 18.42587 0.181364
9 22 18.48671 12.34323 19.5407 6.048181
10 20 19.18937 0.657128 19.43256 0.321993
11 15 19.35149 18.93549 18.04604 9.278389
12 22 18.48119 12.382 19.53684 6.067178
MSE  9.98 MSE  4.40
Do MSE 0,2  MSE 0,3 nên ta sẽ dùng   0,3 để làm trơn và dự báo.

23
22
21
20
Quan sát
19
thực tế
18 alpha=0.2
17
alpha=0.3
16
15
14
0 2 4 6 8 10 12 14

7.3.3 Dự báo bằng phương pháp hàm xu thế tuyến tính


Quan hệ hồi quy xây dựng hàm để ước lượng mức độ phụ thuộc biến này vào biến kia. Hai biến
trong quan hệ hồi quy mang tính không đối xứng, và hai biến sẽ có một biến là biến phụ thuộc là
đại lượng ngẫu nhiên và một biến là biến độc lập là đại lượng phi ngẫu nhiên.
Trong chuỗi thời gian lượng biến quan sát theo thời gian Yi  là biến phụ thuộc và mốc thời gian
t i  là biến độc lập. Và mục tiêu dự báo là xây dựng một hàm số để tính biến phụ thuộc theo biến
độc lập. Khi đó hàm xu thế tuyến tính là mô hình hồi quy có dạng :

Yi  
  t
1 2 i

Trong đó : Yi : là giá trị dự báo tại mốc thứ i


1 : hệ số tự do của mô hình.
CHƯƠNG 7: CHUỖI THỜI GIAN; DỰ BÁO CHUỖI THỜI GIAN 123

2 : hệ số góc của mô hình.

Thực tế về mặt giá trị, thì giá trị lượng biến quan sát thực tế Yi  và giá trị dự báo bằng mô hình

Y  sẽ không trùng nhau tại tất cả các mốc quan sát, mà hai đại lượng này sẽ có sự chênh lệch là
i


sai số  ei  với i  1,n . 
ei  Yi  Yi
Bản chất sai số ei là do về mặt thực tế có rất nhiều yếu tố ảnh hưởng đến sự biến động của lượng
biến quan sát Yi  , nhưng trong mô hình thì ta chỉ chọn đại diện để giải thích cho sự biến động
này là thời gian  t i  .

Hệ số hồi quy 1 ; 2 trong mô hình được xác định bằng phương pháp bình phương tối thiểu (OSL:
ordianary squared least). Nguyên tắc của phương pháp bình phương tối thiểu là tổng bình phương
sai số tại tất cả quan sát phải đạt giá trị nhỏ nhất.
n
E 1 ; 
   e 2  Min
 2 i
i 1

Hàm E 1 ; 
 là một mặt bậc hai, do đó giá trị nhỏ nhất của hàm xảy ra tại điểm tới hạn thỏa :
2 
n
 E ˆ ˆ  n  ˆ ˆ 
n

 1 i 1

 ˆ  2 Yi  1  2t i  0 
  t i  2   n  1    Yi 
 i 1   i 1 
 n

 E  2 t Y  ˆ  ˆ t  0
n n n
 t 2  ˆ   t  ˆ   t Y 
 ˆ  i i 1 
2 i    i
 i 1   2   i
 i 1 
 1  
 i 1
i i 

 2 i 1 
n

  t iYi  ntY
ˆ
 2  ni 1

t i 2  nt .
 2

 i 1

 1  Y  ˆ2 t
ˆ
Vậy các hệ số trong hàm xu thế tuyến tính được ước lượng theo công thức:
124

 t Y  ntYi i
ˆ2  i 1
n
và ˆ1  Y  ˆ2 t
2 2
t
i 1
i  nt

Ví dụ 7.11 Một khảo sát về mối quan hệ giữa lượng xe đạp ( Yi nghìn chiếc) của một cửa hàng bán
được theo từng năm thu được bảng số liệu sau

t Y Yi t i t i2
1 21.6 21.6 1
2 22.9 45.8 4
3 25.5 76.5 9
4 21.9 87.6 16
5 23.9 119.5 25
6 27.5 165 36
7 31.5 220.5 49
8 29.7 237.6 64
9 28.6 257.4 81
10 31.4 314 100
t i  55 Y i  264,5  tiYi  1545,5  t i2  385
34

32
y = 1.1x + 20.4
30

28

26

24

22

20
0 2 4 6 8 10 12

 t Y  ntY
i i
1545,5  10.5,5.26,45
Hệ số góc : 2  i 1
n
  1,1
2 2 385  10.5,52
t
i 1
i  nt

Hệ số tự do : 1  Y  ˆ2 t  26,45  10.5,5  20,4

Vậy hàm xu thế tuyến tính có dạng : Yi  20,4  1,1t i

Nghĩa là qua một năm, trung bình lượng xe đạp của cửa hàng này bán tăng trung bình 1,1 ngàn
chiếc.
2
ti Yi Yi Y  Y 
i i

1 21.6 21.5 0.01


2 22.9 22.6 0.09
CHƯƠNG 7: CHUỖI THỜI GIAN; DỰ BÁO CHUỖI THỜI GIAN 125

3 25.5 23.7 3.24


4 21.9 24.8 8.41
5 23.9 25.9 4
6 27.5 27 0.25
7 31.5 28.1 11.56
8 29.7 29.2 0.25
9 28.6 30.3 2.89
10 31.4 31.4 0
MSE  3,07

You might also like