Download as pdf or txt
Download as pdf or txt
You are on page 1of 22

CHƯƠNG 3.

QUÁ TRÌNH DỪNG

§𝟑. DỰ ĐOÁN TUYẾN TÍNH TỐI ƯU

3.1 Khái niệm dự đoán tối ưu

Cho {𝑋& , 𝑡 ∈ ℤ} là một quá trình ngẫu nhiên dừng có kỳ vọng

không và hàm tự hiệp phương sai 𝛾(ℎ) = 𝐸(𝑋&01 𝑋& ), ℎ ∈ ℤ. Ta đặt vấn

đề tìm một tổ hợp tuyến tính các biến 𝑋2 , 𝑋3 , … , 𝑋5 để xấp xỉ tốt nhất

cho 𝑋502 hiểu theo nghĩa là, nếu tổ hợp tuyến tính phải tìm, ký hiệu

5 3
𝑋502 , có dạng 𝑋502 = 782 𝜙57 𝑋50297 , thì 𝐸 𝑋502 − 𝑋502 đạt min,

5 3
tức là 𝐸 𝑋502 − 782 𝜙57 𝑋50297 đạt cực tiểu.

5
Để làm điều đó ta xét tập ℳ = 782 𝑎7 𝑋50297 𝑎2 , … , 𝑎5 ∈ ℝ .

Rõ ràng ℳ là một tập đóng và ℳ ⊂ 𝐿3 , hơn nữa việc làm cực tiểu

3
𝐸 𝑋502 − 𝑋502 tương đương với việc cực tiểu bình phương của

3
chuẩn 𝑋502 − 𝑋502 trong 𝐿3 , do đó theo định lý chiếu (định lý 3.1))

và phương trình dự đoán (3.4), ta có

𝑋502 = Pℳ 𝑋502 .

Phương trình dự đoán (3.4) cho ta


5
〈𝑋502 − 782 𝜙57 𝑋50297 , 𝑌 〉= 0, ∀ 𝑌 ∈ ℳ (3.9)

5
và vì 𝑌 có dạng 𝑌 = 782 𝑎7 𝑋50297 , dùng tính chất của tích vô hướng

suy ra
CHƯƠNG 3. QUÁ TRÌNH DỪNG

5
〈𝑋502 − 782 𝜙57 𝑋50297 , 𝑋C 〉= 0, 𝑘 = 𝑛, 𝑛 − 1, … ,2,1. (3.10)

Bây giờ nhớ lại tích vô hướng (3.1) trong 𝐿3 :〈𝑋, 𝑌 〉= 𝐸(𝑋𝑌), ta đưa

hệ (3.10) về dạng véc tơ – ma trận

𝜞5 𝝓5 = 𝜸5 , (3.11)

trong đó

𝝓5 = 𝜙52 , … , 𝜙55 K ; 𝜸5 = 𝛾(1), … , 𝛾(𝑛) K ; 𝜞5 = [𝛾(𝑖 − 𝑗)]5O,782 .

Định lý chiếu khẳng định phương trình (3.11) có ít nhất một nghiệm,

trong trường hợp det(𝜞5 ) = 0, (3.11) có thể có vô số nghiệm, nhưng

giá trị dự đoán tối ưu luôn duy nhất.

3.2 Kỳ vọng có điều kiện và dự đoán tốt nhất trong 𝑳𝟐


R.S
Ở tiết 1 ta đã biết, nếu 𝑋5 , 𝑋 ∈ 𝐿3 , thì 𝑋5 𝑋 khi và chỉ khi

3 3
𝑋5 − 𝑋 = 𝐸 𝑋5 − 𝑋 → 0 khi 𝑛 → ∞.

Để ý sự hội tụ trung bình bình phương có các tính chất hiển nhiên

nói dưới đây.

* Mệnh đề 3.2.
3
(a) 𝑋5 hội tụ theo trung bình bình phương khi và chỉ khi 𝐸 𝑋R − 𝑋5

→ 0 khi 𝑚, 𝑛 → ∞.
R.S
(b) Nếu 𝑋5 𝑋 thì khi 𝑛 → ∞, có:
CHƯƠNG 3. QUÁ TRÌNH DỪNG

R.S
i. 𝐸𝑋5 =〈𝑋5 , 1〉 〈𝑋, 1〉= 𝐸𝑋;
R.S
3
ii. 𝐸 𝑋5 =〈𝑋5 , 𝑋5 〉 〈𝑋, 𝑋 〉= 𝐸 𝑋 3;
R.S
iii. 𝐸(𝑋5 𝑌5 ) =〈𝑋5 , 𝑌5 〉 〈𝑋, 𝑌 〉= 𝐸(𝑋𝑌).

Nếu ℳ là một không gian con đóng của 𝐿3 , thì dự đoán trung bình bình

phương tốt nhất của 𝑌 trong ℳ là phần tử 𝑌 ∈ ℳ sao cho

3 3
𝑌−𝑌 = inf 𝑌 − 𝑍 = inf 𝐸 𝑌 − 𝑍 3 .
Z∈ℳ Z∈ℳ

Định lý chiếu 3.1 khẳng định sự tồn tại duy nhất của dự đoán trung bình

bình phương tốt nhất 𝑌 của 𝑌 trong ℳ chính là

𝑌 = Pℳ 𝑌.

Bây giờ ta bổ sung một chút về cấu trúc của ℳ để xây dựng khái

niệm kỳ vọng có điều kiện và dự đoán tuyến tính tốt nhất.

* Định nghĩa 3.7. (Kỳ vọng có điều kiện 𝐸ℳ 𝑋) Cho ℳ là một không

gian con đóng trong 𝐿3 và chứa các hàm hằng, khi đó nếu 𝑋 ∈ 𝐿3 thì ta

định nghĩa kỳ vọng có điều kiện của 𝑋 với ℳ cho trước là phép chiếu

𝐸ℳ 𝑋 = Pℳ 𝑋. (3.12)

Từ định nghĩa tích vô hướng trong 𝐿3 phương trình dự đoán (3.4) ta suy

ra 𝐸ℳ 𝑋 là phần tử duy nhất của ℳ thoả

𝐸(𝑊𝐸ℳ 𝑋) = 𝐸(𝑊𝑋) ∀𝑊 ∈ ℳ.
CHƯƠNG 3. QUÁ TRÌNH DỪNG

Ngoài ra, vì toán tử 𝐸ℳ là toán tử chiếu trong 𝐿3 nên dĩ nhiên 𝐸ℳ

có các tính chất của phép chiếu, đặc biệt có:

𝐸ℳ (𝑎𝑋 + 𝑏𝑌) = 𝑎𝐸ℳ 𝑋 + 𝑏𝐸ℳ 𝑌, 𝑎, 𝑏 ∈ ℝ;


R.S R.S
𝐸ℳ 𝑋5 𝐸ℳ 𝑋 nếu 𝑋5 𝑋;

𝐸ℳ_ (𝐸ℳ` 𝑋) = 𝐸ℳ_ 𝑋 nếu ℳ2 ⊆ ℳ3 .

Cũng cần để ý rằng

𝐸ℳ 1 = 1

và nếu ℳb là không gian con đóng của 𝐿3 chứa mọi hàm hằng thì dùng

phương trình dự đoán suy ra

𝐸ℳc 𝑋 = 𝐸𝑋.

* Định nghĩa 3.8. (Kỳ vọng có điều kiện 𝐸(𝑋 𝑍)) Nếu 𝑍 là một biến

ngẫu nhiên trên (𝛺, 𝒜, 𝑃) và 𝑋 ∈ 𝐿3 (𝛺, 𝒜, 𝑃) thì kỳ vọng có điều kiện

của 𝑋 với 𝑍 cho trước được định nghĩa

𝐸(𝑋 𝑍) = 𝐸ℳ(Z) 𝑋, (3.13)

trong đó ℳ(𝑍) là không gian con đóng của 𝐿3 gồm mọi biến ngẫu

nhiên trong 𝐿3 có dạng một hàm Borel 𝜙(𝑍) nào đó, 𝜙(. ): ℝ → ℝ.

Toán tử 𝐸ℳ(Z) có mọi tính chất như của 𝐸ℳ ở trên, ngoài ra


CHƯƠNG 3. QUÁ TRÌNH DỪNG

𝐸ℳ(Z) 𝑋 ≥ 0 nếu 𝑋 ≥ 0.

Có thể mở rộng định nghĩa kỳ vọng có điều kiện 𝐸(𝑋 𝑍) sang

trường hợp nếu 𝑍2 , 𝑍3 , … , 𝑍5 là các biến ngẫu nhiên trong (𝛺, 𝒜, 𝑃) và

𝑋 ∈ 𝐿3 ; ta định nghĩa

𝐸(𝑋 𝑍2 , 𝑍3 , … , 𝑍5 ) = 𝐸ℳ(Z_ ,Z` ,…,Zj ) 𝑋,

trong đó ℳ 𝑍2 , 𝑍3 , … , 𝑍5 là không gian con đóng của 𝐿3 gồm mọi

biến ngẫu nhiên trong 𝐿3 có dạng 𝜙 𝑍2 , 𝑍3 , … , 𝑍5 với 𝜙 . là một hàm

Borel 𝜙 𝑍 𝜙 . : ℝ5 → ℝ. Khi đó các tính chất của 𝐸(𝑋 𝑍) cũng đúng

cho 𝐸(𝑋 𝑍2 , 𝑍3 , … , 𝑍5 ).

3.3 Kỳ vọng có điều kiện và dự đoán tuyến tính tốt nhất

Theo định lý chiếu, kỳ vọng có điều kiện 𝐸ℳ(Z_ ,Z` ,…,Zj ) 𝑋 là toán

tử dự đoán có sai số trung bình bình phương tốt nhất của 𝑋 trên

ℳ(𝑍2 , 𝑍3 , … , 𝑍5 ), nghĩa là hàm số tốt nhất của 𝑍2 , 𝑍3 , … , 𝑍5 (theo

nghĩa m.s) để dự đoán 𝑋. Tuy nhiên trong tính toán việc xác định chiếu

trên ℳ(𝑍2 , 𝑍3 , … , 𝑍5 ) thường rất phức tạp.

Vì vậy đối với 𝑍2 , 𝑍3 , … , 𝑍5 ∈ 𝐿3 , ta đi tìm chiếu của 𝑋 trên không

gian span{1, 𝑍2 , 𝑍3 , … , 𝑍5 } ⊆ ℳ(𝑍2 , 𝑍3 , … , 𝑍5 ), và khi đó


5
𝑃klmn{2,Z_ ,Z` ,…,Zj } 𝑋 = O8b 𝛼O 𝑍O , 𝑍b = 1, (3.14)
CHƯƠNG 3. QUÁ TRÌNH DỪNG

trong đó 𝛼b , 𝛼2 , … , 𝛼5 thoả mãn


5
〈 O8b 𝛼O 𝑍O , 𝑍7 〉=〈𝑋, 𝑍7 〉 𝑗 = 0, 𝑛

hay tương đương


5
O8b 𝛼O 𝐸(𝑍O 𝑍7 ) = 𝐸(𝑋𝑍7 ), 𝑗 = 0, 𝑛. (3.15)

Định lý chiếu bảo đảm (3.15) luôn có nghiệm 𝛼b , 𝛼2 , … , 𝛼5 và

(3.14) cũng cho một phép chiếu, vì thế đó toán tử dự đoán tuyến tính

tốt nhất của 𝑋 theo các thành phần 1, 𝑍2 , 𝑍3 , … , 𝑍5 và cũng vì là chiếu

trên một không con của ℳ(𝑍2 , 𝑍3 , … , 𝑍5 ) nên không thể có sai số trung

bình bình phương nhỏ hơn của 𝐸ℳ(Z_ ,Z` ,…,Zj ) 𝑋.

Tuy vậy, phép chiếu đó rất quan trọng vì các lý do sau:

+ Phép chiếu đó dễ tính hơn 𝐸ℳ(Z_ ,Z` ,…,Zj ) 𝑋;

+ Phép chiếu đó chỉ phụ thuộc vào các mô men cấp 1 𝐸𝑋, 𝐸𝑍O và cấp

2 𝐸(𝑍O 𝑍7 ) và 𝐸(𝑋𝑍7 ) của phân phối đồng thời của (𝑋, 𝑍2 , 𝑍3 , … , 𝑍5 );

+ Nếu (𝑋, 𝑍2 , 𝑍3 , … , 𝑍5 ) có phân phối chuẩn nhiều chiều thì có thể

chứng minh

𝑃klmn{2,Z_ ,Z` ,…,Zj } 𝑋 = 𝐸ℳ(Z_ ,Z` ,…,Zj ) 𝑋.

* Định nghĩa 3.9. (Dự đoán tuyến tính tốt nhất của 𝑋 theo các thành

phần {𝑍s , 𝜆 ∈ 𝛬}) Nếu 𝑋 ∈ 𝐿3 , và 𝑍s ∈ 𝐿3 , 𝜆 ∈ 𝛬, thì dự đoán tuyến


CHƯƠNG 3. QUÁ TRÌNH DỪNG

tính tốt nhất của X theo các thành phần của {𝑍s , 𝜆 ∈ 𝛬}là phần tử của

span{𝑍s , 𝜆 ∈ 𝛬} có trung bình bình phương khoảng cách đến 𝑋 ngắn

nhất, và theo định lý chiếu, dự đoán đó chính là Pklmn{2,Z_ ,Z` ,…,Zj } 𝑋.

* Thí dụ 3.10. Giả sử 𝑌 = 𝑋 3 + 𝑍, với 𝑋 và 𝑍 là các biến ngẫu nhiên

độc lập có phân phối chuẩn chuẩn hoá (tức ~𝒩(0; 1)). Khi đó dự đoán

tốt nhất của 𝑌 theo 𝑋 là 𝐸(𝑌 𝑋) = 𝑋 3 ; thật vậy vì 𝑋 3 ∈ ℳ(𝑋) nên

𝐸(𝑌 𝑋) = 𝐸ℳ(z) 𝑌 và do đó (3.13) thoả với ℳ = ℳ(𝑋).

Mặt khác dự đoán tuyến tính tốt nhất của 𝑌 theo {1, 𝑋} có dạng

Pklmn{2,z} 𝑌 = 𝑎𝑋 + 𝑏. Từ đó dùng phương trình dự đoán (3.4) ta có:

〈𝑎𝑋 + 𝑏, 𝑋〉=〈𝑌, 𝑋 〉= 𝐸(𝑌𝑋) = 0,

〈𝑎𝑋 + 𝑏, 1〉=〈𝑌, 1〉= 𝐸(𝑌) = 1.

Từ đó suy ra 𝑎 = 0, 𝑏 = 1 và Pklmn{2,z} 𝑌 = 1.

Trung bình bình phương của hai sai số dự đoán là:


3
𝐸(𝑌 𝑋) − 𝑌 = 𝐸(𝑌 3 ) = 1,

3 3
Pklmn{2,z} 𝑌 − 𝑌 = 𝑌 − 1 = 𝐸 𝑋 { + 𝐸 𝑍 3 − 1 = 3.

Điều đó chứng tỏ dự đoán tốt nhất ưu việt hơn dự đoán tuyến tính tốt

nhất.
CHƯƠNG 3. QUÁ TRÌNH DỪNG

Chú ý: Vì 𝐿3 (𝛺, 𝒜, 𝑃) là không gian Hilbert nên định nghĩa kỳ vọng

có điều kiện là phép chiếu trực giao lên không gian con ℳ ⊂ 𝐿3 cũng

trùng với kỳ vọng có điều kiện được định nghĩa theo kiểu truyền thống.

§𝟒. PHÂN PHỐI CHUẨN NHIỀU CHIỀU

Cho véc tơ ngẫu nhiên 𝑛 chiều 𝑿 = (𝑋2 , 𝑋3 , … , 𝑋5 )K ∈ ℝ5 . Nếu

𝐸 𝑋O < ∞, 𝑖 = 1; 𝑛, thì ta có thể định nghĩa kỳ vọng của véc tơ ngẫu

nhiên 𝑿 là

𝝁𝑿 = 𝐸𝑿 = (𝐸𝑋2 , 𝐸𝑋3 , … , 𝐸𝑋5 )K .

Nếu 𝑿 = (𝑋2 , 𝑋3 , … , 𝑋5 )K và 𝒀 = (𝑌2 , 𝑌3 , … , 𝑌R )K là hai véc tơ ngẫu

nhiên có 𝐸 𝑋O < ∞, 𝑖 = 1; 𝑛, 𝐸 𝑌7 < ∞, 𝑗 = 1; 𝑚, thì ta có thể định

nghĩa 𝜮𝑿𝒀 là ma trận hiệp phương sai của 𝑿 và 𝒀

𝜮𝑿𝒀 = Cov(𝑿, 𝒀) = 𝐸 (𝑿 − 𝐸𝑿)(𝒀 − 𝐸𝒀)K

= 𝐸(𝑿𝒀) − 𝐸(𝑿)𝐸(𝒀). (3.16)

Phần tử (𝑖, 𝑗) của 𝜮𝑿𝒀 là Cov(𝑋O , 𝑌7 ) = 𝐸(𝑋O 𝑌7 ) − 𝐸(𝑋O )𝐸(𝑌7 ). Đặc biệt

khi 𝒀 = 𝑿 thì Cov(𝑿, 𝑿) = Cov(𝑿) chính là ma trận hiệp phương sai

của 𝑿.

* Mệnh đề 3.3. Nếu 𝒂 là một véc tơ 𝑚 chiều, 𝑩 là một ma trận cỡ 𝑚×𝑛

và 𝑿 = (𝑋2 , 𝑋3 , … , 𝑋5 )K với 𝐸 𝑋O < ∞, 𝑖 = 1; 𝑛, thì véc tơ ngẫu nhiên


CHƯƠNG 3. QUÁ TRÌNH DỪNG

𝒀 = 𝒂 + 𝑩𝑿 (3.17)

có kỳ vọng là 𝐸𝒀 = 𝒂 + 𝑩𝐸𝑿

và ma trận hiệp phương sai

𝜮𝒀𝒀 = 𝑩𝜮𝑿𝑿 𝑩𝑻 .

* Mệnh đề 3.4. Ma trận hiệp phương sai 𝜮𝑿𝑿 đối xứng và xác định

không âm.

Để ý tính đối xứng của 𝜮𝑿𝑿 được suy ra từ định nghĩa; còn tính

xác định không âm là hệ quả của mệnh đề 3.3: Với 𝒃 = (𝑏2 , … , 𝑏5 )K

bất kỳ trong ℝ5 , ta có

𝒃𝑻 𝜮𝑿𝑿 𝒃 = Var(𝒃𝑻 𝑿) ≥ 0.

* Mệnh đề 3.5. Với bất kỳ một ma trận cỡ 𝑛×𝑛, đối xứng và xác định

không âm 𝜮, ta luôn có

𝜮 = 𝑷𝜦𝑷‰ , (3.18)

trong đó 𝑷 là một ma trận trực giao (𝑷‰ 𝑷 = I) và 𝜦 là ma trận chéo 𝜦

= diag{𝜆2 , … , 𝜆5 } với 𝜆2 , … , 𝜆5 là các trị riêng không âm của 𝜮.

Đây là một kết quả cơ bản của lý thuyết ma trận; ở đây lưu ý nếu

ρO , 𝑖 = 1; 𝑛, là các véc tơ riêng trực chuẩn của 𝜮 ứng với các trị riêng

𝜆2 , … , 𝜆5 thì có thể chọn 𝑷 là ma trận vuông cấp 𝑛 với cột thứ 𝑖 là 𝝆O .

Chú ý 1: Từ biểu diễn (3.18) và do det 𝑷 = det𝑷‰ = 1 suy ra


CHƯƠNG 3. QUÁ TRÌNH DỪNG

det𝜮 = 𝜆2 … 𝜆5 .

* Định nghĩa 3.10. (Phân phối chuẩn nhiều chiều) Véc tơ ngẫu nhiên

𝒀 = (𝑌2 , … , 𝑌R )K có phân phối chuẩn nhiều chiều nếu và chỉ nếu tồn tại

một véc tơ 𝒂, một ma trận 𝑩 và một véc tơ ngẫu nhiên 𝑿 = (𝑋2 , … , 𝑋5 )K

có các thành phần 𝑋O độc lập với phân phối chuẩn chuẩn hoá, sao cho

𝒀 = 𝒂 + 𝑩𝑿.

Chú ý 2: Các thành phần của véc tơ 𝑿 ở trên có hàm mật độ đồng thời

5 3
𝑓𝑿 (𝒙) = (2𝜋)95/3 exp − 782 𝑥7 /2 , 𝒙 = (𝑥2 , … , 𝑥5 )K ∈ ℝ5

và hàm đặc trưng tương ứng là


“𝑿 5 3
𝜙𝑿 (𝒖) = 𝐸𝑒 O𝒖 = exp − 782 𝑢7 /2 , 𝒖 = (𝑢2 , … , 𝑢5 )K ∈ ℝ5 .

Chú ý 3: Từ định nghĩa trên và mệnh đề 3.3 ta thấy nếu 𝒀 có phân phối

chuẩn 𝑛 chiều và nếu 𝑫 là một ma trận cỡ 𝑘×𝑛, 𝒄 là véc tơ 𝑘 chiều thì

𝒁 = 𝒄 + 𝑫𝒀 là một véc tơ ngẫu nhiên có phân phối chuẩn 𝑘 chiều.

Đồng thời từ định nghĩa ở trên (𝒀 có phân phối chuẩn nhiều chiều) ta

có biểu diễn 𝒀 = 𝒂 + 𝑩𝑿, suy ra 𝐸𝒀 = 𝒂 và 𝜮𝒀𝒀 = 𝑩𝑩𝑻 .

* Mệnh đề 3.6. Nếu 𝒀 = (𝑌2 , … , 𝑌R )K là một véc tơ ngẫu nhiên có phân

phối chuẩn nhiều chiều với 𝐸𝒀 = 𝝁 và 𝜮𝒀𝒀 = 𝜮 thì hàm đặc trưng của

𝒀 là
CHƯƠNG 3. QUÁ TRÌNH DỪNG

𝜙𝒀 (𝒖) = exp 𝑖𝒖K 𝝁 − 𝒖K 𝜮𝒖/2 , 𝒖 = (𝑢2 , … , 𝑢R )K ∈ ℝR . (3.19)

Hàm mật độ của 𝒀, nếu det 𝜮 > 0, là

𝑓𝒀 (𝒙) = (2𝜋)9R/3 (𝑑𝑒𝑡𝜮)92/3 exp −(𝒙 − 𝝁)K 𝜮92 (𝒙 − 𝝁)/2 ,

𝒙 = (𝑥2 , … , 𝑥R )K ∈ ℝR .

Chứng minh:

Nếu 𝒀 được biểu diễn theo 𝒀 = 𝒂 + 𝑩𝑿 và có phân phối chuẩn 𝑚

chiều thì 𝜙𝒀 (𝒖) = 𝐸exp 𝑖𝒖K (𝒂 + 𝑩𝑿) = exp(𝑖𝒖K 𝒂) exp(𝑖𝒖K 𝑩𝑿).

Dùng biểu thức trong chú ý 2 với 𝒖 ∈ ℝR được thay bởi 𝑩𝑻 𝒖 ta có

𝜙𝒀 (𝒖) = exp 𝑖𝒖K 𝝁 − 𝒖K 𝑩𝑩𝑻 𝒖/2 ,

và do đó theo chú ý 3 biẻu thức trên chính là (3.19). Ngoài ra nếu

det 𝜮 > 0 thì theo mệnh đề 3.5 ta có

𝜮 = 𝑷𝜦𝑷‰ ,

trong đó 𝑷 là một ma trận trực giao cấp 𝑚, 𝜦 = diag{𝜆2 , … , 𝜆R } và mọi

92/3 92/3
𝜆O > 0. Nếu ta định nghĩa ma trận 𝜦92/3 = diag{𝜆2 , … , 𝜆R } và

𝜮92/3 = 𝑷𝜦92/3 𝑷‰ thì dễ dàng suy ra 𝜮92/3 𝜮𝜮92/3 = 𝑰R , 𝑰R là ma

trận đơn vị cấp 𝑚. Từ đó theo mệnh đề 3.3 và chú ý 3 suy ra véc tơ

ngẫu nhiên 𝒁 = 𝜮92/3 (𝒀 − 𝝁) (3.20)


CHƯƠNG 3. QUÁ TRÌNH DỪNG

có phân phối chuẩn nhiều chiều với 𝐸𝒁 = 0 và 𝜮𝒁𝒁 = 𝑰R . Dùng kết quả

trong chú ý 2 ta thấy 𝒁 có hàm đặc trưng 𝜙𝑿 (𝒖) = exp(−𝒖K 𝒖/2) và từ

đó suy ra 𝒁 có hàm mật độ như trong chú ý 2 đó.

Từ (3.20) cũng suy ra hàm mật độ của 𝒀 là

𝑓𝒀 (𝒚) = 𝑓𝒁 (𝜮92/3 (𝒚 − 𝝁)) (𝑑𝑒𝑡𝜮)92/3

= (2𝜋)9R/3 (𝑑𝑒𝑡𝜮)92/3 exp − 𝒚 − 𝝁 K 𝜮92 (𝒚 − 𝝁)/2 .

Chú ý 4: Phép biến đổi (3.20) đã biến 𝒀 thành một véc tơ ngẫu nhiên

với các thành phần độc lập có phân phối chuẩn chuẩn hoá; đó chính là

sự tổng quát hoá phép biến đổi chuẩn hoá quen thuộc 𝑧 = (𝑌 − 𝜇)/𝜎

trong trường hợp một chiều với 𝜇, 𝜎 3 lần lượt là kỳ vọng và phương

sai của biến 1 chiều 𝑌~𝒩(𝜇,𝜎 3 ).

Chú ý 5: Cho một véc tơ 𝝁 ∈ ℝ5 và một ma trận 𝜮 cấp 𝑛 đối xứng, xác

định không âm thì tồn tại một véc tơ ngẫu nhiên có phân phối chuẩn

nhiều chiều, với kỳ vọng 𝝁 và ma trận hiệp phương sai 𝜮. Từ một véc

toe ngẫu nhiên có phân phối chuẩn chuẩn hoá muốn chế ra một véc tơ

ngẫu nhiên có phân phối chuẩn nhiều chiều có hai tham số 𝝁, 𝜮, ta chỉ

cần chọn 𝒂 = 𝝁 và 𝑩 = 𝜮2/3 trong (3.17), trong đó 𝜮2/3 theo thuật ngữ
CHƯƠNG 3. QUÁ TRÌNH DỪNG

của mệnh đề 3.6 chính là ma trận 𝑷𝜦2/3 𝑷‰ , với 𝜦2/3 là ma trận chéo

2/3 2/3
diag{𝜆2 , … , 𝜆5 }.

Chú ý 6: Mệnh đề 3.6 chứng tỏ một phân phối chuẩn nhiều chiều được

xác định duy nhất bởi véc tơ kỳ vọng và ma trận hiệp phương sai. Vì

vậy nếu 𝒀 có phân phối chuẩn và có 𝐸𝒀 = 𝝁, 𝜮𝒀𝒀 = 𝜮, thì ta cũng ký

hiệu 𝒀~𝒩(𝝁,𝜮).

* Thí dụ 3.11. (Phân phối chuẩn hai chiều) Véc tơ ngẫu nhiên hai chiều

𝑿 = (𝑋2 , 𝑋3 )K được gọi là véc tơ chuẩn hai chiều với kỳ vọng 𝝁 =

(𝜇2 , 𝜇3 )K và ma trận hiệp phương sai

𝜎23 𝜌𝜎2 𝜎3
𝜮= , 𝜎2 , 𝜎3 ≥ 0, −1 ≤ 𝜌 ≤ 1; (3.21)
𝜌𝜎2 𝜎3 𝜎33

nếu và chỉ nếu 𝑿 có hàm đặc trưng (suy từ mệnh đề 3.6)

𝜙𝒀 (𝒖) = exp 𝑖 𝑢2 𝜇2 + 𝑢3 𝜇3 − 0,5(𝑢23 𝜎23 + 2𝑢2 𝑢3 𝜌𝜎2 𝜎3 + 𝑢33 𝜎33 ) .

Các tham số 𝜎2 , 𝜎3 lần lượt là các độ lệch chuẩn của 𝑋2 , 𝑋3 , còn 𝜌 là hệ

số tương quan giữa hai thành phần đó của 𝑿. Do bất kỳ một ma trận đối

xứng, xác định không âm nào đều có dạng (3.21) nên có thể nói rằng

mọi véc tơ ngẫu nhiên chuẩn hai chiều đều có hàm đặc trưng dạng như

ở trên. Nếu 𝜎2 ≠ 0, 𝜎3 ≠ 0, −1 < 𝜌 < 1, thì 𝜮 có nghịch đảo


CHƯƠNG 3. QUÁ TRÌNH DỪNG

92 3 92 𝜎293 −𝜌𝜎292 𝜎392


𝜮 = (1 − 𝜌 )
−𝜌𝜎292 𝜎392 𝜎393

và do đó 𝑿 có hàm mật độ (xem mệnh đề 3.6)

2
𝑓𝑿 (𝒙) =
3£¤_ ¤` 29¥`

2 2
1 𝑥1 −𝜇1 𝑥1 −𝜇1 𝑥2 −𝜇2 𝑥2 −𝜇2
× exp − − 2𝜌 + .
2 1−𝜌2 𝜎21 𝜎21 𝜎22 𝜎22

* Mệnh đề 3.7. Véc tơ ngẫu nhiên 𝑿 = (𝑋2 , … , 𝑋5 )K là một véc tơ chuẩn

nhiều chiều với véc tơ kỳ vọng 𝝁 và ma trận hiệp phương sai 𝜮 nếu và

chỉ nếu với mỗi 𝒂 = (𝑎2 , … , 𝑎5 )K ∈ ℝ5 , 𝒂K 𝑿 có phân phối chuẩn với

kỳ vọng 𝒂K 𝝁 và phương sai 𝒂K 𝜮𝒂.

Bây giờ ta sẽ chứng tỏ phân phối có điều kiện từ các biến ngẫu

nhiên chuẩn nhiều chiều cũng là chuẩn nhiều chiều. Giả sử 𝑿 được chia

thành hai véc tơ con

(2)
𝑿 = 𝑿(3) ,
𝑿

đồng thời ta cũng phân tích kỳ vọng và ma trận hiệp phương sai thành

𝝁(2) 𝜮 𝜮23
𝝁 = (3) và 𝜮 = 22 , trong đó 𝝁(O) = 𝐸𝑿(O) , 𝑖 = 1; 2, và 𝜮O7 =
𝝁 𝜮32 𝜮33

𝐸 (𝑿 O
− 𝝁(O) )(𝑿 7
− 𝝁(7) )K , 𝑖, 𝑗 = 1; 2 (để ý 𝜮23 = 𝜮K32 ).
CHƯƠNG 3. QUÁ TRÌNH DỪNG

* Mệnh đề 3.8.

(i) 𝑿(2) và 𝑿(3) độc lập nếu và chỉ nếu 𝜮23 = 0.

(ii) Nếu det𝜮33 > 0 thì phân phối có điều kiện của 𝑿(2) khi cho 𝑿(3)

là 𝒩(𝝁 2
+ 𝜮23 𝜮92
33 𝑿
3
−𝝁 3
; 𝜮22 − 𝜮23 𝜮92
33 𝜮32 ).

Chứng minh:

(i) Việc chứng minh không phức tạp, dùng mệnh đề 3.6.

(ii) Nếu đặt 𝒁 = 𝑿(2) − 𝝁 2


− 𝜮23 𝜮92
33 𝑿
3
−𝝁 3
thì hiển nhiên

𝒁 𝟎 𝜮22 − 𝜮23 𝜮92


33 𝜮32 0
~𝒩 (3) ;
𝑿(3) 𝝁 0 𝜮33

và theo (i) 𝒁 và 𝑿(3) độc lập. Dùng phân phối ở trên ta có thể viết hàm

đặc trưng có điều kiện của 𝑿(2) khi đã cho 𝑿(3) là

𝐸(exp(𝑖𝒖K 𝑿(2) 𝑿(3) ))

= 𝐸 exp 𝑖𝒖K 𝒁 + 𝑖𝒖K 𝝁 2


− 𝜮23 𝜮92
33 𝑿
3
−𝝁 3
𝑿(3)

= exp 𝑖𝒖K 𝝁 2
− 𝜮23 𝜮92
33 𝑿
3
−𝝁 3
𝐸 exp(𝑖𝒖K 𝒁 𝑿(3) )

(do 𝒁 và 𝑿(3) độc lập). Cũng vì tính độc lập đó nên

𝐸 exp(𝑖𝒖K 𝒁 𝑿(3) ) = 𝐸 exp(𝑖𝒖K 𝒁)

= exp(−0,5𝒖K 𝜮22 − 𝜮23 𝜮92


33 𝜮32 𝒖)’

nghĩa là
CHƯƠNG 3. QUÁ TRÌNH DỪNG

𝐸(exp(𝑖𝒖K 𝑿(2) 𝑿(3) ))

= exp 𝑖𝒖K 𝝁 2
− 𝜮23 𝜮92
33 𝑿
3
−𝝁 3

− 0,5𝒖K 𝜮22 − 𝜮23 𝜮92


33 𝜮32 𝒖 .

* Thí dụ 3.12. Từ mệnh đề 3.6 suy ra với véc tơ chuẩn hai chiều 𝑿

trong thí dụ 3.11 thì 𝑋2 và 𝑋3 độc lập khi và chỉ khi 𝜌𝜎2 𝜎3 = 0. Nếu các

tham số 𝜌, 𝜎2 , 𝜎3 đều > 0 thì kỳ vọng có điều kiện của 𝑋2 khi đã cho 𝑋3

𝐸(𝑋2 𝑋3 ) = 𝜇2 + 𝜌𝜎2 𝜎392 𝑋3 − 𝜇3

và phương sai có điều kiện là

Var(𝑋2 𝑋3 ) = 𝜎23 1 − 𝜌3 .

§𝟓. TOÁN TỬ LÙI

Toán tử lùi 𝐵 áp dụng cho một quá trình {𝑋& , 𝑡 ∈ ℤ} cho ta quá

trình {𝑌& , 𝑡 ∈ ℤ} sao cho

𝑌& = 𝐵𝑋& = 𝑋&92 . (3.22)

Toán tử lùi là một toán tử tuyến tính, khả nghịch và nghịch đảo của

nó 𝐵 92 = 𝐹, được gọi là toán tử tiến, được định nghĩa bởi

𝐹𝑋& = 𝑋&02 .

Có thể thấy các toán tử 𝐵, 𝐹 thoả mãn:


CHƯƠNG 3. QUÁ TRÌNH DỪNG

𝐵 - 𝑋& = 𝑋&9- ; 𝐹 - 𝑋& = 𝑋&0- ;

5 5
O8b 𝑎O 𝐵 O 𝑋& = O8b 𝑎O 𝑋&9O . (3.23)

Hệ thức (3.23) diễn đạt tác động lên quá trình {𝑋& } của một đa thức của

toán tử 𝐵.

5.1 Chuỗi theo toán tử lùi

Ta có thể định nghĩa tổng quát chuỗi theo 𝐵 (hay theo 𝐹), hạn

chế cho các quá trình dừng.

Cho một quá trình dừng {𝑋& , 𝑡 ∈ ℤ} và một dãy {𝑎O }, 𝑖 ∈ ℤ, khả
®
tổng tuyệt đối O89® 𝑎O < ∞, và như ta đã biết quá trình 𝑌& =

® ®
O89® 𝑎O 𝑋&9O là một quá trình dừng. Ta ký hiệu O89® 𝑎O 𝐵 O là ánh xạ

đặt tương ứng quá trình dừng 𝑋& với quá trình dừng 𝑌& . Có thể chứng

tỏ các chuỗi theo 𝐵 có những tính chất như các chuỗi thông thường:

® ® ®
(i) O89® 𝑎O 𝐵O + 789® 𝑏7 𝐵7 = O89®(𝑎O + 𝑏O ) 𝐵 O ,

® ®
do O89® 𝑎O 𝑋&9O + 789® 𝑏7 𝑋&97

® ® ®
= O89® 𝑎O 𝐵O + 789® 𝑏7 𝐵 7 𝑋& = O89®(𝑎O + 𝑏O ) 𝐵 O 𝑋&

®
= O89®(𝑎O + 𝑏O ) 𝑋&9O ;

® ®
(ii) 𝜆 O89® 𝑎O 𝐵O = O89® 𝜆𝑎O 𝐵O ;

® ® ® ®
(iii) O89® 𝑎O 𝐵O 789® 𝑏7 𝐵7 = C89® O89® 𝑎O 𝑏C9O 𝐵 C ,
CHƯƠNG 3. QUÁ TRÌNH DỪNG

®
trong đó 𝛼C = O89® 𝑎O 𝑏C9O tồn tại do chuỗi C 𝛼C hội tụ tuyệt đối

và được gọi là tích chập của các chuỗi C 𝑎C và C 𝑏C . Do tính đối

xứng ta luôn có
® ®
O89® 𝑎O 𝑏C9O = O89® 𝑎C9O 𝑏O .

5.2 Nghịch đảo của đa thức theo toán tử lùi

+ Nghịch đảo của 1− 𝜆𝐵

Ta biết rằng 1 − 𝜆𝐵 là ánh xạ từ tập các quá trình dừng vào chính

nó. Ta sẽ tìm điều kiện khả đảo và nghịch đảo của ánh xạ trong trường

hợp nó tồn tại.

* Mệnh đề 3.9. Ánh xạ 1 − 𝜆𝐵 là khả đảo nếu và chỉ nếu 𝜆 ≠ 1.

Chứng minh:

- Trường hợp 𝜆 < 1

𝜆O , 𝑖 ≥ 0,
Chuỗi số thực với số hạng tổng quát 𝑎O = là hội tụ tuyệt
0, 𝑖 < 0.
® O
đối, do vậy có thể xác định O8b 𝜆 𝐵 O . Nhân chuỗi này với 1 − 𝜆𝐵

® O
O8b 𝜆 𝐵 O (1 − 𝜆𝐵) = 𝐵 b = 1.

Như vậy 1 − 𝜆𝐵 khả đảo và nghịch đảo của nó, ký hiệu là (1 − 𝜆𝐵)92 ,

® O
chính là O8b 𝜆 𝐵O .
CHƯƠNG 3. QUÁ TRÌNH DỪNG

Nói cách khác, cho trước một quá trình dừng {𝑋& , 𝑡 ∈ ℤ} thì quá

® O
trình {𝑌& , 𝑡 ∈ ℤ} được định nghĩa bởi 𝑌& = O8b 𝜆 𝑋&9O là một quá trình

dừng duy nhất thoả

(1 − 𝜆𝐵)𝑌& = 𝑌& − 𝜆𝑌&92 = 𝑋& . (3.24)

Lưu ý rằng không phải chỉ có một quá trình 𝑌& thoả mãn (3.24). Có thể

tìm được những nghiệm khác bằng cách thêm vào nghiệm tổng quát 𝑌&∗

của phương trình thuần nhất 𝑌& − 𝜆𝑌&92 = 0, nghiệm tổng quát đó có

dạng 𝐴𝜆& , với 𝐴 là một biến ngẫu nhiên bất kỳ, những nghiệm ứng với

𝐴 ≠ 0 hiển nhiên không phải là một quá trình dừng.

- Trường hợp 𝜆 > 1

Ta có 1 − 𝜆𝐵 = − 𝜆𝐵(1 − (1/𝜆)𝐹).

Ta thấy – 𝜆𝐵 là nghịch đảo của – (1/𝜆)𝐹 = – (1/𝜆)𝐵 92 , mặt khác

® O ® 9O
1/𝜆 < 1 do đó chuỗi O8b(1/𝜆) 𝐹 = O8b(1/𝜆) 𝐵 tồn tại và nghịch

đảo của nó là 1 − (1/𝜆)𝐹.

Như thế 1 − 𝜆𝐵 là tích của hai hàm khả đảo nên chính nó cũng

2
khả đảo và nghịc đảo của nó là (1 − 𝜆𝐵)92 = (− 𝜆𝐵)92 (1 − 𝐹)92
s

2 92 ® 2 O ® 2 O02 ® 2 O
= 𝐹 O8b s³ 𝐹 =− O8b s³´_ 𝐹 =− O82 s³ 𝐹
29 s² s

9® O
=− O892 𝜆 𝐵O .
CHƯƠNG 3. QUÁ TRÌNH DỪNG

- Trường hợp 𝜆 = 1

Đây là trường hợp 1 − 𝜆𝐵 không khả đảo; chẳng hạn với 𝜆 = 1

ta thấy mọi quá trình 𝑋& = 𝑚 sẽ được biến đổi thành (1 − 𝐵)𝑋& = 𝑚 −

𝑚 = 0, do đó ánh xạ này không đơn ánh; nó cũng không là toàn ánh:

quá trình hằng 𝑚 ≠ 0 không có quá trình trước đó là quá trình dừng, vì

như thế thì sẽ có

𝑋& − 𝑋&92 = 𝑚 ⟹ 𝐸𝑋& − 𝐸𝑋&92 = 0 ⟹ 𝑚 = 0 vô lý!

+ Nghịch đảo của một đa thức

Xét một đa thức 𝛷(𝑧) = 1 − 𝜑2 𝑧 − 𝜑3 𝑧 3 − ⋯ − 𝜑¹ 𝑧 ¹ có các

nghiệm 𝑧O = 1/𝜆O có mô đun lớn hơn 1. Khi đó tồn tại một chuỗi nguyên

® ®
𝛹(𝑧) = O8b 𝜓O 𝑧 O sao cho O8b 𝜓O < ∞ và 𝛷(𝑧) 𝛹(𝑧) = 1 hay 𝛹(𝑧)

là nghịch đảo của 𝛷(𝑧).

Do các chuỗi theo 𝐵 cũng có tính chất như các chuỗi nguyên nên

𝛷(𝐵) = 1 − 𝜑2 𝐵 − 𝜑3 𝐵 3 − ⋯ − 𝜑¹ 𝐵 ¹ khả đảo và có nghịch đảo là

𝛹(𝐵). Có nhiều cách để xác định các hệ số 𝜓O :

+ Cách I: (Phương pháp hệ số bất định)

Viết tường minh 𝛷(𝑧) 𝛹(𝑧) = 1, đồng nhất các hệ số cùng bậc để

thu được một hệ phương trình đối với 𝜓O , hệ này có thể giải kiểu đệ

quy
CHƯƠNG 3. QUÁ TRÌNH DỪNG

𝜓b = 1
𝜓2 − 𝜑2 = 0
𝜓3 − 𝜑2 𝜓2 − 𝜑3 = 0
………
𝜓¹ − 𝜑2 𝜓¹92 − ⋯ − 𝜑¹92 𝜓2 − 𝜑¹ = 0
……………
𝜓5 − 𝜑2 𝜓592 − ⋯ − 𝜑¹92 𝜓59¹02 − 𝜑¹ 𝜓59¹ = 0 ∀𝑛 > 𝑝.

+ Cách II: (Phương pháp chia đa thức)

Thực hiện phép chi 1 cho 𝛷(𝑧) theo luỹ thừa tăng và ta sẽ tìm

được các hệ số 𝜓O

1 = 𝛷(𝑧)(𝜓b + 𝜓2 𝑧 + ⋯ + 𝜓½ 𝑧 ½ ) + 𝑧 ½02 𝜆½ (𝑧) ∀𝑟,

trong đó 𝜆½ (𝑧) là đa thức đối với 𝑧. Cụ thể

2
=
29¿_ À9¿` À ` 9⋯9¿Á À Á

𝑧2 𝑧+𝜑2 𝑧2 +⋯+𝜑𝑝 𝑧𝑝
= 1+
1−𝜑1 𝑧−𝜑2 𝑧2 −⋯−𝜑𝑝 𝑧𝑝

(¿_` 0¿` ) À ` 0⋯0(¿_ ¿ÁÂ_ 0¿Á )À Á 0¿_ ¿Á À Á´_


= 1 + 𝜑2 𝑧 +
29¿_ À9¿` À ` 9⋯9¿Á À Á

®
=…= O8b 𝜓O 𝑧O .

+ Cách III: (Phương pháp phân tích 1/ 𝛷(𝑧) thành các phân thức tối

giản và khai triển chúng thành các chuỗi nguyên)


CHƯƠNG 3. QUÁ TRÌNH DỪNG

Sau khai triển ta thu được 𝛹(𝑧) là đa thức nghịch đảo của 𝛷(𝑧),

tiếp theo thay 𝑧 bằng toán tử 𝐵 và nhận được toán tử 𝛹(𝐵) là nghịch

đảo của 𝛷(𝐵).

Có thể chứng minh được rằng nếu mọi nghiệm của đa thức 𝛷(𝑧)

đều có mô đun lớn hơn 1, thì từ phương trình sai phân

𝛷(𝐵)𝑋& = 𝑢&

suy ra

𝑋& = 𝛹(𝐵)𝑢& ,
S 3
và 𝐸 𝑋& − O8b 𝜓O 𝑢&9O ⟶ 0, khi 𝑠 → ∞;
®
tức là O8b 𝜓O 𝑢&9O hội tụ theo nghĩa trung bình bình phương.

You might also like