BTL1 LTTK

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 11

LÝ THUYẾT THỐNG KÊ

NGUYỄN THÁI ĐIỀN∗ LÊ HOÀNG PHÚC †


NGÔ KIM NGỌC ‡

Khoa Toán - Tin học, trường Đại học Khoa học Tự nhiên,
ĐHQG TP. Hồ Chí Minh

Tháng 3/2024

Mục lục
1 CÁC KẾT QUẢ BỔ SUNG 2

2 PHÂN PHỐI MẪU CỦA X 3

3 PHÂN PHỐ MẪU CỦA S 2 5

4 PHÂN PHỐI MẪU TỪ PHÂN PHỐI CHUẨN LÀ PHÂN PHỐI χ2 7

5 PHÂN PHỐI MẪU CỦA THỐNG KÊ THỨ TỰ 10


MSSV: 21110458

MSSV: 22110160

MSSV: 22110135

1
1 CÁC KẾT QUẢ BỔ SUNG
Kết quả 1. Nếu X ∼ N (0, 1) thì:
X 2 ∼ χ2 (1) (1)

Kết quả 2. Nếu X ∼ N µ, σ 2 thì:

X −µ
∼ N (0, 1) (2)
σ

Kết quả 3. Nếu X1 , X2 , . . . , Xn độc lập và có cùng phân phối N µ, σ 2 thì
n  2
X Xi − µ
∼ χ2 (n) (3)
i=1
σ

Kết quả 4. Một biến ngẫu nhiên X ∼ χ2 (n) thì có hàm sinh moment:

MX (t) = (1 − 2t)−n/2 (4)

Kết quả 5. Cho Z1 , Z2 , · · · là môt dãy các biến số ngẫu nhiên với hàm phân phối tích lũy FZn
và hàm sinh momen MZn , n ∈ N. Nếu biến số ngẫu nhiên Z có hàm phân phối tích lũy FZ và
hàm sinh momen MZ thỏa tính chất là MZn (t) → MZ (t), vói mọi t, thì ta có FZn (t) → FZ (t)
tại mọi điểm t mà tại đó FZ liên tuc.

Chứng minh: Chứng minh của các kết quả 1,2,3,4 được được học ở môn học: Lý thuyết độ
đo và xác suất1

1
Tài liệu 2,3

2
2 PHÂN PHỐI MẪU CỦA X

ĐỊNH LÝ 1: Chơ các biến ngẫu nhiên X1 , . . . , Xn độc lập và Xi ∼ N µi , σ22 , i = 1, . . . , n.
Khi đó Y = ni=1 ai Xi ∼ N
P Pn Pn 2 2 
i=1 a i µ i , i=1 ai σi , vời ai là hằng số.

ĐỊNH LÝ 2: Cho mẫu ngẫu nhiền (X1 , . . . , Xn ) lầy từ tổng thể có phần phối N µ, σ 2 .
Khi đó: !
σ2
X̄ ∼ N µ, . (5)
n

ĐỊNH LÝ 3: Định lý giá trị trung tâm.


Chứng minh. Định lý 1:
Ta có hàm sinh moment của Xi là
1 2 2
MXi (t) = eµi t+ 2 σi t i = 1, . . . , n.
Pn
Do X1 , . . . , Xn độc lập và cùng phân phối nên ta có hàm sinh môment của Y = i=1 ai X i
là n Pn 1 Pn
Mai Xi (t) = e( i=1 ai µi )t+ 2 ( i=1 ai σi )t
2 2 2
Y
Ma1 X1 +a2 X2 ...+ani Xni (t) =
i=1

Khi đó ta có  
n
X n
X n
X
Y = ai X i ∼ N  ai µ i , a2i σi2  .
i=1 i=1 i=1

Chứng minh. PĐịnh lý 2:


Ta có X̄ = n ni=1 Xi . Khi đó, ta có
1

 
n n n
1 X 1X 1X
E[X̄] = E  Xi  = E [Xi ] = µ = µ.
n i=1 n i=1 n i=1
 
n n n
1 X 1 X 1 X 2 σ2
Var[X̄] = Var  Xi = 2
 Var [Xi ] = 2 σ = .
n i=1 n i=1 n i=1 n

Khi đó, ta thấy !


σ2
X̄ ∼ N µ, .
n

Chứng minh. Định lý giá trị trung tâm:


Xét trường hợp µ = 0 và σ 2 = 1. Ta chứng minh với giả định thêm rằng các Xi có chung

3
một hàm sinh momen M (t) xác định trên một lân cận của 0 . Khi đó, hàm sinh momen của
xi

n
cho bởi
"  #  
ti t
E exp √ =M √
n n

và do đó hàm sinh momen của n


X X
√i
i=1
n

là "   #n
t
M √ .
n

Đặt L(t) = ln M(t). Ta có

L(0) = 0;
M′ (0)
L′ (0) = = µ = 0; và
M(0)
2
M(0)M′′ (0) − M′ (0)

′′
= E X2 = 1.

L (0) = 2
[M(0)]

Để chứng minh định lý ta dùng kết quả (5) bằng cách chứng tỏ rằng
"  #n
t 2
M √ → et /2 khi n → ∞,
n

hay tương đương là


t2
 
t
nL √ → khi n → ∞.
n 2
Thật vậy, do quy tắc L’Hospital, ta có
     
t ′ √t −3/2 ′ √t
L n√ −L n
n t L n
t
lim = lim = lim
n→∞ n−1 n→∞
 −2n

−2 n→∞ 2n−1/2

L′′ √tn n−3/2 t2 


t
 2
t t2
′′
= lim = lim L √ =
n→∞ −2n−3/2 n→∞ n 2 2

và do đó định lý giới hạn trung tâm đúng cho trường hợp µ = 0 và σ 2 = 1. Trường hợp tổng
quát được quy về trường hợp trên bằng cách xét dãy các biến số ngẫu nhiên chuẩn hóa
Xi − µ
Xi∗ = ,
σ
trong đó E (X∗i ) = 0 và var (X∗i ) = 1.

4
3 PHÂN PHỐ MẪU CỦA S 2
Chứng minh định lý sau: 2
1
Pn
Nếu S 2 = n−1 i=1 X i − X̄ là phương sai mẫu có hiệu chỉnh của mãu ngẫu nhiên

(X1 , X2 , . . . , Xn ) lấy từ tổng thể có phân phối N µ, σ 2 thì

(n − 1)S 2
U= ∼ χ2 (n − 1)
σ2

Chứng minh. Ta có X1 , X2 , . . . , Xn độc lập, có cùng phân phối N µ, σ 2 nên theo (5) ta có
 
n n n 2
X Xi X µ X σ 
X̄ = ∼N ,
i=1
n i=1
n i=1 n2
 2

hay X̄ ∼ N µ, σn .
X̄−µ
√ ∼ N (0, 1), và bằng kết quả (1)
Tới đây ta sử dụng các kết quả: Với kết quả (2) ta có σ/ n
ta có !2
X̄ − µ
√ ∼ χ2 (1).
σ/ n

Ta có n n
X 2 X  2
Xi − X̄ = (Xi − µ) + (µ − X̄)
i=1 i=1
n h
X i
2 2
= (Xi − µ) + 2 (Xi − µ) (µ − X̄) + (X̄ − µ)
i=1
Xn n
X n
X
= (Xi − µ)2 + 2(µ − X̄) (Xi − µ) + (X̄ − µ)2
i=1 i=1 i=1
n
X
= (Xi − µ)2 − 2n(X̄ − µ)2 + n(X̄ − µ)2
i=1
Xn
= (Xi − µ)2 − n(X̄ − µ)2 .
i=1

Suy ra !2 !2
n n  2
(n − 1)S 2 X Xi − X̄ X Xi − µ X̄ − µ
= = − √ .
σ2 i=1
σ i=1
σ σ/ n

Mặc khác với kết quả (3) ta có


n  2
X Xi − µ
∼ χ2 (n)
i=1
σ

5
Đặt !2
n  2
X Xi − µ 2 X̄ − µ
Y = ∼ χ (n), Z = √ ∼ χ2 (1).
i=1
σ σ/ n

Khi đó Y, Z độc lập do các biến ngẫu nhiên X1 , X2 , . . . , Xn độc lập. Suy ra hàm sinh moment
của Y − Z là
       
MY −Z (t) = E et(Y −Z) = E etY /etZ = E etY /E etZ
= (1 − 2t)−n/2 · (1 − 2t)1/2 = (1 − 2t)−(n−1)/2 .

Suy ra Y − Z ∼ χ2 (n − 1). Hay

(n − 1)S 2
U= ∼ χ2 (n − 1).
σ2

6
4 PHÂN PHỐI MẪU TỪ PHÂN PHỐI CHUẨN LÀ
PHÂN PHỐI χ2
ĐỊNH LÝ 1: Cho biến ngẫu nhiên Z ∼ N (0, 1), U ∼ χ2 (k), Z và U độc lập. Khi đó,
T = √Z ∼ t(k), t(k) là phân phối Student với bậc tự do k.
U/k

ĐỊNH LÝ 2: Cho mẫu ngẫu nhiên (X1 , . . . , Xn ) lấy từ tổng thể có phân phối N µ, σ 2 với
1
Pn 2
σ 2 chưa biết và S 2 = n−1 i=1 Xi − X̄ là phương sai mẫu có hiệu chỉnh. Khi đó,

X̄ − µ
T = √ ∼ t(n − 1)
S/ n
Chứng minh. Định lý 1:
Xét hai biến số ngẫu nhiên độc lập, Z ∼ N (0, 1) và U ∼ χ(k), với k ∈ N, nghĩa là
!   2−1
1 z2 1 u 2 −u
fZ (z) = √ exp − và fU (u) =   e 2 , với z, y > 0.
2π 2 2Γ k 2
2
q
U
Với W = k
, cdf và pdf của W cho bởi
r ! Z mw2 Z mw2   42 −1
U   1 u u
FW (w) = P(W ≤ w) = P ≤w = P U ≤ kw 2
= fU (u)du = n
 e− 2 du
k 0 2Γ 2 0 2

và   k2 −1
1 mw w2
fW (w) = F′W (w) =   e− 2 · 2kw.
2Γ k 2
2
Z
Xét T = W
. Ta có
∞   k2 Z ∞  !
t2 + k w2
Z
k 1 2− 12
fT (t) = wfZ (tw)fW (w)dw = √  2 exp − w2 ·wdw.
0 2πΓ k 2 0 2
2

(t2 +k)w2 
Đối biến q = 2
, dq = t2 + k wdw, ta được
  k2 Z ∞   22 − 21
1 k −q 2q dq
fT (t) = √  2 e 2
· 2
2πΓ k 2 0 t +k t +k
2
  k2 + 12 Z ∞
1 k 1 k+1
= √  k 2 2
t 2 −1 e−q dq
πΓ k2 t +k 0
 
Γ k+1
2 2

1
 k2 + 21
= √  k 2 2 .
πΓ k2 t +k

7
Bằng cách viết
  k+1
2
 k2 + 12 !− a+1
2
t2

3 1 3 1 1
k =k   =√ 1+ ,
2 2
 
2
t +k t2

k
k 1+ k
k

ta suy ra   !− k+1
Γ k+1
2 t2
2

fT (t) = √   1+ ,
kπΓ k2 k

T = √Z ∼ t(k).
U/k

Chứng minh. Định lý 2:


Xét hai biến số ngẫu nhiên độc lập, X ∼ χ (m) và Y ∼ χ (n), với m, n ∈ N. Ta có
  n2 −1   n2 −1
π 1− π2 1 y 1
fX (x) = m
 e và fY (y) = n
 e− 2 , với x, y > 0.
2Γ 2 2 2Γ 2 2
x
Với U = m
, cdf của U cho bởi
  Z mu
x
FU (u) = P (U ≤ u) = P ≤ u = P (X ≤ mu) = fX (x)dx
m 0

và do đó ta được pdf của U,


  π2 −1   n2
m mu −m 1 m m mu
fU (u) = mfX (mu) = e 2 = u 2 −1 e− 2 .
2Γ m2 m
 
2 Γ 2
2

Tương tự, ta được pdf cho V,


  a2
n1 a
−1 − an
fV (v) = v 2 e 2.
Γ n2

2

Bây giờ, với


U X/m
Z= =
V Y/n
ta có
Z ∞   n2   n2 Z ∞
1 m 1n n mvv a we
fZ (z) = vfU (zv)fV (v)dv = v(zv) 2 −1 e− 2 v 2 −1 e− 2 dv
Γ m2 n
 
0 2 Γ 2 2 0
  m2   a2 Z ∞   !
1 m n n man mz + n
= m
 n
 z 2 −1 v 2 −1 exp − v dv
Γ 2 Γ 2 2 2 0 2

8
mz+n mz+n
 
Đổi biến t = 2
v, dt = 2
dv, ta được
 m2   n2
 Z ∞  m+n −1
1 nm m
−1 2t 2 2
fz (z) = m
 n
 z 2 e−t dt
Γ 2 Γ 2
22 0 mz + n mz + 1
  m2   n2   m+2 Z ∞
1 m n m
−1 2 2 m+2
= m
 n
 z2 t 2 −1 e−t dt
Γ 2 Γ 2 2 2 mz + 1 0
m  n m+1
Γ m+n
     
2 m 2 n 2 m −1 2 2
= z 2
Γ m2 Γ n2
 
2 2 mz + 1
m

Bằng cách viết mz + n = n 1 + n
z , ta biến đổi
 π2   n2  m+n   m2 m
z 2 −1
 
m n n
−1 2 2 m
z 2 =  n+a .
2 2 mz + 1 n 1+ m z 2
n

Tóm lại, ta được


n m
Γ m+n m 2

2 n  z 2 −1
fz (z) =  m+a ,
Γ m2 Γ n
2 1+ m z 2
n
hay
X/m
Z= ∼ f(m, n)
Y/n
.

9
5 PHÂN PHỐI MẪU CỦA THỐNG KÊ THỨ TỰ
Định nghĩa: Gọi F là hàm phân phối của biến ngẫu nhiên liên tục. Cho mẫu ngẫu nhiên
(X1 , X2 , . . . , Xn ) lấy từ tổng thể có phân phối F. Thì Y1 ≤ Y2 ≤ . . . ≤ Yn với Yi là các giá
trị của Xi được sắp xếp theo thứ tự tăng dẩn. Yk được gọi là phần tử thống kê thứ tự thứ
k. Hàm phân phối tich lūy của Yk :
 
Xn
FYk (y) = P (Yk ≤ y) = P  Zi ≥ k 
i=1

Xác suất cho Yk ≤ y tươngPđương với xác suất có ít nhất k phần tử Xi ≤ y. ChoP y cố định,
n n
lượng Xi ≤ y trong
gọi Zi = I(−∞,y] Xi , ta có i=1 Zi là sốP n phần tử. Do đó i=1 Zi có
n P n P n 
phân phối Binom(n, F(y)). Suy ra, P Z
i=1 i ≥ k = j=k P Z
i=1 i = j . Vậy ta thu
được hàm cdf của phần tử thứ k là:
n
!
X n
FYk (y) = [F (y)]j [1 − F (y)]n−j
j
j=k

Với k = n: FYn (y) = [F (y)]n Với k = 1: FY1 (y) = P (Y1 ≤ y) = 1 − P (Y1 > y)

= 1 − P (Y1 > y) · P (Y2 > y) . . . ..P (Yn > y) = 1 − [1 − F (y)]n

⇒ Hàm mật độ xác suất (pdf) của trường hợp Ymin và Ymax là:

fY1 (y) = FY′ 1 (y) = n[1 − F (y)]n−1 f (y)


fYn (y) = FY′ n (y) = n[F (y)]n−1 f (y)

Hàm mật độ xác suất của Yk : nghĩa là tìm pdf của Yk tại vị trí y. Hay lim∆y→0 P [y<Y∆y
k <y+∆y]
.
P [y < Yk < y + ∆y] = P[(k − 1) phần từ Xi ≤ y, một Xi trong khoảng (y, y + ∆y], (n-k)
phần tử Xi > y + ∆y]. Chia thành 3 nhóm trên trục y, nhóm 1 gồm (k − 1) phần từ Xi nhỏ
hơn y, nhóm 2 gồm 1 phần từ Xi tại vị!trí y, nhóm 2 gồm ( n − k ) phần tử Xi lớn hơn y.
n
Ta có số cách xếp nhóm 1 là cách, số cách xếp nhóm 2 khi đã xếp nhóm 1 là
k−1
! !
n−k+1 n−k
cách, và số cách xếp nhóm 3 sau khi xếp 2 nhóm kia là . Vậy ta
1 n−k
! ! !
n n−k+1 n−k n!
có được số cách để xếp 3 nhóm trên là · · = (k−1)!(n−k)! .
k−1 1 n−k
Cùng với xác suất tương ứng của mối nhóm ta thu được:
n!
fYk (y) = FY′ k = [F (y)]k−1 [1 − F (y)]n−k f (y)
(k − 1)!1!(n − k)!
!
n
= k[F (y)]k−1 [1 − F (y)]n−k f (y)
k

10
Nếu mẫu ngẫu nhiên (X1 , X2 , . . . , Xn ) được lấy từ tổng thể có phân phối đều U (0, 1).
Khi đó pdf của Yk vơi 0 < y < 1 :
n!
fYk (y) = y k−1 [1 − y]n−k f (y)
(k − 1)!(n − k)!
Γ(n + 1) 1
= y k−1 [1 − y]n−k f (y) = y k−1 [1 − y]n−k f (y)
Γ(k)Γ(n − k + 1) B(k, n − k + 1)

⇒ Yk có cũng phân phối xác suất Beta(k,n+1-k). Hàm mật độ xác suất của nhiều phần tử
(JDF) Tương tự vời giải thích cho hàm mật đọ xác suất của Yk , chia thành 5 nhóm tên trục
y  
fYi ,Yj (u, v)∆u∆v ≈ P u < Yi < u + ∆u; v < Yj < v + ∆v ≈
P[(i − 1) phần tử Xi ≤ u, mọt Xi trong khoàng (u, u + ∆u], (j − i − 1) phần tử Xi trong
khoảng (u + ∆u, v], mọt Xi trong khoảng (v, v + ∆v], (n-j) phần tử Xi ≥ v + ∆v]. JDF của
Yi và Yj với 1 ≤ i < j ≤ n và u < v :

n!
fYi ,Yj (u, v) = [F (u)]i−1 [F (v) − F (u)]j−i−1 [1 − F (v)]n−j f (u)f (v)
(i − 1)!(j − i − 1)!(n − j)!

với v ≤ u : fYi ,Yj (u, v) = 0


Tổng Quát: với y1<y2<...<yn
n!
fY1 ,...,Yn (y1, . . . , yn) = lim Qn P [y1 < Y1 ≤ y1 + ∆y1 , . . . , yn < Yn ≤ yn + ∆yn ]
i=1 ∆yi
∆y→0

= n!f (y1) . . . f (yn)

Đối với mẫu có phân phối của biến ngẫu nhiên rời rạc: Cho hàm mặt độ của biến rời rạc
là px(k), k = 0, 1, 2, . . .. Cho mẫu ngẫu nhiên (X1 , X2 , . . . P
, Xn ) tữ px(k), chọn ngẫu nhiên 1
số nguyên m không âm. Hàm cuf được cho bởi FX (m) = m k=0 pk .
Xét A = (m ≤ X1 ∩ m ≤ X2 ∩ . . . ∩ m ≤ Xn) và B = (m + 1 ≤ X1 ∩ . . . ∩ m + 1 ≤ Xn ) thì
 
pXmin (m) = P A ∩ B C = P (A) − P (A ∩ B) = P (A) − P (B)
 n
P (A) = P (m ≤ X1 ) · P (m ≤ X2 ) . . . ..P (m ≤ Xn ) = 1 − FX (m − 1)
 n  n  n
Tương tự: P (B) = 1 − FX (m) Vậy, pXmin (m) = 1 − FX (m − 1) − 1 − FX (m)

11

You might also like