Download as pdf or txt
Download as pdf or txt
You are on page 1of 12

Seminar iz Primijenjene statistike

Zadatak 14

Matea Pavić

23. svibnja 2017.


Hotellingov T 2 -test za dva uzorka
Podaci: ALM, Exercise 1.8.3, str. 68. i 70.

a) Opišite test omjera vjerodostojnosti za hipotezu jednakosti očekivanja (TMS 8.9,


Problem 1, str.137-138.) dva normalna uzorka.
b) Ispitajte normalnost podataka.
c) Sprovedite test iz a) na usporedbu skupina ”Thyroxin” i ”Thiouracil” iz zadatka.

1
a) Neka su x1 , . . . ,xn iz Np (µ, Σ) i y1 , . . . , ym iz Np (τ , Σ), Σ > 0, dva nezavisna
uzorka.

Definiramo uzoračke varijance:


n
1 X
Sx = (xi − x̄)(xi − x̄)t (1)
n − 1 i=1

m
1 X
Sy = (yi − ȳ)(yi − ȳ)t (2)
m − 1 i=1

1
Spool = ((n − 1)Sx + (m − 1)Sy ) (3)
n+m−2

(i) Odredimo prvo distribuciju od Spool .


Sa predavanja znamo da su pogreškovne statistike jednake

Gx = (n − 1)Sx , Gy = (m − 1)Sy (4)


,te da su Wishartove distribucije, tj.

(n − 1)Sx ∼ wp (n − 1, Σ), (m − 1)Sy ∼ wp (m − 1, Σ) (5)

Definicija Wishartove distribucije povlači da postoje nezavisni slučajni vektori


Xi ∼ Np (0, Σ), i = 1, . . . , n i nezavisni slučajni vektori Yj ∼ Np (0, Σ), j = 1, . . . , m
takvi da vrijedi
p p
X X
(n − 1)Sx = Xi Xit , (m − 1)Sy = Yi Yit (6)
i=1 i=1

Stavimo Zi = Xi za i = 1, . . . , n − 1 i Zn−1+i = Yi za i = 1, . . . , m − 1.
Sada imamo n+m−2 nezavisnih jednako distribuiranih slučajnih vektora iz Np (0, Σ)
takve da vrijedi
n+m−2
X
(n − 1)Sx + (m − 1)Sy = Zi Zit (7)
i=1

2
Iz definicije Wishartove distribucije dobivamo

(n + m − 2)Spool ∼ wp (n + m − 2, Σ) (8)

(ii) Odredimo distribuciju od T 2


Za testiranje hipoteza H0 : µ = τ, H1 : µ 6= τ koristimo statistiku T 2 koja je
dana s
1 1 −1
T2 = ( + )−1 (x̄ − ȳ)t Spool (x̄ − ȳ) (9)
n m

Trebamo odrediti njenu distribuciju. Dijeljenjem (9) s n + m − 2 dobivamo


1 1 1
T 2 = ( + )−1 (x̄ − ȳ)t ((n + m − 2)Spool )−1 (x̄ − ȳ) (10)
n+m−2 n m

Zapišimo modele:

x = 1n µt + Ex , y = 1m τ t + Ey (11)

,vec(Ex ) ∼ Nnp (0, Σ ⊗ In ), vec(Ey ) ∼ Nmp (0, Σ ⊗ Im ).


Sa predavanja slijedi µ̂t = (1tn 1n )−1 1tn x = x̄t i slično τ̂ t = ȳ t .
Kako su Ex i Ey normalno distribuirani vrijedi
1 t 1 1 1
ex := Ex 1n ∼ Np (0, Σ), ey := Ext 1m ∼ Np (0, Σ) (12)
n n m m

Zbog x̄ − µ = ex i ȳ − τ = ey slijedi
1 n+m
T2 = ( )(ex + µ − τ − ey )t ((n + m − 2)Spool )−1 (ex + µ − τ − ey ) (13)
n+m−2 nm

Kako je Σ > 0 regularna i ex i ey su nezavisni, vrijedi ex − ey ∼ Np (0, ( n1 + m1 )Σ),pa


s predavanja slijedi
1 1
q (µ − τ + ex − ey ) ∼ Np ( q (µ − τ ), Σ) (14)
1 1 1 1
n
+ m n
+ m

3
1
Stavimo li Z := Σ− 2 √ 11 1
(µ − τ + ex − ey ) dobivamo
n
+m
1
Z ∼ Np (Σ− 2 √ 11 1
(µ − τ ), Ip )
n
+m

1 1
Odredimo distribuciju od W := (n + m − 2)Σ− 2 Spool Σ 2 . Primijetimo prvo da je
1
n+m−2
T2 = Z t W −1 Z.

Kako je (n + m − 2)Spool Wishartove distribucije znamo da postoji n+m-2


nezavisnih,jednako distribuiranih slučajnih vektora iz Np (0, Σ) takvih da je
(n + m − 2)Spool = n+m−2 Xi Xit . Sada je
P
i=1
1 1
W = n+m−2 (Σ− 2 Xi )(Σ− 2 Xi )t
P
i=1
1
Zbog Σ− 2 Xi ∼ Np (0, Ip ), slijedi W ∼ wp (n + m − 2).

Na predavanjima smo pokazali sljedeće:

Ako su Z ∼ Nd (δ, I), W ∼ wd (m), m ≥ d,nezavisne, onda je


m − d + 1 t −1 1
Z W Z ∼ F (d, m − d + 1; δ t δ) (15)
d 2

Sada iz svega slijedi


n+m−p−1 1 1
T 2 ∼ F (p, n + m − p − 1; δ t δ) (16)
p n+m−2 2

(iii) Test omjera vjerodostojnosti


Neka su X1 , . . . , Xn nezavisni, p-dimenzionalni slučajni vektori, Xi ∼ Np (µ, Σ),
Σ > 0. Tražimo test omjera vjerodostojnosti za testiranje hipoteza
H0 : θ ∈ Θ0 , H1 : θ ∈ Θ1 , tj. H0 : µ = τ , H1 : µ 6= τ , gdje je
Θ = Θ0 ∪ Θ1 = {(µ0 , µ1 , Σ) : µ0 , µ1 ∈ Mp,1 , Σ ∈ Mn , Σ > 0}, Θ1 = Θc0 .
Omjer vjerodostojnosti je funkcija Λ : Rn → R definirana sa

max{L(θ) : θ ∈ Θ0 }
Λ= (17)
max{L(θ) : θ ∈ Θ}

4
Vrijedi
np n np
L(µ̂, Σ̂) = exp(l(µ̂, Σ̂)), l(µ̂, Σ̂) = log(2π) − log(det(Σ̂)) −
2 2 2
Primijenimo gornje razmatranje na uzorke s početka zadatka,tj. na x1 , . . . , xn iz
Np (µ, Σ) i y1 , . . . , ym iz Np (τ , Σ) (uzorci su nezavisni).
Gx = (n − 1)Sx , Gy = (m − 1)Sy , (n + m)Σ̂ = Gx + Gy

Logaritmiranjem L(θ) = L(µ0 , µ1 , Σ) dobivamo

(n + m)p 1
l(µ0 , µ1 , Σ) = − log(det(Σ)) − tr((n + m)Σ̂Σ−1 )−1
2 2

n m
− (x̄ − µ0 )t Σ−1 (x̄ − µ0 ) − (ȳ − µ)t Σ−1 (ȳ − µ)
2 2

Maksimiziranjem slijedi
p(n+m) n+m p(n+m)
L(µˆ0 , µˆ1 , Σ̂) = (2π)− 2 det(Σ̂)− 2 e− 2

Ako uzmemo θ ∈ Θ0 (tj. uz H0 ),imamo


p(n+m) n+m 1
L(µˆ0 , µˆ0 , Σ̂) = log(2π)− 2 − log(det(Σ)) − tr((Gx − Gy )Σ−1 )
2 2

n m
− (x̄ − µ0 )t Σ−1 (x̄ − µ0 ) − (ȳ − µ0 )t Σ−1 (ȳ − µ0 )
2 2

Za procjenu Σ̂0 dobije se


1 nm
Σ̂0 = (Gx + Gy + (x̄ − ȳ)(x̄ − ȳ)t )
n+m n+m
Ponovno,maksimiziranjem dobivamo
p(n+m) n+m p(n+m)
L(µˆ0 , µˆ0 , Σ̂0 ) = (2π)− 2 det(Σ̂0 )− 2 e− 2

5
Sada je omjer vjerodostojnosti
1 nm
L(µˆ0 , µˆ0 , Σ̂0 ) det(Σ̂0 ) n+m det( n+m (Gx + Gy + n+m
(x̄ − ȳ)(x̄ − ȳ)t )) n+m
Λ= =( )− 2 =( 1 )− 2
L(µˆ0 , µˆ1 , Σ̂) det(Σ̂) det( n+m (Gx + Gy ))

Iz A, B ∈ Mp,q ⇒ det(Ip + AB) = det(Iq + BA), za A = (Gx − Gy )−1 (x̄ − ȳ) i


1 −1
B = ( n1 + m
) (x̄ − ȳ)t dobivamo
1 n+m
Λ = (1 + T 2 )− 2 (18)
n+m−2

Dakle Λ je funkcija od T 2 .
Izračunajmo još p-vrijednost testa omjera vjerodostojnosti, pv = P(Λ ≤ c).
n+m
Definiramo strogo padajuću funkciju f (t) = (1 + 1
n+m−2
t)− 2 . Sada je Λ = f (T 2 ).

n+m−p−1 2 n+m−p−1 −1
⇒ pv = 1 − P(T 2 ≤ f −1 (c)) = 1 − P( p(n+m−2) T ≤ p(n+m−2)
f (c))
n+m−p−1 2
Pod pretpostavkom H0 je p(n+m−2)
T ∼ F (p, n + m − p − 1), pa možemo izračunati
p-vrijednost.

6
b) Ispitajmo normalnost podataka (podaci su težine 3 skupine štakora u gra-
mima, koja je mjerena tjedno) Lillieforsovom inačicom Kolmogorov-Smirnovljevog
testa, te Shapiro-Wilkinsonovim testom normalnosti.

Dobiveni rezultati:

• Time 0
Lillie test: D = 0.1694, p-value = 0.7868
Shapiro: W = 0.88797, p-value = 0.2642

• Time 1
Lillie test: D = 0.26723, p-value = 0.1363
Shapiro: W = 0.78898, p-value = 0.03182

• Time 2
Lillie test: D = 0.18911, p-value = 0.6303
Shapiro: 0.95952, p-value = 0.8146

• Time 3
Lillie test: D = 0.20478, p-value = 0.5021
Shapiro: W = 0.8977, p-value = 0.3173

• Time 4
Lillie test: D = 0.23784, p-value = 0.2696
Shapiro: W = 0.85604, p-value = 0.1395

7
Dobiveni rezultati:

• Time 0
Lillie test: D = 0.15909, p-value = 0.6719
Shapiro: W = 0.94558, p-value = 0.6166

• Time 1
Lillie test: D = 0.13478, p-value = 0.8732
Shapiro: W = 0.97143, p-value = 0.9037

• Time 2
Lillie test: D = 0.18948, p-value = 0.3916
Shapiro: W = 0.94085, p-value = 0.5625

• Time 3
Lillie test: D = 0.11301, p-value = 0.9735
Shapiro: W = 0.97818, p-value = 0.9547

• Time 4
Lillie test: D = 0.17052, p-value = 0.5629
Shapiro: W = 0.9358, p-value = 0.5073

8
Dobiveni rezultati:

• Time 0
Lillie test: D = 0.14352, p-value = 0.8096
Shapiro: W = 0.96045, p-value = 0.791

• Time 1
Lillie test: D = 0.1817, p-value = 0.4592
Shapiro: W = 0.92074, p-value = 0.3632

• Time 2
Lillie test: D = 0.15658, p-value = 0.6955
Shapiro: W = 0.97756, p-value = 0.9508

• Time 3
Lillie test: D = 0.16512, p-value = 0.6145
Shapiro: W = 0.92772, p-value = 0.4259

• Time 4
Lillie test: D = 0.16797, p-value = 0.5872
Shapiro: W = 0.95393, p-value = 0.7151

9
Vidimo da su sve p-vrijednosti ”velike”,osim u slučaju Time 1 kod skupine
Thyroxin,gdje nam Shapirov test normalnosti daje pv=0.03182.
Dakle na svim razumnim razinama značajnosti nećemo odbaciti H0 (podaci su nor-
malno distribuirani),osim za Time 1 skupine Thyroxin gdje odbacujemo H0 u korist
alternative. Taj slučaj možemo provjeriti i grafičkim testom:

Thyroxin,Time 1
85

● ●
80
Sample Quantiles

75


70

−1.0 −0.5 0.0 0.5 1.0

Theoretical Quantiles

10
c) Sprovedimo test iz a) na usporedbu skupina ”Thyroxin” i ”Thiouracil”

Dobiveni rezultati:
T 2 = 30.76503, Λ = 7.624986e − 05
f = 67.68306, pv = 6.93855e − 08
Zaključak:
Kako je p-vrijednost jako mala odbacujemo H0 u korist H1 na svim razumnim
razinama značajnosti,tj.očekivana težina štakora u skupini tretiranoj Thyroxinom i
u skupini tretiranoj Thiouracilom nije jednaka.

11

You might also like