Professional Documents
Culture Documents
Stat - Estymacja
Stat - Estymacja
Stat - Estymacja
Zagadnienie 3
Robert Kapłon
Statystyka dla inżynierów
Semestr zimowy
Plan prezentacji
2 Estymacja punktowa
4 Własności estymatorów
5 Estymacja przedziałowa
Procedura konstrukcji przedziału
Przedział ufności dla średniej µ
Przedziały ufności dla frakcji
1
1. Populacja, próba i wnioskowanie statystyczne
Definicje
x1 , x2 , . . . , xn
2
2. Estymacja punktowa
Pojęcia podstawowe
3
Pojęcia podstawowe cd.
5
Funkcja wiarygodności – definicja
5
Estymator największej wiarygodności
6
Estymator największej wiarygodności
Twierdzenie o niezmienniczości
Jeśli θ̂ jest estymatorem największej wiarygodności parametru θ, wtedy g( θ̂)
jest również estymatorem g(θ) dla każdej funkcji g.
6
Estymator największej wiarygodności
Twierdzenie o niezmienniczości
Jeśli θ̂ jest estymatorem największej wiarygodności parametru θ, wtedy g( θ̂)
jest również estymatorem g(θ) dla każdej funkcji g.
Przykład niezmienniczości:
2
1. Jeśli estymatorem parametru θ jest X, to estymatorem θ 2 będzie X .
2. Jeśli estymatorem wartości średniej w rozkładzie
p Bernoulliego jest p̂ to
estymatorem odchylenia standardowego jest p̂(1 − p̂)
6
Szacowanie parametrów metodą ML
∂ log L(θ|x)
=0
∂θ
4. otrzymany w ten sposób estymator należy wykorzystać do sprawdzenia
warunku dostatecznego istnienia ekstremum
∂ 2 log L(θ|x)
<0
∂θ 2 θ=θ̂
7
Wyznaczanie estymatorów — zadania
f(x|p) = px (1 − p) 1−x , x = 0, 1.
λx
f(x|λ) = e−λ , x = 0, 1, . . .
x!
Znajdź estymator największej wiarygodności parametru λ.
Zadanie 3. Niech X1, . . . , Xn ∼ N (µ, σ 2 ). Parametry θ = (µ, σ 2 ). Oszacuj
nieznany wektor θ parametrów.
8
4. Własności estymatorów
Uwagi ogólne
9
Estymator nieobciążony
Å[ θ̂] = θ, θ ∈ Θ.
10
Estymator nieobciążony
Å[ θ̂] = θ, θ ∈ Θ.
10
Sprawdzanie obciążoności estymatorów
11
Estymator efektywny – definicja
to mówimy, że estymator θ̂1 jest bardziej efektywny niż θ̂2 . Z kolei miarą
efektywność θ̂1 jest iloraz Var( θ̂2 )/Var( θ̂1 )
12
Estymator efektywny – definicja
to mówimy, że estymator θ̂1 jest bardziej efektywny niż θ̂2 . Z kolei miarą
efektywność θ̂1 jest iloraz Var( θ̂2 )/Var( θ̂1 )
12
Estymator efektywny – nierówność Cramèra-Rao
13
Estymator efektywny – nierówność Cramèra-Rao
13
Estymator efektywny – przykład
14
Estymator efektywny – przykład
14
Estymator efektywny – przykład
14
Estymator efektywny – przykład
1 Ín 1
Z kolei lewa strona Var(X) = n2 i=1 Var(Xi ) = n2
n Var(X) = σ 2 /n
14
Estymator zgodny – definicja
15
Własności estymatorów największej wiarygodności
θ̂ − θ
q ⇝ N (0, 1)
Var( θ̂)
gdzie
1
Var( θ̂) = 2
∂ log f(x |θ)
nÅ ∂θ
16
5. Estymacja przedziałowa
Definicja ogólna przedziału ufności
Ð(TL ⩽ θ ⩽ TU ) = 1 − α
17
Uwagi odnośnie przedziału ufności
18
Konstrukcja przedziału ufności i funkcja centralna
Ð(a ⩽ Q(X; θ) ⩽ b) = 1 − α
19
Konstrukcja przedziału ufności i funkcja centralna cd.
TL (X; a, b) ⩽ θ ⩽ TU (X; a, b)
F(xα ) = α
20
Przykłady funkcji centralnych
θ̂ − θ X−µ X − µ√
q =p = n ∼ N (0, 1)
2
σ /n σ
Var( θ̂)
21
Przykłady funkcji centralnych
θ̂ − θ X−µ X − µ√
q =p = n ∼ N (0, 1)
2
σ /n σ
Var( θ̂)
Tym samym
X − µ√
Q(X; µ) = n ∼ N (0, 1)
σ
jest funkcją centralną parametru µ o zestandaryzowanym rozkładzie
normalnym — rozkład nie zależy od parametrów.
21
Przykłady funkcji centralnych
iid
Niech próba X1, X2, . . . , Xn ∼ N (µ, σ 2 ), gdzie µ i σ 2 są nieznanymi
parametrami. Przyjmując, że estymatorami parametrów µ i σ 2 są
1Õ 1 Õ 2
n n
X= Xi , S2 = Xi − X
n n−1
i=1 i=1
X − µ√
Q(X; µ) = n ∼ t(n − 1)
S
n−1 2
Q(X; σ 2 ) = S ∼ χ 2 (n − 1)
σ2
gdzie t(n − 1) oznacza rozkład t-Studenta z n − 1 stopniami swobody, a
χ 2 (n − 1) jest rozkładem chi-kwadrat z n − 1 stopniami swobody.
22
Przykład konstrukcji przedziału dla µ (znane σ 2 )
Do konstrukcji przedziału ufności dla parametru µ (średniej) i zadanej liczbowo σ 2
wykorzystajmy wyprowadzoną wcześniej funkcję centralną
X−µ√
Q(X; µ) = n ∼ N (0, 1)
σ
Stałe a i b znajdziemy, przyjmując minimalną długość przedziału (czyli a = −b)
!
X−µ√
Ð(a ⩽ Q(X; θ) ⩽ b) = 1 − α ⇒ Ð −b ⩽ n ⩽ b =1−α ⇒
σ
α α
⇒ Φ(b) − Φ(−b) = 1 − α ⇒ 2Φ(b) − 1 = 1 − α ⇒ Φ(b) = 1 − ⇒ b = Φ−1 1 −
2 2
23
Przykład konstrukcji przedziału dla µ (znane σ 2 )
Do konstrukcji przedziału ufności dla parametru µ (średniej) i zadanej liczbowo σ 2
wykorzystajmy wyprowadzoną wcześniej funkcję centralną
X−µ√
Q(X; µ) = n ∼ N (0, 1)
σ
Stałe a i b znajdziemy, przyjmując minimalną długość przedziału (czyli a = −b)
!
X−µ√
Ð(a ⩽ Q(X; θ) ⩽ b) = 1 − α ⇒ Ð −b ⩽ n ⩽ b =1−α ⇒
σ
α α
⇒ Φ(b) − Φ(−b) = 1 − α ⇒ 2Φ(b) − 1 = 1 − α ⇒ Φ(b) = 1 − ⇒ b = Φ−1 1 −
2 2
z kolei Φ−1 1 − α2 jest kwantylem rzędu 1 − α/2 (odczytywanym z tablic) co oznaczamy
z ( 1− α ) . Przedział wyznaczamy
2
23
Przykład konstrukcji przedziału dla µ (znane σ 2 )
Do konstrukcji przedziału ufności dla parametru µ (średniej) i zadanej liczbowo σ 2
wykorzystajmy wyprowadzoną wcześniej funkcję centralną
X−µ√
Q(X; µ) = n ∼ N (0, 1)
σ
Stałe a i b znajdziemy, przyjmując minimalną długość przedziału (czyli a = −b)
!
X−µ√
Ð(a ⩽ Q(X; θ) ⩽ b) = 1 − α ⇒ Ð −b ⩽ n ⩽ b =1−α ⇒
σ
α α
⇒ Φ(b) − Φ(−b) = 1 − α ⇒ 2Φ(b) − 1 = 1 − α ⇒ Φ(b) = 1 − ⇒ b = Φ−1 1 −
2 2
z kolei Φ−1 1 − α2 jest kwantylem rzędu 1 − α/2 (odczytywanym z tablic) co oznaczamy
z ( 1− α ) . Przedział wyznaczamy
2
X−µ√ σ σ
− z ( 1− α ) ⩽ n ⩽ z ( 1− α ) ⇒ X − z ( 1− α ) √ ⩽ µ ⩽ X + z ( 1− α ) √
2 σ 2 2 n 2 n
Możliwa jest sytuacja, gdy a = −∞ lub b = ∞. Wtedy otrzymamy tzw. przedziały
jednostronne.
23
Przedziału ufności dla µ, gdy nieznane σ 2
Raczej nie zdarza się, aby σ 2 było znane. Dlatego w praktyce do konstrukcji
przedziału dla średniej wykorzystujemy funkcję centralną
X − µ√
Q(X; µ) = n ∼ t(n − 1)
S
Postępując dokładnie jak w wypadku, gdy σ 2 było znane, możemy otrzymać
następujący przedział
α S α S
X−t 1− ,n−1 √ ⩽ µ ⩽ X+t 1− ,n−1 √
2 n 2 n
gdzie t 1 − α2 , n − 1 jest kwantylem rzędu (1 − α/2) rozkładu t-Studenta o n − 1
stopniach swobody. √
Uwaga:
√ Można spotkać alternatywną postać przedziału, gdzie zamiast n jest
n − 1. Oznacza to, że przyjęto estymator obciążony wariancji S2 (czyli
występuje w niej składnik n1 a nie n−11
).
24
Przedział ufności dla średniej — zadanie
Zadanie 4. Przeprowadzono badanie na próbie 10 kobiet w wieku 19-30 lat.
Zapytano je o liczbę dziennie spożywanych kalorii i otrzymano: 1847, 1920,
1978, 1958, 2000, 2018, 1893, 2037, 1920, 2030. Przyjmując poziom ufności
1 − α = 0.95 oszacować metodą przedziałową średnią dostarczanych kalorii.
25
Przedział ufności dla średniej — zadanie
Zadanie 4. Przeprowadzono badanie na próbie 10 kobiet w wieku 19-30 lat.
Zapytano je o liczbę dziennie spożywanych kalorii i otrzymano: 1847, 1920,
1978, 1958, 2000, 2018, 1893, 2037, 1920, 2030. Przyjmując poziom ufności
1 − α = 0.95 oszacować metodą przedziałową średnią dostarczanych kalorii.
Ponieważ nie znamy σ 2 , wiec wykorzystamy przedział
α S α S
X−t 1− ,n−1 √ ⩽ µ ⩽ X+t 1− ,n−1 √
2 n 2 n
26
Uwagi do: X − t 1 − α2 , n − 1 √S ⩽ µ ⩽ X + t 1 − α2 , n − 1 √S
n n
1. Założenie mówiące o rozkładzie normalnym badanej cechy nie jest tak istotne
(model jest dość odporny), chyba że występują wartości odstające lub rozkład jest
bardzo skośny. Statystyki X i S2 nie są odporne na wartości odstające.
2. Należy więc zidentyfikować wartości odstające i podjąć decyzję co z nimi zrobić.
3. Jeśli próba jest duża, to nie musimy się przejmować normalnością rozkładu
pojedynczych obserwacji, ponieważ interesuje nas rozkład średniej X. Wiemy z CTG,
że X zbiega do rozkładu normalnego.
4. Również estymowany S2 , bez względu na rozkład, wraz ze wzrostem próby dąży do
σ 2 (zgodnie z prawem wielkich liczb).
5. Próba mniejsza niż 15: użyj przedziału, gdy obserwacje mają rozkład normalny. Gdy
występują obserwacje odstające lub/i brak normalności – zrezygnuj.
6. Jeśli próba n ⩾ 40, a rozkład jest skośny, można użyć tego przedziału.
27
Przedział ufności Walda dla frakcji p̂
Niech X1, X2, . . . , Xn będzie próbą losową, w której każde Xi (i = 1, . . . , n) ma
rozkład BernoulliegoÍz parametrem p, więc P(Xi = 1) = p. Oznaczając liczbę
sukcesów przez X = ni=1 Xi estymatorem największej wiarygodności p jest
X
p̂ = .
n
Z własności MLE wiemy, że gdy n → ∞ wtedy
p̂ − p
Q(X; p) = p ∼ N(0, 1).
Var( p̂)
gdzie Var( p̂) = p̂(1 − p̂)/n (niezmienniczość), a z(1 − α/2) jest kwantylem rzędu
1 − α/2 zestandaryzowanego rozkładu normalnego.
28
Przedział ufności Walda (cd.)
29
Przedział ufności Wilsona dla frakcji p̂
Kiedy rozmiar próby jest mały (n < 40) wtedy (1 − α)100% przedział ufności
(Wilsona) ma postać:
s s
√ √
z1−α/2 n z21−α/2 z1−α/2 n z21−α/2
p̃ − p̂(1 − p̂) + < p < p̃ + p̂(1 − p̂) +
n + z21−α/2 4n n + z21−α/2 4n
gdzie
X + 21 z21−α/2
p̃ = , z1−α/2 = z(1 − α/2)
n + z21−α/2
Uwagi:
Przedział Wilsona zawsze ma granice między 0 a 1.
W stosunku do innych sposobów szacowania przedziałów, tutaj prawdziwy
poziom ufności jest najbliższy temu przyjętemu.
30
Przedział ufności Cloppera-Pearsona (dokładny) dla frakcji p̂
W konstrukcji tego konserwatywnego przedziału wykorzystuje się związek
między rozkładem dwumianowym a rozkładem beta.
Budowa (1 − α)100% przedziału Cloppere-Pearsona sprowadza się do
wyznaczenia odpowiednich kwantyli z dwóch rozkładów beta.
Uwagi:
Konserwatywny oznacza, że prawdziwy poziom ufności jest zawsze równy
lub większy od postulowanego/założonego poziomu 1 − α.
Niektórzy uważają, że z praktycznego poziomu widzenia nie jest on dobrym
wyborem, właśnie ze względu na jego konserwatywność – zwykle jest
szerszy od innych przedziałów.
Swoją nazwę dokładny przedział ten zawdzięcza wykorzystaniu rozkładu
dokładnego. Wspomniana wcześniej funkcja binconf() oznacza go jako
exact.
31
Przedział ufności dla frakcji — zadanie
32