Download as pdf or txt
Download as pdf or txt
You are on page 1of 13

Estymacja przedziałowa

Aneta Wróblewska

II Informatyki lic.
Instytut Informatyki UMCS

Aneta Wróblewska Estymacja przedziałowa


Wprowadzenie

Liczba stopni swobody – liczba niezależnych wyników obserwacji


pomniejszona o liczbę związków, które łączą te wyniki ze sobą. Liczbę
stopni swobody można utożsamiać z liczbą niezależnych zmiennych
losowych, które wpływają na wynik.

Rozkład chi-kwadrat (χ2 )


Zakładając, że X1 , X2 , . . . , Xk są niezależnymi zmiennymi losowymi o
rozkładzie normalnym o parametrach µ = 0 i σ = 1, zmienna losowa
k
Xi2 ma rozkład χ2 o k stopniach swobody. Piszemy Y ∼ χ2 .
P
Y =
i=1

E χ2 = k
D 2 χ2 = 2k

σ(χ2 ) = 2k
Dla różnych k stablicowane są wartości dystrybuanty F (χ2 ).

Aneta Wróblewska Estymacja przedziałowa


Rozkład chi-kwadrat

W literaturze
√ można spotkać się z zapisem rozkładu chi-kwadrat jako
χ2 (k; 2k), co oznacza, że podana zmienna ma rozkład chi-kwadrat o k
stopniach swobody. Rozkład χ2 jest rozkładem asymetrycznym, przy
czym wraz ze wzrostem k rozkład staje się coraz bardziej zbliżony do
symetrycznego, a dla k > 30 podany
√ rozkład dąży (wraz ze wzrostem k)
do rozkładu normalnego N(k, 2k). Oznacza to, że wraz ze wzrostem k
(powyżej 30) rozkład χ2 przechodzi w rozkład asymptotycznie normalny
o tych samych parametrach E χ2 = k i D 2 χ2 = 2k

Aneta Wróblewska Estymacja przedziałowa


Wprowadzenie

Rozkład t-Studenta

Jeżeli Z ∼ N(0; 1) i χ2 ∼ χ2 (k;
√ 2k) są niezależnymi zmiennymi
losowymi, to zmienna T = χZ2 k ma rozkład t-Studenta o k stopniach
swobody.

Rozkład t-Studenta jest rozkładem symetrycznym względem prostej


x = 0, a jego kształt jest bardzo zbliżony do rozkładu normalnego
standaryzowanego.
ET = 0 dla k ≥ 2
k
D 2T = k−2
q
k
σ(T ) = k−2
Dla k > 30 zmienna o rozkładzie t-Studenta ma rozkład przybliżony
do rozkładu normalnego standaryzowanego N(0, 1).

Aneta Wróblewska Estymacja przedziałowa


Rozkład t-Studenta

Dla różnych wartości k i różnych prawdopodobieństw α stablicowane są


wartości tα takie, dla których spełniona jest zależność

P(−tk,α < T < tk,α ) = 1 − α

dla k stopni swobody.

Aneta Wróblewska Estymacja przedziałowa


Estymacja - podstawowe pojęcia

Parametr zbiorowości generalnej (Θ) - miara opisowa, na przykład


średnia arytmetyczna (µ), odchylenie standardowe (σ),
której wartość na ogół jest nieznana;
Estymator (statystyka)(Tn ) - miara opisowa pochodząca z n-elementowej
próby losowej, np. średnia arytmetyczna (x), odchylenie
standardowe (S). Ponieważ może istnieć nieskończenie
wiele prób, estymator jest zatem zmienną losową.
Estymacja punktowa - procedura pozwalająca wyznaczyć konkretną
wartość będącą oszacowaniem nieznanego parametru
zbiorowości generalnej.
Estymacja przedziałowa - procedura pozwalająca na ustalenie przedziału
liczbowego, który z określonym prawdopodobieństwem
zawiera nieznaną wartość parametru zbiorowości
generalnej.

Aneta Wróblewska Estymacja przedziałowa


Własności estymatorów
Estymatory użyteczne w teorii estymacji parametrów to estymatory
nieobciążone, zgodne oraz relatywnie najbardziej efektywne.
Nieobciążoność - jeśli wartość oczekiwana estymatora stosowanego do
wyznaczania nieznanego parametru zbiorowości generalnej
jest równa wartości tego parametru, to taki estymator
nazywamy nieobciążonym

E (Tn ) = Θ

Zgodność - własność estymatora powodująca, że wraz ze wzrostem


liczebności próby wartość estymatora zbliża się do
parametru zbiorowości generalnej:

lim P{|Tn − Θ| < } = 1,


n→∞

gdzie  > 0 jest dowolnie małą liczbą.


Efektywność - spośród dwóch estymatorów wybieramy ten, którego
wariancja jest mniejsza. Miarą efektywności jest zatem
jego wariancja D 2 (Tn )
Aneta Wróblewska Estymacja przedziałowa
Estymacja przedziałowa nieznanej wartości średniej

W przypadku estymacji punktowej do oszacowania nieznanej wartości


parametru służy tylko jedna wartość, która rzadko jest równa
parametrowi zbiorowości generalnej. Ponadto procedura estymacji
punktowej nie dostarcza żadnych dodatkowych informacji mogących
zbliżyć nas do prawdziwej wartości parametru. W związku z tym
stosujemy się estymację przedziałową, dzięki której możemy zbudować
przedział liczbowy, który z określoną wiarygodnością (ufnością) zawierał
będzie nieznaną wartość parametru zbiorowości generalnej. Dodatkowo
przedział ten zwany przedziałem ufności podajemy z poziomem ufności.
Współczynnik ufności (poziom ufności) - prawdopodobieństwo, że
nieznana wartość parametru będzie mieściła się w
przedziale wyznaczonym dzięki estymacji przedziałowej.
Współczynnik ufności oznacza się jako 1 − α. Najczęściej
ma on wartość 0, 99, 0.95 lub 0, 90.

Aneta Wróblewska Estymacja przedziałowa


Przedział ufności dla średniej

Końce przedziału ufności wylicza się według odpowiednich wzorów w


zależności od przyjętego modelu przyjmując dany poziom ufności.
Model I
populacja generalna ma rozkład normalny N(µ, σ);
odchylenie standardowe σ jest znane;
parametr µ jest nieznany, dla niego szukamy przedziału ufności;
próba o liczebności n.
Przedział ufności ma wtedy postać:
σ σ
P(X − µα √ < µ < X + µα √ ) = 1 − α,
n n

gdzie X jest średnią z próby, zaś µα obliczamy z zależności


P(|U| > µα ) = α (U ma standardowy rozkład normalny).

Aneta Wróblewska Estymacja przedziałowa


Przedział ufności dla średniej

Model II
populacja generalna ma rozkład normalny N(µ, σ);
odchylenie standardowe σ nie jest znane;
parametr µ jest nieznany, dla niego szukamy przedziału ufności;
próba o małej liczebności n, n ≤ 30.
Przedział ufności ma wtedy postać:
S S
P(X − tα,n−1 √ < µ < X + tα,n−1 √ ) = 1 − α,
n−1 n−1

gdzie X jest średnią z próby, S - odchyleniem standardowym z próby, zaś


tα,n−1 obliczamy z zależności P(|T | > tα,n−1 ) = α (T ma rozkład
t-Studenta o n − 1 stopniach swobody i poziomie istotności α).

Aneta Wróblewska Estymacja przedziałowa


Przedział ufności dla średniej

Model III
populacja generalna ma rozkład dowolny;
odchylenie standardowe σ nie jest znane, ale wariancja jest
skończona;
parametr µ jest nieznany, dla niego szukamy przedziału ufności;
próba o dużej liczebności n, n > 30.
Przedział ufności ma wtedy postać:
S S
P(X − µα √ < µ < X + µα √ ) = 1 − α,
n n

gdzie X jest średnią z próby, S odchyleniem standardowym z próby, zaś


µα obliczamy z zależności P(|U| > µα ) = α (U ma standardowy rozkład
normalny).

Aneta Wróblewska Estymacja przedziałowa


Przedziały ufności dla wariancji i odchylenia standardowego

Model I
populacja generalna ma rozkład normalny N(µ, σ);
odchylenie standardowe σ nie jest znane, szukamy przedziału
ufności dla σ 2 ;
próba o małej liczebności n, n < 30.
Przedział ufności ma wtedy postać:

nS 2 nS 2
P( < σ2 < ) = 1 − α,
c2 c1

przy czym c1 oraz c2 spełniają zależności: P(χ2 < c1 ) = α2 oraz


P(χ2 > c2 ) = α2 dla zmiennej losowej o rozkładzie χ2 o n − 1 stopniach
swobody.

Aneta Wróblewska Estymacja przedziałowa


Przedziały ufności dla wariancji i odchylenia standardowego

Model II
populacja generalna ma rozkład normalny N(µ, σ) lub zbliżony do
normalnego;
odchylenie standardowe σ nie jest znane, szukamy przedziału
ufności dla σ;
próba o dużej liczebności n, n ≥ 30.
Przedział ufności ma wtedy postać:
S S
P( <σ< ) = 1 − α,
1 + õ2n
α
1 − √µ2n
α

gdzie µα jest takie, że P(|U| > µα ) = α (U ma standardowy rozkład


normalny).

Aneta Wróblewska Estymacja przedziałowa

You might also like