Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 25

ESTYMACJA

Andrzej Sokołowski
Wnioskowanie
statystyczne

Testowanie
Estymacja
hipotez

Próba

Próba Estymacja Estymacja


Populacja nieparametryczna parametryczna

Estymacja
punktowa

Estymacja
przedziałowa
Estymacja
nieparametryczna

 Celem jest znalezienie kształtu


rozkładu w populacji (lub jego „typu”)
 Szereg rozdzielczy
 Histogram
 Estymacja jądrowa
Estymacja
nieparametryczna
Estymacja
nieparametryczna

Emanuel Parzen
Murray Rosenblatt
(1929-2016)
(1926-2019)
Estymacja nieparametryczna
Przykład 1

 Dane: PIT 37 2004, Urząd Podatkowy


Świdnica
 Zmienna jakościowa „Płeć”
 Rozkład teoretyczny: dwupunktowy
 Liczebność próby: 648
 Metoda estymacji: szereg rozdzielczy,
histogram
Hi sto g ra m : K o d _ p l ci : P l e c
400

350

300

250

Liczba obs.
200

150

100

50

0
M K
K l a sa
Estymacja nieparametryczna
Przykład 2

 Należy oszacować rozkład wieku


podatników
 Zmienna ciągła: „Wiek”
 Spodziewany rozkład teoretyczny:
nieznany
 Metoda estymacji: szereg rozdzielczy,
histogram
His togram: W iek: =2004-v 31
Oc z ekiw ana normalna
110

100

90

80

70

Liczba obs.
60

50

40

30

20

10

0
15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90
X < Granic a klas y
Estymator punktowy

 Statystyka policzona na podstawie


informacji z próby, wykorzystywana
do oszacowania parametru
 Zn()= Zn(X1,X2,...,Xn,,)
 Wzór, który mówi co trzeba zrobić z
liczbami w próbie, aby oszacować
nieznany parametr
Estymacja parametryczna

PARAMETR Wartość Odchylenie


przeciętna standardowe
μ (w populacji)

ESTYMATOR Średnia Odchylenie
arytmetyczna standardowe
X (w próbie)
S
OCENA 43,8 14,9
Dobry estymator powinien być …

 ZGODNY – gdy rośnie liczebność próby to maleje


prawdopodobieństwo popełnienia dużego błędu
estymacji (im większa próba, tym mniejszy błąd
estymacji)
 NIEOBCIĄŻONY – Wartość przeciętna estymatora
powinna być równa nieznanej wartości
parametru (średnio rzecz biorąc estymator nie
kłamie)
 EFEKTYWNY – efektywność estymatora mierzona
jest jego wariancją (rozrzutem wyników, które
daje)
 ODPORNY – wartości odstające mają mały wpływ
(lub żaden) na własności estymatora
Własności estymatorów …


Metody uzyskiwania estymatorów

 Metoda momentów– momenty w


próbie są konstruowane analogicznie
do momentów w populacji
 Metoda największej wiarygodności –
poszukujemy takiej wartości
parametru dla której nasza próba
będzie najbardziej prawdopodobna
Metody uzyskiwania estymatorów


Wybrane estymatory
punktowe

Własność populacji Poziom Zmienność Struktura

Parametr populacji Wartość przeciętna Wariancja Wskaźnik struktury / frakcja

Oznaczenie parametru μ σ2 p

Estymator Średnia arytmetyczna Wariancja z próby Wskaźnik struktury z próby

Litera x p̂
S2 Ŝ 2

zgodny,
zgodny, nieobciążony, obciążony, zgodny, zgodny, nieobciążony, wymaga
Charakterystyka estymatora
najefektywniejszy, nieodporny najefektywniej nieobciążony dużej próby (n100)
szy
Średnia arytmetyczna

Odchylenie standardowe w
próbie

Estymacja przedziałowa
Przedziały ufności (PU, CI)

 Przedział ufności z wysoką ufnością pokrywa


nieznaną wartość
 Ta ufność mierzona jest poziomem ufności
wybieranym przez badacza
 Najpopularniejszy to 1-=0,95 (95 spośród 100
przedziałów pokrywa nieznaną wartość
parametru, więc moja ufność do pojedynczego
przedziału to 0,95 lub 95%)
 Im większa próba, tym krótszy przedział ufności
 Im wyższy poziom ufności, tym dłuższy P.U.
 Precyzja estymacji – połowa P.U.
Przedział ufności dla E(X)

S S
P ( X  t    X  t )  1
n 1 n 1 n≤30

S S
P ( X  u    X  u )  1 n>30
n n
Wiliam Sealy Gosset (1876-1937)
„Student”

THE PROBABLE ERROR OF A MEAN


By STUDENT
Introduction
Any experiment may he regarded as forming an individual of a “population”
of experiments which might he performed under the same conditions. A series
of experiments is a sample drawn from this population.
Now any series of experiments is only of value in so far as it enables us to
form a judgment as to the statistical constants of the population to which the
experiments belong. In a greater number of cases the question finally turns on
the value of a mean, either directly, or as the mean difference between the two
quantities.
If the number of experiments be very large, we may have precise information
as to the value of the mean, but if our sample be small, we have two sources of
uncertainty: (1) owing to the “error of random sampling” the mean of our series
of experiments deviates more or less widely from the mean of the population,
and (2) the sample is not sufficiently large to determine what is the law of
distribution of individuals. It is usual, however, to assume a normal distribution,
because, in a very large number of cases, this gives an approximation so close
that a small sample will give no real information as to the manner in which
the population deviates from normality: since some law of distribution must
he assumed it is better to work with a curve whose area and ordinates are
tabled, and whose properties are well known.
Tablica rozkładu Studenta – (fragment)

Poziom ufności
0,80 0,90 0,95 0,98 0,99 0,999
Poziom istotności dla testu jednostronnego
Stopnie
swobody 0,10 0,05 0,025 0,01 0,005 0,0005
Poziom istotności dla testu dwustronnego
0,20 0,10 0,05 0,02 0,01 0,001

1 3,078 6,314 12,706 31,821 63,657 636,619


2 1,886 2,920 4,303 6,965 9,925 31,598
3 1,638 2,353 3,182 4,541 5,841 12,941
4 1,533 2,132 2,776 3,747 4,604 8,610
5 1,476 2,015 2,571 3,365 4,032 6,859
6 1,440 1,943 2,447 3,143 3,707 5,959
7 1,415 1,895 2,365 2,998 3,499 5,405
8 1,397 1,860 2,306 2,896 3,355 5,041
9 1,383 1,833 2,262 2,821 3,250 4,781
10 1,372 1,812 2,228 2,764 3,169 40587
26 1,315 1,706 2,056 2,479 2,779 3,707
27 1,314 1,703 2,052 2,473 2,771 3,690
28 1,313 1,701 2,048 2,467 2,763 3,674
29 1,311 1,699 2,045 2,462 2,756 3,659
30 1,310 1,697 2,042 2,457 2,750 3,646
40 1,303 1,684 2,021 2,423 2,704 3,551
60 1,296 1,671 2,000 2,390 2,660 3,460
120 1,289 1,658 1,980 2,358 2,617 3,373
Normal 1,282 1,645 1,960 2,326 2,576 3,291

You might also like