Download as pdf or txt
Download as pdf or txt
You are on page 1of 47

dr Katarzyna Jermakowicz

Statystyka
Wykład 5
Testowanie hipotez statystycznych
Twierdząc coś, jak bardzo można się pomylić?

„Błądzić jest rzeczą ludzką.”


Seneka Starszy

„Statystyka to narzędzie, które pozwala na osiągnięcie błędu z


dokładnością do setnych części procenta.”
Anonim
Hipoteza statystyczna

Przez hipotezę statystyczną rozumie się dowolne przypuszczenie co do


rozkładu populacji generalnej:
• Parametryczna (mówi o wartościach parametrów rozkładu)
• Nieparametryczna (mówi o własnościach cech)

Prawdziwość tego przypuszczenia oceniana jest na podstawie


wyników próby losowej.

Po sformułowaniu odpowiedniej hipotezy dotyczącej populacji


generalnej niezbędne jest określenie zasad weryfikacji tej hipotezy.
Test statystyczny

Testem statystycznym nazywamy regułę postępowania, która każdej


możliwej próbie przyporządkowuje decyzję przyjęcia lub odrzucenia
hipotezy.

Kolejne kroki testowania hipotezy statystycznej:


1. Sformułowanie hipotezy zerowej H0 i alternatywnej H1.
2. Wybór poziomu istotności: 𝛼.
3. Wybór statystyki testowej: ST.
4. Wyznaczenie obszaru krytycznego K.
5. Obliczenie statystyki na podstawie próby.
6. Decyzja.
Cel testowania

Zadaniem testu jest: obalenie hipotezy zerowej (H0) na rzecz hipotezy


alternatywnej (H1)

Obalenie hipotezy polega na wykazaniu, że gdyby była ona prawdziwa,


to uzyskanie takich wyników pomiarów jak otrzymane byłoby mało
prawdopodobne
Weryfikacja

• Na podstawie wyniku badania (próby) obliczamy tzw. statystykę


testową ST.

• Wybór ST zależy od H0 i H1 , planu eksperymentu i przyjętych


założeń o rozkładzie wyników pomiarów.

• W oparciu o H0 i H1 , ew. inne, niejawne założenia i (nieraz głęboką)


wiedzę statystyczną konstruujemy dla ST obszar krytyczny K
Weryfikacja

• Jeśli ST znajdzie się w obszarze krytycznym, to H0 odrzucamy i


twierdzimy, że prawdziwa jest H1
• W przeciwnym razie jesteśmy zmuszeni pozostać przy słuszności
hipotez H0
Błąd I rodzaju

Błąd I rodzaju – odrzucenie słusznej hipotezy H0.


Prawdopodobieństwo tego błędu oznaczamy 𝛼 i nazywamy poziomem
istotności.
Jest to prawdopodobieństwo popełnienia błędu polegającego na tym,
że przyjmujemy uzyskany rezultat (z próby) jako prawdziwy, tj.
reprezentatywny dla populacji (chociaż jest inaczej).
• W programie antywirusowym: uznanie bezpiecznego pliku za zainfekowany
• W medycynie: uznanie zdrowego pacjenta za chorego
• W sądzie: skazanie niewinnego człowieka
Błąd II rodzaju

• Błąd II rodzaju – nieodrzucenie fałszywej hipotezy H0.


• Oszacowanie prawdopodobieństwa popełnienia błędu drugiego
rodzaju oznaczamy symbolem 𝛽, a jego dopełnienie do jedności
nazywane jest mocą testu.
• W programie antywirusowym: uznanie zainfekowanego pliku za bezpieczny
• W medycynie: mimo schorzenia uznanie pacjenta za zdrowego
• W sądzie: uniewinnienie kogoś, kto popełnił przestępstwo
Tabelka błędów
Decyzja

H0 przyjęta jako prawdziwa H1 przyjęta jako


(brak podstaw do prawdziwa
odrzucenia H0) (odrzucenie H0)
H0 jest Poprawne
Błąd I rodzaju
prawdziwa nieodrzucenie H0

H1 jest Poprawne
Błąd II rodzaju
prawdziwa odrzucenie H0
Przykład 1

• Przypuszczamy, że średni wzrost poborowych wynosi 175 cm.


Jest to zatem hipoteza zerowa dotycząca wartości średniej w
populacji generalnej poborowych.

• Dla sprawdzenia tego przypuszczenia na podstawie próby losowej


należy obliczyć średni wzrost w próbie 𝑥𝑛 .

• Jeśli otrzymana z próby wartość średniej arytmetycznej będzie się


znacznie różnić od 175 cm, odrzucimy hipotezę zerową.

• Co to znaczy ”znacznie różnić od 175 cm”?

• Hipoteza alternatywna?
Co trzeba ustalić, wybrać? (kroki 1-3)

1. Sformułować hipotezy:
a) zerową H0: 𝑚 = 𝑚0 = 175
b) alternatywną H1: 𝑚 ≠ 𝑚0 (test dwustronny)

2. Wybrać poziom istotności 𝛼 – prawdopodobieństwo błędu


I rodzaju (zazwyczaj 𝛼 = 10% lub 𝛼 = 5% lub 𝛼 = 1%)

3. Wybrać odpowiednią statystykę (zależy, co wiemy o populacji)


Wybór statystyki (krok 3)

Wybór statystyki zależy od tego czy:


• Populacja ma rozkład normalny
• Próba jest duża
• Znamy odchylenie standardowe z populacji (𝜎) czy tylko z próby (𝑠)
Przykład 1, c.d.

Założenia:
• Wzrost poborowych w populacji ma rozkład normalny
• Znamy odchylenie standardowe w populacji 𝜎 = 5 cm
Z tego wynika, że próba nie musi być duża i wybieramy statystykę:

ഥ − 𝒎𝟎
𝑿
𝑼= 𝒏
𝝈
która ma rozkład normalny standardowy 𝑁(0,1)
Obszar krytyczny (krok 4)

Obszar krytyczny zależy


od wybranego
poziomu istotności 𝛼
oraz tego, jaka jest
hipoteza alternatywna
– skoro 𝑚 ≠ 𝑚0 to obszar
krytyczny jest dwustronny
Przykład 1 – rozwiązanie

Wybieramy poziom istotności 𝜶 = 𝟓%


Wartość krytyczna prawa
𝟓%
= 𝑹𝑶𝒁𝑲Ł. 𝑵𝑶𝑹𝑴𝑨𝑳𝑵𝒀. 𝑺. 𝑶𝑫𝑾𝑹 𝟏 − = 𝟏, 𝟗𝟔
𝟐

Obszar krytyczny to wartości


większe od 1,96 lub
mniejsze od -1,96
Liczymy średni wzrost w próbie
liczącej 30 poborowych,
ഥ = 𝟏𝟕𝟑 cm
𝑿
Liczymy statystykę 𝑼 = −𝟐, 𝟏𝟗
Decyzja: odrzucamy H0 na rzecz H1
Przykład 2

• Firma rozwożąca paczki na terenie miasta zapewnia, że średni czas


dostarczenia paczki od drzwi klienta do miejsca przeznaczenia wynosi
co najwyżej 28 minut. Chcemy to sprawdzić, więc wybieramy losowo
próbę liczącą 100 paczek. Średnia z próby to 31,5 minuty, a odchylenie
standardowe z próby to 4 minuty.
• Czy to świadczy, że firma nie kłamie, zakładając poziom istotności 1%?
Przykład 2 – krok po kroku

1. Hipotezy:
• zerowa H0: 𝑚 ≤ 28
• alternatywna H1: 𝑚 > 28 (test prawostronny)
2. Poziom istotności: 𝛼 = 1%
3. Wybór statystyki zależy od charakteru danych
Przykład 2

Założenia:
• Nie jest znane odchylenie standardowe z populacji (𝜎), ale jest
znane z próby (s)
• Próba jest duża
Z tego wynika, że odpowiednia statystyka to:

𝑿ഥ − 𝒎𝟎
𝑼= 𝒏
𝒔
która ma rozkład normalny standardowy 𝑁(0,1)
Przykład 2 – rozwiązanie

• Skoro 𝑚 > 𝑚0 to obszar


krytyczny jest prawostronny
(wartości większe od 2,33)
• Wartość krytyczna (tylko prawa) =
= 𝑹𝑶𝒁𝑲Ł. 𝑵𝑶𝑹𝑴𝑨𝑳𝑵𝒀. 𝑺. 𝑶𝑫𝑾𝑹(𝟗𝟗%) = 𝟐. 𝟑𝟑
Liczymy statystykę: 𝑼 = 𝟕, 𝟓
Decyzja: odrzucamy H0 na korzyść H1
Przykład 3

• Producent baterii zapewnia, że trwałość wytwarzanych przez niego


baterii wynosi przeciętnie 65 godzin. Ze względu na powtarzające
się skargi klientów na czas krótszy niż deklarowany postawiono to
zweryfikować.
• W próbie 100 baterii okazało się, że ich trwałość wynosi 64 godziny,
przy odchyleniu standardowym 5 godzin.
• Przyjmując poziom istotności 1% trzeba sprawdzić, czy istnieje
dostateczna podstawa do uznania zapewnienia producenta za
fałszywe.
Przykład 3 – krok po kroku

1. Hipotezy:
• zerowa H0: 𝑚 ≥ 65
• alternatywna H1: 𝑚 < 65 (test lewostronny)
2. Poziom istotności: 𝛼 = 1%
3. Wybór statystyki zależy od charakteru danych – założenia jak w
przykładzie 3 (duża próba, znane odchylenie z próby), stąd ta sama
statystyka 𝑈
Przykład 3 – rozwiązanie

Jeśli 𝑚 < 𝑚0 to obszar


krytyczny jest lewostronny
(wartości mniejsze od -2,33)
Wartość krytyczna (tylko lewa) =
= 𝑹𝑶𝒁𝑲Ł. 𝑵𝑶𝑹𝑴𝑨𝑳𝑵𝒀. 𝑺. 𝑶𝑫𝑾𝑹 𝟏% =
= −𝟐. 𝟑𝟑
Liczymy statystykę: 𝑼 = −𝟐, 𝟎𝟎
Decyzja:
nie ma podstaw do odrzucenia H0
(na ma dowodu do wyciągnięcia wniosku, że zapewnienia producenta są
fałszywe)
Przykład 4 – mała próba

• Pewna firma meblarska specjalizuje się w produkcji tapczanów,


których cena kształtuje się różnie, ale przypuszcza się, że
przeciętna cena tapczanu wynosi $210.
• W celu sprawdzenia tej hipotezy dyrektor działu marketingu wybrał
próbę losową 20 tapczanów i stwierdził, że średnia cena wynosi
$225, przy odchyleniu standardowym $25.
• Zweryfikować postawioną hipotezę przy założeniu, że ceny
tapczanu kształtują się według rozkładu normalnego i poziomach
istotności 5% oraz 1%.
Przykład 4 – krok po kroku

1. Hipotezy:
• zerowa H0: 𝑚 = 210
• alternatywna H1: 𝑚 ≠ 210 (test dwustronny)

2. Poziom istotności: 𝛼 = 5% lub 𝛼 = 1%

3. Wybór statystyki zależy od charakteru danych – mała próba, rozkład


normalny, znamy odchylenie z próby, stąd statystyka
ഥ − 𝒎𝟎
𝑿
𝒕= 𝒏
𝒔
która ma rozkład t-studenta o 𝑛 − 1 stopniach swobody
Przykład 4 – rozwiązanie dla 5%

• 𝛼 = 5%
• 𝑑𝑓 = 20 − 1 = 19

Wartość krytyczna prawa


= 𝑹𝑶𝒁𝑲Ł. 𝑻. 𝑶𝑫𝑾𝑹. 𝑫𝑺 𝟓%; 𝟏𝟗 = 𝟐, 𝟎𝟗

Obszar krytyczny dwustronny (wartości większe od 2,09 lub mniejsze


od -2,09)

• Liczymy statystykę: 𝑼 = 𝟐, 𝟔𝟖
• Decyzja: odrzucamy H0 (wynik różni się istotnie od zakładanego)
Przykład 4 – rozwiązanie dla 1%

• 𝛼 = 1%
• 𝑑𝑓 = 20 − 1 = 19

Wartość krytyczna prawa


= 𝑹𝑶𝒁𝑲Ł. 𝑻. 𝑶𝑫𝑾𝑹. 𝑫𝑺 𝟏%; 𝟏𝟗 = 𝟐, 𝟖𝟔
Obszar krytyczny dwustronny (wartości większe od 2,86 lub mniejsze
od -2,86)

Liczymy statystykę: 𝑼 = 𝟐, 𝟔𝟖

Decyzja: nie ma podstaw do odrzucenia H0 (wynik nie różni się istotnie


od zakładanego)
Przykład 5 – frakcja

• Do tej pory procent rolników używających nawozy sztuczne wynosił


35%. W przekonaniu wielu osób, susze i inne zjawiska wywarły
wpływ na frakcję rolników używających nawozów sztucznych.
• Pobrano losową próbę 150 rolników, w której znaleziono 68
rolników używających nawozów.
• Przeprowadzić test hipotezy o niezmienności frakcji na poziomie
istotności 1%.
Przykład 5 – założenia

• Rozkład dwumianowy
• Duża próba
Stąd rozkład frakcji w próbie można przybliżać za pomocą rozkładu
normalnego i wybieramy statystykę:
ෝ − 𝒑𝟎
𝒑
𝑼= 𝒏
𝒑𝟎 ∙ 𝒒𝟎

która ma rozkład normalny standardowy.


𝑝0 oznacza hipotetyczną wartość p oraz 𝑞0 = 1 − 𝑝0
Przykład 5 – rozwiązanie

• Hipoteza H0: 𝑝 = 𝑝0 = 35%, stąd 𝑞0 = 65%


• Hipoteza alternatywna H1: 𝑝 ≠ 35%
• Wielkość próby: 𝑛 = 150

Wartość krytyczna prawa


𝟏%
= 𝑹𝑶𝒁𝑲Ł. 𝑵𝑶𝑹𝑴𝑨𝑳𝑵𝒀. 𝑺. 𝑶𝑫𝑾𝑹 𝟏 − = 𝟐, 𝟓𝟖
𝟐
Obszar krytyczny to wartości większe od 2,58 i mniejsze od -2,58
Liczymy statystykę: 𝑈 = 𝟐, 𝟔𝟓

Decyzja: odrzucamy H0 (wynik jest istotnie różny od oczekiwanego)


p – value

Trochę inne podejście do testowania hipotez


Decyzja o odrzuceniu lub nie hipotezy zerowej zależy od poziomu
istotności 𝛼 (przykład 4)

p – value to najmniejsza wartość 𝜶, przy której moglibyśmy odrzucić


hipotezę zerową
lub inaczej

p – value to prawdopodobieństwo otrzymania wartości statystyki z


próby, jaką otrzymaliśmy (albo bardziej skrajnej) przy założeniu, że
hipoteza zerowa jest prawdziwa.
p – value

• Test prawostronny – p jest miarą pola pod krzywą gęstości


rozkładu na prawo od otrzymanej statystyki
• Test lewostronny – p jest miarą pola pod krzywą gęstości rozkładu
na lewo od otrzymanej statystyki
• Test dwustronny – p jest miarą pola pod krzywą gęstości rozkładu
na prawo od dodatniej i na lewo od ujemnej otrzymanej statystyki

Reguła decyzji:

Przy danym poziomie istotności 𝜶 odrzuć hipotezę zerową


gdy 𝜶 ≥ 𝒑
Interpretacja p – value

𝑝 < 0,01 – wynik eksperymentu jest bardzo istotny


0,01 < 𝑝 < 0,05 – wynik eksperymentu jest istotny
0,05 < 𝑝 < 0,1 – wynik eksperymentu jest mało istotny / nieistotny
𝑝 > 0,1 – wynik eksperymentu jest nieistotny

Im mniejsze p Tym większe przekonanie, by odrzucić H0

Im większe p Tym słabsza podstawa do odrzucenia H0


p – value w omawianych przykładach

Przykład 1: 𝒑 = 𝟐, 𝟖𝟓%
Przykład 2: 𝒑 = 𝟎, 𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟑𝟐%
Przykład 3: 𝒑 = 𝟐, 𝟐𝟖%
Przykład 4: 𝒑 = 𝟏, 𝟒𝟕%
Przykład 5: 𝒑 = 𝟎, 𝟖%
Zależność cech

• W rzeczywistości rzadko jest tak aby jakaś cecha obiektów lub


zjawisko pewnego rodzaju kształtowało się zupełnie niezależnie od
innych cech lub zjawisk.
• Rodzaje zależności:
- przyczynowo-skutkowe.
- symptomatyczne (współzależne)
• Niezależnie od tego, jakiego są typu, dwie lub więcej zmiennych
pozostaje w relacji, jeśli wartości tych zmiennych w mierzonej
próbie rozłożone są w określony sposób.
Korelacje a wykresy – zwykła obserwacja
Współczynnik korelacji dla cech mierzalnych

Współczynnik korelacji liniowej Pearsona


𝝆 = 𝑾𝑺𝑷. 𝑲𝑶𝑹𝑬𝑳𝑨𝑪𝑱𝑰(𝒁𝑨𝑲𝑹𝑬𝑺𝟏; 𝒁𝑨𝑲𝑹𝑬𝑺𝟐)

−𝟏 ≤ 𝝆 ≤ 𝟏

• Jeśli 𝝆 jest bliskie 0, to brak lub słaba korelacja


• Jeśli 𝝆 jest bliskie 1, to silna dodatnia korelacja
• Jeśli 𝝆 jest bliskie -1, to silna ujemna korelacja
Rozkład chi-kwadrat
Rozkład zmiennej losowej, która jest sumą k kwadratów niezależnych
zmiennych losowych o standardowym rozkładzie normalnym. Liczbę
naturalną k nazywa się liczbą stopni swobody.
Funkcja gęstości Dystrybuanta
Test chi-kwadrat

• Test, w którym wykorzystuje się statystykę o rozkładzie χ2


• Zastosowanie m.in. do weryfikacji hipotez dotyczących cech
mierzalnych i niemierzalnych
- Test zgodności χ2
- Test niezależności χ2
• Danymi do tych testów są liczebności i częstości różnych klas.
Testy chi-kwadrat

1. Formułujemy pewne przypuszczenia co do populacji (H0 i H1)


2. Obliczamy oczekiwane liczebności danych w różnych klasach przy
założeniu H0
3. Notujemy zaobserwowane liczebności danych należących do klas
4. Za pomocą wzoru obliczamy statystykę opartą na różnicach
między wartościami oczekiwanymi i zaobserwowanymi
5. Porównujemy wartość statystyki z wartościami krytycznymi
rozkładu chi-kwadrat i podejmujemy decyzję
Test zgodności chi-kwadrat – przykład

Firma rozważa 5 projektów nazw swojego nowego produktu. Przed


wybraniem jednej z nich firma postanowiła sprawdzić, czy wszystkie 5
nazw równie silnie przyciąga klientów. Wybrano próbę losową 100
osób i każdą z nich poproszono o wskazanie najlepszej spośród pięciu
nazw. Oto wyniki:

Nazwa A B C D E
Liczba 4 12 34 40 10
wyborów

Przeprowadzić test wpływu tych nazw na klientów.


Test zgodności chi-kwadrat – przykład, c.d.

Hipotezy:
• Zerowa H0: wszystkie nazwy równie silnie przyciągają klientów
• Alternatywna H1: nie wszystkie nazwy przyciągają równie silnie

Zakładając prawdziwość H0, liczba wyborów każdej nazwy powinna


być taka sama, czyli 𝐸𝑖 = 100: 5 = 20 (dla 𝑖 = 1,2,3,4,5)
Wartość statystyki:
𝒌
𝑶𝒊 − 𝑬𝒊 𝟐
𝝌𝟐 = ෍
𝑬𝒊
𝒊=𝟏

gdzie 𝑂𝑖 - liczebności obserwowane, 𝐸𝑖 - liczebności oczekiwane


Test zgodności chi-kwadrat – przykład, rozwiązanie

Wartość statystyki:

4 − 20 2 12 − 20 2 34 − 20 2 40 − 20 2 10 − 20 2
χ2 = + + + +
20 20 20 20 20
𝝌𝟐 = 𝟓𝟎, 𝟖
Liczba stopni swobody: df = 5 − 1 = 4
Wartość krytyczna = 𝑹𝑶𝒁𝑲Ł. 𝑪𝑯𝑰. 𝑶𝑫𝑾𝑹. 𝑷𝑺 𝟏%; 𝟒 ≈ 𝟏𝟑, 𝟐𝟖
p-value = 𝑹𝑶𝒁𝑲Ł. 𝑪𝑯𝑰. 𝑷𝑺(𝟓𝟎, 𝟖; 𝟒) ≈ 𝟎
Decyzja: odrzucić H0 (dowolne 𝜶 > 𝒑)
Test niezależności chi-kwadrat – przykład

Zebrano dane dotyczące 500 firm uporządkowanych według rodzajów


działalności (usługi, handel, produkcja) oraz według wyniku (zysk czy
strata):

Usługi Handel Produkcja Suma


Zysk 120 90 40 250
Strata 110 95 45 250
Suma 230 185 85 500
Są to liczebności obserwowane 𝑂𝑖𝑗
Określić, czy „firma przyniosła zyski” oraz „branża firmy” są niezależne
(H0 są niezależne, H1 nie są niezależne)
Test niezależności chi-kwadrat – przykład

Liczymy wartości oczekiwane mnożąc sumy z danego wiersza i


kolumny i dzieląc przez łączną sumę (500)

Usługi Handel Produkcja Suma


Zysk 230 ∙ 250 185 ∙ 250 85 ∙ 250 250
= 115 = 92,5 = 42,5
500 500 500
Strata 230 ∙ 250 185 ∙ 250 85 ∙ 250 250
= 115 = 92,5 = 42,5
500 500 500
Suma 230 185 85 500
Test niezależności chi-kwadrat – przykład, rozwiązanie

Wartość statystyki:

120 − 115 2 110 − 115 2 90 − 92,5 2


χ2 = + + +
115
2
115
2
92,5
95 − 92,5 40 − 42,5 45 − 42,5 2
+ + + = 𝟎, 𝟖𝟔𝟒𝟐
92,5 42,5 42,5
Liczba stopni swobody: df = (2 − 1)(3 − 1) = 2
Wartość krytyczna = 𝑹𝑶𝒁𝑲Ł. 𝑪𝑯𝑰. 𝑶𝑫𝑾𝑹. 𝑷𝑺 𝟓%; 𝟐 ≈ 𝟓, 𝟗𝟗
p-value = 𝑹𝑶𝒁𝑲Ł. 𝑪𝑯𝑰. 𝑷𝑺 𝟎, 𝟖𝟔𝟒𝟐; 𝟐 ≈ 𝟎, 𝟔𝟒𝟗 = 𝟔𝟒, 𝟗%

Decyzja: nie możemy odrzucić H0 (b.duże 𝒑) – nie ma


dowodów, że istnieje związek między zyskami a branżą
Dziękuję za uwagę

You might also like