Jermakowicz 12042024203539 Statystyka 5

dr Katarzyna Jermakowicz
Statystyka
Wykład 5
Testowanie hipotez statystycznych
Twierdząc coś, jak bardzo można się pomylić?
„Błądzić jest rzeczą ludzką.”

Seneka Starszy
„Statystyka to narzędzie, które pozwala na osiągnięcie błędu z

dokładnością do setnych części procenta.”
Anonim
Hipoteza statystyczna
Przez hipotezę statystyczną rozumie się dowolne przypuszczenie co do

rozkładu populacji generalnej:
• Parametryczna (mówi o wartościach parametrów rozkładu)
• Nieparametryczna (mówi o własnościach cech)
Prawdziwość tego przypuszczenia oceniana jest na podstawie

wyników próby losowej.
Po sformułowaniu odpowiedniej hipotezy dotyczącej populacji

generalnej niezbędne jest określenie zasad weryfikacji tej hipotezy.
Test statystyczny
Testem statystycznym nazywamy regułę postępowania, która każdej

możliwej próbie przyporządkowuje decyzję przyjęcia lub odrzucenia
hipotezy.
Kolejne kroki testowania hipotezy statystycznej:

1. Sformułowanie hipotezy zerowej H0 i alternatywnej H1.
2. Wybór poziomu istotności: 𝛼.
3. Wybór statystyki testowej: ST.
4. Wyznaczenie obszaru krytycznego K.
5. Obliczenie statystyki na podstawie próby.
6. Decyzja.
Cel testowania
Zadaniem testu jest: obalenie hipotezy zerowej (H0) na rzecz hipotezy

alternatywnej (H1)
Obalenie hipotezy polega na wykazaniu, że gdyby była ona prawdziwa,

to uzyskanie takich wyników pomiarów jak otrzymane byłoby mało
prawdopodobne
Weryfikacja
• Na podstawie wyniku badania (próby) obliczamy tzw. statystykę

testową ST.
• Wybór ST zależy od H0 i H1 , planu eksperymentu i przyjętych

założeń o rozkładzie wyników pomiarów.
• W oparciu o H0 i H1 , ew. inne, niejawne założenia i (nieraz głęboką)

wiedzę statystyczną konstruujemy dla ST obszar krytyczny K
Weryfikacja
• Jeśli ST znajdzie się w obszarze krytycznym, to H0 odrzucamy i

twierdzimy, że prawdziwa jest H1
• W przeciwnym razie jesteśmy zmuszeni pozostać przy słuszności
hipotez H0
Błąd I rodzaju
Błąd I rodzaju – odrzucenie słusznej hipotezy H0.

Prawdopodobieństwo tego błędu oznaczamy 𝛼 i nazywamy poziomem
istotności.
Jest to prawdopodobieństwo popełnienia błędu polegającego na tym,
że przyjmujemy uzyskany rezultat (z próby) jako prawdziwy, tj.
reprezentatywny dla populacji (chociaż jest inaczej).
• W programie antywirusowym: uznanie bezpiecznego pliku za zainfekowany
• W medycynie: uznanie zdrowego pacjenta za chorego
• W sądzie: skazanie niewinnego człowieka
Błąd II rodzaju
• Błąd II rodzaju – nieodrzucenie fałszywej hipotezy H0.

• Oszacowanie prawdopodobieństwa popełnienia błędu drugiego
rodzaju oznaczamy symbolem 𝛽, a jego dopełnienie do jedności
nazywane jest mocą testu.
• W programie antywirusowym: uznanie zainfekowanego pliku za bezpieczny
• W medycynie: mimo schorzenia uznanie pacjenta za zdrowego
• W sądzie: uniewinnienie kogoś, kto popełnił przestępstwo
Tabelka błędów
Decyzja
H0 przyjęta jako prawdziwa H1 przyjęta jako

(brak podstaw do prawdziwa
odrzucenia H0) (odrzucenie H0)
H0 jest Poprawne
Błąd I rodzaju
prawdziwa nieodrzucenie H0
H1 jest Poprawne
Błąd II rodzaju
prawdziwa odrzucenie H0
Przykład 1
• Przypuszczamy, że średni wzrost poborowych wynosi 175 cm.

Jest to zatem hipoteza zerowa dotycząca wartości średniej w
populacji generalnej poborowych.
• Dla sprawdzenia tego przypuszczenia na podstawie próby losowej

należy obliczyć średni wzrost w próbie 𝑥𝑛 .
• Jeśli otrzymana z próby wartość średniej arytmetycznej będzie się

znacznie różnić od 175 cm, odrzucimy hipotezę zerową.
• Co to znaczy ”znacznie różnić od 175 cm”?
• Hipoteza alternatywna?
Co trzeba ustalić, wybrać? (kroki 1-3)
1. Sformułować hipotezy:
a) zerową H0: 𝑚 = 𝑚0 = 175
b) alternatywną H1: 𝑚 ≠ 𝑚0 (test dwustronny)
2. Wybrać poziom istotności 𝛼 – prawdopodobieństwo błędu

I rodzaju (zazwyczaj 𝛼 = 10% lub 𝛼 = 5% lub 𝛼 = 1%)
3. Wybrać odpowiednią statystykę (zależy, co wiemy o populacji)

Wybór statystyki (krok 3)
Wybór statystyki zależy od tego czy:

• Populacja ma rozkład normalny
• Próba jest duża
• Znamy odchylenie standardowe z populacji (𝜎) czy tylko z próby (𝑠)
Przykład 1, c.d.
Założenia:
• Wzrost poborowych w populacji ma rozkład normalny
• Znamy odchylenie standardowe w populacji 𝜎 = 5 cm
Z tego wynika, że próba nie musi być duża i wybieramy statystykę:
ഥ − 𝒎𝟎
𝑿
𝑼= 𝒏
𝝈
która ma rozkład normalny standardowy 𝑁(0,1)
Obszar krytyczny (krok 4)
Obszar krytyczny zależy

od wybranego
poziomu istotności 𝛼
oraz tego, jaka jest
hipoteza alternatywna
– skoro 𝑚 ≠ 𝑚0 to obszar
krytyczny jest dwustronny
Przykład 1 – rozwiązanie
Wybieramy poziom istotności 𝜶 = 𝟓%

Wartość krytyczna prawa
𝟓%
= 𝑹𝑶𝒁𝑲Ł. 𝑵𝑶𝑹𝑴𝑨𝑳𝑵𝒀. 𝑺. 𝑶𝑫𝑾𝑹 𝟏 − = 𝟏, 𝟗𝟔
𝟐
Obszar krytyczny to wartości

większe od 1,96 lub
mniejsze od -1,96
Liczymy średni wzrost w próbie
liczącej 30 poborowych,
ഥ = 𝟏𝟕𝟑 cm
𝑿
Liczymy statystykę 𝑼 = −𝟐, 𝟏𝟗
Decyzja: odrzucamy H0 na rzecz H1
Przykład 2
• Firma rozwożąca paczki na terenie miasta zapewnia, że średni czas

dostarczenia paczki od drzwi klienta do miejsca przeznaczenia wynosi
co najwyżej 28 minut. Chcemy to sprawdzić, więc wybieramy losowo
próbę liczącą 100 paczek. Średnia z próby to 31,5 minuty, a odchylenie
standardowe z próby to 4 minuty.
• Czy to świadczy, że firma nie kłamie, zakładając poziom istotności 1%?
Przykład 2 – krok po kroku
1. Hipotezy:
• zerowa H0: 𝑚 ≤ 28
• alternatywna H1: 𝑚 > 28 (test prawostronny)
2. Poziom istotności: 𝛼 = 1%
3. Wybór statystyki zależy od charakteru danych
Przykład 2
Założenia:
• Nie jest znane odchylenie standardowe z populacji (𝜎), ale jest
znane z próby (s)
• Próba jest duża
Z tego wynika, że odpowiednia statystyka to:
𝑿ഥ − 𝒎𝟎
𝑼= 𝒏
𝒔
która ma rozkład normalny standardowy 𝑁(0,1)
• Skoro 𝑚 > 𝑚0 to obszar

krytyczny jest prawostronny
(wartości większe od 2,33)
• Wartość krytyczna (tylko prawa) =
= 𝑹𝑶𝒁𝑲Ł. 𝑵𝑶𝑹𝑴𝑨𝑳𝑵𝒀. 𝑺. 𝑶𝑫𝑾𝑹(𝟗𝟗%) = 𝟐. 𝟑𝟑
Liczymy statystykę: 𝑼 = 𝟕, 𝟓
Decyzja: odrzucamy H0 na korzyść H1
Przykład 3
• Producent baterii zapewnia, że trwałość wytwarzanych przez niego

baterii wynosi przeciętnie 65 godzin. Ze względu na powtarzające
się skargi klientów na czas krótszy niż deklarowany postawiono to
zweryfikować.
• W próbie 100 baterii okazało się, że ich trwałość wynosi 64 godziny,
przy odchyleniu standardowym 5 godzin.
• Przyjmując poziom istotności 1% trzeba sprawdzić, czy istnieje
dostateczna podstawa do uznania zapewnienia producenta za
fałszywe.
1. Hipotezy:
• zerowa H0: 𝑚 ≥ 65
• alternatywna H1: 𝑚 < 65 (test lewostronny)
2. Poziom istotności: 𝛼 = 1%
3. Wybór statystyki zależy od charakteru danych – założenia jak w
przykładzie 3 (duża próba, znane odchylenie z próby), stąd ta sama
statystyka 𝑈
Jeśli 𝑚 < 𝑚0 to obszar

krytyczny jest lewostronny
(wartości mniejsze od -2,33)
Wartość krytyczna (tylko lewa) =
= 𝑹𝑶𝒁𝑲Ł. 𝑵𝑶𝑹𝑴𝑨𝑳𝑵𝒀. 𝑺. 𝑶𝑫𝑾𝑹 𝟏% =
= −𝟐. 𝟑𝟑
Liczymy statystykę: 𝑼 = −𝟐, 𝟎𝟎
Decyzja:
nie ma podstaw do odrzucenia H0
(na ma dowodu do wyciągnięcia wniosku, że zapewnienia producenta są
fałszywe)
Przykład 4 – mała próba
• Pewna firma meblarska specjalizuje się w produkcji tapczanów,

których cena kształtuje się różnie, ale przypuszcza się, że
przeciętna cena tapczanu wynosi $210.
• W celu sprawdzenia tej hipotezy dyrektor działu marketingu wybrał
próbę losową 20 tapczanów i stwierdził, że średnia cena wynosi
$225, przy odchyleniu standardowym $25.
• Zweryfikować postawioną hipotezę przy założeniu, że ceny
tapczanu kształtują się według rozkładu normalnego i poziomach
istotności 5% oraz 1%.
1. Hipotezy:
• zerowa H0: 𝑚 = 210
• alternatywna H1: 𝑚 ≠ 210 (test dwustronny)
2. Poziom istotności: 𝛼 = 5% lub 𝛼 = 1%
3. Wybór statystyki zależy od charakteru danych – mała próba, rozkład

normalny, znamy odchylenie z próby, stąd statystyka
ഥ − 𝒎𝟎
𝑿
𝒕= 𝒏
𝒔
która ma rozkład t-studenta o 𝑛 − 1 stopniach swobody
Przykład 4 – rozwiązanie dla 5%
• 𝛼 = 5%
• 𝑑𝑓 = 20 − 1 = 19

= 𝑹𝑶𝒁𝑲Ł. 𝑻. 𝑶𝑫𝑾𝑹. 𝑫𝑺 𝟓%; 𝟏𝟗 = 𝟐, 𝟎𝟗
Obszar krytyczny dwustronny (wartości większe od 2,09 lub mniejsze

od -2,09)
• Liczymy statystykę: 𝑼 = 𝟐, 𝟔𝟖
• Decyzja: odrzucamy H0 (wynik różni się istotnie od zakładanego)
Przykład 4 – rozwiązanie dla 1%
• 𝛼 = 1%
• 𝑑𝑓 = 20 − 1 = 19

= 𝑹𝑶𝒁𝑲Ł. 𝑻. 𝑶𝑫𝑾𝑹. 𝑫𝑺 𝟏%; 𝟏𝟗 = 𝟐, 𝟖𝟔
Obszar krytyczny dwustronny (wartości większe od 2,86 lub mniejsze
od -2,86)
Liczymy statystykę: 𝑼 = 𝟐, 𝟔𝟖
Decyzja: nie ma podstaw do odrzucenia H0 (wynik nie różni się istotnie

od zakładanego)
Przykład 5 – frakcja
• Do tej pory procent rolników używających nawozy sztuczne wynosił

35%. W przekonaniu wielu osób, susze i inne zjawiska wywarły
wpływ na frakcję rolników używających nawozów sztucznych.
• Pobrano losową próbę 150 rolników, w której znaleziono 68
rolników używających nawozów.
• Przeprowadzić test hipotezy o niezmienności frakcji na poziomie
istotności 1%.
Przykład 5 – założenia
• Rozkład dwumianowy
• Duża próba
Stąd rozkład frakcji w próbie można przybliżać za pomocą rozkładu
normalnego i wybieramy statystykę:
ෝ − 𝒑𝟎
𝒑
𝑼= 𝒏
𝒑𝟎 ∙ 𝒒𝟎
która ma rozkład normalny standardowy.

𝑝0 oznacza hipotetyczną wartość p oraz 𝑞0 = 1 − 𝑝0
• Hipoteza H0: 𝑝 = 𝑝0 = 35%, stąd 𝑞0 = 65%

• Hipoteza alternatywna H1: 𝑝 ≠ 35%
• Wielkość próby: 𝑛 = 150

𝟏%
= 𝑹𝑶𝒁𝑲Ł. 𝑵𝑶𝑹𝑴𝑨𝑳𝑵𝒀. 𝑺. 𝑶𝑫𝑾𝑹 𝟏 − = 𝟐, 𝟓𝟖
𝟐
Obszar krytyczny to wartości większe od 2,58 i mniejsze od -2,58
Liczymy statystykę: 𝑈 = 𝟐, 𝟔𝟓
Decyzja: odrzucamy H0 (wynik jest istotnie różny od oczekiwanego)

p – value
Trochę inne podejście do testowania hipotez

Decyzja o odrzuceniu lub nie hipotezy zerowej zależy od poziomu
istotności 𝛼 (przykład 4)
p – value to najmniejsza wartość 𝜶, przy której moglibyśmy odrzucić

hipotezę zerową
lub inaczej
p – value to prawdopodobieństwo otrzymania wartości statystyki z

próby, jaką otrzymaliśmy (albo bardziej skrajnej) przy założeniu, że
hipoteza zerowa jest prawdziwa.
p – value
• Test prawostronny – p jest miarą pola pod krzywą gęstości

rozkładu na prawo od otrzymanej statystyki
• Test lewostronny – p jest miarą pola pod krzywą gęstości rozkładu
na lewo od otrzymanej statystyki
• Test dwustronny – p jest miarą pola pod krzywą gęstości rozkładu
na prawo od dodatniej i na lewo od ujemnej otrzymanej statystyki
Reguła decyzji:
Przy danym poziomie istotności 𝜶 odrzuć hipotezę zerową

gdy 𝜶 ≥ 𝒑
Interpretacja p – value
𝑝 < 0,01 – wynik eksperymentu jest bardzo istotny

0,01 < 𝑝 < 0,05 – wynik eksperymentu jest istotny
0,05 < 𝑝 < 0,1 – wynik eksperymentu jest mało istotny / nieistotny
𝑝 > 0,1 – wynik eksperymentu jest nieistotny
Im mniejsze p Tym większe przekonanie, by odrzucić H0
Im większe p Tym słabsza podstawa do odrzucenia H0

p – value w omawianych przykładach
Przykład 1: 𝒑 = 𝟐, 𝟖𝟓%
Przykład 2: 𝒑 = 𝟎, 𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟑𝟐%
Przykład 3: 𝒑 = 𝟐, 𝟐𝟖%
Przykład 4: 𝒑 = 𝟏, 𝟒𝟕%
Przykład 5: 𝒑 = 𝟎, 𝟖%
Zależność cech
• W rzeczywistości rzadko jest tak aby jakaś cecha obiektów lub

zjawisko pewnego rodzaju kształtowało się zupełnie niezależnie od
innych cech lub zjawisk.
• Rodzaje zależności:
- przyczynowo-skutkowe.
- symptomatyczne (współzależne)
• Niezależnie od tego, jakiego są typu, dwie lub więcej zmiennych
pozostaje w relacji, jeśli wartości tych zmiennych w mierzonej
próbie rozłożone są w określony sposób.
Korelacje a wykresy – zwykła obserwacja
Współczynnik korelacji dla cech mierzalnych
Współczynnik korelacji liniowej Pearsona

𝝆 = 𝑾𝑺𝑷. 𝑲𝑶𝑹𝑬𝑳𝑨𝑪𝑱𝑰(𝒁𝑨𝑲𝑹𝑬𝑺𝟏; 𝒁𝑨𝑲𝑹𝑬𝑺𝟐)
−𝟏 ≤ 𝝆 ≤ 𝟏
• Jeśli 𝝆 jest bliskie 0, to brak lub słaba korelacja

• Jeśli 𝝆 jest bliskie 1, to silna dodatnia korelacja
• Jeśli 𝝆 jest bliskie -1, to silna ujemna korelacja
Rozkład chi-kwadrat
Rozkład zmiennej losowej, która jest sumą k kwadratów niezależnych
zmiennych losowych o standardowym rozkładzie normalnym. Liczbę
naturalną k nazywa się liczbą stopni swobody.
Funkcja gęstości Dystrybuanta
Test chi-kwadrat
• Test, w którym wykorzystuje się statystykę o rozkładzie χ2

• Zastosowanie m.in. do weryfikacji hipotez dotyczących cech
mierzalnych i niemierzalnych
- Test zgodności χ2
- Test niezależności χ2
• Danymi do tych testów są liczebności i częstości różnych klas.
Testy chi-kwadrat
1. Formułujemy pewne przypuszczenia co do populacji (H0 i H1)

2. Obliczamy oczekiwane liczebności danych w różnych klasach przy
założeniu H0
3. Notujemy zaobserwowane liczebności danych należących do klas
4. Za pomocą wzoru obliczamy statystykę opartą na różnicach
między wartościami oczekiwanymi i zaobserwowanymi
5. Porównujemy wartość statystyki z wartościami krytycznymi
rozkładu chi-kwadrat i podejmujemy decyzję
Test zgodności chi-kwadrat – przykład
Firma rozważa 5 projektów nazw swojego nowego produktu. Przed

wybraniem jednej z nich firma postanowiła sprawdzić, czy wszystkie 5
nazw równie silnie przyciąga klientów. Wybrano próbę losową 100
osób i każdą z nich poproszono o wskazanie najlepszej spośród pięciu
nazw. Oto wyniki:
Nazwa A B C D E
Liczba 4 12 34 40 10
wyborów
Przeprowadzić test wpływu tych nazw na klientów.

Test zgodności chi-kwadrat – przykład, c.d.
Hipotezy:
• Zerowa H0: wszystkie nazwy równie silnie przyciągają klientów
• Alternatywna H1: nie wszystkie nazwy przyciągają równie silnie
Zakładając prawdziwość H0, liczba wyborów każdej nazwy powinna

być taka sama, czyli 𝐸𝑖 = 100: 5 = 20 (dla 𝑖 = 1,2,3,4,5)
Wartość statystyki:
𝒌
𝑶𝒊 − 𝑬𝒊 𝟐
𝝌𝟐 = ෍
𝑬𝒊
𝒊=𝟏
gdzie 𝑂𝑖 - liczebności obserwowane, 𝐸𝑖 - liczebności oczekiwane

Test zgodności chi-kwadrat – przykład, rozwiązanie
4 − 20 2 12 − 20 2 34 − 20 2 40 − 20 2 10 − 20 2
χ2 = + + + +
20 20 20 20 20
𝝌𝟐 = 𝟓𝟎, 𝟖
Liczba stopni swobody: df = 5 − 1 = 4
Wartość krytyczna = 𝑹𝑶𝒁𝑲Ł. 𝑪𝑯𝑰. 𝑶𝑫𝑾𝑹. 𝑷𝑺 𝟏%; 𝟒 ≈ 𝟏𝟑, 𝟐𝟖
p-value = 𝑹𝑶𝒁𝑲Ł. 𝑪𝑯𝑰. 𝑷𝑺(𝟓𝟎, 𝟖; 𝟒) ≈ 𝟎
Decyzja: odrzucić H0 (dowolne 𝜶 > 𝒑)
Test niezależności chi-kwadrat – przykład
Zebrano dane dotyczące 500 firm uporządkowanych według rodzajów

działalności (usługi, handel, produkcja) oraz według wyniku (zysk czy
strata):
Usługi Handel Produkcja Suma

Zysk 120 90 40 250
Strata 110 95 45 250
Suma 230 185 85 500
Są to liczebności obserwowane 𝑂𝑖𝑗
Określić, czy „firma przyniosła zyski” oraz „branża firmy” są niezależne
(H0 są niezależne, H1 nie są niezależne)
Test niezależności chi-kwadrat – przykład
Liczymy wartości oczekiwane mnożąc sumy z danego wiersza i

kolumny i dzieląc przez łączną sumę (500)
Usługi Handel Produkcja Suma

Zysk 230 ∙ 250 185 ∙ 250 85 ∙ 250 250
= 115 = 92,5 = 42,5
500 500 500
Strata 230 ∙ 250 185 ∙ 250 85 ∙ 250 250
= 115 = 92,5 = 42,5
500 500 500
Suma 230 185 85 500
Test niezależności chi-kwadrat – przykład, rozwiązanie
120 − 115 2 110 − 115 2 90 − 92,5 2

χ2 = + + +
115
2
115
2
92,5
95 − 92,5 40 − 42,5 45 − 42,5 2
+ + + = 𝟎, 𝟖𝟔𝟒𝟐
92,5 42,5 42,5
Liczba stopni swobody: df = (2 − 1)(3 − 1) = 2
Wartość krytyczna = 𝑹𝑶𝒁𝑲Ł. 𝑪𝑯𝑰. 𝑶𝑫𝑾𝑹. 𝑷𝑺 𝟓%; 𝟐 ≈ 𝟓, 𝟗𝟗
p-value = 𝑹𝑶𝒁𝑲Ł. 𝑪𝑯𝑰. 𝑷𝑺 𝟎, 𝟖𝟔𝟒𝟐; 𝟐 ≈ 𝟎, 𝟔𝟒𝟗 = 𝟔𝟒, 𝟗%
Decyzja: nie możemy odrzucić H0 (b.duże 𝒑) – nie ma

dowodów, że istnieje związek między zyskami a branżą
Dziękuję za uwagę
☺

Jermakowicz 12042024203539 Statystyka 5

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Jermakowicz 12042024203539 Statystyka 5

Uploaded by

Copyright:

Available Formats

dr Katarzyna Jermakowicz

„Błądzić jest rzeczą ludzką.”

„Statystyka to narzędzie, które pozwala na osiągnięcie błędu z

Przez hipotezę statystyczną rozumie się dowolne przypuszczenie co do

Prawdziwość tego przypuszczenia oceniana jest na podstawie

Po sformułowaniu odpowiedniej hipotezy dotyczącej populacji

Testem statystycznym nazywamy regułę postępowania, która każdej

Kolejne kroki testowania hipotezy statystycznej:

Zadaniem testu jest: obalenie hipotezy zerowej (H0) na rzecz hipotezy

Obalenie hipotezy polega na wykazaniu, że gdyby była ona prawdziwa,

• Na podstawie wyniku badania (próby) obliczamy tzw. statystykę

• Wybór ST zależy od H0 i H1 , planu eksperymentu i przyjętych

• W oparciu o H0 i H1 , ew. inne, niejawne założenia i (nieraz głęboką)

• Jeśli ST znajdzie się w obszarze krytycznym, to H0 odrzucamy i

Błąd I rodzaju – odrzucenie słusznej hipotezy H0.

• Błąd II rodzaju – nieodrzucenie fałszywej hipotezy H0.

H0 przyjęta jako prawdziwa H1 przyjęta jako

• Przypuszczamy, że średni wzrost poborowych wynosi 175 cm.

• Dla sprawdzenia tego przypuszczenia na podstawie próby losowej

• Jeśli otrzymana z próby wartość średniej arytmetycznej będzie się

• Co to znaczy ”znacznie różnić od 175 cm”?

2. Wybrać poziom istotności 𝛼 – prawdopodobieństwo błędu

3. Wybrać odpowiednią statystykę (zależy, co wiemy o populacji)

Wybór statystyki zależy od tego czy:

Obszar krytyczny zależy

Wybieramy poziom istotności 𝜶 = 𝟓%

Obszar krytyczny to wartości

• Firma rozwożąca paczki na terenie miasta zapewnia, że średni czas

• Skoro 𝑚 > 𝑚0 to obszar

• Producent baterii zapewnia, że trwałość wytwarzanych przez niego

Jeśli 𝑚 < 𝑚0 to obszar

• Pewna firma meblarska specjalizuje się w produkcji tapczanów,

2. Poziom istotności: 𝛼 = 5% lub 𝛼 = 1%

3. Wybór statystyki zależy od charakteru danych – mała próba, rozkład

Wartość krytyczna prawa

Obszar krytyczny dwustronny (wartości większe od 2,09 lub mniejsze

Wartość krytyczna prawa

Decyzja: nie ma podstaw do odrzucenia H0 (wynik nie różni się istotnie

• Do tej pory procent rolników używających nawozy sztuczne wynosił

która ma rozkład normalny standardowy.

• Hipoteza H0: 𝑝 = 𝑝0 = 35%, stąd 𝑞0 = 65%

Wartość krytyczna prawa

Decyzja: odrzucamy H0 (wynik jest istotnie różny od oczekiwanego)

Trochę inne podejście do testowania hipotez

p – value to najmniejsza wartość 𝜶, przy której moglibyśmy odrzucić

p – value to prawdopodobieństwo otrzymania wartości statystyki z

• Test prawostronny – p jest miarą pola pod krzywą gęstości

Przy danym poziomie istotności 𝜶 odrzuć hipotezę zerową

𝑝 < 0,01 – wynik eksperymentu jest bardzo istotny

Im mniejsze p Tym większe przekonanie, by odrzucić H0

Im większe p Tym słabsza podstawa do odrzucenia H0

• W rzeczywistości rzadko jest tak aby jakaś cecha obiektów lub

Współczynnik korelacji liniowej Pearsona

• Jeśli 𝝆 jest bliskie 0, to brak lub słaba korelacja

• Test, w którym wykorzystuje się statystykę o rozkładzie χ2

1. Formułujemy pewne przypuszczenia co do populacji (H0 i H1)

Firma rozważa 5 projektów nazw swojego nowego produktu. Przed

Przeprowadzić test wpływu tych nazw na klientów.

Zakładając prawdziwość H0, liczba wyborów każdej nazwy powinna

gdzie 𝑂𝑖 - liczebności obserwowane, 𝐸𝑖 - liczebności oczekiwane

Zebrano dane dotyczące 500 firm uporządkowanych według rodzajów

Usługi Handel Produkcja Suma

Liczymy wartości oczekiwane mnożąc sumy z danego wiersza i