Download as pdf or txt
Download as pdf or txt
You are on page 1of 39

STATYSTYKA MATEMATYCZNA

1. Wykład wstępny
2. Zmienne losowe i teoria prawdopodobieństwa
3. Populacje i próby danych
4. Testowanie hipotez i estymacja parametrów
5. Najczęściej wykorzystywane testy statystyczne I
6. Najczęściej wykorzystywane testy statystyczne II
7. Regresja liniowa
8. Regresja nieliniowa
9. Określenie jakości dopasowania równania regresji liniowej i nieliniowej
10. Korelacja
11. Elementy statystycznego modelowania danych
12. Porównywanie modeli
13. Analiza wariancji
14. Analiza kowariancji
15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
Wstęp

1. Test t • Zakres stosowania

2. Test Manna-Whitneya • Definicja

3. Test Wilcoxona • Przykład

Copyright ©2020, Joanna Szyda


Wstęp

Test

Hipotezy Próba danych

Copyright ©2020, Joanna Szyda


TEST T
Test t - zakres stosowania

1. Porównanie średnich arytmetycznych

2. Dane ciągłe

3. Rozkład normalny

4. Podobne wariancje

5. Warianty testu:
• Pojedyncza próba H0:  = 1.0
• Dwie niezależne próby H0: A = B
• Dwie sparowane próby H0: A = B

Copyright ©2020, Joanna Szyda


Test t – pojedyncza próba
Próba danych
BMD PŁEĆ
0.97 1
0.73 1
0.87 1 1. Badanie osteoporozy
0.94 1
2. Medical Research Council, Cambridge
1.02 1
0.76 1 3. Gęstość kości [g/cm2] 40 zdrowych osób dorosłych
0.78 1
1.01 1
0.82 1
0.76 1
0.87 1
0.72 1

0.91 2
1.02 2
0.87 2
Copyright ©2020, Joanna Szyda
Test t – pojedyncza próba

1. Określenie hipotez H0 i H1
H0: średnia gęstość kości w populacji wynosi 1.0 g/cm2
H1: średnia gęstość kości w populacji różni się od 1.0 g/cm2
H0:  = 1.0 H1:  ≠ 1.0

2. Ustalenie poziomu istotności


MAX = 0.05

3. Wybór i obliczenie wartości testu statystycznego

Excel: przykład Copyright ©2020, Joanna Szyda


Test t – pojedyncza próba

4. Określenie rozkładu testu


x − 1.0 x − 1.0
t= = ~ t N −1
ˆ 2 ˆ x
x
N

5. Obliczenie wartości t

 t = 0.0000000000
Excel: przykład

6. Decyzja
t < max H0 H1
średnia gęstość kości w populacji różni się od 1.0 g/cm2
Copyright ©2020, Joanna Szyda
Test t - zakres stosowania

1. Porównanie średnich arytmetycznych

2. Dane ciągłe

3. Rozkład normalny
This is probably the most widely
4. Podobne wariancje used statistical test of all time.
Richard Lowry

5. Warianty testu:
• Pojedyncza próba H0:  = 1.0
• Dwie niezależne próby H0: A = B
• Dwie sparowane próby H0: A = B

Copyright ©2020, Joanna Szyda


Test t – dwie niezależne próby
Próba danych
BMD PŁEĆ
0.97 1
0.73 1 1. Badanie osteoporozy
0.87 1
0.94 1
2. Medical Research Council, Cambridge
1.02 1 3. Gęstość kości [g/cm2] 40 zdrowych osób dorosłych
0.76 1
0.78 1 4. Wartości znane dla mężczyzn i kobiet
1.01 1
0.82 1
0.76 1
0.87 1
0.72 1

0.91 2
1.02 2
0.87 2
Copyright ©2020, Joanna Szyda
Test t – dwie niezależne próby

1. Określenie hipotez H0 i H1
H0: gęstość kości kobiet jest taka sama jak mężczyzn
H1: gęstość kości kobiet jest różna niż mężczyzn
H0: K = M H1: K ≠ M

2. Ustalenie poziomu istotności


MAX = 0.05

3. Wybór i obliczenie wartości testu statystycznego

Copyright ©2020, Joanna Szyda


Test t – dwie niezależne próby

3. Wybór i obliczenie wartości testu statystycznego

Excel: przykład Copyright ©2021, Joanna Szyda


Test t – dwie niezależne próby

4. Określenie rozkładu testu

5. Obliczenie wartości t

 t = 0.0466 Excel: przykład

6. Decyzja
t < max H0 H1
gęstość kości u mężczyzn jest inna niż u kobiet, …, jest wyższa
Copyright ©2020, Joanna Szyda
Test t - zakres stosowania

1. Porównanie średnich arytmetycznych

2. Dane ciągłe

3. Rozkład normalny

4. Podobne wariancje

5. Warianty testu:
• Pojedyncza próba H0:  = 1.0
• Dwie niezależne próby H0: A = B
• Dwie sparowane próby H0: A = B

Copyright ©2020, Joanna Szyda


Test t – dwie sparowane próby
Próba danych

Low CCT High CCT


20.0 14.3 1. Badanie ciśnienia w gałce ocznej
13.9 13.8
18.3 15.8
2. Ciśnienie w obu gałkach tej samej osoby
21.1 33.4 3. Podział oczu pod względem grubości rogówki (low CCT
20.1 20.3
i high CCT)
24.4 19.9
20.2 14.3
11.6 11.4
28.8 25.1
18.5 24.1

Copyright ©2022, Joanna Szyda


Test t – dwie sparowane próby

1. Określenie hipotez H0 i H1
H0: ciśnienie w gałce ocznej nie zależy od grubości rogówki
H1: ciśnienie w gałce ocznej zależy od grubości rogówki
H0: L = H H1: L ≠ H

2. Ustalenie poziomu istotności


MAX = 0.05

3. Wybór i obliczenie wartości testu statystycznego


N

D N  (x 1i − x2 i )
t= , D= i =1
N
N
 (D − D )
2
i
i =1
Excel: przykład N −1 Copyright ©2020, Joanna Szyda
Test t – dwie sparowane próby

3. Wybór i obliczenie wartości testu statystycznego

 (x 1i − x2 i )
4.5
D= i =1
= = 0.45
N 10

D N 0.45 10
t= = = 0.25
N
288.21
 (D − D )
2

i =1
i
10 − 1
N −1

Copyright ©2020, Joanna Szyda


Test t – dwie sparowane próby

4. Określenie rozkładu testu


D N
t= N
~ t N −1
(
 i
D − D )2

i =1
N −1

5. Obliczenie wartości t

 t = 0.8071 Excel: przykład

6. Decyzja
t > max H0 H1
ciśnienie w gałce ocznej nie zależy od grubości rogówki
Copyright ©2020, Joanna Szyda
TEST MANNA-WHITNEYA
Test Manna-Whitneya - zakres stosowania

1. Porównanie średnich arytmetycznych

2. Dane ciągłe lub porządkowe (rangi)

3. Dane nie mają rozkładu normalnego

4. Dwie niezależne próby

Copyright ©2020, Joanna Szyda


Test Manna-Whitneya
próba danych
ŚREDNIE WYSOKIE
5.5 6.0
6.0 7.0 1. Długość krewetki w zależności od zasolenia wody
5.0 7.5
3. Długość krewetki [mm] w wieku 4 tygodni
7.0 6.0
5.5 7.5
6.0 8.0
7.0 11.0 10
8
6.0 9.0 N
6
4
8.0 8.0 2
0
7.0 11.0 1 2 3 4 5 6 7 8 9
6.0 8.0 DŁUGOŚĆ

7.0 8.0 8
6
6.0 7.0 N4

8.0 7.0 2
0
6.0 7.0 1 2 3 4 5 6 7 8 9 10 11
7.0 9.0 DŁUGOŚĆ

Copyright ©2020, Joanna Szyda


Test Manna-Whitneya

1. Określenie hipotez H0 i H1
H0: długość krewetki nie zależy do zasolenia wody
H1: długość krewetki zależy od zasolenia wody
H0: H = M H1: H ≠ M

2. Ustalenie poziomu istotności


MAX = 0.05

3. Wybór i obliczenie wartości testu statystycznego

 n2 (n2 + 1) n2 n1 (n1 + 1) n1 
U = min n1n2 + −  r2i , n1n2 + −  r1i 
 2 i =1 2 i =1 

Excel: przykład Copyright ©2020, Joanna Szyda


Test Manna-Whitneya

3. Wybór i obliczenie wartości testu statystycznego

 n2 (n2 + 1) n2 n1 (n1 + 1) n1 
U = min n1n2 + −  r2i , n1n2 + −  r1i 
 2 i =1 2 i =1 
 16(17 ) 16(17 ) 
U = min16 *16 + − 182, 16 *16 + − 346  =
 2 2 
min (46, 210 ) = 46

Copyright ©2020, Joanna Szyda


Test Manna-Whitneya

4. Określenie rozkładu testu


• Test nieparametryczny – brak rozkładu
• Dla n1n2 > 20 – aproksymowany przez rozkład normalny:

U ~ (
N U ,  U2 ) → brak tablic
n1n2
U−
U − U → tablice
z= = 2 ~ N (0,1)
 U2 n1n2 (n1 + n2 + 1)
12

Copyright ©2020, Joanna Szyda


Test Manna-Whitneya

4. Określenie rozkładu testu

n1n2 16 *16
U− 46 −
z= 2 = 2 = 3.09 ~ N (0,1)
n1n2 (n1 + n2 + 1) 16 *16(33)
12 12

5. Obliczenie wartości t:

 t = 0.002 Excel: przykład

lub porównanie z wartością krytyczną:

𝑈𝛼=0.05,𝑛1 =16,𝑛2 =16 = 75 𝑈 = 46


Copyright ©2022, Joanna Szyda
Test Manna-Whitneya

6. Decyzja
t < max Ut ≤ 𝑈𝛼=0.05,𝑛1 =16,𝑛2 =16 H0 H1

UWAGA !!!

długość krewetki zależy od zasolenia wody

Copyright ©2022, Joanna Szyda


TEST WILCOXONA
Zakres stosowalności testu Wilcoxona

1. Test nieparametryczny

2. Dane ciągłe lub porządkowe (rangi)

3. Dane nie mają rozkładu normalnego

4. Porównywane dwu zależnych =


sparowanych prób danych

Copyright ©2020, Joanna Szyda


Test Wilcoxona
próba danych
NR OWCY BEZ JAGNIĘCIA Z JAGNIĘCIEM
1 72.00 55.50
2 62.35 43.80 1. Próba danych – zachowanie się
3 55.77 66.80 pokarmowe owiec
4 59.98 68.00
5 51.60 57.88
2. Dane zebrano w latach 1994-1996 w
6 61.48 61.90
7 52.57 45.40
stadzie owiec utrzymywanym u podnóża
8 52.50 56.67
Rocky Mountains w Kanadzie
9 56.43 73.30
10 60.13 77.50 3. Różnice w czasie pasienia się owcy z
11 48.60 63.53 jagnięciem i bez
12 42.90 54.50
13 53.50 55.58
14 70.43 91.10
4. % czasu spędzanego na pasieniu się
15 47.10 64.05
16 50.08 71.40
Copyright ©2020, Joanna Szyda
Test Wilcoxona
próba danych
NR OWCY BEZ JAGNIĘCIA Z JAGNIĘCIEM
1 72.00 55.50
2 62.35 43.80
3 55.77 66.80
4 59.98 68.00
5 51.60 57.88
6 61.48 61.90
7 52.57 45.40
8 52.50 56.67
9 56.43 73.30 3

10 60.13 77.50
2
11 48.60 63.53
N
12 42.90 54.50
1
13 53.50 55.58
14 70.43 91.10
0
15 47.10 64.05 -25 -20 -15 -10 -5 0 5 10 15 20

16 50.08 71.40 RÓŻNICA W CZASIE

Copyright ©2020, Joanna Szyda


Test Wilcoxona

1. Określenie hipotez H0 i H1
H0: czas pasienia się owcy nie zależy od obecności jagnięcia
H1: czas pasienie się owcy zależy od obecności jagnięcia
H0: J = B H1: J ≠ B

2. Ustalenie poziomu istotności


MAX = 0.05

3. Wybór i obliczenie wartości testu statystycznego

 n1 − N − n1 + 
W = min  ri ,  ri 
 i =1 i = n1 
Excel: przykład Copyright ©2020, Joanna Szyda
Test Wilcoxona

3. Wybór i obliczenie wartości testu statystycznego

 n1 − N − n1 + 
W = min  ri ,  ri  = min (107, 29 ) = 29
 i =1 i = n1 

Copyright ©2020, Joanna Szyda


Test Wilcoxona
4. Określenie rozkładu testu
• Test nieparametryczny – brak rozkładu
• Dla N > 15 – aproksymowany przez rozkład normalny:
W= ~ (
N W ,  W2 )
W − W
z= ~ N (0,1)
 2
W

N ( N + 1)
W−
z= 4 ~ N (0,1)
N ( N + 1)(2 N + 1)
24
16 *17
29 −
z= 4 = −2.02 ~ N (0,1)
16 *17 * 33
24 Copyright ©2020, Joanna Szyda
Test Wilcoxona

5. Obliczenie wartości t:

 t = 0.0437 Excel: przykład

lub porównanie z wartością krytyczną:

W =0.05, N =16 = 29 Wt = 29

6. Decyzja
t < max Wt = W H0 H1 ?
czas pasienie się owcy nie/zależy od obecności jagnięcia ?

Copyright ©2020, Joanna Szyda


QUIZ
Quiz

Test Wilcoxona

Copyright ©2022, Joanna Szyda


Quiz

TEST T

2 niezależne próby

Copyright ©2021, Joanna Szyda


Quiz

TEST T

2 sparowane próby

Copyright ©2021, Joanna Szyda


1. Test t

2. Test Manna-Whitneya

3. Test Wilcoxona

You might also like