Professional Documents
Culture Documents
Statystyka Matematyczna: 2. Zmienne Losowe I Teoria Prawdopodobieństwa
Statystyka Matematyczna: 2. Zmienne Losowe I Teoria Prawdopodobieństwa
Statystyka Matematyczna: 2. Zmienne Losowe I Teoria Prawdopodobieństwa
1. Wykład wstępny
2. Zmienne losowe i teoria prawdopodobieństwa
3. Populacje i próby danych
4. Testowanie hipotez i estymacja parametrów
5. Najczęściej wykorzystywane testy statystyczne I
6. Najczęściej wykorzystywane testy statystyczne II
7. Regresja liniowa
8. Regresja nieliniowa
9. Określenie jakości dopasowania równania regresji liniowej i nieliniowej
10. Korelacja
11. Elementy statystycznego modelowania danych
12. Porównywanie modeli
13. Analiza wariancji
14. Analiza kowariancji
15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
wstęp
1. Zmienna losowa
3. Dystrybuanta
4. Statystyki opisowe
5. Przykładowe rozkłady
zmienna losowa → X
f (w)dw = 0.12
160 Copyright ©2020, Joanna Szyda
funkcja (gęstości) prawdopodobieństwa probability (density) function
9
0.25 P( X = xi ) = 1 +
0.20
i =1 f (w)dw = 1
−
f (w)
0.15
P(X=x)
0.10
0.05
0.00
1 2 3 4 5 6 7 8 9
liczba szczeniąt x wysokość w kłębie w
f (w,z)
w
P(x,y)
y
z
x
prawdopodobieństwo
łączne, warunkowe
Copyright ©2020, Joanna Szyda
dystrybuanta
dystrybuanta cumulative distribution function
• dystrybuanta • dystrybuanta
• jakie jest prawdopodobieństwo • jakie jest prawdopodobieństwo
uzyskania wartości mniejszej lub uzyskania wartości mniejszej lub
równej x równej w
• X { 1, 2, 3, 4, 5, 6, 7, 8, 9 } • W [ 150, 190 ]
w
• F(x) = P(Xx) •F (w) = f (w)dw
−
• np. urodzenie maksymalnie 5 • np. maksymalna wys. w kłębie 170
szczeniąt
170
F(5)=P(X5)=0.40 F (170 ) = f (w)dw = 0.69
−
Copyright ©2020, Joanna Szyda
dystrybuanta cumulative distribution function
F (w → ) = 1
9
1.50
P( X = x ) = 1
i =1
i
1.00
P(X≤x)
F (w)
0.50
0.00
1 2 3 4 5 6 7 8 9
maks. liczba szczeniąt x wysokość w kłębie w
1.00
• prawdopodobieństwo urodzenia maksymalnie
9 szczeniaków: 0.80
P(Xx)
F(9)=P(X9)=1 0.60
3 szczeniaków: 0.20
F(3)=P(X3)=0.03+0.04+0.06 0.00
1 2 3 4 5 6 7 8 9
• prawdopodobieństwo urodzenia 4 lub 5 maks. liczba szczeniąt x
szczeniaków:
F(5)-F(3)
Copyright ©2020, Joanna Szyda
dystrybuanta cumulative distribution function
F (w)
o wysokości w kłębie maksymalnie 190 cm:
F(190)=P(W190)≈1.00
• prawdopodobieństwo wystąpienia osobnika
o wysokości w kłębie 160-170 cm:
F(170)-F(160)=0.32
wysokość w kłębie w
• prawdopodobieństwo wystąpienia osobnika
o wysokości w kłębie powyżej 165 cm:
1-F(165)=0.62
Copyright ©2022, Joanna Szyda
STATYSTYKI OPISOWE
wartość oczekiwana i wariancja
• przebieg funkcji
• kształt rozkładu funkcji
(gęstości)
prawdopodobieństwa
mediana
modalna
Wariancja
→ V(X), Var(X), X2
→ liczba określająca rozproszenie wartości zmiennej wokół wartości oczekiwanej
→ odchylenie standardowe, V ( X ), X , s.d .( X )
V ( X ) = E X − E ( X ) V (W ) = E W − E (W )
2 2
standaryzacja zmiennej X
X − E(X )
Z=
V (X )
Momenty rozkładu
• n-ty moment
Mediana → x
~
→ liczba, która dzieli funkcję gęstości na połowy
→ mniej zależna od odstających obserwacji niż śr.
0.20
f (w)
P(X=x)
0.10
0.00
1 2 3 4 5 6 7 8 9
liczba szczeniąt x wysokość w kłębie w
Copyright ©2022, Joanna Szyda
modalna mode
Modalna → liczba, która występuje najczęściej
→ może istnieć więcej niż jedna modalna
→ może nie być wartości modalnej
0.20
f (w)
P(X=x)
0.15
0.10
0.05
0.00
1 2 3 4 5 6 7 8 9
w. oczekiwana
modalna
mediana
rozkład symetryczny
1 2 3 4 5 6 7 modalna
mediana
w. oczekiwana
rozkład skośny
1 2 3 4 5 6 7
1 2 3 4 5 6 7 duża wariancja
1 2 3 4 5 6 7 mała wariancja
Copyright ©2022, Joanna Szyda
STATYSTYKI OPISOWE
maksimum
3 kwartyl:
75% danych
mediana:
50% danych
1 kwartyl:
25% danych
minimum
obserwacja odstająca
Copyright ©2020, Joanna Szyda
STATYSTYKI OPISOWE
https://www.khanacademy.org/math/probability/random-variables-
topic/random_variables_prob_dist/v/probability-density-functions
1 1 𝑥−𝜇 2
∙
𝑓 𝑥 = 𝑒 𝜎2
2
𝜎 2𝜋
𝑥 ∈ −∞, +∞
𝑁 𝜇, 𝜎 2
𝑥 ∈ −∞, +∞
𝑡𝑘
𝐸 𝑥 =0
𝑘
𝑉𝑎𝑟 𝑥 =
𝑘−2
• Kształt zależny od stopni swobody
• Dla wielu stopni swobody zbliżony do rozkładu normalnego
www.geo.fu-berlin.de/en/v/soga/Basics-of-statistics Hartmann, K., Krois, J., Waske, B. (2018): E-Learning Project SOGA: Statistics and Geospatial Data Analysis. Department of Earth Sciences, Freie Universitaet Berlin. Copyright ©2022, Joanna Szyda
rozkład 2
𝑘
𝑥 2−1 −
𝑥
𝑓 𝑥 = 𝑘 𝑒 2
𝑘
22 Γ 2
𝑥 ∈ 0, +∞
𝜒𝑘2
𝐸 𝑥 =𝑘
𝑉𝑎𝑟 𝑥 = 2𝑘
• Skośny
• Kształt zależny od liczby stopni swobody
www.geo.fu-berlin.de/en/v/soga/Basics-of-statistics Hartmann, K., Krois, J., Waske, B. (2018): E-Learning Project SOGA: Statistics and Geospatial Data Analysis. Department of Earth Sciences, Freie Universitaet Berlin. Copyright ©2022, Joanna Szyda
ROZKŁAD DWUMIANOWY
n x
f ( x ) = p (1 − p )
n− x
x
x [0, n]
E ( x ) = np
Var ( x ) = np(1 − p )
x
f (x ) = e −
x!
x [0, n]
E (x ) =
Var ( x ) =
• Liczba "sukcesów" (x) w danym przedziale czasu
• np. liczba odchowanych prosiąt w 2 tyg. po urodzeniu
• Przykład: http://www.youtube.com/watch?v=Fk02TW6reiA
Copyright ©2020, Joanna Szyda
1. Zmienna losowa
3. Dystrybuanta
4. Statystyki opisowe
5. Przykładowe rozkłady