Professional Documents
Culture Documents
Mat4 Zastępstwo 22 11 23
Mat4 Zastępstwo 22 11 23
Wektory losowe
Dane są zmienne losowe 𝑋1 , 𝑋2 , … , 𝑋𝑛 określone na przestrzenie probabilistycznej (Ω, S, P).
Uporządkowany układ n zmiennych losowych będziemy oznaczać 𝑿 = (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) i
nazywać n-wymiarową zmienną losową (wektorem losowym).
𝑿: Ω → 𝑅𝑛
W szczególności gdy 𝑛 = 2 mamy do czynienia z dwuwymiarową zmienną losową (𝑋, 𝑌).
Przydatne, gdy modelujemy doświadczenie, którego wyniki opisujemy układem kilku liczb,
np. wzrost i waga losowej osoby.
PRZYPADEK DYSKRETNY
Dwuwymiarowa zmienna (X;Y) ma rozkład skokowy, jeśli zmienne X i Y mają skończone lub
przeliczalne zbiory wartości.
Rozkład określa się za pomocą funkcji prawdopodobieństwa lub przez dystrybuantę.
𝑝𝑖𝑗 ≥ 0
∑ ∑ 𝑝𝑖𝑗 = 1
𝑖 𝑗
Przykład
Z talii 52 kart losujemy jedną kartę. Niech zmienna X przyjmuje wartości równe liczbie
wylosowanych asów, a zmienna Y licznie wylosowanych kart kier. Wyznaczyć łączny rozkład
wektora losowego (X,Y).
36
y\x 0 1 𝑃(𝑋 = 0; 𝑌 = 0) =
52
0 36 3 12
𝑃(𝑋 = 0; 𝑌 = 1) =
52 52 52
1 12 1 3
𝑃(𝑋 = 1; 𝑌 = 0) =
52 52 52
1
𝑃(𝑋 = 1; 𝑌 = 1) =
52
Rozkłady brzegowe określone są następująco:
𝑃(𝑋 = 𝑖) = 𝑝𝑖 ∙ = ∑ 𝑝𝑖𝑗
𝑗
Ponieważ:
𝑃(𝑋 = 𝑖) = 𝑝𝑖 ∙ = 𝑃(𝑋 = 𝑥𝑖 ; 𝑌 = 𝑦1 ) + 𝑃(𝑋 = 𝑥𝑖 ; 𝑌 = 𝑦2 ) + ⋯ 𝑃(𝑋 = 𝑥𝑖 ; 𝑌 = 𝑦𝑘 ) + ⋯
prawdopodobieństwo 𝑃(𝑋 = 𝑖) jest prawdopodobieństwem tego, że zmienna X przyjmuje
wartość 𝑥𝑖 niezależnie od tego jaką wartość przyjmuje zmienna Y, zatem funkcja ta jest
rozkładem prawdopodobieństwa zmiennej X.
Zmienne losowe X i Y są niezależne, jeśli dla każdej pary (𝑥𝑖 ; 𝑦𝑗 ) spełniony jest warunek:
x 0 1
0 36 3 39
52 52 52
1 12 1 13
52 52 52
48 4
52 52
36 48 39
𝑃(𝑋 = 0; 𝑌 = 0) = 𝑃(𝑋 = 0) ∙ 𝑃(𝑌 = 0), ponieważ = 52 ∙ 52
52
12 48 13
𝑃(𝑋 = 0; 𝑌 = 1) = 𝑃(𝑋 = 0) ∙ 𝑃(𝑌 = 1), ponieważ = ∙
52 52 52
3 4 39
𝑃(𝑋 = 1; 𝑌 = 0) = 𝑃(𝑋 = 1) ∙ 𝑃(𝑌 = 0), ponieważ = 52 ∙ 52
52
1 4 13
𝑃(𝑋 = 1; 𝑌 = 1) = 𝑃(𝑋 = 1) ∙ 𝑃(𝑌 = 1), ponieważ = 52 ∙ 52
52
Przykład
Rozkład wektora losowego dany jest tabelą:
x\y 0 1
0 0,25 0,25
1 0,25 0,25
Rozkłady warunkowe
Dla zmiennej losowej skokowej, rozkładem warunkowym zmiennej losowej Y pod
warunkiem, że 𝑋 = 𝑥𝑖 nazywamy:
𝑝𝑖𝑗
𝑃(𝑌 = 𝑦𝑗 |𝑋 = 𝑥𝑖 ) =
𝑝𝑖.
Analogicznie, rozkładem warunkowym zmiennej losowej X pod warunkiem, że 𝑌 = 𝑦𝑖
nazywamy:
𝑝𝑖𝑗
𝑃(𝑋 = 𝑥𝑖 |𝑌 = 𝑦𝑗 ) =
𝑝.𝑗
Przykład
x\y -1 1
-1 1 1 1
6 6 3
Znajdź rozkład warunkowy
0 1 0 1
zmiennej losowej X pod
3 3 warunkiem, że 𝑌 = 1
1 1 1 1
6 6 3
2 1
3 3
1
1
𝑃(𝑋 = −1|𝑌 = 1) = 6 =
1 2
3
0
𝑃(𝑋 = 0|𝑌 = 1) = = 0
1
3
1
1
𝑃(𝑋 = 1|𝑌 = 1) = 6 =
1 2
3
Warunkowa wartość oczekiwana
PRZYPADEK CIĄGŁY
Zmienną (X;Y) nazywamy zmienną losową ciągłą, jeśli jej dystrybuanta da się przedstawić w
postaci
𝑥 𝑦
𝐹(𝑥; 𝑦) = ∫ ∫ 𝑓(𝑠; 𝑡)𝑑𝑡𝑑𝑠
−∞ −∞
UWAGA
∞ ∞
• ∫−∞ ∫−∞ 𝑓(𝑥; 𝑦)𝑑𝑥𝑑𝑦 = 1
• 𝑓(𝑥; 𝑦) ≥ 0
• W punktach ciągłości funkcji 𝑓(𝑥; 𝑦) zachodzi
𝜕2 𝐹(𝑥; 𝑦)
= 𝑓(𝑥; 𝑦)
𝜕𝑥𝜕𝑦
• 𝑃(𝐴) = ∬𝐴 𝑓(𝑥; 𝑦)𝑑𝑥𝑑𝑦
Przykład
Funkcja 𝑓(𝑥; 𝑦) jest gęstością zmiennej losowej (𝑋; 𝑌)
𝑐𝑥𝑦, 0≤𝑥 ≤2𝑖0≤𝑦≤1
𝑓(𝑥; 𝑦) = {
0, 𝑝. 𝑝.
a. Wyznacz stałą c;
b. Wyznacz dystrybuantę;
2 1 2 2 1
𝑦2 𝑥
∫ ∫ 𝑐𝑥𝑦𝑑𝑦𝑑𝑥 = 𝑐 ∫ 𝑥 | 𝑑𝑥 = 𝑐 ∫ 𝑑𝑥 = 𝑐 → 𝑐 = 1
0 0 0 2 0 0 2
Dla obszaru E:
𝑥 𝑦
𝐹(𝑥; 𝑦) = ∫ ∫ 0𝑑𝑡𝑑𝑠 = 0
0 0
Dla obszaru A:
𝑥 𝑦
𝑥 2 𝑦2
𝐹(𝑥; 𝑦) = ∫ ∫ 𝑡𝑠𝑑𝑡𝑑𝑠 =
0 0 4
Dla obszaru B
2 𝑦
𝐹(𝑥; 𝑦) = ∫ ∫ 𝑡𝑠𝑑𝑡𝑑𝑠 = 𝑦2
0 0
Dla obszaru C
𝑥 1 𝑥2
𝐹(𝑥; 𝑦) = ∫0 ∫0 𝑡𝑠𝑑𝑡𝑑𝑠 = 4
Dla obszaru D
2 1
𝐹(𝑥; 𝑦) = ∫ ∫ 𝑡𝑠𝑑𝑡𝑑𝑠 = 1
0 0
Ostatecznie:
0, 𝑥 ≤ 0 𝑙𝑢𝑏 𝑦 ≤ 0
1 2 2
𝑥 𝑦 , 0 < 𝑥 ≤ 2𝑖 0 <𝑦 ≤ 1
4
𝐹(𝑥; 𝑦) = 𝑦2 , 𝑥 > 2𝑖 0 <𝑦 ≤ 1
1 2
𝑥 , 𝑦 > 1𝑖 0 <𝑥 ≤2
4
{ 1, 𝑥 > 2𝑖 𝑦 >1
Przykład
1
21 1 , 0≤𝑥≤2
𝑓𝑋 (𝑥) = ∫0 4 𝑑𝑦 = 2 → 𝑓𝑋 (𝑥) = {2
0, 𝑝. 𝑝.
1
1
𝑓𝑌 (𝑦) = → 𝑓𝑌 (𝑦) = {2 , 0≤𝑦≤2
2 0, 𝑝. 𝑝.
Czy zmienne są niezależne? TAK.
Dla zmiennej losowej ciągłej, gęstością warunkową nazywamy:
𝑓(𝑥0 ; 𝑦)
𝑓(𝑦|𝑋 = 𝑥0) =
𝑓𝑋 (𝑥0 )
𝑓(𝑥; 𝑦0 )
𝑓(𝑥|𝑌 = 𝑦0 ) =
𝑓𝑌 (𝑦0 )
Przykład
1
𝑓(𝑥; 𝑦) = {4 , 0≤ 𝑥 ≤ 2𝑖 0 ≤ 𝑦 ≤ 2
0, 𝑝. 𝑝.
Obliczmy gęstość rozkładu warunkowego 𝑋|𝑌 = 1.
1
𝑓(𝑥|𝑌 = 1) = {2 , 0≤𝑥≤2
0, 𝑝. 𝑝.
∑ ∑ 𝑥𝑖 ∙ 𝑦𝑗 ∙ 𝑝𝑖𝑗
𝐸(𝑋𝑌) = 𝑖 𝑗
∬ 𝑥 ∙ 𝑦 ∙ 𝑓(𝑥, 𝑦)𝑑𝑥𝑑𝑦
{
Jeżeli zmienne są niezależne, to 𝑬(𝑿𝒀) = 𝑬𝑿 ∙ 𝑬𝒀, zatem 𝑪𝒐𝒗(𝑿; 𝒀) = 𝟎.
Zmienne
UWAGA W drugą stronę to nie zachodzi. nieskorelowane
Przykład
z tablic dra
L.Kowalskiego
𝑬𝑿 = 𝟎
𝟏 𝟏
𝑬𝒀 = 𝑬𝑿𝟐 = 𝑫𝟐 𝑿 + (𝑬𝑿)𝟐 = +𝟎 =
𝟑 𝟑
𝟏
𝟑
𝟏 𝟑
𝑬(𝑿 ∙ 𝒀) = 𝑬𝑿 = ∫ ∙ 𝒙 𝒅𝒙 = 𝟎
−𝟏 𝟐
𝑬(𝑿 ∙ 𝒀) = 𝑬𝑿 ∙ 𝑬𝒀 → 𝑪𝒐𝒗(𝑿, 𝒀) = 𝟎
• 𝑐𝑜𝑣(𝑋; 𝑋) = 𝐷 2 𝑋
• 𝑐𝑜𝑣(𝑋; 𝑌) = 𝑐𝑜𝑣(𝑌; 𝑋)
• 𝑐𝑜𝑣(𝑎 + 𝑋; 𝑌) = 𝑐𝑜𝑣(𝑋; 𝑌)
• 𝑐𝑜𝑣 (𝑎𝑋 + 𝑏𝑌; 𝑍 ) = 𝑎 ∙ 𝑐𝑜𝑣 (𝑋; 𝑌) + 𝑏 ∙ 𝑐𝑜𝑣 (𝑌; 𝑍 )
Jeżeli 𝑍 = 𝑋 + 𝑌, to
𝐷 2 (𝑋 + 𝑌) = 𝐷 2 𝑍 = 𝐶𝑜𝑣(𝑍, 𝑍) = 𝐶𝑜𝑣(𝑋 + 𝑌, 𝑋 + 𝑌) =
= 𝐶𝑜𝑣(𝑋, 𝑋) + 𝐶𝑜𝑣(𝑋, 𝑌) + 𝐶𝑜𝑣(𝑌, 𝑋) + 𝐶𝑜𝑣(𝑌, 𝑌) =
= 𝐷 2 (𝑋) + 𝐷 2 (𝑌) + 2𝐶𝑜𝑣(𝑋; 𝑌)
• 𝐷 2 (𝑋 + 𝑌) = 𝐷 2 (𝑋) + 𝐷 2 (𝑌) + 2𝐶𝑜𝑣(𝑋; 𝑌)
Ogólnie:
• 𝐷 2 (𝑎𝑋 + 𝑏𝑌) = 𝑎2 𝐷 2 (𝑋) + 𝑏 2 𝐷 2 (𝑌) + 2𝑎𝑏𝐶𝑜𝑣(𝑋; 𝑌)
KOWARIANCJA ZALEŻY OD JEDNOSTEK
Macierz kowariancji
𝑫𝟐 (𝑿) 𝑪𝒐𝒗(𝑿; 𝒀)
𝑲=[ ]
𝑪𝒐𝒗(𝑿; 𝒀) 𝑫𝟐 (𝒀)
• Kwadratowa;
• Symetryczna;
• Wyznacznik nieujemny, tzn. (𝒄𝒐𝒗(𝑿; 𝒀))𝟐 ≤ 𝑫𝟐 𝑿 ∙ 𝑫𝟐 𝒀
Korelacja
Współczynnik korelacji 𝝆 między zmiennymi X i Y jest miarą siły liniowego związku między
zmiennymi.
𝑪𝒐𝒗(𝑿; 𝒀)
𝝆(𝑿; 𝒀) =
𝑫(𝑿) ∙ 𝑫(𝒀)
Własności współczynnika korelacji:
• −1 ≤ 𝝆 ≤ 1;
• Jeżeli X i Y są niezależne, to 𝝆(𝑿; 𝒀) = 𝟎.
• Jeśli 𝜌(𝑋; 𝑌) = 1, to 𝑌 = 𝑎𝑋 + 𝑏 i 𝑎 > 0
• Jeśli 𝜌(𝑋; 𝑌) = −1, to 𝑌 = 𝑎𝑋 + 𝑏 i 𝑎 < 0
• Jeżeli 𝝆(𝑿; 𝒀) = 𝟎, to zmienne są nieskorelowane.
• Jeżeli 𝝆(𝑿; 𝒀) > 𝟎, to zmienne są skorelowane dodatnio.
• Jeżeli 𝝆(𝑿; 𝒀) < 𝟎, to zmienne są skorelowane ujemnie.
• 𝝆(𝒂𝑿 + 𝒃; 𝒄𝒀 + 𝒅) = 𝝆(𝑿; 𝒀) dla 𝑎, 𝑐 > 0
Macierz korelacji
𝟏 𝝆(𝑿; 𝒀)
𝑹=[ ]
𝝆(𝑿; 𝒀) 𝟏
Przykład
Oblicz współczynnik korelacji między zmiennymi X i Y. Czy zmienne są niezależne? Czy
zmienne są nieskorelowane?
x\y -1 1
-1 1 1 1
6 6 3
0 1 0 1
3 3
1 1 1 1
6 6 3
2 1
3 3
1 1 1
𝐸𝑋 = (−1) ∙ +0∙ +1∙ =0
3 3 3
1 1 1 2
𝐸𝑋 2 = (−1)2 ∙ + 02 ∙ + 12 ∙ =
3 3 3 3
2
𝐷2𝑋 =
3
2 1 1
𝐸𝑌 = (−1) ∙ +1∙ =−
3 3 3
2 1
𝐸𝑌2 = (−1) 2 ∙ + 12 ∙ = 1
3 3
8
𝐷2𝑋 =
9
1 1 1 1 1
𝐸𝑋𝑌 = (−1) ∙ + 1 ∙ + (−1) ∙ + 1 ∙ = 0 → 𝐶𝑜𝑣(𝑋; 𝑌) = 0 − (− ) ∙ 0 = 0
6 6 6 6 3
Zatem zmienne są nieskorelowane. Nie są jednak niezależne.
Twierdzenia graniczne
TWIERDZENIE POISSONA
0,3
0,25
0,2
0,15 Bin(1000;0,002)
P(2)
0,1
0,05
0
0 1 2 3 4 5 6 7 8
UWAGA
Dla dużych 𝑛 i małych 𝑝 zachodzi wzór:
𝑛 𝑘 𝑛−𝑘 − 𝜆
𝜆𝑘
( ) 𝑝 (1 − 𝑝) ≈𝑒 ,
𝑘 𝑘!
gdzie 𝜆 = 𝑛𝑝.
Przykład
Z rozkładu dwumianowego:
1000
𝑃(𝑋 = 3) = ( ) ∙ 0,0023 ∙ 0,998997 ≈ 0,180628
3
Z rozkładu Poissona:
𝜆 = 𝑛𝑝 = 1000 ∙ 0,002 = 2
23
𝑃(𝑋 = 3) = 𝑒 −2 ≈ 0,180447
3!
Wykres rozkładu dwumianowego wraz ze wzrostem liczby prób 𝑛 coraz bardziej przypomina
wykres krzywej Gaussa.
Wykres rozkładu dwumianowego wraz ze wzrostem liczby prób 𝑛 coraz bardziej przypomina
wykres krzywej Gaussa.
https://upload.wikimedia.org/wikipedia/commons/0/06/De_moivre-laplace.gif
WNIOSEK
𝑋 − 𝑛𝑝
𝑃 (𝑎 < < 𝑏) ≈ Φ(𝑏) − Φ(𝑎).
√𝑛𝑝(1 − 𝑝)
𝑛 𝑝
20 0,25 ≤ 𝑝 ≤ 0,75
50 0,1 ≤ 𝑝 ≤ 0,9
100 0,05 ≤ 𝑝 ≤ 0,95
Przykład
Rozważmy zmienną losową o rozkładzie dwumianowym 𝑋~𝐵(15; 0,4).
0,25
0,2
0,15
0,1
0,05
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
𝑬(𝑿) =6
𝑫𝟐 (𝑿) = 𝟑, 𝟔
→ 8
Sprawdźmy czy 𝑃(5 ≤ 𝑋 ≤ 8) ≈ ∫5 𝑓(𝑥)𝑑𝑥 ,
UWAGA
Stosując poprawkę na ciągłość, każde z prawdopodobieństw 𝑃(𝑋 = 𝑘) rozkładu
dwumianowego przybliżamy całką:
𝑘+0,5
𝑃(𝑋 = 𝑘) = ∫ 𝑓(𝑥)𝑑𝑥
𝑘−0,5
Rzucono 40 razy monetą symetryczną. Niech X oznacza liczbę wyrzuconych orłów. Obliczyć
𝑃(15 ≤ 𝑋 ≤ 25).
𝜎2 𝜎
𝐸(𝑋̅) = 𝜇 𝐷 ̅)
2 (𝑋
= → 𝐷(𝑋̅) =
𝑛 √𝑛
Przykład Wykonujemy dwa rzuty czworościenną kostką. Wykres niebieski ilustruje rozkład
wyników na jednej kostce, wykres zielony sumę oczek na dwóch kostkach.
Przykład c.d. Tym razem znajdziemy rozkład nie sumy oczek lecz średniej z wyników na dwóch
kostkach.
CENTRALNE TWIERDZENIE GRANICZNE
• 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 ~𝑁(𝑛𝜇; √𝑛𝜎)
𝜎
• 𝑋̅~𝑁 (𝜇; )
√𝑛
𝑋̅−𝜇
• 𝜎 ~𝑁(0; 1)
√𝑛
𝑋̅ − 𝜇
𝑍= 𝜎
√𝑛
jest zbieżna do rozkładu 𝑁(0; 1).
WNIOSEK
𝑋̅ − 𝜇
𝑃 (𝑎 < 𝜎 < 𝑏) = Φ(𝑏) − Φ(a),
√𝑛
co równoważnie można zapisać:
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 − 𝑛𝜇
𝑃 (𝑎 < < 𝑏) = Φ(𝑏) − Φ(a).
𝜎 √𝑛
Przykład
2
Zmienne losowe 𝑋1 , 𝑋2 , … , 𝑋30 są niezależne i mają identyczne rozkłady 𝑋𝑘 ~𝑃 (3) , 𝑘 =
1,2, … , 30.
Obliczyć:
15 − 20 22 − 20
𝑃(15 < 𝑋1 + 𝑋2 + ⋯ + 𝑋30 ≤ 22) = 𝑃 ( <𝑌< )=
√20 √20
= 𝑃(−1,12 < 𝑌 < 0,45) = Φ(0,45) − Φ(−1,12) = 0,54228
Wstępne pojęcia statystyki
• Zbieranie danych
• Analizowanie danych
• Wnioskowanie na podstawie danych
demon Laplace’a
efekt motyla
Przedmiotem badań statystycznych są tzw. procesy masowe. Z tą analizą wiążą się dwa
podstawowe pojęcia:
▪ Zbiorowość statystyczna = populacja – zbiór elementów podobnych ze względu na
pewne kryteria
▪ Próba losowa – podzbiór populacji. Jej struktura powinna być zbliżona do struktury
populacji, aby wyniki uzyskane z próby można uogólnić do całej populacji
Cecha = zmienna charakteryzująca badane obiekty (wzrost, waga, wielkość kredytu, liczba
dzieci, poziom cukru we krwi, miesięczne wydatki na rozrywkę).
Badanie statystyczne może być:
▪ Całościowe – obejmujące całą populację
▪ Częściowe – obejmujące próbę losową
George Gallup
ZMIENNA LOSOWA
Wyniki 𝑥1 , 𝑥2 , … , 𝑥𝑛 to
zaobserwowane wartości n-
elementowej próby.
• Średnia z próby
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑋̅ =
𝑛
• Wariancja (nieobciążona) z próby
2
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑆 =
𝑛−1
ROZKŁAD CHI-KWADRAT
Jeśli zmienne 𝑋1 , 𝑋2 , … , 𝑋𝑛 są niezależne o rozkładzie N(0;1), to
Przykładowo, dla 𝑛 = 6:
𝑘 = 0,87