Professional Documents
Culture Documents
BI PST Textbook 2022 12 15
BI PST Textbook 2022 12 15
Přednášející:
Mgr. Petr Novák, Ph.D.
Obsah
Organizace předmětu 5
Podmínky absolvování . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Doporučená literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Náhodné veličiny 28
3.1 Definice náhodné veličiny, distribuční funkce . . . . . . . . . . . . . . . . . . . 28
3.2 Diskrétní náhodné veličiny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3 Spojité náhodné veličiny, hustota . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.4 Funkce náhodné veličiny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.5 Kvantilová funkce a simulace . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.6 Charakteristiky náhodných veličin . . . . . . . . . . . . . . . . . . . . . . . . 42
3.6.1 Střední hodnota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.6.2 Rozptyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.6.3 Obecné momenty náhodné veličiny . . . . . . . . . . . . . . . . . . . . 49
3.6.4 Momentová vytvořující funkce . . . . . . . . . . . . . . . . . . . . . . 51
3.6.5 Kvantily . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.7 Důležitá diskrétní rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.1 Konstantní náhodná veličina . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.2 Bernoulliho (Alternativní) rozdělení . . . . . . . . . . . . . . . . . . . 56
3.7.3 Binomické rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.7.4 Indikátor jevu – Bernoulliho náhodná veličina . . . . . . . . . . . . . . 61
3.7.5 Geometrické rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.7.6 Poissonovo rozdělení – motivace . . . . . . . . . . . . . . . . . . . . . 64
3.7.7 Poissonovo rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.7.8 Shrnutí důležitých diskrétních rozdělení . . . . . . . . . . . . . . . . . 67
3.8 Důležitá spojitá rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.8.1 Rovnoměrné rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.8.2 Exponenciální rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.8.3 Normální rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.8.4 Standardizace obecné náhodné veličiny . . . . . . . . . . . . . . . . . . 72
3.8.5 Standardizace normální náhodné veličiny . . . . . . . . . . . . . . . . 72
3.8.6 Shrnutí důležitých spojitých rozdělení . . . . . . . . . . . . . . . . . . 74
4 Náhodné vektory 75
4.1 Diskrétní náhodné vektory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.1.1 Diskrétní sdružené rozdělení . . . . . . . . . . . . . . . . . . . . . . . . 76
4.1.2 Diskrétní marginální rozdělení . . . . . . . . . . . . . . . . . . . . . . 77
4.1.3 Nezávislost diskrétních náhodných veličin . . . . . . . . . . . . . . . . 77
4.1.4 Diskrétní podmíněné rozdělení . . . . . . . . . . . . . . . . . . . . . . 79
4.1.5 Podmíněná střední hodnota diskrétní náhodné veličiny . . . . . . . . . 80
4.2 Spojité náhodné vektory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.2.1 Spojité sdružené rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.2.2 Spojité marginální rozdělení . . . . . . . . . . . . . . . . . . . . . . . . 82
4.2.3 Nezávislost spojitých náhodných veličin . . . . . . . . . . . . . . . . . 83
4.2.4 Spojité podmíněné rozdělení . . . . . . . . . . . . . . . . . . . . . . . . 84
4.2.5 Podmíněná střední hodnota spojité náhodné veličiny . . . . . . . . . . 85
4.3 Funkce náhodného vektoru . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.3.1 Součet náhodných veličin . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.3.2 Součet náhodných veličin – momentová vytvořující funkce . . . . . . . 88
4.3.3 Střední hodnota funkce náhodných veličin . . . . . . . . . . . . . . . . 89
4.3.4 Střední hodnota součtu náhodných veličin . . . . . . . . . . . . . . . . 89
2
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 OBSAH
5 Limitní věty 96
5.1 Odhadování vlastností experimentu . . . . . . . . . . . . . . . . . . . . . . . . 96
5.1.1 Odhadování střední hodnoty . . . . . . . . . . . . . . . . . . . . . . . 96
5.2 Základní nerovnosti pro důkaz slabého ZVČ . . . . . . . . . . . . . . . . . . . 96
5.2.1 Markovova nerovnost . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.2.2 Čebyševova nerovnost . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.3 Zákony velkých čísel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.3.1 Charakteristiky průměru náhodných veličin . . . . . . . . . . . . . . . 99
5.3.2 Slabý zákon velkých čísel . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.3.3 Silný zákon velkých čísel . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.4 Centrální limitní věta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.4.1 Konvergence v distribuci . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.4.2 Centrální limitní věta . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 3
OBSAH BI-PST, ZS 2022/23, Přednáška 1-12
4
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 OBSAH
Organizace předmětu
Podmínky absolvování
• Cvičení:
• Zkouška:
Doporučená literatura
České tituly:
Anglické tituly:
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 5
1 ZÁKLADNÍ POJMY PRAVDĚPODOBNOSTI BI-PST, ZS 2022/23, Přednáška 1-12
Přesná predikce není často možná, protože je studovaný jev buďto příliš komplexní,
nebo nemáme k dispozici všechny potřebné informace.
• Např. pokud máme k dispozici vyváženou minci, můžeme spočítat, jaká je šance,
že nám z 1000 hodů padne 100 orlů.
• Např. z 1000 hodů mincí můžeme zkusit odhadnout, jak často padá hlava nebo
orel.
• Pokud nám padne orel jen 100 krát, znamená to, že mince není vyvážená?
• Konečný počet n vzájemně různých výsledků nějakého pokusu (např. hod kostkou).
• Předpokládáme, že všechny výsledky jsou stejně pravděpodobné.
• Jestliže právě m z těchto výsledků odpovídá realizaci jevu A (např. padlo sudé číslo),
potom definujeme pravděpodobnost jevu A jako
m počet příznivých výsledků
P(A) = = .
n počet všech možných výsledků
6
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 1.1 Motivace
• Myšlenkový experiment. Často hod mincí či kostkou, výběr kuličky z krabičky, atp.
Příklad 1.1 (– Hod dvěma vyváženými mincemi). Jaká je pravděpodobnost, že padne alespoň
jednou hlava (heads)?
Počet dvojic, ve kterých je alespoň jedna hlava, je 3. Celkově jsou 4 možnosti
(HH,HO,OH,OO). Tedy:
3
P(alespoň jedna H) = .
4
Příklad 1.2 (– Hod vyváženou šestistěnnou kostkou). Jaká je pravděpodobnost, že padne
sudé číslo?
Sudá čísla jsou 3 (2,4,6). Celkově je 6 možností. Tedy:
3 1
P(sudé) = = .
6 2
Pokud
• a každý výsledek (např. bod) je stejně pravděpodobný (anebo každá oblast stejné „velikosti“
je stejně pravděpodobná),
Příklad 1.3 (– Romeo a Julie). Romeo a Julie se mají setkat na tajném místě mezi polednem
a 1 hod. po poledni. Každý dorazí v náhodném okamžiku, rovnoměrně zvoleném v tomto
rozmezí, ale počká jen 15 minut. Pokud ten druhý nedorazí, odejde. Jaká je pravděpodobnost,
že se setkají?
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 7
1 ZÁKLADNÍ POJMY PRAVDĚPODOBNOSTI BI-PST, ZS 2022/23, Přednáška 1-12
Romeo
B
1/4
0 1/4 Julie 1
1 − (3/4) · (3/4) 7
P(B) = = .
1 16
8
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 1.2 Experiment, pravděpodobnostní prostor
E = (Ω, F, P),
kde Ω zahrnuje všechny výsledky experimentu a F je kolekce všech jevů, kterým umíme (nebo
smíme) přiřadit či spočítat pravděpodobnost P.
Definice 1.4. Množinu všech možných výsledků daného experimentu značíme Ω a nazýváme
ji prostor elementárních jevů nebo také výběrový prostor (sample space).
Libovolný možný výsledek ω ∈ Ω nazýváme elementární jev (outcome).
Elementární jevy v Ω, tedy výsledky experimentu, musí být vzájemně exkluzivní a v sou-
hrnu vyčerpávající.
• Hod dvěma mincemi: Ω = {H, O} × {H, O} ≡ {(H, H), (H, O), (O, H), (O, O)}
• Náhodný text emailu v kódování UTF-32 (constant length) o maximální velikosti 1MB.
Maximální počet znaků ve zprávě je
1 MB 220 bytes
= = 218 = 262144.
32 bits 4 bytes
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 9
1 ZÁKLADNÍ POJMY PRAVDĚPODOBNOSTI BI-PST, ZS 2022/23, Přednáška 1-12
6 1
1,5
5 2
druhý hod
4 3
4
3
2 5 5,4
1 6
1 2 3 4 5 6 6,6
první hod
10
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 1.2 Experiment, pravděpodobnostní prostor
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 11
1 ZÁKLADNÍ POJMY PRAVDĚPODOBNOSTI BI-PST, ZS 2022/23, Přednáška 1-12
iii) σ−aditivita: když jsou A1 , A2 , . . . ∈ F vzájemně disjunktní jevy (Ai ∩ Aj = ∅ pro ∀i, j :
i 6= j), tak
∞ ∞
!
[ X
P Ai = P(Ai ).
i=1 i=1
Bertrandův paradox
Příklad 1.12 (– Bertrandův paradox (Joseph Bertrand, 1889)). Náhodná tětiva na jednot-
kové kružnici.
Jaká je pravděpodobnost, že náhodně umístěná tětiva χ v jed-
notkové kružnici bude delší, než strana ` (libovolného) vepsaného
rovnostranného trojúhelníku?
Tedy P(A), kde A = {|χ| > `}.
To záleží na tom, co přesně míníme slovem „náhodná“:
Možnost 1 : Vybereme rovnoměrně náhodně střed χ:
Bertrandův paradox
12
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 1.3 Vlastnosti pravděpodobnosti
µ(A) velikost A
P(A) = = .
µ(Ω) velikost Ω
i) P(∅) = 0
Důsledky:
• P(A) ≤ 1 – z v)
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 13
1 ZÁKLADNÍ POJMY PRAVDĚPODOBNOSTI BI-PST, ZS 2022/23, Přednáška 1-12
Heuristika:
P(Ac ) = 1 − P(A)
⌦
A B
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
⌦
A B
Průnik jsme přičetli dvakrát. Musíme jej tedy odečíst.
14
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 1.3 Vlastnosti pravděpodobnosti
Důkaz. (pokračování)
iv) Množinu A ∪ B můžeme napsat jako disjunktní sjednocení A ∪ (B \ A).
Z bodu ii) plyne P(A ∪ B) = P(A) + P(B \ A).
Protože, P(B) = P(B \ A) + P(A ∩ B),
dostáváme finálně:
B
A
P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
v) Pokud A ⊂ B, tak A ∩ B = A.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 15
1 ZÁKLADNÍ POJMY PRAVDĚPODOBNOSTI BI-PST, ZS 2022/23, Přednáška 1-12
ii) Dokážeme tvrzení pro tři jevy A, B, C: Množinu A ∪ B ∪ C můžeme napsat jako dis-
junktní sjednocení A ∪ ((B ∪ C) \ A).
Z bodu ii) předchozí věty plyne P(A ∪ B ∪ C) = P(A) + P((B ∪ C) \ A).
Protože P(B ∪ C) = P((B ∪ C) \ A) + P(A ∩ (B ∪ C)), dostáváme:
P(A ∪ B ∪ C) = P(A) + P(B ∪ C) − P((A ∩ B) ∪ (A ∩ C)).
a znovu aplikujeme bod ii) předchozí věty na:
P(B ∪ C) a P((A ∩ B) ∪ (A ∩ C))
P(B ∪ C) = P(B) + P(C) − P(B ∩ C)
P((A ∩ B) ∪ (A ∩ C)) = P(A ∩ B) + P(A ∩ C) − P(A ∩ B ∩ A ∩ C)
C
B
A
finálně dostáváme:
P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C)
Důkaz. Dokážeme první část tvrzení: A můžeme zapsat jako disjunktní sjednocení A =
∞
[
(An \ An−1 ). Proto platí:
n=1
∞ ∞ N
!
[ X X
P(A) = P (An \ An−1 ) = P(An \ An−1 ) = lim P(An \ An−1 )
N →∞
n=1 n=1 n=1
= lim P(AN )
N →∞
16
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 1.3 Vlastnosti pravděpodobnosti
• Dva hráči, A a B, hrají opakovaně spravedlivou hru (kde oba mají stejnou šanci na
výhru), dokud jeden hráč nedosáhne 6 vítězství.
– A vyhrál 5x,
– B vyhrál 3x.
Tedy sázku by si měli rozdělit v poměru sedm dílů pro A a jeden díl pro B.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 17
2 PODMÍNĚNÁ PRAVDĚP. A NEZÁVISLOST BI-PST, ZS 2022/23, Přednáška 1-12
Jak se změní pravděpodobnost ve chvíli, kdy máme částečnou informaci o výsledku experi-
mentu?
Příklad 2.1. Když hodíme vyváženou kostkou, bez další informace víme, že P(6) = 1/6.
Pokud navíc víme, že padlo sudé číslo, je jasné, že P(6|sudé) = 1/3.
Definice 2.2. Buďte A a B náhodné jevy, kde P(B) > 0. Podmíněnou pravděpodobnost jevu
A za podmínky, že nastal jev B, definujeme jako
P(A ∩ B)
P(A|B) = .
P(B)
P(A) = velikost(A)/velikost(Ω).
Pokud víme, že určitě nastal jev B, zajímáme se pouze o výsledky, které patří do B. U
jevu A proto nyní také uvažujeme pouze výsledky v B, takže se jedná o A ∩ B.
Pravděpodobnosti pak chápeme jako relativní velikost průniku vzhledem k velikosti B.
Dostáváme
18
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 2.1 Podmíněná pravděpodobnost
⌦
A B plocha(část A uvnitř B)
P(A dáno B) =
plocha(B)
plocha(A ∩ B) / plocha(Ω)
P(A|B) =
plocha(B) / plocha(Ω)
Příklad 2.4 (– dva hody kostkou). Uvažujme dva hody vyváženou kostkou. Jaká je P(součet >
6 | první = 3)?
Odpověď je jistě 1/2: hodnota při druhém hodu musí být 4, 5 nebo 6.
Formálně: Ω = {1, 2, 3, 4, 5, 6}2 ,
P(A) = |A|/36 pro každou A ⊂ Ω.
Nechť B = {(3, ω2 ) : 1 ≤ ω2 ≤ 6}, A = {(ω1 , ω2 ) : ω1 + ω2 > 6}.
Pak
|A∩B|
P(A ∩ B) 36 |A ∩ B| 3
P(A|B) = = |B| = = .
P(B) |B| 6
36
Příklad 2.5 (– rodina se dvěma dětmi). Trochu těžší příklad: Předpokládejme, že děti se rodí
rovnoměrně a nezávisle. V rodině jsou dvě děti. Jaká je P(oba chlapci|alespoň jeden je chlapec)?
Ω = {DD, DH, HD, HH}.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 19
2 PODMÍNĚNÁ PRAVDĚP. A NEZÁVISLOST BI-PST, ZS 2022/23, Přednáška 1-12
Lemma 2.6. Nechť pro jev B platí P(B) > 0. Podmíněná pravděpodobnost P(·|B) je také
pravděpodobnostní mírou, tj. P(·|B) ∈ [0, 1] a splňuje axiomy pravděpodobnosti.
i) P(·|B) : F → R,
• jestliže A1 a A2 jsou vzájemně disjunktní, pak P(A1 ∪ A2 |B) = P(A1 |B) + P(A2 |B)
• atd.
Poznámky:
B1 B2 B3
A
A ∩ B2
A ∩ B1 A ∩ B3
20
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 2.1 Podmíněná pravděpodobnost
Připomenutí:
P(A ∩ Bi )
P(A|Bi ) =
P(Bi )
A = A ∩ Ω = A ∩ (B1 ∪ B2 ∪ B3 )
A = (A ∩ B1 ) ∪ (A ∩ B2 ) ∪ (A ∩ B3 )
Příklad 2.7 (– poruchovost diod). Ve výprodeji jsme výhodně koupili krabici diod, namí-
chaných ze dvou značek. Podstatná část diod je vadná. Víme, že
Určete pravděpodobnost, že náhodně vybraná dioda bude vadná. Údaje o chybovosti představují
podmíněné pravděpodobnosti:
B1 B2 B3
A
A ∩ B2
A ∩ B1 A ∩ B3
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 21
2 PODMÍNĚNÁ PRAVDĚP. A NEZÁVISLOST BI-PST, ZS 2022/23, Přednáška 1-12
Připomenutí:
P(A ∩ Bj ) = P(A|Bj ) P(Bj )
P(A) = P(A|B1 ) P(B1 ) + P(A|B2 ) P(B2 ) + P(A|B3 ) P(B3 )
P(A ∩ Bj )
P(Bj |A) =
P(A)
P(A|Bj ) P(Bj )
P(Bj |A) =
P(A|B1 ) P(B1 ) + P(A|B2 ) P(B2 ) + P(A|B3 ) P(B3 )
Příklad 2.8 (– poruchovost diod, pokračování). Z krabice jsme vybrali diodu a zjistili jsme,
že je vadná.
Jaká je pravděpodobnost, že byla z dovozu? Hledáme opačně podmíněnou pravděpodob-
nost, než máme na vstupu. Z definice podmíněné pravděpodobnosti:
P(dovoz ∩ vadná)
P(dovoz|vadná) = .
P(vadná)
Jmenovatel jsme už našli dříve, čitatel rozepíšeme pomocí opačně podmíněných pravdě-
podobností:
P(vadná|dovoz) P(dovoz)
P(dovoz|vadná) =
P(vadná|cz) P(cz) + P(vadná|dovoz) P(dovoz)
0.2 · 0.6 0.12 12
= = = = 75%.
0.1 · 0.4 + 0.2 · 0.6 0.16 16
P(A|Bj ) P(Bj )
P(Bj |A) = Pn .
i=1 P(A|Bi ) P(Bi )
22
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 2.1 Podmíněná pravděpodobnost
P(K|S) P(S)
P(S|K) = =
P(K|S) P(S) + P(K|S c ) P(S c )
0.7 · 0.3 21
= = = 0.75.
0.7 · 0.3 + 0.1 · 0.7 28
P(A1 ∩ · · · ∩ An ) =
P(A1 ) P(A2 |A1 ) P(A3 |A1 ∩ A2 ) . . . P(An |A1 ∩ · · · ∩ An−1 ).
Důkaz. Postupně aplikujeme vztah P(A ∩ B) = P(A) P(B|A) plynoucí z definice podmíněné
pravděpodobnosti.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 23
2 PODMÍNĚNÁ PRAVDĚP. A NEZÁVISLOST BI-PST, ZS 2022/23, Přednáška 1-12
P(S ∩ K) 0.21
P(S|K) = = = 0.75.
P(K) 0.21 + 0.07
Příklad 2.13 (– multiplikativní zákon). Taháme z balíčku 52 karet bez vracení. Jaká je
pravděpodobnost, že ze tří po sobě tažených karet není žádná srdcová?
Ai = {i-tá karta není srdcová}, i = 1, 2, 3.
39 38 37 .
P(A1 ∩ A2 ∩ A3 ) = P(A1 ) P(A2 |A1 ) P(A3 |A1 ∩ A2 ) = · · = 41.4%
52 51 50
Ilustrace výpočtu pomocí stromu podmíněných pravděpodobností:
• P (A1 ∩ A2 ∩ A3 ) 39 38 37
• 52 · 51 · 50
P (A3 |A1 ∩ A2 )
37/50
A3
• •
• • P (A1 ∩ A2 ∩ Ac3 ) 39 38 13
• • 52 · 51 · 50
• • • •
P (Ac1 ) 13/52
• •
Monty Hall
Moderátor ukáže soutěžícímu troje zavřené dveře: za jedněmi z nich je nové luxusní auto,
za zbývajícími dvěma starý kozel. Soutěžící si má vybrat které otevřít. Vybere si, třeba, dveře
#1.
Moderátor však otevře jiné, řekněme #2, a ukáže, že za nimi je kozel. A zeptá se soutě-
žícího: „Chcete změnit svou volbu a vybrat si místo dveří #1 dveře #3?“
Co byste odpověděli vy?
24
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
1 1
BI-PST, ZS 2022/23, Přednáška 1-12 2.1 Podmíněná pravděpodobnost
P(opilý|nehoda) = 0.1.
Snažíme se zjistit opačně podmíněnou pravděpodobnost P(nehoda|opilý). Jiná studie zjistila,
že méně než 1% osob řídí pod vlivem alkoholu. Pravděpodobnost nehody je složité určit, ale
jsme schopni spočítat, o kolik je větší pravděpodobnost zavinění nehody opilým řidičem oproti
střízlivému:
P(nehoda|opilý) P(nehoda ∩ opilý)/ P(opilý)
=
P(nehoda|střízlivý) P(nehoda ∩ střízlivý)/ P(střízlivý)
P(opilý|nehoda) · P(nehoda)/ P(opilý) 0.1/0.01
= = = 11.
P(střízlivý|nehoda) · P(nehoda)/ P(střízlivý) 0.9/0.99
Tedy u řidičů pod vlivem alkoholu je alespoň 11x vyšší pravděpodobnost, že způsobí smrtelnou
dopravní nehodu.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 25
2 PODMÍNĚNÁ PRAVDĚP. A NEZÁVISLOST BI-PST, ZS 2022/23, Přednáška 1-12
Příklad 2.16 (– hod kostkou). Uvažujme jev A: padne sudé číslo a jev B: padne číslo
menší něž 3.
Jsou jevy A a B nezávislé?
1 3 2 1
P(A ∩ B) = a P(A) P(B) = · = .
6 6 6 6
Tudíž jevy A a B jsou nezávislé.
Příklad 2.17 (– hod kostkou). Uvažujme jev A: padne sudé číslo a jev B: padne šestka.
Jsou jevy A a B nezávislé?
1 3 1 1
P(A ∩ B) = a P(A) P(B) = · = .
6 6 6 12
Tudíž jevy A a B nejsou nezávislé.
Věta 2.19. Je-li (Ai )i∈I soubor nezávislých jevů, pak pro libovolnou konečnou podmnožinu
∅=
6 J ⊂ I, je
P(∩i∈J Ai | ∩i∈I\J Ai ) = P(∩i∈J Ai ).
26
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 2.2 Nezávislost náhodných jevů
Ve skutečnosti ale neslučitelné jevy A a B mohou být nezávislé, jen pokud P(A) = 0 nebo
P(B) = 0.
Podmíněná nezávislost
Definice 2.20. Nechť (Ω, F, P) je pravděpodobnostní prostor a C je náhodný jev s P(C) > 0.
Náhodné jevy A a B se nazývají podmíněně nezávislé za podmínky C, pokud
Připomenutí:
Příklad 2.21 (– hod sedmistěnnou kostkou). Hodíme sedmistěnnou kostkou, kde jsou všechny
strany stejně pravděpodobné. Uvažujme: Jev A: padne sudé číslo. Jev B: padne číslo menší
něž 3. Jsou jevy A a B nezávislé?
A = {2, 4, 6}, B = {1, 2}, A ∩ B = {2}
1 3 2 6
P(A ∩ B) = a P(A) · P(B) = · = .
7 7 7 49
Tudíž jevy A a B nejsou nezávislé.
Příklad 2.22 (– hod sedmistěnnou kostkou + podmínka). Uvažujme navíc jev C: padne
nejvýš šestka. Jsou jevy A a B podmíněně nezávislé při daném C?
P(A ∩ B ∩ C) P({2}) 1/7 1
P(A ∩ B|C) = = = =
P(C) P({1, ...6}) 6/7 6
3/7 2/7 1
P(A|C) · P(B|C) = · = .
6/7 6/7 6
Tudíž jevy A a B jsou podmíněně nezávislé při daném C.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 27
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
3 Náhodné veličiny
3.1 Definice náhodné veličiny, distribuční funkce
Abychom mohli náhodné experimenty matematicky zpracovávat, je vhodné každému výsledku
ω ∈ Ω přiřadit číslo. Vhodným přiřazením vybereme tu část informace, která je z našeho
pohledu zajímavá.
Takové přiřazení lze provést mnoha způsoby. Budeme jej nazývat náhodnou veličinou
a značit X, Y apod.
ω1 X
Prostor elemen- ω2
tárních jevů Ω ω4
ω3 R
Příklady 3.2.
• Počítání (indikátor) hlav při hodech mincí: X(hlava) = 1, X(orel) = 0.
• Moje výhra při hře s mincí: X(hlava) = 1, X(orel) = −1.
• Pro hráče na pokerovém turnaji je zajímavé kolik vyhrál v dané hře.
• Můžeme sledovat maximální hodnotu, která padla v n hodech kostkou.
• Můžeme měřit výšku náhodně vybraného člověka.
Příklad 3.3 (– minimum ze dvou hodů čtyřstranné kostky). Dva hody čtyřstrannou kostkou
(pravidelný čtyřstěn). Ω = {1, 2, 3, 4}2 , ω = (ω1 , ω2 ).
Uvažujeme náhodnou veličinu X(ω) = min{ω1 , ω2 }.
4 • • • •
3 • • • •
• • • •
2 • • • • 1 2 3 4 R
1 • • • •
1 2 3 4
28
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.1 Definice náhodné veličiny, distribuční funkce
Poznámky:
• Některé mohou nabývat jen izolovaných hodnot (např. 0 nebo 1 pro hlavu a orla při
hodu mincí, hodnoty 1,...,6 při hodu kostkou).
• Některé mohou nabývat hodnot na spojité škále (např. váha novorozence, doba čekání
na autobus,...).
Takto dělíme náhodné veličiny na diskrétní a spojité. U diskrétních náhodných veličin nás
zajímají pravděpodobnosti jednotlivých hodnot, u spojitých se zajímáme o pravděpodobnosti
podintervalů. Nehledě na typ, distribuční funkce nám dá úplný popis chování náhodné veličiny.
Pro jakékoliv číslo x umíme zjistit, s jakou pravděpodobností bude náhodná veličina X menší
nebo rovna tomuto číslu. To nám umožňuje zodpovědět libovolné otázky o rovnostech či
nerovnostech.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 29
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
0
-4 0 1 4
ii) Pro jednoduchost uvedeme pouze náznak důkazu pomocí posloupnosti jevů Bn = {X ≤
−n}. Ta je pro n → ∞ klesající ve smyslu inkluze s průnikem rovným ∅, t.j. Bn & ∅.
Takže dle věty o spojitosti pravděpodobnosti dostáváme P(Bn ) → P(∅) = 0. Pro důkaz
druhého tvrzení stačí vzít posloupnost An = {X ≤ n} % Ω a dle stejné věty získat
P(An ) → P(Ω) = 1.
Poznámky:
• F je spojitá zprava, protože v její definici jsme povolili rovnost: F (x) = P(X ≤ x).
• Některé knihy používají P(X < x) a jejich distribuční funkce je pak spojitá zleva.
Důkaz. i) Pro každé x lze sestavit disjunktní rozklad Ω = {X > x} ∪ {X ≤ x}, čili
{X > x} = {X ≤ x}C .
30
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.2 Diskrétní náhodné veličiny
iii) Viz literatura. Idea důkazu pomocí neklesající posloupnosti a věty o spojitosti pravdě-
podobnosti:
FX (x) FX (x)
0 0
x x
Smı́šená náhodná veličina
1
FX (x)
0
x
P(X = xk ), k = 1, 2, ....
• Pravděpodobnost P(X = x) lze chápat jako funkci x, kterou pak nazýváme pravděpo-
dobnostní funkcí nebo diskrétní hustotou náhodné veličiny X.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 31
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
H • • 1 •
3/4 •
O • •
O H 1/4 •
0 1 2 x
1 1 •
3/4 •
1/2 •
1/4 • • 1/4 •
0 1 2 x 0 1 2 x
Pro řady s nezápornými členy nezáleží na pořadí sčítanců. Proto výše uvedené řady mů-
žeme sčítat přes všechny možné hodnoty veličiny X bez předepsaného pořadí. Všimněte si
navíc, že P(X = x) > 0 platí pouze pro konečně či spočetně mnoho x.
Rozdělení X je ekvivalentně určeno pomocí FX či P(X = xk ), k = 1, 2, ...:
Předpokládejme rostoucí řazení hodnot x1 < x2 < x3 < . . . veličiny X. Potom
P(X = xk ) = FX (xk ) − FX (xk−1 ).
Výpočet pravděpodobností P(X = xk ):
Shromáždíme všechny ω pro které X(ω) = x a sečteme jejich pravděpodobnosti.
Výpočet distribuční funkce FX (x) = P(X ≤ x):
Shromáždíme všechny ω pro které X(ω) ≤ x a sečteme jejich pravděpodobnosti.
32
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.2 Diskrétní náhodné veličiny
• Terč může být rozdělen na různé části. Obvykle soustředná mezikruží, označená
např. T1 , T2 , T3 , T4 , T5 .
• Pak můžeme uvažovat diskrétní náhodnou veličinu X, která určuje počet bodů za pří-
slušnou trefu.
4 • • • •
3 • • • •
• • • •
2 • • • • 1 2 3 4 R
1 • • • •
1 2 3 4
Pravděpodobosti hodnot: pX
7/16
4 • • • •
5/16
3 • • • •
3/16
2 • • • •
1/16
1 • • • •
1 2 3 4 1 2 3 4 x
FX
Distribuční funkce: 1
15
16
12
4 • • • • 16
3 • • • • 7
16
2 • • • •
1 • • • •
1 2 3 4 1 2 3 4 x
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 33
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
34
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.3 Spojité náhodné veličiny, hustota
+∞
Z
i) fX (x)dx = 1 ( normalizační podmínka),
−∞
dFX
iii) fX (x) = (x) v bodech, kde FX má derivaci,
dx
Zb
iv) P(a < X ≤ b) = fX (x) dx = FX (b) − FX (a),
a
Z
v) P(X ∈ B) = fX (x)dx pro všechny B v Borelovské σ-algebře na R, (tzn. množiny
B
{X ∈ B} jsou měřitelné), tj. pro všechny „ běžné “ množiny.
Důsledky:
+∞
Z
Důkaz. i) fX (x)dx = lim FX (x) = 1.
x→+∞
−∞
Zb Za Zb
iv) P(a < X ≤ b) = F (b) − F (a) = fX (x)dx − fX (x)dx = fX (x)dx.
−∞ −∞ a
iii) (První) základní věta integrálního počtu (first fundamental theorem of calculus).
iv) (Druhá) základní věta integrálního počtu, Newtonův vzorec, Newton-Leibnizův vzorec
(second fundamental theorem of calculus).
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 35
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
a b
Zb
P(a < X ≤ b) = fX (t) dt = F (b) − F (a)
a
Všimněme si, že u spojitých náhodných veličin nezáleží, jestli jsou nerovnosti ostré, nebo
neostré:
P(a < X ≤ b) = P(a ≤ X ≤ b) = P(a ≤ X < b) = P(a < X < b).
Čemu se musí rovnat konstanta c, aby se skutečně jednalo o hustotu? Z normalizační pod-
mínky víme, že plocha pod grafem hustoty musí být jednotková, resp. hustota se musí nain-
tegrovat na jedničku:
Z∞ Z1
fX (x)dx = c · dx = [c · x]10 = c = 1,
−∞ 0
tedy konstanta c musí být rovna jedné.
Příklad 3.16 (– rozdělení příchodu na sraz, pokračování). Hustota rovnoměrného rozdělení
na intervalu [0, 1]:
1.2
1.0
0.8
0.6
0.4
0.2
0.0
36
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.3 Spojité náhodné veličiny, hustota
Z3/4
3/4
1dx = [x]1/4 = 3/4 − 1/4 = 1/2.
1/4
1.2
1.0
0.8
0.6
0.4
0.2
0.0
Příklad 3.17 (– rozdělení příchodu na sraz, pokračování). Co když se příchody Julie na sraz
řídí rozdělením s hustotou
4y
pro y ∈ [0, 1/2]
fY (y) = 4 − 4y pro y ∈ [1/2, 1]
0 jinak.
2.0
1.5
1.0
0.5
0.0
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 37
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
2.0
1.5
1.0
0.5
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Příklad 3.18 (– lineární transformace). Je-li X náhodně změřená teplota ve stupních Celsia
(◦ C), pak
Y = 1.8 X + 32
je odpovídající náhodná teplota ve stupních Fahrenheita (◦ F).
Formálně (detailně) píšeme Y (ω) = 1.8 X(ω) + 32, kde ω ∈ Ω je výsledek experimentu.
• Může se stát, že Y = g(X) vůbec není náhodná veličina. Proto je třeba předpokládat
měřitelnost g.
• Navíc rozdělení náhodné veličiny Y = g(X) může být diskrétní, spojité či smíšené.
38
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.4 Funkce náhodné veličiny
Příklad 3.20. Uvažujme náhodnou veličinu X s rozdělením v tabulce níže. Najděte rozdělení Y =
X 2.
x -3 -1 0 1 3
P(X = x) 0.2 0.2 0.45 0.05 0.1
{Y ≤ y} = {g(X) ≤ y} ∈ F.
Poznámka 3.22. Obecně pro distribuční funkci FY (y) veličiny Y = g(X) platí
FY (y) = P(Y ≤ y) = P(g(X) ≤ y) = P {ω ∈ Ω : g(X(ω)) ≤ y} .
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 39
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
Definice 3.23. Nechť X je náhodná veličina s distribuční funkcí FX . Nechť α ∈ (0, 1).
Hodnota qα se nazývá α-kvantil náhodné veličiny X právě tehdy, když
Kvantil uvažovaný jako funkce α se nazývá kvantilová funkce a značí se FX−1 (α).
FX (qα ) = P(X ≤ qα ) = α,
FZ
X (x)
40
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.5 Kvantilová funkce a simulace
• Mersenne Twister
• Wichmann-Hill
• mnoho dalších.
0.10
0.05
0.00
1 2 3 4 5 6
hodnota
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 41
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
U náhodné veličiny nás zajímají střed, šířka a další podobné charakteristiky jejího rozdělení.
Jednou ze základních charakteristik náhodné veličiny je její střední hodnota.
Definice 3.25. Střední hodnota (expectation) diskrétní náhodné veličiny X, nabývající hod-
not x1 , x2 , ..., je definována vztahem
X
EX = xk P(X = xk ).
k
Z∞
EX = xf (x) dx.
−∞
Nutnou podmínkou je, že uvedená suma resp. integrál absolutně konverguje. Jinak říkáme,
že střední hodnota náhodné veličiny X neexistuje (nebo je ±∞).
Poznámka k sumačnímu zápisu v definici střední hodnoty diskrétní náhodné veličiny. Díky
absolutní konvergenci nezáleží na pořadí sčítanců v obou řadách. (Obecně u nekonečné řady
na pořadí sčítanců záleží!) V první řadě proto sčítáme přes všechny možné hodnoty xk veličiny
X bez předepsaného pořadí. Je to často názornější než sčítat přes všechny indexy
X k hodnot xk
seřazených do nějaké určité sekvence. Podobně v zápisu druhé řady místo xk P(X = xk )
X k
píšeme x P(X = x). Víme totiž, že P(X = x)) > 0 platí pro konečně či spočetně
x:P(X=x)>0
mnoho x a že na pořadí sčítanců opět nezáleží.
• Analogie: Nahradíme sumu x P(X = x) integrálem xf (x) přes všechny možné hodnoty
x.
42
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin
P(X = x)
1 f(x) ... hustota
2
1
4
1
8
0 1
↑ 3E X je rovnovážný
7
bod EX je rovnovážný bod
Příklad 3.26 (– hod dvěma mincemi). Hodíme dvěma férovými mincemi. Nechť X značí
počet padlých hlav. Najděme střední hodnotu X. Máme čtyři stejně pravděpodobné výsledky,
Ω = {OO, HO, OH, HH}. Hlav tedy může padnout 0, 1 nebo 2, a to s pravděpodobnostmi
1/4, 1/2 a 1/4.
0.6
P(X=1)=1/2
0.4
P(X=0)=1/4 P(X=2)=1/4
0.2
0.0
Příklad 3.27 (– házení šestistěnnou kostkou). Uvažujme hod jednou vyváženou šestistěnnou
kostkou. Nechť X značí počet hozených bodů. Jaká je střední hodnota X?
k 1 2 3 4 5 6
P(X = k) 1/6 1/6 1/6 1/6 1/6 1/6
6
X 1 1 1 1 1 1 21
EX = k · P(X = k) = 1 · +2· +3· +4· +5· +6· = = 3.5.
k=1
6 6 6 6 6 6 6
0.25
0.20
0.15
0.10
0.05
0.00
0 1 2 3 4 5 6 7
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 43
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
0 1 2 3 4 5 6 7
Z∞
ii) Má-li X spojité rozdělení, pak E Y = E g(X) = g(x) fX (x)dx.
−∞
Suma resp. integrál musí absolutně konvergovat, jinak E Y neexistuje (nebo je ±∞).
Analogie: Nahradíme sumu g(x) P(X = x) integrálem g(x)f (x) přes všechna možná x.
44
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin
ii) Obecný důkaz pro spojitou veličinu X je složitější. Nejprve si ukážeme důkaz pro nezá-
pornou funkci g. Obecnou funkci g pak přepíšeme jako rozdíl dvou nezáporných funkcí
g = g + − g − (kladná a záporná část).
Lemma 3.30. Pro nezápornou náhodnou veličinu X (diskrétní, spojitou či smíšenou) platí
Z∞ Z∞
EX = [1 − FX (x)] dx = P(X > x) dx.
0 0
Důkaz věty – pokračování. ii) Nechť X je spojitá náhodná veličina a g je nezáporná funkce
taková, že Y = g(X) je náhodná veličina (diskrétní, spojitá či smíšená). Protože Y je
nezáporná, dle lemmatu můžeme psát
Z∞ Z∞
E(g(X)) = E Y = P(Y > y) dy = P(g(X) > y) dy
0 0
Z∞ Z ZZ
viz (∗) = fX (x) dx dy = fX (x) d(x, y)
0 {x: g(x)>y} {(x,y): 0<y<g(x)}
Z g(x)
Z
= fX (x) dy dx (g(x) je nezáporná)
{x: 0<g(x)} 0
Z∞ g(x)
Z Z∞
= fX (x) dy dx = g(x)fX (x) dx.
−∞ 0 −∞
Z
(∗) Použili jsme P(X ∈ A) = fX (x) dx pro A = {x : g(x) > y}.
A
Obecnou funkci g rozložíme na její kladnou a zápornou část, které jsou obě nezáporné.
Pak píšeme E g(X) = E Y = E Y + − E Y − = E g + (X) − E g − (X) a použijeme uvedený
důkaz.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 45
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
Poznámky:
• Později si ukážeme, že střední hodnota se chová jako lineární operátor (či spíše funkci-
onál) na prostoru náhodných veličin. Prozatím ještě neznáme náhodné veličiny vzniklé
transformací souboru náhodných veličin, tedy neumíme nakládat s veličinou Z = aX +
bY
Pro diskrétní, spojité či smíšené náhodné veličiny X a Y s konečnými středními hodno-
tami platí i
E(aX + bY ) = a E X + b E Y, ∀a, b ∈ R.
3.6.2 Rozptyl
Rozptyl se také označuje jako σ 2 a měří šíři rozdělení: je to průměrná čtvercová vzdálenost
od středu. Směrodatná odchylka, též označovaná jako σ, má stejné jednotky jako X.
Následující vlastnosti rozptylu jsou užitečné pro praktické výpočty.
46
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin
Vlastnosti rozptylu
var(aX + b) = a2 var X.
var(X) = E((X − E X)2 ) = E X 2 − 2X(E X) + (E X)2
= E(X 2 ) − E(2X(E X)) + E((E X)2 )
= E(X 2 ) − 2(E X)(E X) + (E X)2
= E(X 2 ) − (E X)2 .
Dostáváme tak vztah, který používá pouze µ1 = E X a µ2 = E(X 2 ), jež často buď známe,
nebo jež můžeme snadněji spočítat:
zjednodušeně pak:
var X = E(X − E X)2 = E X 2 − (E X)2 .
Všimněme si, že var(X) je vždy nezáporný (je to střední hodnota nezáporné náhodné
veličiny (X − E X)2 ). Proto:
(E X)2 ≤ E(X 2 ).
Protože věta o základních vlastnostech střední hodnoty platí ve stejné podobě pro dis-
krétní i spojité náhodné veličiny, můžeme tyto úvahy provádět bez specifikování typu náhodné
veličiny.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 47
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
Příklad 3.34 (– střední hodnota a rozptyl rovnoměrného rozdělení). Označme dobu, kdy
přijde Romeo na místo srazu, jako náhodnou veličinu X. Předpokládejme, že je X rovnoměrně
rozdělená na intervalu [0, 1], tedy s hustotou:
(
1 pro x ∈ [0, 1]
fX (x) =
0 jinak.
1.2
1.0
0.8
0.6
0.4
0.2
0.0
Příklad 3.35 (– střední hodnota a rozptyl rovnoměrného rozdělení). Jaká je střední hodnota
a rozptyl doby Romeova příchodu? Střední hodnotu spočítáme z definice:
Z∞ Z1 1
1 12 02 1
EX = xfX (x)dx = x1dx = x2 = − = .
2 0 2 2 2
−∞ 0
Z∞ Z1 1
1 3 13 03 1
2 2
EX = x fX (x)dx = x2 1dx = x = − = .
3 0 3 3 3
−∞ 0
48
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin
2.0
1.5
1.0
0.5
0.0
0.0 0.2 0.4 0.6 0.8 1.0
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 49
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
• Momenty dané náhodné veličiny X nemusí existovat nebo můžou být nekonečné (pokud
příslušná suma nebo integrál nekonverguje).
Poznámka 3.39. Rozptyl je kvadratickou mírou disperze, tedy má stejné jednotky jako druhá
mocnina X. Směrodatná odchylka jakožto odmocnina z rozptylu má pak stejné jednotky jako
X. Toto pozorování bude užitečné později.
Šikmost
Charakteristikou sešikmení (skewness) je koeficient šikmosti:
Míra asymetrie: koeficient γ1 je kladný nebo záporný podle toho, na kterou stranu se hustota
pravděpodobnosti víc odchyluje od střední hodnoty:
γ1 = 1.26 γ1 = −1.14
50
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin
Špičatost
Koeficient špičatosti (excess kurtosis):
σ4 E(X − E X)4
γ2 = 4
−3= − 3.
σ (var X)2
Špičatost porovnává tvar hustoty náhodné veličiny s normálním (Gaussovým) rozdělením,
které má γ2 = 0: γ = 0.5 . . . špičatejší
2
• E X 2 = M 00 (0)
λk e−λ
P(X = k) = , k = 0, 1, . . .
k!
∞
λk e−λ s
= eλ(e −1) .
X
M (s) = E(esX ) = esk
k=0
k!
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 51
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
Dostáváme:
d λ(es −1) s s=0
e = λ es eλ(e −1) =⇒ E(X) = λ,
ds
d2 λ(es −1) s s=0
= (λes )2 + λes eλ(e −1) =⇒ E(X 2 ) = λ + λ2
2
e
ds
a tedy var(X) = λ.
Z∞ " #∞
sx −λx e(s−λ)x λ
M (s) = λ e e dx = λ = .
s−λ 0
λ−s
0
Všimněte si, že M (s) je definována jen pro s ∈ [0, λ). Pro s ≥ λ integrál diverguje. Odsud
d λ λ s=0 1
= =⇒ E(X) = ,
ds λ − s (λ − s)2 λ
d2 λ 2λ s=0 2 1
= =⇒ E(X 2 ) = a tedy var(X) = 2 .
ds2 λ − s (λ − s)3 λ2 λ
3.6.5 Kvantily
Mezi důležité charakteristiky rozdělení náhodných veličin patří kvantily a kritické hodnoty.
Kvantil je zobecněnou inverzí distribuční funkce.
Definice 3.44. Nechť X je náhodná veličina s distribuční funkcí FX a α ∈ (0, 1). Bod qα
nazýváme α-kvantilem veličiny X, právě když platí
Kvantil qα , uvažovaný jako funkce α, nazýváme kvantilovou funkcí a značíme FX−1 (α). (1−α)-
kvantil nazýváme α-kritickou hodnotou: cα = q1−α .
• Pro spojitou ostře rostoucí FX je kvantilová funkce FX−1 (α) klasickou inverzí distribuční
funkce FX .
52
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin
q0.5 x
fX
P(X ≤ q0.75 ) = 0.75 P(X ≥ z0.25 ) = 0.25
q0.75 = z0.25 x
Distribuční funkce je zde ryze rostoucí, takže můžeme snadno najít kvantilovou funkci jako
její inverzi:
FX (qα ) = α ⇒ qα = α ⇒ FX−1 (α) = α.
Hledané kvantily pak jsou:
q0.05 = 0.05 = 3 min. a q0.95 = 0.95 = 57 min.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 53
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
Podobně:
p .
FY (q0.95 ) = 0.95 ⇔ 1 − 2(q0.95 − 1)2 = 0.95 ⇔ q0.95 = 1 − 0.05/2 = 0.84 = 50.5 min.
Prostřední region, pokrývající čas, kdy daná osoba přijde s pravděpodobností 90%, je znatelně
užší pro Julii, než pro Romea. To odpovídá pozorování, že časy příchodu Julie mají nižší
rozptyl.
Důležité kvantily
Kvantily rozdělují populaci (tedy možné hodnoty náhodné veličiny) do skupin podle ur-
čených pravděpodobností. Důležité dělící body se nazývají:
• q0.5 – medián
54
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin
Tyto kvantily nám mohou dát přehled o chování zkoumané náhodné veličiny:
Střední hodnota se někdy může od mediánu výrazně lišit, zejména u jednostranných rozdělení
s těžkými chvosty.
Příklad 3.49 (– průměrný vs. mediánový příjem). Dle Informačního systému o průměr-
ném výdělku (www.ispv.cz) byl v ČR v prvním pololetí roku 2022 průměrný měsíční příjem
41 990 Kč. Nicméně 67% populace mělo příjmy nižší. Mediánový příjem činil 34 652 Kč:
0.030
0.025
0.020
0.015
0 20 40 60 80 100
Příklad 3.50 (– průměrný vs. mediánový příjem). Dle Informačního systému o průměr-
ném výdělku (www.ispv.cz) byl v ČR v prvním pololetí roku 2022 průměrný měsíční příjem
41 990 Kč. Nicméně 67% populace mělo příjmy nižší. Mediánový příjem činil 34 652 Kč:
0.030
0.025
0.020
0 20 40 60 80 100
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 55
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
Definice 3.51. Náhodná veličina X se nazývá konstantní, jestliže pro nějaké c ∈ R platí:
Tedy platí:
P(X = c) = 1, P(X = x) = 0 ∀x 6= c
Příklad 3.52.
P(X = c) = 1, P(X = x) = 0 ∀x 6= c
Střední hodnota a rozptyl:
X
E(X) = xk P(X = xk ) = c P(x = c) = c
all xk
X
var(X) = E(X − E X)2 = E(X 2 ) − (E X)2 = x2k P(X = xk ) − (c)2 =
xk
2 2
= c − (c) = 0.
56
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.7 Důležitá diskrétní rozdělení
Příklad 3.54 (– hod mincí). Experimenty s opakovaným házením mince jsou základním
nástrojem pro porozumění sekvencím náhodných veličin.
0.7
P(X = x)
0.5
0.3
0
−1 −0.5 0 0.5 1 1.5 2
x
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 57
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
Při opakovaném házení mincí nás často zajímá, kolikrát z n hodů nám padne “hlava”:
vybíráme k-tici míst, kde nastane úspěch, v posloupnosti délky n), které mají stejnou prav-
děpodobnost pk (k úspěchů) krát (1 − p)n−k (a zbytek (n − k) neúspěchů).
n
!
X n k n−k
a b = (a + b)n .
k=0
k
Proto platí
n n
!
X X n k
P(X = k) = p (1 − p)n−k = (p + (1 − p))n = 1n = 1.
k=0 k=0
k
58
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.7 Důležitá diskrétní rozdělení
0.3
0.2
P(X = x)
0.1
0
0 1 2 3 4 5 6 7 8 9 10
x
! !
n k n k n−k
P(X = k) = p (1 − p)n−k = p q , k = 0, 1, . . . , n.
k k
n n
!
X X X n
EX = xk P(X = xk ) = k P(X = k) = k pk q n−k .
all xk k=0 k=0
k
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 59
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
Proto
var(X) = E(X 2 ) − (E X)2 = np + n(n − 1)p2 − n2 p2 = n p (1 − p)
Z předchozího víme, že
n
!
X n
kpk q n−k = np(p + q)n−1 ,
k=0
k
Dosazením q = 1 − p získáme:
n
!
X n 2 k n−k
E X2 = k p q = pn + n(n + 1)p2
k=0
k
Předchozí výpočty střední hodnoty a rozptylu přímo z definice jsou dosti náročné. Později,
až zavedeme nezávislost náhodných veličin, spočteme střední hodnotu a rozptyl binomického
rozdělení snadno jako střední hodnotu a rozptyl součtu n nezávislých náhodných veličin s Ber-
noulliho rozdělením.
Příklad 3.60 (– hod kostkami). Hodíme deseti nezávislými, vyváženými šestistěnnými kost-
kami. Jaký je střední počet padlých šestek? Náhodná veličina X značící počet padlých šestek
má binomické rozdělení Binom(10, 1/6). Střední hodotu jsme spočítali jako
60
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.7 Důležitá diskrétní rozdělení
Alternativně
P(X ≥ 3) = 1 − P(X ≤ 2) = 1 − P(X = 0) − P(X = 1) − P(X = 2)
0 10 1 9 2 8
10 1 5 10 1 5 10 1 5
=1− − −
0 6 6 1 6 6 2 6 6
510 59 58 .
=1− − 10 − 45 = 0.224.
610 610 610
• Bernoulliho náhodná veličina X z předchozího příkladu s mincemi není nic jiného něž
indikátor jevu {H}. Tedy X = 1{H} = 1H .
• Binomickou náhodnou veličinou X odpovídající počtu hlav, které padly v n hodech,
můžeme vyjádřit jako součet
n
X
X= 1Hi ,
i=1
kde 1Hi je indikátor jevu Hi = “v i-tém hodu padla hlava”.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 61
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
1 − (1 − p)k
=p = 1 − (1 − p)k .
1 − (1 − p)
V neceločíselných x > 0 je její hodnota rovna hodnotě v bodě bxc (dolní celá část x):
62
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.7 Důležitá diskrétní rozdělení
0.3
0.2
P(X = x)
0.1
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x
Zaměňovat pořadí nekonečného součtu a derivování lze jen v případě, že suma stejnoměrně
konverguje, což pro tuto sumu platí pro |q| < 1.
∞
X p 1
Dosazením q = 1 − p získáme: E(X) = p k q k−1 = 2
= .
k=1
(1 − (1 − p)) p
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 63
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
Dosazením q = 1 − p získáváme:
∞ ∞
X X 2−p
E(X 2 ) = k 2 pq k−1 = p k 2 q k−1 =
k=1 k=1
p2
2
2−p 1 1−p
var(X) = E(X 2 ) − (E X)2 = − = .
p2 p p2
64
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.7 Důležitá diskrétní rozdělení
Celkově dostáváme
λk −λ
lim P(X = k) = e . . . takto definujeme Poissonovo rozdělení.
n→∞ k!
Tomuto rozdělení říkáme Poissonovo (viz níže). Pro sekvenci náhodných veličin konver-
genci, kdy
P(Xn = x) → P(X = x), n → ∞, ∀x
D
nazýváme konvergence v distribuci a značíme ji Xn → X. Tuto konvergenci budeme definovat
a používat později.
λk −λ
P(X = k) = e , k = 0, 1, . . . .
k!
Značení: X ∼ Poisson(λ)
První vztah jsme použili v předchozím odvození. Druhý poslouží pro ověření normalizační
podmínky:
∞ ∞ ∞
λk −λ λk
e = e−λ = e−λ eλ = 1.
X X X
P(X = k) =
k=0 k=0
k! k=0
k!
0.3
P(X = x) 0.2
0.1
0
0 1 2 3 4 5 6 7 8 9 10
x
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 65
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
k=1
(k − 1)!
∞
λm
= λ e−λ
X
m=0
m!
−λ λ
= λe e = λ.
Příklad 3.71 (– překlepy v textu). Autor v průměru udělá jeden překlep na tisíc znaků. Jaký
je střední počet překlepů na normostraně textu (30 řádků po 60 znacích)? Použijte Poissonovu
aproximaci. Máme n = 30·60 = 1800, p = 1/1000 a λ = n·p = 1800/1000 = 1.8. Náhodná ve-
ličina X značící počet překlepů má aproximativně Poissonovo rozdělení Poisson(1.8). Střední
hodnotu získáme jako
E X = λ = 1.8.
Jaká je pravděpodobnost, že na jedné normostraně textu autor neudělá ani jeden překlep?
λk −λ
Víme, že P(X = k) = e . Tedy
k!
(1.8)0 −1.8
P(X = 0) = e = e−1.8 = 0.165.
0!
66
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.8 Důležitá spojitá rozdělení
λk −λ
P(X = k) = e , k = 0, 1, 2, . . . , E X = var X = λ.
k!
Definice 3.72. Náhodná veličina X má rovnoměrné (uniformní) rozdělení na intervalu (a, b),
kde a < b, pokud je její hustota na tomto intervalu konstantní:
1
pro x ∈ (a, b),
fX (x) = b−a
0 jinde.
Normalizace: Ověříme snadno, plocha pod grafem hustoty musí být rovna jedné:
Z∞ Zb b
1 x b−a
fX (x) dx = dx = = = 1.
b−a b−a a b−a
−∞ a
Distribuční funkce:
Zx x
1 t x−a
FX (x) = dt = = pro x ∈ [a, b].
b−a b−a a b−a
a
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 67
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
1
b−a
a b
x
Z∞ Zb " #b
x x2 b2 − a2 a+b
EX = x fX (x) dx = dx = = = .
b−a 2(b − a) a
2(b − a) 2
−∞ a
Z∞ Zb " #b
x2 x3 a2 + ab + b2
E(X 2 ) = x2 fX (x) dx = dx = = ··· = .
b−a 3(b − a) a
3
−∞ a
a2 + ab + b2 (a + b)2 (b − a)2
var(X) = E(X 2 ) − (E X)2 = − = ··· = .
3 4 12
fX (x) =
0 jinde.
Značení: X ∼ Exp(λ).
Normalizace:
Z∞ Z∞ " #∞
−λx e−λx λ
fX (x)dx = λe dx = λ =0− = 1.
−λ 0
−λ
−∞ 0
Distribuční funkce:
Zx " #x
−λt e−λt
FX (x) = λe dt = λ = 1 − e−λx .
−λ 0
0
68
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.8 Důležitá spojitá rozdělení
2
fX fX = λe−λx
λ=2
1
1 λ=1
2
1
λ= 2
0
x
λe−λx
pro x ≥ 0,
fX (x) =
0 jinde.
Z∞ Z∞ Z∞ −λx ∞
−λx per partes ∞ e 1
−xe−λx 0 + e−λx dx = −
E(X) = x fX (x) dx = xλe dx = =
λ 0 λ
0 0 0
Z∞ Z∞ Z∞ Z∞
−λx per partes
2 −λx ∞ −λx 2 2
2
E(X ) = 2
x fX (x) dx = x λe2
= −x e + 2xe dx = xλe−λx =
0 λ λ2
0 0 0 0
2 2 12 1
var(X) = E(X ) − (E(X)) = 2 − 2 = 2
λ λ λ
Příklad 3.76 (– životnost lampy projektoru). Doba, po kterou vydrží svítit lampa projek-
1
toru, než se porouchá, se řídí exponenciálním rozdělením s parametrem λ = 100 (počítáno
v hodinách). Jaká je střední doba do poruchy lampy? Víme, že
1 1
EX = = 1 = 100 hodin.
λ 100
Z∞ " #∞
−λt e−λt 1 .
P(X > 50) = λe dt = λ = e− 100 50 = e−1/2 = 0.606.
−λ 50
50
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 69
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
1 (x−µ)2
fX (x) = √ e− 2σ 2 pro x ∈ (−∞, ∞).
2πσ 2
Značení: X ∼ N(µ, σ 2 ).
Distribuční funkce:
Nelze vyjádřit analyticky, pouze vypočítat numericky. Distribuční funkce pro standardní
normální rozdělení se značí Φ a její hodnoty jsou tabelovány.
0.5 fX (x)
0.4
x 2
0.3 √1 e− 2
2π
0.2
0.1
−4 −3 −2 −1 0 1 2 3 4
x
70
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.8 Důležitá spojitá rozdělení
�3 �2 �1 0 1 2 3
N(5,1/4)
0.8
N(0,1)
N(-1,4)
�6 �4 �2 2 4 6
1 (x−µ)2
fX (x) = √ e− 2σ 2 pro x ∈ (−∞, ∞).
2πσ 2
Z∞ (x−µ)2
1 substituce
E(X) = x√ e− 2σ 2 dx = µ
2πσ 2
−∞
var(X) = σ 2 .
Toto je opět složitý výpočet, stejně jak normalizace normálního rozdělení, který s matemati-
kou, kterou máme, neumíme provést.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 71
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
72
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.8 Důležitá spojitá rozdělení
(X-3)/2 ~ N(0,1)
X-3~N(0,4) X~N(3,4)
�6 �4 �2 2 4 6 8
Příklad 3.81 (– výlov). Hmotnost kaprů v rybníce se řídí normálním rozdělením se střední
hodnotou 2.5 kg a směrodatnou odchylkou 300 g. Jaká je pravděpodobnost, že vylovíme
většího než tříkilového kapra? Hmotnost náhodně vyloveného kapra má rozdělení N(µ, σ 2 ),
kde µ = 2.5 a σ 2 = (0.3)2 . Víme, že Z = X−µ
σ má standardní normální rozdělení N(0, 1).
Φ(x)
x
.00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7703 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 73
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12
1 a+b (b − a)2
fX (x) = , x ∈ [a, b] EX = , var X = .
b−a 2 12
1 (x−µ)2
fX (x) = √ e− 2σ 2 , x ∈ (−∞, ∞) E X = µ, var X = σ 2 .
2πσ 2
74
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12
4 Náhodné vektory
Někdy měříme na jednom výsledku experimentu několik náhodných veličin najednou. Např.
hmotnost a výšku náhodně vybraného studenta.
Tyto soubory náhodných veličin označujeme jako náhodné vektory. Jednotlivé veličiny
mohou mít různá rozdělení a hodnoty veličin na sobě mohou silně záviset. Je tedy vhodné
zkoumat jejich rozdělení společně jako tzv. sdružené rozdělení.
Definice 4.1. Máme-li dvě náhodné veličiny X a Y definované na stejném pravděpodob-
nostním prostoru (Ω, F, P), pak definujeme jejich sdruženou distribuční funkci FX,Y (x, y)
vztahem
FX,Y (x, y) = P(X ≤ x ∩ Y ≤ y).
Pro n náhodných veličin X1 , X2 , . . . , Xn definujeme sdruženou distribuční funkci
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 75
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12
Sdružené pravděpodobnosti lze uvažovat jako funkci x a y. Té pak říkáme sdružená prav-
děpodobnostní funkce (X, Y ).
Sdružené rozdělení diskrétního náhodného vektoru tak lze ekvivalentně zadat buďto po-
mocí sdružené distribuční funkce, nebo pomocí sdružených pravděpodobností.
Sdružená distribuční funkce diskrétních náhodných veličin má tvar
X X
FX,Y (x, y) = P(X ≤ x ∩ Y ≤ y) = P(X = xi ∩ Y = yj )
{i: xi ≤x} {j: yj ≤y}
Pro diskrétní sdružené rozdělení platí normalizační podmínka podobně jako v jednoroz-
měrném případě:
X X X
P(X = xi ∩ Y = yj ) = P {X = xi } ∩ all yj {Y = yj }
S
0.4 1
P(X = x ∩ Y = y)
FX,Y
0.2 0.5
0.3
0 0
3.5
2 2 3.5
1 2 1 2
y 0.5 1 y 0 0 0.5 1
x x
y
0 0.3 0.5 1
2
x 0 0.3 0.4 0.7
1
P(X = x ∩ Y = y) 0.5 1 2
0 0 0 0
2 0 0.1 0.2
y 0 0.5 1 2 x
1 0.3 0.1 0.3
76
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.1 Diskrétní náhodné vektory
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 77
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12
Důkaz. Pokud platí podmínka pro rovnosti, musí platit i pro nerovnosti (součet pravděpo-
dobností disjunktních jevů).
Pokud platí podmínka pro nerovnosti, musí platit i pro rovnosti (rozdíl pravděpodobností
vhodných nerovností dá rovnosti).
Příklad 4.10 (– Alice, Bob a sázka na hod kostkou). Najděte marginální rozdělení výhry pro
Alici a Boba zvlášť.
Marginální rozdělení získáme řádkovými a sloupcovými součty:
78
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.1 Diskrétní náhodné vektory
x
P(X = x ∩ Y = y) −1 1 P(Y = y)
−1 2/6 1/6 1/2
y
1 1/6 2/6 1/2
P(X = x) 1/2 1/2
Výsledek bychom dokázali získat i bez znalosti teorie náhodných vektorů. Marginální rozdělení je
jednorozměrné rozdělení náhodné veličiny, tak jak ho známe z dřívějška, bez ohledu na druhou veličinu.
Zde můžeme snadno říct, že např. Alice má stejnou šanci na výhru i prohru, tedy 50:50.
Jsou hodnoty výhry Alice a Boba nezávislé? Ne, snadno ověříme, že např.
1/3 = P(X = 1 ∩ Y = 1) 6= P(X = 1) · P(Y = 1) = 1/2 · 1/2 = 1/4.
P(X=x|Y=3)
P(X=x∩Y=y)
y
P(X=x|Y=2)
y=3
y=2 x
x=3
y=1 x=2
x=1
P(X=x|Y=1)
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 79
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12
80
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.2 Spojité náhodné vektory
y
P(X = x|Y = y) −1 1
−1 2/3 1/3
x
1 1/3 2/3
Tedy
E[X|Y = −1] = −1 P(X = −1|Y = −1) + 1 P(X = 1|Y = −1) = −1 · 2/3 + 1 · 1/3 = −1/3,
E[X|Y = 1] = −1 P(X = −1|Y = 1) + 1 P(X = 1|Y = 1) = −1 · 1/3 + 1 · 2/3 = 1/3,
X
E[X] = x P(X = x) = −1 · 1/2 + 1 · 1/2 = 0.
x
Vidíme, že znalost hodnoty jedné veličiny nám ovlivňuje podmíněnou střední hodnotu druhé.
Jsou-li veličiny X a Y spojité, je běžné popisovat jejich rozdělení pomocí sdružené hustoty
pravděpodobnosti.
Definice 4.15. Náhodné veličiny X a Y mají sdružené (absolutně) spojité rozdělení, jestliže
existuje nezáporná funkce fX,Y : R2 → [0, ∞) taková, že pro každé x, y ∈ R platí
Zy Zx
FX,Y (x, y) = fX,Y (u, v) du dv.
−∞ −∞
Zy Zx
FX,Y (x, y) = fX,Y (u, v) du dv.
−∞ −∞
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 81
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12
∂ 2 FX,Y
fX,Y (x, y) = (x, y).
∂x∂y
• Normalizační podmínka
Z∞ Z∞
fX,Y (x, y)dxdy = 1.
−∞ −∞
Zd Zb
• P(a < X ≤ b ∩ c < Y ≤ d) = fX,Y (x, y) dx dy.
c a
0 0
2 2
0 2 0 2
0 0
y −2 −2 y −2 −2
x x
1 − x2 −2y2 Zy Zx
fX,Y (x, y) = e 2 1 − u2 −2v2
π FX,Y (x, y) = e 2 du dv
π
−∞ −∞
82
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.2 Spojité náhodné vektory
Věta 4.16. Nechť náhodné veličiny X a Y mají sdružené spojité rozdělení s hustotou fX,Y .
Náhodné veličiny X a Y jsou potom také spojité s marginálními hustotami
Z∞ Z∞
fX (x) = fX,Y (x, y) dy, fY (y) = fX,Y (x, y) dx
−∞ −∞
Důkaz.
∞
Zx
Z
FX (x) = P(X ≤ x) = P(X ≤ x ∩ Y ∈ R) = fX,Y (u, v) dv du.
−∞ −∞
x R
Hustota fX je dle definice jakákoliv nezáporná funkce taková, že FX (x) = −∞ fX (u) du.
Výraz v závorce je tedy hustota fX . Druhou část tvrzení pro fY dokážeme analogicky.
Věta 4.17. Spojité náhodné veličiny X a Y jsou nezávislé právě tehdy, když pro všechna
x, y ∈ R platí rovnost
fX,Y (x, y) = fX (x) · fY (y).
Náhodné veličiny X1 , . . . , Xn jsou nezávislé právě tehdy, když pro každé x ∈ Rn platí
n
Y
fX (x) = fXi (xi ).
i=1
Derivováním obou stran podle x i y získáme rovnost hustot. Opačnou implikaci získáme
naopak integrováním obou stran rovnosti pro hustoty.
kde g(x) a h(y) jsou nezáporné funkce, pak veličiny X a Y jsou nezávislé. Uvědomme si, že ale
funkce g(x) nemusí být přímo hustotou fX (x) a funkce h(y) hustotou fY (y), mohou se od nich
lišit multiplikativní konstantou. Tedy v případě, že najdeme rozklad fX,Y (x, y) = g(x) · h(y),
pak víme, že náhodné veličiny X a Y jsou nezávislé a jejich hustoty mají tvar fX (x) = k · g(x)
1
a fY (y) = h(y), kde konstantu k je třeba určit z normalizační podmínky.
k
X Důkaz proveďte sami dosazením do vztahu pro výpočet marginálních hustot.
Toto tvrzení můžeme formulovat i pro nezávislost více náhodných veličin X1 , . . . , Xn .
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 83
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12
Z2 Z2 " #2
y2 4
−2x −2x −2x
fX (x) = ye dy = e ydy = e = e−2x − 0 = 2e−2x .
2 0
2
0 0
Z∞ Z∞ " #∞
e−2x 1 y
−2x −2x
fY (y) = ye dx = y e dx = y =y 0− = .
−2 0
−2 2
0 0
Ověření nezávislosti:
y
ye−2x = fX,Y (x, y) = fX (x) · fY (y) = 2e−2x · = ye−2x .
2
Ano, jsou nezávislé.
Obecně
R y+∆y
g(y) ∆y ≈ y g(v) dv,
Použijeme:
R y+∆y
fX,Y (u, y) ∆y ≈ y fX,Y (u, v) dv,
R y+∆y
fY (y) ∆y ≈ y fY (v) dv.
84
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.2 Spojité náhodné vektory
Motivace pro podmíněnou hustotu: Když fY (y) > 0, pro malé ∆y > 0 dostaneme
P(X ≤ x ∩ y ≤ Y ≤ y + ∆y)
P(X ≤ x|y ≤ Y ≤ y + ∆y) = =
P(y ≤ Y ≤ y + ∆y)
RxR y+∆y Rx
−∞ y fX,Y (u, v) dv du −∞ fX,Y (u, y) ∆y du
= R y+∆y ≈ =
y fY (v) dv fY (y) ∆y
Zx
fX,Y (u, y)
= du.
fY (y)
−∞
pro všechna y taková, že fY (y) > 0. Značíme ji též P(X ≤ x|Y = y) = FX|Y (x|y).
Připomeneme: Jedná se o značení a ne o podmíněnou pravděpodobnost, protože P(Y =
y) = 0.
Pomocí podmíněné distribuční funkce definujeme i podmíněnou hustotu:
Definice 4.21. Podmíněná hustota X dáno (za podmínky) Y = y je určena vztahem
fX,Y (x, y)
fX|Y (x|y) = ,
fY (y)
pro všechna y taková, že fY (y) > 0.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 85
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12
Ve spojitém případě funkce h musí být měřitelná, aby Y byla náhodná veličina.
Z = h(X) = h(X1 , . . . , Xn ) = X1 + · · · + Xn .
Z∞
fZ (z) = fX (x)fY (z − x) dx (konvoluce fX a fY ).
−∞
86
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.3 Funkce náhodného vektoru
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 87
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12
X k
X
P(Z = k) = P(X = j) P(Y = l) = P(X = j) P(Y = k − j)
{(j,l)∈N20 : j+l=k} j=0
k j k
X
−λ λ −µ µk−j −(λ+µ) 1
X k!
= e e =e λj µk−j
j=0
j! (k − j)! k! j=0 j!(k − j)!
(λ + µ)k −(λ+µ)
= e . . . Poissonovo rozdělení s parametrem λ + µ.
k!
X Snadněji lze odvodit pomocí vytvořujících funkcí náhodných veličin.
88
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.3 Funkce náhodného vektoru
(λ + µ)k −(λ+µ)
P(Z = k) = e .
k!
Porovnejte s obtížností přímého výpočtu.
Důsledek:
• E(aX + b) = a E X + b, což jsme dokázali samostatně již dříve.
Tato vlastnost často výrazně zjednodušuje výpočty.
Důkaz. Rozepsáním střední hodnoty funkce a výpočtem marginálních rozdělení plyne pro
diskrétní X a Y :
X
E(aX + bY ) = (axi + byj ) P(X = xi ∩ Y = yj )
i,j
X X
= axi P(X = xi ∩ Y = yj ) + byj P(X = xi ∩ Y = yj )
i,j i,j
X X X X
=a xi P(X = xi ∩ Y = yj ) + b yj P(X = xi ∩ Y = yj )
i j j i
X X
=a xi P(X = xi ) + b yj P(Y = yj ) = a E X + b E Y.
i j
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 89
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12
Z∞ Z∞ Z∞ Z∞
E(aX + bY ) = (ax + by)fX,Y (x, y) dx dy = axfX,Y (x, y) dx dy+
−∞ −∞ −∞ −∞
Z∞ Z∞ Z∞
∞
Z∞
∞
Z Z
+ byfX,Y (x, y) dx dy = a x fX,Y (x, y) dy dx + b y bfX,Y (x, y) dxdy
−∞ −∞ −∞ −∞ −∞ −∞
Z∞ Z∞
=a xfX (x) dx + b yfY (y) dy = a E X + b E Y.
−∞ −∞
Definice 4.28. Nechť X a Y jsou náhodné veličiny s konečnými druhými momenty. Pak
definujeme kovarianci náhodných veličin X a Y vztahem
cov(X, Y ) cov(X, Y )
ρ(X, Y ) = =√ √ .
σX σY var X var Y
h i
X−E X Y −E Y
• ρ(X, Y ) je kovariance standardizovaných veličin: ρ(X, Y ) = E σX σY .
i) cov(X, Y ) = E[XY ] − E X E Y .
iii) −1 ≤ ρ(X, Y ) ≤ 1.
Důkaz.
90
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.4 Kovariance a korelace
iv) Přímý výpočet z definice. Nejprve si spočteme cov(aX +b, cY +d), var(aX +b) a var(cY +
d)
Důkaz. Dokážeme pro spojité X a Y . Nezávislost znamená fX,Y (x, y) = fX (x) fY (y). Do-
staneme tak
Z∞ Z∞ Z∞ Z∞
E XY = xy fX,Y (x, y) dx dy = xy fX (x) fY (y) dx dy =
−∞ −∞ −∞ −∞
∞ ∞
Z Z
= x fX (x) dx y fY (y) dy = E X E Y.
−∞ −∞
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 91
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12
Rozptyl součtu náhodných veličin lze vyjádřit jako součet rozptylů, ale ne vždy.
i) cov(X, X) = var X.
Vlastnosti rozptylu
Důkaz.
iii) Nekorelované (nebo nezávislé) náhodné veličiny mají v předchozím výsledku kovarianci
rovnou nule.
10 Y
ρ=0
X
−4 −3 −2 −1 1 2 3 4
−5
−10
92
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.4 Kovariance a korelace
X
−4 −3 −2 −1 1 2 3 4
−5
−10
Stejně tak E Y = 0. Pro Alici i Boba se tedy jedná o spravedlivou hru. Jejím opakovaným hraním
nebude ani jeden systematicky bohatnout či chudnout.
Střední hodnotu součinu rozepíšeme na jednotlivé případy:
XX
E[XY ] = x · y · P(X = x ∩ Y = y)
x y
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 93
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12
Shrnutí
Diskrétní náhodná veličina X Spojitá náhodná veličina X
Rozptyl X:
X Z∞
2
= (x − E X) P(X = x) = (x − E X)2 fX (x) dx
all x −∞
94
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.4 Kovariance a korelace
Nezávislost X a Y :
P(X = x ∩ Y = y) = P(X = x) P(Y = y) fX,Y (x, y) = fX (x) fY (y)
Kovariance X a Y :
cov(X, Y ) = E[(X − E X)(Y − E Y )] = E[XY ] − E X E Y
X a Y jsou nekorelované právě tehdy, když cov(X, Y ) = 0.
Když jsou X a Y nezávislé, pak jsou i nekorelované.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 95
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12
5 Limitní věty
Doposud jsme studovali jednotlivé náhodné veličiny a vektory. Nyní se zaměříme na chování
posloupností náhodných veličin, které vznikly na základě opakovaného provádění experimentu.
Naším cílem je studovat vlastnosti tohoto náhodného experimentu na základě jeho opakování.
Hlavní otázkou je, zda a jak se odhady vlastností experimentu zlepšují s nárůstem jeho
opakování. Hlavními výsledky jsou zde zákon velkých čísel a centrální limitní věta, které
popisují vlastnosti průměru napozorovaných hodnot, který slouží jako základní odhad střední
hodnoty náhodné veličiny.
případně součet
n
X
Sn = Xi ,
i=1
kde X1 , . . . , Xn jsou nezávislé náhodné veličiny se stejným rozdělením. Značení: i.i.d. – in-
dependent and identically distributed.
Limitní věty hovoří o chování X̄n případně Sn v limitě při n → ∞.
Věta 5.2 (– Markovova nerovnost). Nechť X je náhodná veličina s konečnou střední hodnotou.
Potom platí
E |X|
P(|X| ≥ a) ≤ pro každé a > 0.
a
96
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 5.2 Základní nerovnosti pro důkaz slabého ZVČ
Důkaz. Označme jev A = {|X| ≥ a}. Potom (pro každé ω) platí |X| ≥ a1A , kde 1A je
indikátor jevu A. Aplikujeme střední hodnotu na obě strany této nerovnosti a dostaneme
Příklad 5.3 (– čekání na autobus). Nechť doba T čekání na autobus má exponenciální rozdě-
lení se střední hodnotou 3 minuty. Najděte horní mez pro pravděpodobnost, že budeme čekat
déle než 10 minut. Porovnejte odhad se skutečnou pravděpodobností.
Protože doba čekání T je nezáporná a tedy T = |T |, z Markovovy nerovnosti získáme
E |T | 3
P(T ≥ 10) = P(|T | ≥ 10) ≤ = = 0.3.
10 10
Střední hodnota exponenciálně rozdělené náhodné veličiny je E T = 1/λ = 3, tedy parametr
λ je roven 1/3. Skutečná pravděpodobnost je pak
Z∞ i∞
h 1 .
P(T ≥ 10) = λe−λt dt = −e−λt = e− 3 ·10 = 0.036.
10
10
Vidíme, že Markovova nerovnost poskytuje snadný způsob získání horní meze pro pravděpo-
dobnost týkající se chvostu rozdělení.
Věta 5.4 (– Čebyševova nerovnost). Nechť X je náhodná veličina s konečnou střední hodnotou
a konečným rozptylem. Potom platí
var X
P(|X − E X| ≥ ) ≤ pro každé > 0.
2
Důkaz. Buďto přímo, podobně jako pro Markovovu nerovnost (pro (X − E X)2 ), nebo dosa-
zením (X − E X)2 místo X a 2 místo a do Markovovy nerovnosti. Dostaneme
E |(X − E X)2 |
P(|(X − E X)2 | ≥ 2 ) ≤ .
2
Protože |(X − E X)2 | = (X −E X)2 = |X − E X|2 a kvadratická funkce je pro kladné hodnoty
argumentu rostoucí, platí
|X − E X|2 ≥ 2 ⇔ |X − E X| ≥ .
Výsledně dostáváme
var X
P(|X − E X| ≥ ) ≤ .
2
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 97
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12
var T 9 .
P(T ≥ 10) = P(T − E T ≥ 10 − 3) ≤ P(|T − E T | ≥ 7) ≤ 2
= = 0.184.
7 49
Markovova nerovnost nám dala odhad P(T ≥ 10) ≤ 0.3, takže odhad pomocí Čebyševovy
nerovnosti je o něco blíže skutečné pravděpodobnosti P(T ≥ 10) = 0.036.
E |T | 5 .
P(T ≥ 15) = P(|T | ≥ 15) ≤ = = 0.333.
15 15
Z Čebyševovy nerovnosti pak
var T 13
P(T ≥ 15) = P(T − E T ≥ 15 − 5) ≤ P(|T − E T | ≥ 10) ≤ 2
= = 0.13.
10 100
Získat rozdělení součtu je složitější, než pracovat s rozdělením jedné náhodné veličiny. Užitím
konvoluce získáme:
Z∞ Zt
µe−λ·15 − λe−µ·15 .
P(T ≥ 15) = λe−λu µe−µ·(t−u) dudt = ... = = 0.019.
µ−λ
15 0
Horní meze získané pomocí nerovností jsou orientační, ale je snadné je spočítat, protože
potřebujeme jen střední hodnoty a rozptyly.
98
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 5.3 Zákony velkých čísel
• Střední hodnota
n n n
1X 1 X 1X nµ
E X̄n = E Xi = E Xi = E Xi = = µ.
n i=1 n i=1 n i=1 n
• Rozptyl
n n n
1X 1 X 1 X nσ 2 σ2
var X̄n = var Xi = 2 var Xi = 2 var Xi = 2 = .
n i=1 n i=1
n i=1 n n
Využili jsme linearitu střední hodnoty a vlastnosti rozptylu nezávislých náhodných veličin.
var X̄n σ2
0 ≤ P(|X̄n − µ| ≥ ) = P(|X̄n − E X̄n | ≥ ) ≤ = →0 pro n → ∞.
2 n2
Z věty o limitě sevřené posloupnosti (věta o dvou strážnících) plyne tvrzení věty.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 99
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12
0.8
X̄n
0.6
0.4
2
X̄n
0
−2
−4
0 50 100 150 200 250 300 350 400 450 500
n
σ2
E X̄n = µ, var X̄n = .
n
100
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 5.4 Centrální limitní věta
• Střední hodnota
n n n
X linearita X X
E Sn = E Xi = E Xi = µ = nµ.
i=1 i=1 i=1
• Rozptyl
n n n
X nezávislost X X
var Sn = var Xi = var Xi = σ 2 = nσ 2 .
i=1 i=1 i=1
0.05
0.00
1 2 3 4 5 6
result
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 101
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12
0.05
0.00
2 4 6 8 10 12
result
0.06
0.04
0.02
0.00
5 10 15 20 25
result
102
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 5.4 Centrální limitní věta
0.04
0.02
0.00
10 20 30 40 50 60
result
• P(a < Xn ≤ b) = FXn (b) − FXn (a) ≈ FX (b) − FX (a) = P(a < X ≤ b).
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 103
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12
Podobně
Sn − nµ D
√ −→ N(0, 1) pro n → ∞.
σ n
Symbolem N(0, 1) zde pro stručnost značíme náhodnou veličinu se standardním normálním
rozdělením.
Připomeňme, že pro součet a průměr náhodných veličin je
E Sn = n · µ, E X̄n = µ,
Centrální limitní věta říká, že když vezmeme standardizovaný průměr nebo standardizovaný
součet náhodných veličin
Sn − E Sn X̄n − E X̄n
Zn = √ = q
var Sn var X̄n
Sn − nµ X̄n − µ
= √ = p 2 ,
nσ 2 σ /n
To nám umožňuje snadno odhadovat chování součtů a průměrů náhodných veličin. Větu
lze využít bez ohledu na rozdělení sčítaných či průměrovaných veličin, tedy i když je zcela
neznámé. Přesnost aproximace pak závisí na počtu zkoumaných veličin a na vzdálenosti jejich
rozdělení od normálního rozdělení.
CLV nám umožňuje vyjádřit pravděpodobnosti typu P(X̄n < x), P(X̄n > x) apod. pomocí
distribuční funkce Φ standardního normálního rozdělení,
X̄n − µ √ D
• n −→ N(0, 1),
σ
!
approx. σ2
• X̄n ∼ N µ, pro velká n,
n
approx.
• Sn ∼ N(nµ, nσ 2 ) pro velká n.
104
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 5.4 Centrální limitní věta
0.4
n = 10
0.3
fXn
0.2
0.1
0
−4 −3 −2 −1 0 1 2 3 4
Xn
0.4
n = 50
0.3
fXn
0.2
0.1
0
−4 −3 −2 −1 0 1 2 3 4
Xn
0.4
n = 100
0.3
fXn
0.2
0.1
0
−4 −3 −2 −1 0 1 2 3 4
Xn
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 105
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12
E |Sn | 500 .
P(Sn ≥ 600) = P(|Sn | ≥ 600) ≤ = = 0.83.
600 600
Užitím Čebyševovy nerovnosti:
var Sn 1600
P(Sn ≥ 600) ≤ P(|Sn − E Sn| ≥ 600 − 500) ≤ 2
= = 0.16.
100 10000
Z CLV pak:
Sn − E Sn 600 − 500
P(Sn > 600) = 1 − P(Sn ≤ 600) = 1 − P √ ≤ √
var Sn 1600
100
= 1 − P Zn ≤ ≈ 1 − Φ(2.5) = 0.0062.
40
Mohli jsme použít nerovnosti a centrální limitní větu, i když jsme neznali skutečné rozdělení
vah balíků.
Moivre-Laplaceova CLV
Centrální limitní věta byla odvozena prvně pro Binomické rozdělení, tedy pro rozdělení
počtu zdarů v n pokusech. Pokud provedeme n nezávislých pokusů za stejných podmínek,
přičemž v každém pokusu může nastat zdar s pravděpodobností p ∈ (0, 1) a počet zdarů
označíme jako X, je X ∼ Binom(n, p) s pravděpodobnostmi
!
n k
P(X = k) = p (1 − p)n−k .
k
Střední hodnota je pak E X = np a rozptyl var X = np(1 − p). Označme
(
1 v i-tém pokusu zdar,
Xi =
0 v i-tém pokusu nezdar.
Pn
Součet Sn = i=1 Xi značí opět počet zdarů v n pokusech, tedy totéž, co X. Tedy
Sn − np n→∞
p −→ N(0, 1).
np(1 − p)
106
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 5.4 Centrální limitní věta
0.30
0.25
0.20
probability
0.15
0.10
0.05
0.00
0 1 2 3 4 5
result
0.10
0.05
0.00
0 2 4 6 8 10
result
0.04
0.02
0.00
0 20 40 60 80 100
result
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 107
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12
Příklad 5.12. S jakou pravděpodobností z 1000 nezávislých hodů vyváženou mincí padne
hlava více než 525 krát?
Nechť Xi je indikátorová veličina, značící, zda v i-tém hodu padla Hlava (Xi = 1), nebo
ne (Xi = 0). Součet takových veličin pak dá počet hlav v n hodech a má binomické rozdělení
Binom(n, p) s parametry n = 1000 a p = 1/2. Výpočet pravděpodobnosti přímo by byl složitý.
Místo pravděpodobností z binomického rozdělení použijeme CLV. Pro hod mincí je E Xi =
p = 1/2 a var Xi = p(1−p) = 1/4. Pro součet pak E Sn = np = 500 a var Sn = np(1−p) = 250.
Dostáváme
1000
!
S1000 − 500 25
X
P Xi > 525 √
= P(S1000 − 500 > 525 − 500) = P >√ =
i=1 250 250
S1000 − 500 5 5
=1−P √ ≤√ ≈1−Φ √ = 1 − Φ(1.58) = 0.0571.
250 10 10
108
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12
• najít pravděpodobnost, že mezi třemi tahy s vracením či bez vracení bude určitý počet
modrých kuliček,
• apod.
Dále budeme řešit statistické problémy. Např. když máme urnu s neznámým počtem červených
a modrých kuliček, můžeme na základě náhodného výběru:
• testovat, zda je ve dvou různých urnách stejný poměr červených a modrých nebo ne,
• apod.
Příklady 6.2.
Definice 6.3. Realizace náhodného výběru (vektor náhodných pozorování, případně jen data)
je n-tice konkrétních pozorovaných čísel x1 , . . . , xn .
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 109
6 ZÁKLADNÍ POJMY STATISTIKY BI-PST, ZS 2022/23, Přednáška 1-12
• Odhad tvaru rozdělení – zúžení úvah na třídu rozdělení Fθ určenou neznámým parame-
trem θ. Vychází z apriorní znalosti, intuice nebo zkušenosti.
• případně i další určující vlastnosti (rozpětí hodnot dat, nulová střední hodnota,...).
• volbě parametrické třídy rozdělení {Fθ (x)|θ ∈ Θ}, kde Θ je množina všech možných
hodnot parametru θ
110
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 6.3 Odhad tvaru rozdělení
6.3.1 Histogram
Hustotu můžeme odhadovat pomocí histogramu.
4
1 · 10
0.4 3
1 · 10
2
1 · 10
0.2 1
1 · 10
xmin xmax
0
2 2.5 3 3.5 4 4.5 5 5.5 6
0.4 N(µ, σ 2 )
0.3
fX
0.2
0.1
0
−4 −3 −2 −1 0 1 2 3 4
x
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 111
6 ZÁKLADNÍ POJMY STATISTIKY BI-PST, ZS 2022/23, Přednáška 1-12
0.5 1 1
=
n 10
0 xmin xmax
0.8
0.6
0.4
0.2
N(µ, σ 2 )
0
−4 −2 0 2 4 6
112
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 6.3 Odhad tvaru rozdělení
Příklad 6.6 (– čekání na autobus – histogram). Data jsou z intervalu [0, 12]. Pokud zvolíme
počet přihrádek k pro histogram příliš malý nebo velký, odhad bude nepřesný:
0.1 0.3 0.5 0.7 1.0 1.9 2.8 3.4 3.5 3.8 5.3 7.7 8.6 8.7 11.1
>hist(waiting_time,prob=T,breaks=12)
0.25
0.20
0.15
Density
0.10
0.05
0.00
0 2 4 6 8 10 12
waiting_time
Příklad 6.6 (– čekání na autobus – histogram). Data jsou z intervalu [0, 12]. Pokud zvolíme
počet přihrádek k pro histogram příliš malý nebo velký, odhad bude nepřesný:
0.1 0.3 0.5 0.7 1.0 1.9 2.8 3.4 3.5 3.8 5.3 7.7 8.6 8.7 11.1
>hist(waiting_time,prob=T,breaks=2)
0.12
0.10
0.08
Density
0.06
0.04
0.02
0.00
0 5 10 15
waiting_time
Příklad 6.6 (– čekání na autobus – histogram). Data jsou z intervalu [0, 12]. Zdá se být rozumné
1 1
rozdělit interval na šest částí po dvou minutách. Každé pozorování přidá do histogramu h·n = 2·15 =
¯
0.033:
0.1 0.3 0.5 0.7 1.0 1.9 2.8 3.4 3.5 3.8 5.3 7.7 8.6 8.7 11.1
>hist(waiting_time,prob=T)
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 113
6 ZÁKLADNÍ POJMY STATISTIKY BI-PST, ZS 2022/23, Přednáška 1-12
0.20
0.15
Density
0.10
0.05
0.00
●● ● ● ● ● ● ●● ● ● ● ●
● ●
0 2 4 6 8 10 12
waiting_time
●
0.8
●
0.6
●
Fn(x)
●
0.4
●
0.2
●
0.0
0 2 4 6 8 10 12
waiting_time
Nyní můžeme odhadovat pravděpodobnosti tvaru P(X ≤ x) pomocí Fn (x). Např. pravděpo-
.
dobnost, že nebudeme čekat déle než šest minut, odhadneme pomocí Fn (6) = 11/15 = 0.733.
Tedy jde o podíl pozorování, která jsou menší nebo rovna 6.
můžeme α%-kvantil odhadnout jako x(dnαe) . Medián q0.5 tak odhadneme jako prostřední hod-
notu ze seřazených dat, x(d n2 e) . Jedná se tak o inverzi empirické distribuční funkce. Je-li počet
dat sudý, některý software odhaduje medián jako průměr x( n2 ) a x( n2 +1) .
Příklad 6.7 (– čekání na autobus – medián). Odhadněme medián doby čekání na autobus z po-
zorovaných dat:
0.1 0.3 0.5 0.7 1.0 1.9 2.8 3.4 3.5 3.8 5.3 7.7 8.6 8.7 11.1
Medián odhadneme jako prostřední pozorovanou hodnotu. Tedy s pravděpodobností přibližně 50%
budeme čekat méně než 3.4 minuty a též více než 3.4 minuty.
114
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12
7 Bodové odhady
7.1 Úvod
Z naměřených dat můžeme sestrojit aproximaci hodnot parametru θ, kterou nazýváme bodo-
vým odhadem.
Definice 7.1. Bodový odhad parametru θ je funkce θ̂n (X1 , . . . , Xn ) náhodného výběru, která
nezávisí na hodnotách θ.
Poznámky:
• Bodový odhad je příkladem tzv. statistiky, což je libovolná funkce náhodného výběru,
která nezávisí na parametru θ.
• Obecně můžeme sestrojit také bodový odhad nějaké funkce parametru g(θ).
1
• Typickým příkladem je g(λ) = = E X pro X mající exponenciální rozdělení.
λ
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 115
7 BODOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12
Definice 7.3. Odhad θ̂n parametru θ se nazývá konzistentní, jestliže pro každé θ ∈ Θ:
P
θ̂n −→ θ pro n → ∞.
Věta 7.4. Nechť E θ̂n2 < +∞ pro každé n. Pokud pro n → +∞ platí
• Nestrannost:
n n n
1X 1 X 1X
E X̄n = E Xi = E Xi = E Xi = µ.
n i=1 n i=1 n i=1
P
X̄n −→ µ pro n → ∞.
σ2
• To samé plyne z předchozí věty a faktu, že var X̄n = → 0.
n
116
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 7.2 Vlastnosti bodových odhadů
1.0
0.5
0.0
Xbar
2
1
0
Xbar
4
3
2
1
0
Xbar
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 117
7 BODOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12
Pro každý případ existuje dolní mez pod kterou rozptyl žádného nestranného odhadu
nemůže klesnout (Rao - Cramerova mez). Pokud najdeme odhad s rozptylem rovným této
dolní mezi, máme nejlepší nestranný odhad.
Věta 7.6. Pro binomické, Poissonovo, exponenciální a normální rozdělení je výběrový průměr
nejlepším nestranným odhadem střední hodnoty. Pro normální rozdělení je výběrový rozptyl
nejlepším nestranným odhadem rozptylu.
118
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 7.3 Metoda momentů
Metoda dává rozumné odhady, protože ze zákona velkých čísel konvergují empirické mo-
menty ke skutečným, mk → E Xik pro n → +∞. Odhady jsou tak vždy konzistentní. Po-
známka: Pro pokrytí všech parametrů je někdy potřeba vyjádřit i momenty vyšších řádů.
E Xi = µ, E Xi2 = var Xi + (E Xi )2 = σ 2 + µ2 .
σ̂n2 = m2 − m21
n
1X
= X 2 − (X̄n )2 .
n i=1 i
• Po úpravě
n
!
1 X n−1 2
σ̂n2 = X 2 − n(X̄n )2 = s .
n i=1 i n n
Tento odhad není nestranný, ale jeho vychýlení bude s rostoucím počtem pozorování klesat.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 119
7 BODOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12
Při pevných hodnotách pozorovaných dat x = (x1 , . . . , xn ) se fθ (x) resp. pθ (x) jakožto funkce
θ nazývá věrohodnostní funkcí a značí se L(θ; x), případně jen L(θ).
Věrohodnostní funkce závisí pouze na parametru θ. Hodnoty x1 , . . . , xn jsou považovány
za známé a pevné.
Definice 7.9. Hodnota θ̂n parametru θ, která maximalizuje věrohodnostní funkci L(θ; x) pro
dané X = x, se nazývá maximálně věrohodný odhad (MLE) parametru θ. To znamená, že
L(θ̂n ; x) ≥ L(θ; x) pro všechna θ ∈ Θ.
Poznámky:
• Jako maximálně věrohodný odhad funkce parametru g(θ) lze vzít g(θ̂n ).
• Často je výhodné maximalizovat logaritmickou věrohodnostní funkci ln L(θ; x), protože
se součin změní na součet.
• V případě k-rozměrného parametru θ = (θ1 , . . . , θk ) tak obvykle řešíme soustavu rovnic
∂ ln L(θ1 , . . . , θk ; x)
= 0 pro j = 1, . . . , k.
∂θj
• Jsou-li splněny tzv. podmínky regularity (viz literatura), odhady získané metodou ma-
ximální věrohodnosti jsou konzistentní, asymptoticky nestranné a mají asymptoticky
normální rozdělení.
120
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 7.4 Metoda maximální věrohodnosti
Příklad 7.10 (– parametry normálního rozdělení – pokračování). Sestrojme MLE odhad parametrů
µ a σ 2 normálního rozdělení N(µ, σ 2 ).
Derivujeme-li log-věrohodnost
n
(xi − µ)2
X 1
ln L(µ, τ ) = − ln(2πτ ) −
i=1
2 2τ
podle τ , dostaneme
Pn
∂ ln L(µ, τ ) 1 2π i=1 (xi − µ)2
= −n + = 0,
∂τ 2 2πτ 2τ 2
což lze převést na rovnost Pn
i=1 (xi − µ)2
−n + = 0.
τ
n
1X
Tedy τ = (xi − µ)2 . Dosazením odhadu µ získáme maximálně věrohodný odhad
n i=1
n
1X
σ̂n2 = τ̂n = (Xi − X̄n )2 .
n i=1
0.1 0.3 0.5 0.7 1.0 1.9 2.8 3.4 3.5 3.8 5.3 7.7 8.6 8.7 11.1
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 121
7 BODOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12
0.10
0.05
0.00
0 2 4 6 8 10 12
waiting_time
122
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12
8 Intervalové odhady
8.1 Intervaly spolehlivosti
Místo bodového odhadu parametru θ nás může zajímat interval, ve kterém leží skutečná
hodnota parametru s danou vysokou pravděpodobností 1 − α:
• Platí tedy
P θ ∈ (L, U ) = 1 − α.
• To znamená, že
P θ∈
/ (L, U ) = α.
α α
P(θ < L) = a P(U < θ) = .
2 2
• Nejčastěji se používají hodnoty α = 0.05 nebo α = 0.01, tj. hledáme 95% nebo 99%
interval spolehlivosti.
Pokud nás zajímá jen dolní resp. horní mez, konstruujeme statistiky L resp. U tak, aby
P L<θ =1−α resp. P θ < U = 1 − α,
neboli
P θ<L =α resp. P U < θ = α.
Interval (L, +∞) nazýváme horní interval spolehlivosti. Interval (−∞, U ) nazýváme dolní
interval spolehlivosti.
Hovoříme pak o jednostranných intervalech spolehlivosti.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 123
8 INTERVALOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12
Statistiku H(θ) často volíme s ohledem na rozdělení příslušného bodového odhadu θ, např.
výběrového průměru pro střední hodnotu a výběrového rozptylu pro rozptyl.
σ σ
X̄n − zα/2 √ , X̄n + zα/2 √ ,
n n
kde zα/2 = Φ−1 (1 − α/2) je kritická hodnota standardního normálního rozdělení, tj. číslo, pro
které platí P(Z > zα/2 ) = α/2 pro Z ∼ N(0, 1).
Jednostranné 100 · (1 − α)% intervaly spolehlivosti pro µ jsou pak
σ σ
X̄n − zα √ , +∞ a −∞ , X̄n + zα √
n n
Důkaz. Nejprve ukážeme, že průměr i.i.d. náhodných veličin z normálního rozdělení má také
normální rozdělení, ale s jinými parametry. Pro důkaz využijeme momentovou vytvořující
funkci MX (s) = E[esX ].
124
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 8.2 Intervaly spolehlivosti pro střední hodnotu
Důkaz. Momentová vytvořující funkce součtu nezávislých veličin je součinem jejich vytvořu-
jících funkcí. Pro součet i.i.d. normáně rozdělených veličin tak:
Pn
nezávislost
Msum (s) = E[es i=1
Xi
] = E[esX1 · ... · esXn ] = E[esX1 ] · ... · E[esXn ]
n
Y stejné rozdělení
= Mi (s) = (M (s))n
i=1
2 2
n
nσ 2 s2
µs− σ 2s
= e = enµs− 2 .
P(z1−α/2 < Z < zα/2 ) = P(Z < zα/2 ) − P(Z < z1−α/2 ) = 1 − α/2 − (1 − 1 + α/2) = 1 − α.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 125
8 INTERVALOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12
Poznámky a shrnutí
−µ
X̄n√
Z= σ/ n
∼ N(0, 1)
Oboustranný
1−α
α/2 α/2
Jednostranný
1−α
α
−∞ 0 zα
Příklad 8.3 (– IQ žáků 8.třídy). IQ žáků osmé třídy se řídí normálním rozdělením N(µ, σ 2 )
s rozptylem σ 2 = 9 známým ze zkušenosti. Chceme získat oboustranný intervalový odhad pro střední
hodnotu IQ o spolehlivosti 95%. Testů se zůčastnilo 16 žáků, naměřili jsme tyto hodnoty:
111, 116, 105, 111, 110, 114, 108, 106, 112, 108, 112, 111, 105, 111, 108, 110.
. √
Pro intervalový odhad potřebujeme výběrový průměr X̄n = 109.9, směrodatnou odchylku σ = σ 2 = 3
a příslušnou kritickou hodnotu. Protože spolehlivost intervalu má být 95%, máme
σ σ
(L, U ) = X̄n − zα/2 √ , X̄n + zα/2 √
n n
. 3 3 .
= 109.9 − 1.96 √ , 109.9 + 1.96 √ = (108.4, 111.3).
16 16
X̄n − µ
√ ∼ N(0, 1).
σ/ n
Centrální limitní věta nám říká, že výběrový průměr veličin z libovolného rozdělení se střední
hodnotou µ a konečným rozptylem σ 2 konverguje k normálnímu rozdělení:
X̄n − µ n→∞
√ −→ N(0, 1).
σ/ n
126
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 8.2 Intervaly spolehlivosti pro střední hodnotu
Toho využijeme pro konstrukci konfidenčních intervalů pro jiná než normální rozdělení.
V důsledku centrální limitní věty můžeme pro velké n stejné intervaly spolehlivosti použít
přibližně i pro náhodný výběr z libovolného rozdělení.
Uvažujme náhodný výběr X1 , . . . , Xn z rozdělení s E Xi = µ a var Xi = σ 2 a předpoklá-
dejme, že známe rozptyl σ 2 .
Oboustranný 100 · (1 − α)% interval spolehlivosti pro µ můžeme při dostatečně velkém n
určit stejně, jako pro výběr z normálního rozdělení:
σ σ
X̄n − zα/2 √ , X̄n + zα/2 √ ,
n n
Příklad 8.4 (– volební účast). Provedli jsme průzkum z cílem zjistit předpokládanou volební účast.
Z 400 respondentů 240 odpovědělo, že volit půjde, zbytek že nepůjde.
Odhadněme volební účast a sestavme příslušný 95% konfidenční interval. Odpovědi si můžeme
představit jako Bernoulliho náhodné veličiny:
(
1 pokud i-tý respondent řekl, že půjde volit
Xi =
0 pokud i-tý respondent řekl, že nepůjde volit.
Víme, že pak
µ = E Xi = p, σ 2 = var Xi = p(1 − p).
n
1X 240 6
p̂n = Xi = = = 60%.
n i=1 400 10
6 4 24
σ̂n2 = p̂n (1 − p̂n ) = · = .
10 10 100
Příklad 8.4 (– volební účast, pokračování). Přibližný interval spolehlivosti pro µ můžeme
sestavit na základě CLV i pro Bernoulliho rozdělení jako
σ σ
(L, U ) = X̄n − zα/2 √ , X̄n + zα/2 √ .
n n
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 127
8 INTERVALOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12
Rozptyl σ 2 neznáme, ale můžeme jej za cenu určité ztráty přesnosti nahradit odhadem σ̂n2 =
p̂n (1 − p̂n ). Přibližný konfidenční interval pak bude
p p !
p̂n (1 − p̂n ) p̂n (1 − p̂n )
(L, U ) = p̂n − zα/2 √ , p̂n + zα/2 √
n n
p p !
6 24/100 6 24/100
= − 1.96 √ , + 1.96 √
10 400 10 400
= (0.552, 0.648) .
Tedy s přibližně 95% spolehlivostí můžeme říct, že k volbám půjde něco mezi 55.2% a 64.8%
obyvatel.
n
1 X
s2n = (Xi − X̄n )2 .
n − 1 i=1
Prozkoumáme, jak intervaly spolehlivosti příslušně upravit, aby jejich přesnost byla právě
1 − α.
Definice 8.5. Uvažujme náhodný výběr Y1 , . . . , Yn z normálního rozdělení N(0, 1). Pak ří-
káme, že náhodná veličina
n
X
Y = Yi2
i=1
Z
T =q
Y
n
128
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 8.2 Intervaly spolehlivosti pro střední hodnotu
(n − 1)s2n
σ2
má chí-kvadrát rozdělení s n − 1 stupni volnosti.
Důkaz. Viz literatura.
X̄n − µ
T = √
sn / n
má Studentovo t-rozdělení s n − 1 stupni volnosti
Důkaz. Můžeme přepsat T jako:
√ X̄n −µ
X̄n − µ σ/ n
T = p 2 =r .
sn /n (n−1)s2n
σ 2 (n−1)
Čitatel má standardní normální rozdělení N(0, 1), ve jmenovateli máme odmocninu z χ2n−1
vyděleného n − 1. Rozdělení X̄n a s2n jsou nezávislá (viz literatura), tedy celý zlomek má
skutečně rozdělení tn−1 .
q
Neznáme-li rozptyl, odhadneme hodnotu σ odmocninou z výběrového rozptylu sn = s2n .
Standardizace X̄n s použitím sn vede na Studentovo t-rozdělení.
Věta 8.9. Uvažujme náhodný výběr X1 , . . . , Xn z normálního rozdělení N(µ, σ 2 ). Oboustranný
100 · (1 − α)% interval spolehlivosti pro µ je
sn sn
X̄n − tα/2,n−1 √ , X̄n + tα/2,n−1 √ ,
n n
kde tα/2,n−1 je kritická hodnota Studentova t-rozdělení s n − 1 stupni volnosti. Jednostranné
100 · (1 − α)% intervaly spolehlivosti pro µ jsou pak
sn sn
X̄n − tα,n−1 √ , +∞ a −∞ , X̄n + tα,n−1 √
n n
při stejném značení.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 129
8 INTERVALOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12
Poznámky a shrnutí
V důsledku centrální limitní věty můžeme pro velké n stejné intervaly spolehlivosti použít
přibližně i pro náhodný výběr z libovolného rozdělení.
Uvažujme náhodný výběr X1 , . . . , Xn z rozdělení s E Xi = µ a var Xi = σ 2 a předpoklá-
dejme, že neznáme rozptyl σ 2 .
Oboustranný 100 · (1 − α)% interval spolehlivosti pro µ můžeme při dostatečně velkém n
určit stejně, jako pro výběr z normálního rozdělení:
sn sn
X̄n − tα/2,n−1 √ , X̄n + tα/2,n−1 √ ,
n n
kde tα/2,n−1 je kritická hodnota Studentova t-rozdělení s n-1 stupni volnosti. Jednostranné
intervaly analogicky.
X̄n −µ
T = √
sn / n
∼ tn−1
Oboustranný
1−α
α/2 α/2
−tα/2,n−1 0 tα/2,n−1
Jednostranný
1−α
α
−∞ 0 tα,n−1
1−α
α/2 α/2
−zα/2 0 zα/2
−tα/2,n−1 tα/2,n−1
130
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 8.2 Intervaly spolehlivosti pro střední hodnotu
Příklad 8.10 (– hmotnost kaprů). Hmotnosti kaprů při výlovu rybníka jsou náhodné veličiny
s normálním rozdělením N(µ, σ 2 ). Z deseti vylovených kaprů jsme zjistili:
10
X 10
X
Xi = 45.65 kg a Xi2 = 208.70 kg2 .
i=1 i=1
1
• s210 = 208.7 − 10 · (4.565)2 = 0.0342 kg2 .
9
Příklad 8.10 (– hmotnost kaprů, pokračování). Najděme dolní 90% konfidenční interval pro
µ.
sn X̄10 = 4.565 kg
−∞ , X̄n + tα,n−1 √
n s210 = 0.0342 kg2
√ ! α = 10% = 0.1
0.0342
−∞ , 4.565 + 1.383 √
10 t0.1,9 = 1.383
Pokud by nám například prodejce tvrdil, že střední váha kaprů je 4.8 kg, můžeme s 90% jisto-
tou říct, že nemá pravdu. Takové úvahy jsou základem testování hypotéz, viz příští přednášku.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 131
8 INTERVALOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12
kde χ2α/2,n−1 je kritická hodnota rozdělení χ2 s n − 1 stupni volnosti, tj. P(X > χ2α/2,n−1 ) =
α/2 pokud X ∼ χ2n−1 . Jednostranné 100 · (1 − α)% intervaly spolehlivosti pro σ 2 jsou pak
! !
(n − 1)s2n (n − 1)s2n
, +∞ a 0, 2 .
χ2α,n−1 χ1−α,n−1
Důkaz. Víme, že
(n − 1)s2n
σ2
má chí-kvadrát rozdělení χ2n−1 . Konfidenční interval sestavíme pomocí odpovídajících kritic-
kých hodnot: !
2 (n − 1)s2n 2
P χ1−α/2,n−1 < < χα/2,n−1 = 1 − α.
σ2
(n−1)s2n
σ2 ∼ χ2n−1
1−α
α/2 α/2
0 χ21−α/2,n−1 χ2α/2,n−1
(n−1)s2 (n−1)s2
σ2
n
< χ2α,n−1 ⇒ χ2
n
< σ2
α,n−1
1−α
α
0 χ2α,n−1
132
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 8.3 Intervaly spolehlivosti pro rozptyl
Příklad 8.12 (– hmotnost kaprů, pokračování). Najděme oboustranný 90% konfidenční in-
terval pro rozptyl hmotnosti kaprů v rybníce σ 2 :
s210 = 0.0342 kg2
!
(n − 1)s2n (n − 1)s2n
, 2
χ2α/2,n−1 χ1−α/2,n−1 α = 10% = 0.1
χ20.05,9 = 16.919
9 · 0.0342 9 · 0.0342
,
16.919 3.325 χ20.95,9 = 3.325
Oboustranný 90% konfidenční interval pro σ 2 je tedy
Příklad 8.12 (– hmotnost kaprů, pokračování). Najděme horní jednostranný 90% konfi-
denční interval pro rozptyl hmotnosti kaprů v rybníce σ 2 :
!
(n − 1)s2n s210 = 0.0342 kg2
, +∞
χ2α,n−1
α = 10% = 0.1
9 · 0.0342
, +∞ χ20.1,9 = 14.684
14.684
Horní jednostranný 90% konfidenční interval pro σ 2 je tedy
Pokud by nám například prodejce tvrdil, že rozptyl váhy kaprů je 0.01 kg2 , tedy že směro-
datná odchylka je 100 gramů, můžeme s 90% jistotou říct, že nemá pravdu.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 133
9 TESTOVÁNÍ HYPOTÉZ BI-PST, ZS 2022/23, Přednáška 1-12
9 Testování hypotéz
9.1 Princip testování hypotéz
Testování hypotéz – motivace
Často potřebujeme ověřit nějaké tvrzení o zkoumaném rozdělení dat, přičemž k dispozici
máme jen náhodný výběr.
Typy hypotéz:
134
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 9.2 Parametrické testy
Většinou lze mít pod kontrolou pouze pravědpodobnost jedné z těchto chyb.
• Chceme, aby pravděpodobnost chyby prvního druhu byla nejvýš rovna zvolené hodnotě
α, kterou nazýváme hladinou významnosti testu.
• Běžně volíme α = 5% nebo α = 1%.
• Chyba druhého druhu pak může být vysoká či nízká, v závislosti na rozsahu zkoumaného
výběru a dalších faktorech.
• Hodnota 1 − P(chyba druhého druhu) se nazývá síla testu.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 135
9 TESTOVÁNÍ HYPOTÉZ BI-PST, ZS 2022/23, Přednáška 1-12
testu je tedy skutečně α. Rozhodovací pravidlo (test) lze volit mnoha způsoby. Dá se ale
ukázat (viz literatura), že pro širokou třídu rozdělení dostaneme testováním pomocí (1 −
α)% konfidenčních intervalů nejnižší pravděpodobnost chyby druhého druhu při dané hladině
významnosti α. Získáváme tak nejsilnější test proti příslušné alternativě.
H0 : θ = θ0 proti HA : θ > θ0 .
K testování použijeme typ intervalu odpovídající alternativní hypotéze, tj. horní 100(1 −
α)% interval spolehlivosti (L, +∞) pro θ. Platí
P θ ∈ (L, +∞) = P(L < θ) = 1 − α.
Pokud bude θ0 mimo tento interval, platí s velkou pravděpodobností HA . Test volíme násle-
dovně:
Poznámky:
H0 : θ ≤ θ0 proti HA : θ > θ0 .
136
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 9.3 Testy o parametrech normálního rozdělení
L U
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 137
9 TESTOVÁNÍ HYPOTÉZ BI-PST, ZS 2022/23, Přednáška 1-12
√
sn 0.0342
(L, U ) = −∞ , X̄n + tα,n−1 √ = −∞ , 4.565 + 1.833 √ = (−∞, 4.672).
n 10
Testovaná hodnota µ0 = 4.7 v intervalu neleží, tedy na hladině významnosti 5% nulovou hypotézu
zamítneme ve prospěch alternativy, že je skutečná střední váha kaprů významně nižší než 4.7 kg.
138
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 9.5 Kritické obory a testové statistiky
Příklad 9.2 (– test vyváženosti mince). Z dvaceti hodů mincí nám padla jen čtyřikrát hlava.
Je mince nevyvážená? Testujme na hladině významnosti 5%. Hody mincí můžeme reprezentovat jako
Bernoulliho náhodné veličiny:
(
1 v i-tém hodu hlava
Xi =
0 v i-tém hodu orel.
Víme, že pak
µ = E Xi = p, σ 2 = var Xi = p(1 − p).
n
1X 4 1
p̂n = Xi = = .
n i=1 20 5
n
1 X n 20 1 4 .
s2n = (Xi − X̄n )2 = p̂n (1 − p̂n ) = · · = 0.168.
n − 1 i=1 n−1 19 5 5
Za cenu určité ztráty přesnosti lze použít i odhad σ̂n2 = p̂n (1 − p̂n ) jako minule.
sn sn
(L, U ) = X̄n − tα/2,n−1 √ , X̄n + tα/2,n−1 √
n n
√ √ !
1 0.168 1 0.168
= − 2.093 √ , + 2.093 √
5 20 5 20
= (0.008, 0.392) .
Testovaná hodnota p0 = 0.5 v intervalu neleží, takže můžeme hypotézu vyváženosti na hladině
významnosti 5 % zamítnout ve prospěch alternativy, že je pravděpodobnost, že padne hlava,
významně odlišná od 0.5.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 139
9 TESTOVÁNÍ HYPOTÉZ BI-PST, ZS 2022/23, Přednáška 1-12
140
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 9.5 Kritické obory a testové statistiky
Příklad 9.3 (– váha kaprů). Na základě dat o vylovených kaprech z minula chceme na hladině
významnosti 5% otestovat pomocí testové statistiky, jestli je střední váha kaprů 4.7 kg, nebo jestli je
významně nižší. Prozkoumáme, zda je vzdálenost testované hodnoty µ0 = 4.7 kg a výběrového průměru
X̄n = 4.565 kg příliš vysoká, než aby mohla platit nulová hypotéza H0 : µ = 4.7 kg. Testujeme hypotézu
o střední hodnotě při neznámém rozptylu, testová statistika tak má tvar
Testujeme proti jednostranné alternativě typu “menší než” na hladině α = 5%, takže zkoumáme,
zda je testová statisika menší než kritická hodnota −tα,n−1 . Zde
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 141
9 TESTOVÁNÍ HYPOTÉZ BI-PST, ZS 2022/23, Přednáška 1-12
• Mnoho statistických programů dává jako výstup testování hypotéz pouze p-hodnotu.
• Velikost p-hodnoty nám říká, jak silné je zamítnutí H0 , nebo jak slabé je nezamítnutí.
Příklad 9.4 (– porovnání výšky otců a synů). Chceme prověřit, zde výška populace roste z ge-
nerace na generaci. Pozorovali jsme pět dvojic otců a jejich synů, nyní dospělých. Naměřili jsme jejich
výšky v centimetrech jako:
Testujeme, jestli jsou střední hodnoty výšky otců a synů stejné, proti alternativě, že synové jsou
významně vyšší. Volíme α = 5%. Horní jednostranný 95% konfidenční interval pro střední hodnotu
µdiff rozdílů Zi je
sZ . 5.52 .
Z̄n − tα,n−1 √ , +∞ = 6 − 2.132 · √ , +∞ = (0.735, +∞).
n 5
Testovaná hodnota µdiff = 0 v intervalu neleží, můžeme tedy shodu zamítnout ve prospěch alternativy,
že synové jsou významně vyšší, než jejich otcové.
142
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 9.6 Dvouvýběrové a párové problémy
Paired t-test
Dvouvýběrový t-test
Chceme porovnat náhodný výběr X1 , ..., Xn1 se druhým nezávislým výběrem Y1 , ..., Yn2 .
Taková situace může nastat, když například sledujeme hodnotu určitého ukazatele u dvou ne-
závislých skupin pacientů, kde každá skupina podstupuje jiný druh léčby. Chceme zjistit, jestli
je hodnota ukazatele stejná pro obě skupiny, nebo jestli se významně liší. Předpokládejme,
že jsou všechny veličiny nezávislé, normálně rozdělené s Xi ∼ N(µ1 , σ12 ) a Yi ∼ N(µ2 , σ22 ).
Chceme testovat H0 : µ1 = µ2 . Dá se ukázat (viz literatura), že za platnosti H0 má statistika
X̄n1 − Ȳn2
T =
s•
Studentovo t-rozdělení. Výběrová směrodatná odchylka s• a počet stupňů volnosti závisí na
tom, zda mají oba výběry shodný rozptyl (σ12 = σ22 ), nebo ne. Test pak můžeme provést
porovnáním testové statistiky T s příslušnými kritickými hodnotami t-rozdělení.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 143
9 TESTOVÁNÍ HYPOTÉZ BI-PST, ZS 2022/23, Přednáška 1-12
s4d
• nd = 2 2
1 s2X 1 s2Y
n1 −1 n1 + n2 −1 n2
Testujeme, zda jsou střední hodnoty výšek mezi výběry shodné, proti alternativě, že se nerovnají, na
hladině významnosti α = 5%. Uvažujme shodný rozptyl výběrů. Testovou statistiku můžeme sestrojit
jako r
X̄n1 − Ȳn2 n1 n2
T = = −1.0545.
s12 n1 + n2
α/2 kritická hodnota t-rozdělení s n1 +n2 −2 stupni volnosti je tα/2,n1 +n2 −2 = t0.025,9 = 2.262. Protože
144
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 9.6 Dvouvýběrové a párové problémy
sample estimates:
mean of x mean of y
180.6000 185.3333
p-hodnota je vyšší než α = 5%, takže shodu výšek na hladině významnosti 5% nelze zamítnout.
• Kde s2X je výběrový rozptyl prvního náhodného výběru a s2Y druhého výběru.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 145
10 LINEÁRNÍ REGRESE BI-PST, ZS 2022/23, Přednáška 1-12
10 Lineární regrese
10.1 Kovariance a korelace
Kovariance a korelace
Chceme prozkoumat souvislost mezi dvěma náhodnými veličinami. Někdy můžeme před-
pokládat, že na sobě náhodné veličiny závisí, někdy zase čekáme, že se navzájem neovlivňují.
Příklady 10.1.
Kovariance a korelace
Kovariance dvou náhodných veličin X a Y je definována následovně:
a dá se vyjádřit jako
cov(X, Y ) = E[XY ] − E X E Y.
Korelační koeficient je definován jako
cov(X, Y )
ρX,Y = √ √
var X var Y
Kovariance a korelace
146
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 10.1 Kovariance a korelace
10 Y
ρ=0
X
−4 −3 −2 −1 1 2 3 4
−5
−10
10 Y
ρ = 0.7
X
−4 −3 −2 −1 1 2 3 4
−5
−10
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 147
10 LINEÁRNÍ REGRESE BI-PST, ZS 2022/23, Přednáška 1-12
Ze zákona velkých čísel pak plyne, že se jedná o konzistentní odhad skutečné kovariance. Dá se
ukázat, že je to také nestranný odhad. Protože jsou výběrové rozptyly konzistentními odhady
skutečných rozptylů, je i výběrový korelační koeficient konzistentním odhadem korelačního
koeficientu.
n
!
1 X 1
s2X Xi2 nX̄n2 161412 − 5 · 179.62 = 32.8,
= − =
n−1 i=1
4
n
!
1 X 1
s2Y Yi2 nȲn2 169017 − 5 · 183.82 = 26.2,
= − =
n−1 i=1
4
n
!
1 X 1
sX,Y = Xi Yi − nX̄n Ȳn = (165156 − 5 · 179.6 · 183.8) = 25.9.
n−1 i=1
4
148
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 10.1 Kovariance a korelace
sX,Y 25.9 .
rX,Y = p 2 2 = √ = 0.883.
sX sY 32.8 · 26.2
Můžeme říct, že mezi výškami otců a jejich synů je silná pozitivní korelace. Výběrový korelační koefi-
cient můžeme v R spočítat pomocí funkce cor(height_father,height_son).
+
188
+
186
height_son
184
+
182
180
+
178
height_father
Věta 10.4. Pozorujeme-li nezávislé a normálně rozdělené dvojice, potom když ρX,Y = 0,
statistika
rX,Y √
T =q n−2
2
1 − rX,Y
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 149
10 LINEÁRNÍ REGRESE BI-PST, ZS 2022/23, Přednáška 1-12
Příklad 10.4 (– souvislost výšky otců a synů, pokračování). Existuje statisticky významná
souvislost mezi výškami otců a jejich synů? Testujme na hladině významnosti α = 5%. Zís-
káme
rX,Y √ . 0.883 √ .
T =q n−2= √ 3 = 3.267.
2
1 − rX,Y 1 − 0.8832
Příklad 10.4 (– souvislost výšky otců a synů, pokračování). Nulovost korelace lze v R testovat
pomocí funkce cor.test:
> cor.test(height_father,height_son)
p-hodnota je menší než α = 5%, takže hypotézu nekorelovanosti můžeme zamítnout na hladině vý-
znamnosti 5%. Alternativně bychom se mohli rozhodnout pomocí t-statistiky T = 3.267.
Příklady 10.5.
150
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 10.2 Regresní model
Yi = α + βxi + εi i = 1, . . . , n.
Předpokládáme, že:
• εi jsou i.i.d. náhodné veličiny s nulovou střední hodnotou (experimentální chyby), často
N(0, σ 2 ),
Z toho plyne:
E Yi = α + βxi , var Yi = var εi = σ 2 .
Chceme najít odhady a a b parametrů α a β takové, že hodnoty
Ŷi = a + b · xi
e5 e6
Rezidua ei
e4
e3
e1 e2
Věta 10.6. Bodové odhady regresních parametrů získané metodou nejmenších čtverců jsou
Pn
i=1 (xi − x̄n )(Yi − Ȳn )
b= Pn 2
a a = Ȳn − b x̄n ,
i=1 (xi − x̄n )
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 151
10 LINEÁRNÍ REGRESE BI-PST, ZS 2022/23, Přednáška 1-12
n
X n
X n
X n
X
0= xi yi − ȳn xi − b x2i + b x̄n xi
i=1 i=1 i=1 i=1
Pn Pn
i=1 xi yi − nȳn x̄n i=1 (yi − ȳn )(xi − x̄n )
b= n 2 − nx̄2 = Pn 2
i=1 (xi − x̄n )
P
x
i=1 i n
X Dá se ukázat, že výše zmíněné odhady jsou nejlepší nestranné odhady regresních para-
metrů.
Kdybychom považovali vysvětlující proměnné za náhodné veličiny X1 , ..., Xn , odhad re-
gresního parametru β lze zapsat pomocí odhadů rozptylů a kovariance:
Pn
i=1 (Xi − X̄n )(Yi − Ȳn ) sX,Y sY
b= Pn 2
= 2 = rX,Y ,
i=1 (Xi − X̄n ) sX sX
Příklad 10.7 (– závislost výšky synů na výšce jejich otců). Modelujme lineární regresní závislost
výšky synů na výšce jejich otců na základě dat z předchozího příkladu. Naměřili jsme:
152
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 10.2 Regresní model
sX,Y 25.9 .
b= = = 0.79
s2X 32.8
. 25.9 .
a = Ȳn − b · X̄n = 183.8 − · 179.6 = 41.98
32.8
Za každý centimetr rozdílu ve výšce otců očekáváme průměrný rozdíl 0.79 centimetru ve výšce
jejich synů. Odhady parametrů můžeme v R získat pomocí lm(height_son∼height_father).
190
+
188
+
186
height_son
184
+
182
180
+
178
height_father
Se
R2 = 1 − ,
ST
Čím je koeficient determinace R2 blíže jedné, tím přesněji lineární model odpovídá datům.
R2 můžeme interpretovat jako podíl variability v datech, která je vysvětlená lineárním
modelem.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 153
10 LINEÁRNÍ REGRESE BI-PST, ZS 2022/23, Přednáška 1-12
H0 : β = 0 proti HA : β 6= 0.
H0 : Yi = α + εi proti HA : Yi = α + βxi + εi .
Call:
lm(formula = height_son ~ height_father)
Residuals:
1 2 3 4 5
0.2012 2.0427 -4.1159 0.7256 1.1463
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 41.9817 43.4272 0.967 0.4050
height_father 0.7896 0.2417 3.267 0.0469 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
p-hodnota příslušná testu hypotézy H0 : β = 0 je 0.0469, tedy je menší než α = 5%. Na hladině
významnosti 5% tak můžeme zamítnout hypotézu, že výšky synů na výšce jejich otců nezávisí.
154
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 10.2 Regresní model
Ŷ = a + b · x.
Můžeme také najít (1 − α)100% interval spolehlivosti predikce, tedy interval, kde se bude
predikovaná hodnota nacházet se zadanou vysokou pravděpodobností:
s
√ 1 (x − x̄n )2
a + b · x ± tα/2,n−2 s2 + Pn 2
n i=1 (xi − x̄n )
Zobrazíme-li regresní přímku a meze intervalu spolehlivosti predikce jako funkci x, získáme
intervaly spolehlivosti kolem regresní přímky.
Region, ve kterém leží celá regresní přímka s pravděpodobností 1 − α, nazýváme pás
spolehlivosti pro regresní přímku. Lze zkonstruovat pomocí Fisherova-Snedecorova
q F-rozdělení
nahrazením tα/2,n−2 v předchozím vztahu kritickou hodnotou 2Fα/2,2,n−2 .
Ŷ = a + b · x
.
= 41.98 + 0.79 · 175
.
= 180.2 cm.
(174.9, 185.5).
Příklad 10.10 (– koncentrace kyseliny mléčné). Zjišťovalo se, kolik kyseliny mléčné je ve
100 ml krve u matek (hodnoty xi ) a u jejich novorozenců (hodnoty Yi ) těsně po porodu.
xi 40 64 34 15 57 45
Yi 33 46 23 12 56 40
Předpokládáme lineární závislost mezi koncentrací u matek a koncentrací u jejich novorozenců.
Odhady regresních parametrů získáme jako:
P6
i=1 (xi − x̄n )(Yi − Ȳn )
b= P6 2
= 0.8543,
i=1 (xi − x̄n )
a = Ȳn − b x̄n = −1.3082.
0∈
/ (0.404, 1.305)
a nulovou hypotézu zamítáme. Závislost je tedy statisticky významná.
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 155
10 LINEÁRNÍ REGRESE BI-PST, ZS 2022/23, Přednáška 1-12
60
pás spolehlivosti pro regresnı́ přı́mku
40
20 y=a+b·x
156
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák