Download as pdf or txt
Download as pdf or txt
You are on page 1of 156

BI-PST – Pravděpodobnost a statistika

Přednáška 1-12: Skripta


Zimní semestr 2022/2023

Přednášející:
Mgr. Petr Novák, Ph.D.

Katedra aplikované matematiky


Fakulta informačních technologií
České vysoké učení technické v Praze

c 2011–2022 Rudolf B. Blažek, Roman Kotecký, Daniel Vašata, Jitka Hrabáková,
Petr Novák

Obsah
Organizace předmětu 5
Podmínky absolvování . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Doporučená literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1 Základní pojmy pravděpodobnosti 6


1.1 Motivace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.1 Klasická definice pravděpodobnosti . . . . . . . . . . . . . . . . . . . . 6
1.1.2 Geometrická definice pravděpodobnosti . . . . . . . . . . . . . . . . . 7
1.2 Experiment, pravděpodobnostní prostor . . . . . . . . . . . . . . . . . . . . . 9
1.2.1 Prostor elementárních jevů . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.2 Náhodné jevy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.3 Pravděpodobnostní míra . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Vlastnosti pravděpodobnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.1 Spojitost pravděpodobnosti . . . . . . . . . . . . . . . . . . . . . . . . 16

2 Podmíněná pravděp. a nezávislost 18


2.1 Podmíněná pravděpodobnost . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.1 Rozklad pravděpodobnosti a Bayesova věta . . . . . . . . . . . . . . . 20
2.1.2 Pravděpodobnostní stromy . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2 Nezávislost náhodných jevů . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
OBSAH BI-PST, ZS 2022/23, Přednáška 1-12

3 Náhodné veličiny 28
3.1 Definice náhodné veličiny, distribuční funkce . . . . . . . . . . . . . . . . . . . 28
3.2 Diskrétní náhodné veličiny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3 Spojité náhodné veličiny, hustota . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.4 Funkce náhodné veličiny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.5 Kvantilová funkce a simulace . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.6 Charakteristiky náhodných veličin . . . . . . . . . . . . . . . . . . . . . . . . 42
3.6.1 Střední hodnota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.6.2 Rozptyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.6.3 Obecné momenty náhodné veličiny . . . . . . . . . . . . . . . . . . . . 49
3.6.4 Momentová vytvořující funkce . . . . . . . . . . . . . . . . . . . . . . 51
3.6.5 Kvantily . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.7 Důležitá diskrétní rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.1 Konstantní náhodná veličina . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.2 Bernoulliho (Alternativní) rozdělení . . . . . . . . . . . . . . . . . . . 56
3.7.3 Binomické rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.7.4 Indikátor jevu – Bernoulliho náhodná veličina . . . . . . . . . . . . . . 61
3.7.5 Geometrické rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.7.6 Poissonovo rozdělení – motivace . . . . . . . . . . . . . . . . . . . . . 64
3.7.7 Poissonovo rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.7.8 Shrnutí důležitých diskrétních rozdělení . . . . . . . . . . . . . . . . . 67
3.8 Důležitá spojitá rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.8.1 Rovnoměrné rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.8.2 Exponenciální rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.8.3 Normální rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.8.4 Standardizace obecné náhodné veličiny . . . . . . . . . . . . . . . . . . 72
3.8.5 Standardizace normální náhodné veličiny . . . . . . . . . . . . . . . . 72
3.8.6 Shrnutí důležitých spojitých rozdělení . . . . . . . . . . . . . . . . . . 74

4 Náhodné vektory 75
4.1 Diskrétní náhodné vektory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.1.1 Diskrétní sdružené rozdělení . . . . . . . . . . . . . . . . . . . . . . . . 76
4.1.2 Diskrétní marginální rozdělení . . . . . . . . . . . . . . . . . . . . . . 77
4.1.3 Nezávislost diskrétních náhodných veličin . . . . . . . . . . . . . . . . 77
4.1.4 Diskrétní podmíněné rozdělení . . . . . . . . . . . . . . . . . . . . . . 79
4.1.5 Podmíněná střední hodnota diskrétní náhodné veličiny . . . . . . . . . 80
4.2 Spojité náhodné vektory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.2.1 Spojité sdružené rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.2.2 Spojité marginální rozdělení . . . . . . . . . . . . . . . . . . . . . . . . 82
4.2.3 Nezávislost spojitých náhodných veličin . . . . . . . . . . . . . . . . . 83
4.2.4 Spojité podmíněné rozdělení . . . . . . . . . . . . . . . . . . . . . . . . 84
4.2.5 Podmíněná střední hodnota spojité náhodné veličiny . . . . . . . . . . 85
4.3 Funkce náhodného vektoru . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.3.1 Součet náhodných veličin . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.3.2 Součet náhodných veličin – momentová vytvořující funkce . . . . . . . 88
4.3.3 Střední hodnota funkce náhodných veličin . . . . . . . . . . . . . . . . 89
4.3.4 Střední hodnota součtu náhodných veličin . . . . . . . . . . . . . . . . 89

2
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 OBSAH

4.4 Kovariance a korelace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90


4.4.1 Nekorelované náhodné veličiny . . . . . . . . . . . . . . . . . . . . . . 91
4.4.2 Rozptyl součtu náhodných veličin . . . . . . . . . . . . . . . . . . . . . 92

5 Limitní věty 96
5.1 Odhadování vlastností experimentu . . . . . . . . . . . . . . . . . . . . . . . . 96
5.1.1 Odhadování střední hodnoty . . . . . . . . . . . . . . . . . . . . . . . 96
5.2 Základní nerovnosti pro důkaz slabého ZVČ . . . . . . . . . . . . . . . . . . . 96
5.2.1 Markovova nerovnost . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.2.2 Čebyševova nerovnost . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.3 Zákony velkých čísel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.3.1 Charakteristiky průměru náhodných veličin . . . . . . . . . . . . . . . 99
5.3.2 Slabý zákon velkých čísel . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.3.3 Silný zákon velkých čísel . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.4 Centrální limitní věta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.4.1 Konvergence v distribuci . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.4.2 Centrální limitní věta . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

6 Základní pojmy statistiky 109


6.1 Statistické metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.2 Náhodný výběr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.2.1 Kroky statistického uvažování . . . . . . . . . . . . . . . . . . . . . . . 110
6.3 Odhad tvaru rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6.3.1 Histogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6.3.2 Empirická distribuční funkce . . . . . . . . . . . . . . . . . . . . . . . 112

7 Bodové odhady 115


7.1 Úvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
7.1.1 Nejužívanější bodové odhady . . . . . . . . . . . . . . . . . . . . . . . 115
7.2 Vlastnosti bodových odhadů . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
7.2.1 Výběrový průměr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
7.2.2 Výběrový rozptyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.3 Metoda momentů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
7.3.1 Odhad rozptylu metodou momentů . . . . . . . . . . . . . . . . . . . . 119
7.4 Metoda maximální věrohodnosti . . . . . . . . . . . . . . . . . . . . . . . . . 120
7.4.1 Odhad parametrů normálního rozdělení . . . . . . . . . . . . . . . . . 121

8 Intervalové odhady 123


8.1 Intervaly spolehlivosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.1.1 Jednostranné intervaly spolehlivosti . . . . . . . . . . . . . . . . . . . 123
8.1.2 Obecný postup sestavení intervalů spolehlivosti . . . . . . . . . . . . . 124
8.2 Intervaly spolehlivosti pro střední hodnotu . . . . . . . . . . . . . . . . . . . . 124
8.2.1 Při známém rozptylu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
8.2.2 Při neznámém rozptylu . . . . . . . . . . . . . . . . . . . . . . . . . . 128
8.3 Intervaly spolehlivosti pro rozptyl . . . . . . . . . . . . . . . . . . . . . . . . . 132


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 3
OBSAH BI-PST, ZS 2022/23, Přednáška 1-12

9 Testování hypotéz 134


9.1 Princip testování hypotéz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
9.2 Parametrické testy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
9.3 Testy o parametrech normálního rozdělení . . . . . . . . . . . . . . . . . . . . 137
9.4 Testy hypotéz založené na CLV . . . . . . . . . . . . . . . . . . . . . . . . . . 138
9.5 Kritické obory a testové statistiky . . . . . . . . . . . . . . . . . . . . . . . . 139
9.6 Dvouvýběrové a párové problémy . . . . . . . . . . . . . . . . . . . . . . . . . 142

10 Lineární regrese 146


10.1 Kovariance a korelace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
10.2 Regresní model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
10.2.1 Metoda nejmenších čtverců pro odhady parametrů regresní přímky . . 151
10.2.2 Přesnost regresního modelu . . . . . . . . . . . . . . . . . . . . . . . . 153
10.2.3 Testování lineární závislosti . . . . . . . . . . . . . . . . . . . . . . . . 154
10.2.4 Intervaly predikce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

4
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 OBSAH

Organizace předmětu
Podmínky absolvování
• Cvičení:

– bude se psát 6 testů po 6 bodech, započte se 5 nejlepších – až 30b


– bude zadána domácí úloha – až 10b
– k zápočtu je nutno získat alespoň 20b (z možných 40b).

• Zkouška:

– písemná zkouška, maximálně 60b


– minimum nutné ke složení písemné zkoušky je 30b
– body ze zkoušky a z cvičení se sčítají
– možnost přilepšit si u dobrovolné zkoušky z teorie až o 5b
– ke zkoušce z teorie mohou jen ti, kdo úspěšně složili písemnou část
– právo veta: zásadní neznalost u zkoušky z teorie může vést ke ztrátě zkouškového
termínu a povinnosti složit písemnou zkoušku znovu.

Doporučená literatura
České tituly:

• Tomáš Hobza: Matematická statistika, FJFI (online)

• Jiří Pavlík: Aplikovaná statistika, skripta VŠCHT (online)

• Jiří Anděl: Základy matematické statistiky, matfyzpress (2007) (pokročilé)

Anglické tituly:

• D. P. Bertsekas & J. N. Tsitsiklis: Introduction to Probability, Athena Scientific MIT


(2008)

• G. R. Grimmett & D. R. Stirzaker: Probability and Random Processes, Oxford University


Press (2001)

• Ch. M. Grinstead & J. L. Snell: Introduction to Probability, AMS (1997) – (online)

Více viz courses.fit.cvut.cz/BI-PST


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 5
1 ZÁKLADNÍ POJMY PRAVDĚPODOBNOSTI BI-PST, ZS 2022/23, Přednáška 1-12

1 Základní pojmy pravděpodobnosti


1.1 Motivace
Pravděpodobnost a statistika
Cíl: Porozumět fungování světa v situacích, kde hraje roli náhoda.

Co považujeme za náhodný děj? V běžném životě se často setkáváme s procesy


(experimenty, testy, přírodními jevy,...), u kterých nejsme schopni předem s jistotou
určit, jaký z možných výsledků nastane.

Přesná predikce není často možná, protože je studovaný jev buďto příliš komplexní,
nebo nemáme k dispozici všechny potřebné informace.

Říkáme potom, že výsledek je nepředvídatelný a určuje ho náhoda.

Teorie pravěpodobnosti vs. matematická statistika


Teorie pravděpodobnosti se snaží kvantifikovat náhodu matematicky.

• Výsledkům pokusu přiřazujeme jejich pravděpodobnost, udávající ideální podíl pří-


padů, kdy daný výsledek nastane.

• Na základě jednoduchých modelů dokážeme řešit složité problémy.

• Např. pokud máme k dispozici vyváženou minci, můžeme spočítat, jaká je šance,
že nám z 1000 hodů padne 100 orlů.

Matematická statistika odhaduje náhodnost pomocí experimentálních dat.

• Na základě výsledků opakovaného pokusu navrhujeme a ověřujeme pravděpodob-


nostní modely.

• Např. z 1000 hodů mincí můžeme zkusit odhadnout, jak často padá hlava nebo
orel.

• Pokud nám padne orel jen 100 krát, znamená to, že mince není vyvážená?

1.1.1 Klasická definice pravděpodobnosti

• Konečný počet n vzájemně různých výsledků nějakého pokusu (např. hod kostkou).
• Předpokládáme, že všechny výsledky jsou stejně pravděpodobné.
• Jestliže právě m z těchto výsledků odpovídá realizaci jevu A (např. padlo sudé číslo),
potom definujeme pravděpodobnost jevu A jako
m počet příznivých výsledků
P(A) = = .
n počet všech možných výsledků

6
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 1.1 Motivace

Nedokonalost této definice:

• Myšlenkový experiment. Často hod mincí či kostkou, výběr kuličky z krabičky, atp.

• Co když je kostka nevyvážená?

• Co když máme nekonečně nebo dokonce nespočetně mnoho možností?

Příklad 1.1 (– Hod dvěma vyváženými mincemi). Jaká je pravděpodobnost, že padne alespoň
jednou hlava (heads)?
Počet dvojic, ve kterých je alespoň jedna hlava, je 3. Celkově jsou 4 možnosti
(HH,HO,OH,OO). Tedy:
3
P(alespoň jedna H) = .
4
Příklad 1.2 (– Hod vyváženou šestistěnnou kostkou). Jaká je pravděpodobnost, že padne
sudé číslo?
Sudá čísla jsou 3 (2,4,6). Celkově je 6 možností. Tedy:

3 1
P(sudé) = = .
6 2

X Zopakujte si základy kombinatoriky.

1.1.2 Geometrická definice pravděpodobnosti

Pokud

• výsledky nastávají v nějakém geometrickém objektu či množině Ω konečné „velikosti“


(délky, plochy, objemu)

• a každý výsledek (např. bod) je stejně pravděpodobný (anebo každá oblast stejné „velikosti“
je stejně pravděpodobná),

pak pravděpodobnost jevu A definujeme jako „ relativní velikost “ množiny A

„velikost“ množiny příznivých výsledků „velikost“ A


P(A) = = .
„velikost“ množiny všech možných výsledků „velikost“ Ω

Mluvíme pak o rovnoměrném rozložení (rozdělení) výsledků experimentu.


Nedokonalost této definice:

• Jak zavést nerovnoměrnost?

• Co s nekonečně velkými objekty?

Příklad 1.3 (– Romeo a Julie). Romeo a Julie se mají setkat na tajném místě mezi polednem
a 1 hod. po poledni. Každý dorazí v náhodném okamžiku, rovnoměrně zvoleném v tomto
rozmezí, ale počká jen 15 minut. Pokud ten druhý nedorazí, odejde. Jaká je pravděpodobnost,
že se setkají?


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 7
1 ZÁKLADNÍ POJMY PRAVDĚPODOBNOSTI BI-PST, ZS 2022/23, Přednáška 1-12

Romeo
B
1/4

0 1/4 Julie 1

Celková plocha je 1. Vybarvená oblast odpovídá situacím kdy se setkají.

1 − (3/4) · (3/4) 7
P(B) = = .
1 16

8
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 1.2 Experiment, pravděpodobnostní prostor

1.2 Experiment, pravděpodobnostní prostor


Abychom se mohli zabývat obecnou definicí pravděpodobnosti, musíme si nejdříve korektně
zavést jevy – množiny, jimž budeme přiřazovat pravděpodobnost. Proto formálně definujeme
tzv. experiment, neboli pravděpodobnostní prostor jako trojici

E = (Ω, F, P),

kde Ω zahrnuje všechny výsledky experimentu a F je kolekce všech jevů, kterým umíme (nebo
smíme) přiřadit či spočítat pravděpodobnost P.

Definice 1.4. Množinu všech možných výsledků daného experimentu značíme Ω a nazýváme
ji prostor elementárních jevů nebo také výběrový prostor (sample space).
Libovolný možný výsledek ω ∈ Ω nazýváme elementární jev (outcome).

Elementární jevy v Ω, tedy výsledky experimentu, musí být vzájemně exkluzivní a v sou-
hrnu vyčerpávající.

1.2.1 Prostor elementárních jevů


První krok tedy vždy je:
analýza možných výsledků vedoucí k volbě prostoru elementárních jevů Ω.
Elementární jevy v Ω by měly být
vzájemně exkluzivní a ve svém souhrnu vyčerpávající.
Vzájemně exkluzivní: elementární jevy: na kostce padlo 1 nebo 2, 1 nebo 3,. . . ? Když padne
1, nebylo by jasné, o který z nich jde.
Ve svém souhrnu vyčerpávající: každý výsledek experimentu je možno interpretovat jako
některý elementární jev.
Při házení mincí bychom mohli mít Ω = {H, O, X}, kde X označuje výsledek, při kterém
mince zůstala na hraně.
Prostor elementárních jevů by měl být dostatečně detailní, aby rozlišil výsledky, které
vnímáme jako různé, měl by však pominout nepodstatné detaily.

Příklady 1.5. • Hod mincí: Ω = {H, O}

• Hod kostkou: Ω = {1, 2, 3, 4, 5, 6}

• Hod dvěma mincemi: Ω = {H, O} × {H, O} ≡ {(H, H), (H, O), (O, H), (O, O)}

• Výška rakety nad povrchem země: Ω = [0, ∞)

• Náhodný text emailu v kódování UTF-32 (constant length) o maximální velikosti 1MB.
Maximální počet znaků ve zprávě je

1 MB 220 bytes
= = 218 = 262144.
32 bits 4 bytes

Tudíž: Ω = {(x1 , x2 , . . . , x218 )|xi ∈ N, 0 ≤ xi < 232 , pro všechna i}


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 9
1 ZÁKLADNÍ POJMY PRAVDĚPODOBNOSTI BI-PST, ZS 2022/23, Přednáška 1-12

Příklady 1.6. • Série n hodů kostkou: Ω = {1, 2, 3, 4, 5, 6}n


• Série(n hodů kostkou, při které nás zajímá jen
) to kolikrát padne která strana:
6 X
Ω= (k1 , k2 , k3 , k4 , k5 , k6 ) ∈ Z6+ : ki = n
i=1

• Hod šipkou do terče T ⊂ R2 : Ω = T ∪{∗}, kde {∗} je jednobodová množina reprezentující


výsledek „ šipka netrefila terč “
Pokud je terč rozdělen na 5 pásem a jde nám jen o to do kterého pásma se šipka zabodla,
je Ω = {1, 2, 3, 4, 5, ∗}
• Házení mincí dokud nepadne první orel: spočetný prostor Ω = {ω1 , ω2 , ω3 , . . . },
ωi : výsledek kdy prvních i − 1 hodů padla hlava a i-tý hod je orel
• Házení mincí nekonečně mnohokrát: nekonečný prostor Ω = {H, O}N

Znázornění elementárních jevů pro sérii experimentů


Pro dva hody kostkou:
• souřadnicový popis
• stromový diagram.
Každá posloupnost výsledků jednotlivých hodů odpovídá jednomu listu a je jednoznačně
určena cestou od kořene stromu k tomuto listu (na obr. jsou explicitně označeny jen 3 listy).

6 1
1,5
5 2
druhý hod

4 3
4
3
2 5 5,4
1 6
1 2 3 4 5 6 6,6
první hod

1.2.2 Náhodné jevy


Náhodným jevem A budeme rozumět množinu elementárních jevů – tj. podmnožinu A ⊂ Ω,
které potřebujeme přiřadit pravděpodobnost.
Příklad 1.7 (– Hod dvěma mincemi). Vyjádřete množinově jev „ padne alespoň jednou
hlava“.
Prostor elementárních jevů je Ω = {(H, H), (H, O), (O, H), (O, O)}.
Jev A označující „ padla alespoň jedna hlava“ bude tedy:
A = {(H, H), (H, O), (O, H)} ⊂ Ω.
Příklad 1.8 (– Hod šestistěnnou kostkou). Vyjádřete množinově jev „ padlo sudé číslo“.
Sudá čísla jsou 2, 4 a 6. Jev A označující „ padlo sudé číslo“ bude tedy
A = {2, 4, 6} ⊂ Ω.

10
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 1.2 Experiment, pravděpodobnostní prostor

Operace s náhodnými jevy


S náhodnými jevy provádíme všechny klasické množinové operace. V teorii pravděpodob-
nosti se však pro tyto operace používá speciální terminologie:
• Ac doplněk jevu A – opačný jev
• A∩B průnik jevů A a B – nastává současně A a B
• A∪B sjednocení A a B – buď A nebo B (nebo oba)
• A\B rozdíl A a B – A, ale ne B
• A⊂B podmnožina – když A, tak B
• ∅ prázdná množina – nemožný jev
• Ω výběrový prostor – jistý jev
• ω prvek Ω – elementární jev
Naším cílem je umět přiřadit pravděpodobnosti i výsledkům těchto operací.

Struktura množiny náhodných jevů


Někdy je nepotřebné, nebo i nemožné přiřadit pravděpodobnosti všem možným podmno-
žinám Ω (tj. ne všechny možné podmnožiny Ω nazýváme jevy).
Pravděpodobnosti však potřebujeme umět přiřadit i výsledkům všech předchozích mno-
žinových operací, a to i při jejich spočetném opakování.
Ukazuje se, že stačí uvažovat náhodné jevy jako prvky nějaké σ-algebry F:
Definice 1.9. Systém F podmnožin prostoru Ω nazýváme σ-algebrou (angl. též σ-field)
jestliže jsou splněny následující podmínky:
i) ∅ ∈ F – obsahuje nemožný jev
ii) když A ∈ F, tak Ac ∈ F – obsahuje opačný jev
S∞
iii) když A1 , A2 , . . . ∈ F, tak i=1 Ai ∈ F – obsahuje spočetné sjednocení.

Poznámka: F obsahuje i jistý jev Ω.


Při specifikaci pravděpodobnostního modelu tedy vždy uvažujeme dvojici (Ω, F), kterou
nazýváme měřitelný prostor.
Zadání F nám říká, jaké jevy můžeme „ pozorovat “ a také měřit jejich pravděpodobnost.
Příklady 1.10. Možné σ-algebry
• F = {∅, Ω} je σ-algebra
• pro libovolné A ⊂ Ω je F = {∅, A, Ac , Ω} σ-algebra
• F = 2Ω – všechny podmnožiny tvoří σ-algebru.
Nejpřímočařejší volba pro konečnou nebo spočetnou Ω.
• Borelovská σ-algebra B – nejmenší σ algebra obsahující všechny otevřené intervaly.
Nejpřímočařejší volba pro nespočetnou Ω ⊂ Rd .


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 11
1 ZÁKLADNÍ POJMY PRAVDĚPODOBNOSTI BI-PST, ZS 2022/23, Přednáška 1-12

1.2.3 Pravděpodobnostní míra

Definice 1.11. Pravděpodobnostní míra na (Ω, F) je funkce P : F → R splňující:

i) nezápornost: pro každé A ∈ F platí P(A) ≥ 0

ii) normalizace: P(Ω) = 1,

iii) σ−aditivita: když jsou A1 , A2 , . . . ∈ F vzájemně disjunktní jevy (Ai ∩ Aj = ∅ pro ∀i, j :
i 6= j), tak
∞ ∞
!
[ X
P Ai = P(Ai ).
i=1 i=1

Trojici E = (Ω, F, P) potom nazýváme experiment nebo pravděpodobnostní prostor.

Z definice plyne, že pro každé A ∈ F platí 0 ≤ P(A) ≤ 1. Pravděpodobnost se také uvádí


v procentech, tedy 0% až 100%. Volba P určuje, co si v daném případě představujeme pod
pojmem „ náhodný “. Vágní zadání však může vést k paradoxům.

Bertrandův paradox

Příklad 1.12 (– Bertrandův paradox (Joseph Bertrand, 1889)). Náhodná tětiva na jednot-
kové kružnici.
Jaká je pravděpodobnost, že náhodně umístěná tětiva χ v jed-
notkové kružnici bude delší, než strana ` (libovolného) vepsaného
rovnostranného trojúhelníku?
Tedy P(A), kde A = {|χ| > `}.
To záleží na tom, co přesně míníme slovem „náhodná“:
Možnost 1 : Vybereme rovnoměrně náhodně střed χ:

Ω1 = {x ∈ R2 : |x| < 1}, A1 = {x ∈ Ω1 : |x| < 1/2},


π(1/2)2 1
P1 (A1 ) = 2
= .
π1 4

Bertrandův paradox

Příklad 1.12 (– Bertrandův paradox– pokračování). Náhodná tětiva na jednotkové kružnici


Možnost 2 : Vybereme rovnoměrně náhodně úhel a směr (irele-
vantní díky symetrii) tětivy χ:
60◦ 1
Ω2 = (0◦, 180◦ ], A2 = (120◦, 180◦ ], P2 (A2 ) = = .
180◦ 3
Možnost 3 : Vybereme rovnoměrně náhodně vzdálenost tětivy χ od
středu a (opět irelevantní) směr:
1
Ω3 = [0, 1), A3 = [0, 1/2), P3 (A3 ) = .
2

12
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 1.3 Vlastnosti pravděpodobnosti

Definice rovnoměrné pravděpodobnosti


Definice pravděpodobnosti pro rovnoměrné rozdělení konečného počtu možností:
Pokud Ω je konečná a realizace jsou stejně pravděpodobné:

#A počet příznivých výsledků


P(A) = = .
#Ω počet všech výsledků

Geometrická definice rovnoměrné pravděpodobnosti:


Buď Ω libovolný prostor s konečnou mírou µ, tj. umíme měřit velikosti (délku, plochu,
objem, hmotnost, čas, apod.). Pro náhodný jev A ⊂ Ω definujeme:

µ(A) velikost A
P(A) = = .
µ(Ω) velikost Ω

Snadno ověříme, že vyhovují definici pravděpodobnostní míry.

1.3 Vlastnosti pravděpodobnosti


Věta 1.13. Nechť A a B jsou náhodné jevy na pravděpodobnostním prostoru s mírou P.
Potom platí:

i) P(∅) = 0

ii) jestliže A a B jsou vzájemně disjunktní, pak P(A ∪ B) = P(A) + P(B)

iii) P(Ac ) = 1 − P(A)

iv) P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

v) pokud A ⊂ B, tak P(A) ≤ P(B) - monotonie

Důsledky:

• P(A) ≤ 1 – z v)

• P(A ∪ B) ≤ P(A) + P(B) – z iv)

Geometrická definice pravděpodobnosti jevu A:

plocha(A) pokud výsledky experimentu


P(A) =
plocha(Ω) jsou rozloženy v rovnoměrně
Vennův diagram:

A
plocha(A)
P(A) =
plocha(Ω)


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 13
1 ZÁKLADNÍ POJMY PRAVDĚPODOBNOSTI BI-PST, ZS 2022/23, Přednáška 1-12

Pravděpodobnost doplňku jevu:


⌦ _
A
A
P(Ac ) = 1 − P(A)

Heuristika:

plocha(Ac ) = plocha(Ω) − plocha(A)

plocha(Ac ) plocha(Ω) plocha(A)


= −
plocha(Ω) plocha(Ω) plocha(Ω)

P(Ac ) = 1 − P(A)

Pravděpodobnost sjednocení disjunktních jevů:



A B
P(A ∪ B) = P(A) + P(B)

Pravděpodobnost sjednocení jevů:


A B
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

Heuristika pomocí sčítání ploch:


⌦ ⌦ ⌦
A B A B A B
+ =


A B
Průnik jsme přičetli dvakrát. Musíme jej tedy odečíst.

Důkaz. i) Vytvoříme posloupnost disjunktních jevů: Ai = ∅ pro všechna i ∈ N z iii) vlast-

14
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 1.3 Vlastnosti pravděpodobnosti

nosti definice pravděpodobnosti dostáváme


∞ ∞
!
[ X
P(∅) = P ∅ = P(∅) ,
i=1 i=1

což může být splněno jen pro P(∅) = 0.


ii) Vytvoříme posloupnost disjunktních jevů: A1 = A, A2 = B a Ai = ∅ pro i > 2.
Z bodu i) a iii) vlastnosti definice pravděpodobnosti dostáváme
∞ ∞
!
[ X
P(A ∪ B) = P Ai = P(Ai ) = P(A) + P(B).
i=1 i=1

iii) 1 = P(Ω) = P(A ∪ Ac ) = P(A) + P(Ac )

Důkaz. (pokračování)
iv) Množinu A ∪ B můžeme napsat jako disjunktní sjednocení A ∪ (B \ A).
Z bodu ii) plyne P(A ∪ B) = P(A) + P(B \ A).
Protože, P(B) = P(B \ A) + P(A ∩ B),
dostáváme finálně:

B
A
P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
v) Pokud A ⊂ B, tak A ∩ B = A.

P(B) = P(B \ A) + P(A ∩ B) = P(B \ A) + P(A) ≥ P(A).

Věta 1.14. Nechť A1 , A2 , . . . jsou náhodné jevy na pravděpodobnostním prostoru s mírou P.


Potom platí:
∞ ∞
!
[ X
i) σ−subaditivita: P Ai ≤ P(Ai )
i=1 i=1
n
! !
|J|−1
[ X \
ii) princip inkluze-exkluze: P Ai = (−1) P Ai
i=1 J⊂{1,2,...,n} i∈J
J6=∅
Pro 3 jevy: P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) +
P(A ∩ B ∩ C)

Vlastnosti pravděpodobnosti – důkaz


∞ ∞ i−1
!
[ [ [
Důkaz. i) Množinu Ai můžeme zapsat jako disjunktní sjednocení Ai \ Ak
i=1 i=1 k=1
Z iii) vlastnosti definice pravděpodobnosti dostáváme
∞ ∞ i−1 ∞ i−1 ∞
! !! !
[ [ [ X [ X
P Ai =P Ai \ Ak = P Ai \ Ak ≤ P(Ai ).
i=1 i=1 k=1 i=1 k=1 i=1


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 15
1 ZÁKLADNÍ POJMY PRAVDĚPODOBNOSTI BI-PST, ZS 2022/23, Přednáška 1-12

ii) Dokážeme tvrzení pro tři jevy A, B, C: Množinu A ∪ B ∪ C můžeme napsat jako dis-
junktní sjednocení A ∪ ((B ∪ C) \ A).
Z bodu ii) předchozí věty plyne P(A ∪ B ∪ C) = P(A) + P((B ∪ C) \ A).
Protože P(B ∪ C) = P((B ∪ C) \ A) + P(A ∩ (B ∪ C)), dostáváme:
P(A ∪ B ∪ C) = P(A) + P(B ∪ C) − P((A ∩ B) ∪ (A ∩ C)).
a znovu aplikujeme bod ii) předchozí věty na:
P(B ∪ C) a P((A ∩ B) ∪ (A ∩ C))
P(B ∪ C) = P(B) + P(C) − P(B ∩ C)
P((A ∩ B) ∪ (A ∩ C)) = P(A ∩ B) + P(A ∩ C) − P(A ∩ B ∩ A ∩ C)

C
B
A

finálně dostáváme:
P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C)

1.3.1 Spojitost pravděpodobnosti


Věta 1.15. Nechť A1 , A2 , . . . je posloupnost náhodných jevů rostoucí ve smyslu inkluze, tj.
A1 ⊂ A2 ⊂ A3 ⊂ . . . . Označme

[
A= Ai .
i=1

Potom P(A) = lim P(Ai ).


i→∞
Obdobně nechť B1 , B2 , . . . je posloupnost náhodných jevů klesající ve smyslu inkluze, tj.
B1 ⊃ B2 ⊃ B3 ⊃ . . . . Označme

\
B= Bi .
i=1

Potom P(B) = lim P(Bi ).


i→∞

Důkaz. Dokážeme první část tvrzení: A můžeme zapsat jako disjunktní sjednocení A =

[
(An \ An−1 ). Proto platí:
n=1
∞ ∞ N
!
[ X X
P(A) = P (An \ An−1 ) = P(An \ An−1 ) = lim P(An \ An−1 )
N →∞
n=1 n=1 n=1
= lim P(AN )
N →∞

Druhou část dokážeme pomocí De Morganových zákonů a první části:


 !C 
∞ ∞ ∞
! !
\ [ [
P(B) = P Bn = P BnC =1−P BnC
n=1 n=1 n=1

16
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 1.3 Vlastnosti pravděpodobnosti

Množiny BnC splňují předpoklady z první části a tedy:


 
C C
P(B) = 1 − lim P(BN ) = lim 1 − P(BN ) = lim P(BN )
N →∞ N →∞ N →∞

Úloha o rozdělení sázky – Chevalier de Méré, 1654

• Dva hráči, A a B, hrají opakovaně spravedlivou hru (kde oba mají stejnou šanci na
výhru), dokud jeden hráč nedosáhne 6 vítězství.

• Oba hráči vsadili stejnou částku, vítěz bere vše.

• Série her je předčasně přerušena, přičemž zatím:

– A vyhrál 5x,
– B vyhrál 3x.

• Jak by si měli rozdělit vloženou sázku?

Úloha o rozdělení sázky – řešení


Blaise Pascal a Pierre de Fermat:

• Pokud by se ve hře pokračovalo, jak by hráč B mohl vyhrát 6x?

– Hráči A stačí vyhrát pouze jednou.


– Takže hráč B musí vyhrát všechny 3 následující hry
– V následujících třech hrách je osm stejně pravděpodobných výsledků:

{(AAA), (AAB), (ABA), (ABB), (BAA), (BAB), (BBA), (BBB)}.

– P(B vyhraje 1. a 2. a 3. příští hru) = P(BBB) = 1/8

• Pro výhru hráče A pak máme:

P(A vyhraje 1. nebo 2. nebo 3. příští hru)


= P(A vyhraje 1. hru)
+ P(A prohraje 1. a vyhraje 2. hru)
+ P(A prohraje 1. a 2. a vyhraje 3. hru)
= P(A • •) + P(BA•) + P(BBA) = 4/8 + 2/8 + 1/8 = 7/8.

Tedy sázku by si měli rozdělit v poměru sedm dílů pro A a jeden díl pro B.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 17
2 PODMÍNĚNÁ PRAVDĚP. A NEZÁVISLOST BI-PST, ZS 2022/23, Přednáška 1-12

2 Podmíněná pravděpodobnost a nezávislost

2.1 Podmíněná pravděpodobnost

Jak se změní pravděpodobnost ve chvíli, kdy máme částečnou informaci o výsledku experi-
mentu?

Příklad 2.1. Když hodíme vyváženou kostkou, bez další informace víme, že P(6) = 1/6.
Pokud navíc víme, že padlo sudé číslo, je jasné, že P(6|sudé) = 1/3.

Definice 2.2. Buďte A a B náhodné jevy, kde P(B) > 0. Podmíněnou pravděpodobnost jevu
A za podmínky, že nastal jev B, definujeme jako

P(A ∩ B)
P(A|B) = .
P(B)

P(A|B) čteme jako: „ pravděpodobnost A dáno B “, nebo


„ pravděpodobnost A za podmínky B “.

Porozumění definici podmíněné pravděpodobnosti

Příklad 2.3. Uvažujme rovnoměrné rozdělení na množině Ω s konečnou velikostí. Velikostí


zde myslíme např. počet prvků, délku, plochu, objem, dobu trvání, atp. Pravděpodobnost
jevu A je pak definována relativní velikostí vzhledem k velikosti Ω, tedy poměrem

P(A) = velikost(A)/velikost(Ω).

Pokud víme, že určitě nastal jev B, zajímáme se pouze o výsledky, které patří do B. U
jevu A proto nyní také uvažujeme pouze výsledky v B, takže se jedná o A ∩ B.
Pravděpodobnosti pak chápeme jako relativní velikost průniku vzhledem k velikosti B.
Dostáváme

velikost(A ∩ B) velikost(A ∩ B)/velikost(Ω) P(A ∩ B)


P(A|B) = = = .
velikost(B) velikost(B)/velikost(Ω) P(B)

18
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 2.1 Podmíněná pravděpodobnost

Podmíněná pravděpodobnost – Vennův diagram



A B
plocha(A)
P(A) =
plocha(Ω)


A B plocha(část A uvnitř B)
P(A dáno B) =
plocha(B)

plocha(A ∩ B) / plocha(Ω)
P(A|B) =
plocha(B) / plocha(Ω)

P(A ∩ B) P(A ∩ B) = P(A|B) P(B)


P(A|B) =
P(B) P(A ∩ B) = P(B|A) P(A)

P(průnik) = P(jev|podmínka) P(podmínka)

Podmíněná pravděpodobnost – příklady

Příklad 2.4 (– dva hody kostkou). Uvažujme dva hody vyváženou kostkou. Jaká je P(součet >
6 | první = 3)?
Odpověď je jistě 1/2: hodnota při druhém hodu musí být 4, 5 nebo 6.
Formálně: Ω = {1, 2, 3, 4, 5, 6}2 ,
P(A) = |A|/36 pro každou A ⊂ Ω.
Nechť B = {(3, ω2 ) : 1 ≤ ω2 ≤ 6}, A = {(ω1 , ω2 ) : ω1 + ω2 > 6}.
Pak
|A∩B|
P(A ∩ B) 36 |A ∩ B| 3
P(A|B) = = |B| = = .
P(B) |B| 6
36

Příklad 2.5 (– rodina se dvěma dětmi). Trochu těžší příklad: Předpokládejme, že děti se rodí
rovnoměrně a nezávisle. V rodině jsou dvě děti. Jaká je P(oba chlapci|alespoň jeden je chlapec)?
Ω = {DD, DH, HD, HH}.

P(HH ∩ (DH ∪ HD ∪ HH))


P(HH|DH ∪ HD ∪ HH) =
P(DH ∪ HD ∪ HH)
P(HH) 1/4 1
= = = .
P(DH ∪ HD ∪ HH) 3/4 3

P(HH ∩ (HH ∪ HD)) 1


Častý omyl: P(HH|starší je hoch) = P(HH|HH ∪ HD) = = .
P(HH ∪ HD) 2


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 19
2 PODMÍNĚNÁ PRAVDĚP. A NEZÁVISLOST BI-PST, ZS 2022/23, Přednáška 1-12

Vlastnosti podmíněné pravděpodobnosti

Lemma 2.6. Nechť pro jev B platí P(B) > 0. Podmíněná pravděpodobnost P(·|B) je také
pravděpodobnostní mírou, tj. P(·|B) ∈ [0, 1] a splňuje axiomy pravděpodobnosti.

Důkaz. Máme dokázat následující:

i) P(·|B) : F → R,

ii) nezápornost: pro každé A ∈ F platí P(A|B) ≥ 0,


P(Ω ∩ B) P(B)
iii) normalizace: P(Ω|B) = 1, P(Ω|B) = = =1
P(B) P(B)
iv) σ−aditivita: když A1 , A2 , . . . ∈ F jsou vzájemně disjunktní jevy (Ai ∩ Aj = ∅ pro
∀i, j : i 6= j), pak
∞ S∞ S∞ ∞
!
[ P (( i=1 Ai ) ∩ B) P( i=1 (Ai ∩ B)) X
P Ai B = = = P(Ai |B).
i=1
P(B) P(B) i=1

Další vlastnosti podmíněné pravděpodobnosti


Podmíněná pravděpodobnost splňuje též všechny další vlastnosti pravděpodobnosti:

• jestliže A1 a A2 jsou vzájemně disjunktní, pak P(A1 ∪ A2 |B) = P(A1 |B) + P(A2 |B)

• P(A1 ∪ A2 |B) = P(A1 |B) + P(A2 |B) − P(A1 ∩ A2 |B)

• P(Ac |B) = 1 − P(A|B)

• atd.

Poznámky:

• pravděpodobnost P(A|B) „žije“ na B: když A ∩ B = ∅, pak P(A|B) = 0


P(A ∩ B ∩ B) P(A ∩ B)
• P(A ∩ B|B) = = = P(A|B).
P(B) P(B)

2.1.1 Rozklad pravděpodobnosti a Bayesova věta


Úplný rozklad pravděpodobnosti
Ω = B1 ∪ B2 ∪ B3 (disjunktní rozklad)

B1 B2 B3
A
A ∩ B2
A ∩ B1 A ∩ B3

20
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 2.1 Podmíněná pravděpodobnost

Připomenutí:
P(A ∩ Bi )
P(A|Bi ) =
P(Bi )

P(A ∩ Bi ) = P(A|Bi ) P(Bi )

A = A ∩ Ω = A ∩ (B1 ∪ B2 ∪ B3 )
A = (A ∩ B1 ) ∪ (A ∩ B2 ) ∪ (A ∩ B3 )

P(A) = P(A ∩ B1 ) + P(A ∩ B2 ) + P(A ∩ B3 )


P(A) = P(A|B1 ) P(B1 ) + P(A|B2 ) P(B2 ) + P(A|B3 ) P(B3 )

Úplný rozklad pravděpodobnosti v příkladu

Příklad 2.7 (– poruchovost diod). Ve výprodeji jsme výhodně koupili krabici diod, namí-
chaných ze dvou značek. Podstatná část diod je vadná. Víme, že

• 40% diod je z ČR, 60% je dovezených,

• 10% domácích diod je vadných,

• 20% dovezených diod je vadných.

Určete pravděpodobnost, že náhodně vybraná dioda bude vadná. Údaje o chybovosti představují
podmíněné pravděpodobnosti:

P(cz) = 0.4, P(dovoz) = 0.6, P(vadná|cz) = 0.1, P(vadná|dovoz) = 0.2.


Vadné diody rozdělíme podle původu:
P(vadná) = P(vadná ∩ cz) + P(vadná ∩ dovoz).
Pravděpodobnosti průniku přepíšeme pomocí podmíněných:
P(vadná) = P(vadná|cz) · P(cz) + P(vadná|dovoz) · P(dovoz)
= 0.1 · 0.4 + 0.2 · 0.6 = 0.04 + 0.12 = 0.16 = 16%.

Bayesova věta (prohození jevu a podmínky)


Pozorujeme jev A a ptáme se, jaká je pravděpodobnost, že nastala možnost Bj .
Ω = B1 ∪ B2 ∪ B3 (disjunktní rozklad)

B1 B2 B3
A
A ∩ B2
A ∩ B1 A ∩ B3


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 21
2 PODMÍNĚNÁ PRAVDĚP. A NEZÁVISLOST BI-PST, ZS 2022/23, Přednáška 1-12

Připomenutí:
P(A ∩ Bj ) = P(A|Bj ) P(Bj )
P(A) = P(A|B1 ) P(B1 ) + P(A|B2 ) P(B2 ) + P(A|B3 ) P(B3 )

P(A ∩ Bj )
P(Bj |A) =
P(A)

P(A|Bj ) P(Bj )
P(Bj |A) =
P(A|B1 ) P(B1 ) + P(A|B2 ) P(B2 ) + P(A|B3 ) P(B3 )

Bayesova věta v příkladu

Příklad 2.8 (– poruchovost diod, pokračování). Z krabice jsme vybrali diodu a zjistili jsme,
že je vadná.
Jaká je pravděpodobnost, že byla z dovozu? Hledáme opačně podmíněnou pravděpodob-
nost, než máme na vstupu. Z definice podmíněné pravděpodobnosti:
P(dovoz ∩ vadná)
P(dovoz|vadná) = .
P(vadná)
Jmenovatel jsme už našli dříve, čitatel rozepíšeme pomocí opačně podmíněných pravdě-
podobností:

P(vadná|dovoz) P(dovoz)
P(dovoz|vadná) =
P(vadná|cz) P(cz) + P(vadná|dovoz) P(dovoz)
0.2 · 0.6 0.12 12
= = = = 75%.
0.1 · 0.4 + 0.2 · 0.6 0.16 16

Bayesova věta – shrnutí


Soubor vzájemně disjunktních náhodných jevů B1 , B2 , . . . Bn se nazývá rozkladem množiny
n
[
Ω, jestliže Ω = Bi . (Disjunktní: pro každé i 6= j platí Bi ∩ Bj = ∅.)
i=1

Věta 2.9 (o úplném rozkladu pravděpodobnosti). Nechť B1 , B2 , . . . , Bn je rozklad Ω takový,


že ∀i : P(Bi ) > 0. Potom pro každý jev A platí
n
X
P(A) = P(A|Bi ) P(Bi ).
i=1

Věta 2.10 (Bayesova). Nechť B1 , B2 , . . . , Bn je rozklad Ω takový, že ∀i : P(Bi ) > 0 a nechť


A je náhodný jev kde P(A) > 0. Potom platí

P(A|Bj ) P(Bj )
P(Bj |A) = Pn .
i=1 P(A|Bi ) P(Bi )

X lze dokázat i pro n = ∞.

22
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 2.1 Podmíněná pravděpodobnost

Bayesova věta v příkladu


Příklad 2.11 (– spamový filtr). Z analýzy našeho účtu elektronické pošty jsme zjistili, že
• 30% dosud přijatých zpráv byl spam (nevyžádaná pošta).
• V 70% spamových zpráv se vyskytuje slovo „ kopie “.
• Z legitimních zpráv je slovo „ kopie “ obsaženo pouze v 10%.
Určete pravděpodobnost, že zpráva obsahující slovo „ kopie “ je spam – P(S|K).
S množina spamových zpráv, S c = Ω \ S množina legitimních zpráv. K množina zpráv
obsahujících slovo „ kopie “, K c neobsahujících slovo „ kopie “.
P(S) = 0.3, P(S c ) = 0.7, P(K|S) = 0.7, P(K|S c ) = 0.1

P(K|S) P(S)
P(S|K) = =
P(K|S) P(S) + P(K|S c ) P(S c )
0.7 · 0.3 21
= = = 0.75.
0.7 · 0.3 + 0.1 · 0.7 28

2.1.2 Pravděpodobnostní stromy


Pravděpodobnostní stromy slouží k vizualizaci podmíněné pravděpodobnosti. Nejprve si odvo-
díme užitečný vztah – rozšíření vzorce pro průnik dvou jevů, který jsme již odvodili z definice
podmíněné pravděpodobnosti:
P(A ∩ B) = P(A|B) P(B)
Pro tři jevy podobně platí:
P(A ∩ B ∩ C) = P(A) P(B|A) P(C|A ∩ B)
Důkaz – stačí přímo dosadit dle definice podmíněné pravděpodobnosti do pravé strany:
P(B ∩ A) P(C ∩ A ∩ B)
P(A) P(B|A) P(C|A ∩ B) = P(A)
P(A) P(A ∩ B)
= P(A ∩ B ∩ C).

Lemma 2.12 (– Multiplikativní zákon). Pro jevy A1 , . . . , An splňující P(A1 ∩ · · · ∩ An ) > 0


platí:

P(A1 ∩ · · · ∩ An ) =
P(A1 ) P(A2 |A1 ) P(A3 |A1 ∩ A2 ) . . . P(An |A1 ∩ · · · ∩ An−1 ).
Důkaz. Postupně aplikujeme vztah P(A ∩ B) = P(A) P(B|A) plynoucí z definice podmíněné
pravděpodobnosti.

P(A1 ∩ · · · ∩ An ) = P(A1 ∩ · · · ∩ An−1 ) P(An |A1 ∩ · · · ∩ An−1 ) =


P(A1 ∩ · · · ∩ An−2 ) P(An−1 |A1 ∩ · · · ∩ An−2 ) P(An |A1 ∩ · · · ∩ An−1 ) = . . . .


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 23
2 PODMÍNĚNÁ PRAVDĚP. A NEZÁVISLOST BI-PST, ZS 2022/23, Přednáška 1-12

Příklad – spamový filtr


S∩K P(S ∩ K) = 0.3 · 0.7 = 0.21
ie (K )
Kop 7
|S ) = 0.
S PB(eK
z
) kopi
e
(S P(K c (K c
0.3
m )
S pa |S )= c
S )= 0.3 S ∩ K c P(S ∩ K ) = 0.3 · 0.3 = 0.09
P(

Le
P( gitimn c
S c ∩ K P(S ∩ K) = 0.7 · 0.1 = 0.07
S c í (S c ie (K )
)= ) Kop
0.1
c) =
0.7
S c ( K |S
PBez
ko
P(K c pie (K c)
|S c) c c
= 0. S c ∩ K c P(S ∩ K ) = 0.7 · 0.9 = 0.63
9

P(S ∩ K) 0.21
P(S|K) = = = 0.75.
P(K) 0.21 + 0.07

Příklad 2.13 (– multiplikativní zákon). Taháme z balíčku 52 karet bez vracení. Jaká je
pravděpodobnost, že ze tří po sobě tažených karet není žádná srdcová?
Ai = {i-tá karta není srdcová}, i = 1, 2, 3.
39 38 37 .
P(A1 ∩ A2 ∩ A3 ) = P(A1 ) P(A2 |A1 ) P(A3 |A1 ∩ A2 ) = · · = 41.4%
52 51 50
Ilustrace výpočtu pomocí stromu podmíněných pravděpodobností:
• P (A1 ∩ A2 ∩ A3 ) 39 38 37
• 52 · 51 · 50

P (A3 |A1 ∩ A2 )
37/50
A3

• •

P (A2 |A1 ) P (Ac3 |A1 ∩ A2 ) 13/50


38/51
A2

• • P (A1 ∩ A2 ∩ Ac3 ) 39 38 13
• • 52 · 51 · 50

P (A1 ) P (Ac2 |A1 ) 39/52 13/51


A1

• • • •
P (Ac1 ) 13/52

• •

Pravděpodobnost daného vrcholu stromu je součinem přislušných hodnot po dráze vychá-


zející z kořene.

Monty Hall
Moderátor ukáže soutěžícímu troje zavřené dveře: za jedněmi z nich je nové luxusní auto,
za zbývajícími dvěma starý kozel. Soutěžící si má vybrat které otevřít. Vybere si, třeba, dveře
#1.
Moderátor však otevře jiné, řekněme #2, a ukáže, že za nimi je kozel. A zeptá se soutě-
žícího: „Chcete změnit svou volbu a vybrat si místo dveří #1 dveře #3?“
Co byste odpověděli vy?

24
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
1 1
BI-PST, ZS 2022/23, Přednáška 1-12 2.1 Podmíněná pravděpodobnost

Jaká je teď pravděpodobnost, že auto je za dveřmi #1 a jaká, že je za dveřmi #3?


Správná odpověď je, ano, změňte svou volbu!
Pravděpodobnosti jsou 1/3 (původní volba) a 2/3 (změněná volba).
Důležité: vše platí za předpokladu, že moderátor je rozhodnut otevřít dveře s kozlem.
Řešení pomocí doplňku složitého jevu:
• Hra, kdy si necháme původně vybrané dveře:
1
P(výhra) = P(auto je za puvodně
 vybranými dveřmi) =
3
• Hra, kdy změníme původní volbu:
1
P(prohra) = P(auto je za původně vybranými dveřmi) =
3
2
P(výhra) = 1 − P(prohra) =
3
Poučení:
• U složitého jevu se zamysleme nad jeho doplňkem.
• Pokud veříme, že si po získání nové informace změnou nemužeme
 uškodit, stojí za úvahu
provést změnu i bez výpočtu.
• POZOR: Podmíněná pravděpodobnost nemusí být vyšší než nepodmíněná!

Správná interpretace podmíněné pravděpodobnosti


Za chybným výkladem informací často stojí nesprávné porozumění podmíněným pravdě-
podobnostem:
Příklad 2.14 (– nehody pod vlivem).
• Zjistili jsme, že zhruba 10% smrtelných dopravních nehod je způsobeno řidiči pod vlivem
alkoholu (41 z 470 úmrtí na silnicích v ČR v roce 2021 dle policejní ročenky).
• To ale znamená, že 90% smrtelných nehod je způsobeno střízlivými řidiči!
• Máme se tedy mít na pozoru před střízlivými řidiči?
Jistě, že ne. Musíme se mít na pozoru před podmíněnými pravděpodobnostmi. Získaný
údaj nám říká, že ze všech nehod, podíl těch, co jsou způsobeny opilými řidiči, je 10%. Tedy

P(opilý|nehoda) = 0.1.
Snažíme se zjistit opačně podmíněnou pravděpodobnost P(nehoda|opilý). Jiná studie zjistila,
že méně než 1% osob řídí pod vlivem alkoholu. Pravděpodobnost nehody je složité určit, ale
jsme schopni spočítat, o kolik je větší pravděpodobnost zavinění nehody opilým řidičem oproti
střízlivému:
P(nehoda|opilý) P(nehoda ∩ opilý)/ P(opilý)
=
P(nehoda|střízlivý) P(nehoda ∩ střízlivý)/ P(střízlivý)
P(opilý|nehoda) · P(nehoda)/ P(opilý) 0.1/0.01
= = = 11.
P(střízlivý|nehoda) · P(nehoda)/ P(střízlivý) 0.9/0.99
Tedy u řidičů pod vlivem alkoholu je alespoň 11x vyšší pravděpodobnost, že způsobí smrtelnou
dopravní nehodu.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 25
2 PODMÍNĚNÁ PRAVDĚP. A NEZÁVISLOST BI-PST, ZS 2022/23, Přednáška 1-12

2.2 Nezávislost náhodných jevů


Intuitivně: A a B jsou nezávislé, pokud pravděpodobnost jevu A není ovlivněná informací, že
B nastalo, P(A|B) = P(A), a naopak, P(B|A) = P(B).

Definice 2.15. Náhodné jevy A a B se nazývají nezávislé, pokud

P(A ∩ B) = P(A) P(B).

Obecně, soubor jevů {Ai : i ∈ I} se nazývá nezávislý, jestliže


!
\ Y
P Ai = P(Ai )
i∈J i∈J

pro všechny neprázdné konečné podmnožiny J indexové množiny I.

Příklad 2.16 (– hod kostkou). Uvažujme jev A: padne sudé číslo a jev B: padne číslo
menší něž 3.
Jsou jevy A a B nezávislé?

A = {2, 4, 6}, B = {1, 2}, A ∩ B = {2}

1 3 2 1
P(A ∩ B) = a P(A) P(B) = · = .
6 6 6 6
Tudíž jevy A a B jsou nezávislé.

Příklad 2.17 (– hod kostkou). Uvažujme jev A: padne sudé číslo a jev B: padne šestka.
Jsou jevy A a B nezávislé?

A = {2, 4, 6}, B = {6}, A ∩ B = {6}

1 3 1 1
P(A ∩ B) = a P(A) P(B) = · = .
6 6 6 12
Tudíž jevy A a B nejsou nezávislé.

Vztah nezávislosti a podmíněné pravděpodobnosti


Nečhť A a B jsou nezávislé a P(B) > 0. Potom zřejmě

P(A ∩ B) P(A) P(B)


P(A|B) = = = P(A).
P(B) P(B)

Pro A a B nezávislé nám znalost B nepřinese žádnou informaci o A.

Věta 2.18. Jsou-li jevy A a B nezávislé, pak i A a B c (Ac a B; Ac a B c ) jsou nezávislé.

Věta 2.19. Je-li (Ai )i∈I soubor nezávislých jevů, pak pro libovolnou konečnou podmnožinu
∅=
6 J ⊂ I, je
P(∩i∈J Ai | ∩i∈I\J Ai ) = P(∩i∈J Ai ).

26
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 2.2 Nezávislost náhodných jevů

Nezávislé vs. neslučitelné jevy


Častým omylem je nesprávně pokládat jevy A a B za nezávislé, pokud A ∩ B = ∅.

Ve skutečnosti ale neslučitelné jevy A a B mohou být nezávislé, jen pokud P(A) = 0 nebo
P(B) = 0.

Když A a B jsou neslučitelné s nenulovými pravděpodobnostmi, tak pokud víme, že nastal


jev B, je jasné, že jev A nastat nemůže.

Zatímco neslučitelnost je množinový pojem, nezávislost je pojem pravděpodobnostní.

Podmíněná nezávislost

Definice 2.20. Nechť (Ω, F, P) je pravděpodobnostní prostor a C je náhodný jev s P(C) > 0.
Náhodné jevy A a B se nazývají podmíněně nezávislé za podmínky C, pokud

P(A ∩ B|C) = P(A|C) P(B|C).

Připomenutí:

• Q(A) = P(A|C) je pravděpodobnostní míra.

• Podmíněná nezávislost je tedy nezávislost vzhledem k pravděpodobnostní míře Q.

Příklad 2.21 (– hod sedmistěnnou kostkou). Hodíme sedmistěnnou kostkou, kde jsou všechny
strany stejně pravděpodobné. Uvažujme: Jev A: padne sudé číslo. Jev B: padne číslo menší
něž 3. Jsou jevy A a B nezávislé?
A = {2, 4, 6}, B = {1, 2}, A ∩ B = {2}
1 3 2 6
P(A ∩ B) = a P(A) · P(B) = · = .
7 7 7 49
Tudíž jevy A a B nejsou nezávislé.

Příklad 2.22 (– hod sedmistěnnou kostkou + podmínka). Uvažujme navíc jev C: padne
nejvýš šestka. Jsou jevy A a B podmíněně nezávislé při daném C?
P(A ∩ B ∩ C) P({2}) 1/7 1
P(A ∩ B|C) = = = =
P(C) P({1, ...6}) 6/7 6
3/7 2/7 1
P(A|C) · P(B|C) = · = .
6/7 6/7 6
Tudíž jevy A a B jsou podmíněně nezávislé při daném C.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 27
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

3 Náhodné veličiny
3.1 Definice náhodné veličiny, distribuční funkce
Abychom mohli náhodné experimenty matematicky zpracovávat, je vhodné každému výsledku
ω ∈ Ω přiřadit číslo. Vhodným přiřazením vybereme tu část informace, která je z našeho
pohledu zajímavá.
Takové přiřazení lze provést mnoha způsoby. Budeme jej nazývat náhodnou veličinou
a značit X, Y apod.

ω1 X
Prostor elemen- ω2
tárních jevů Ω ω4
ω3 R

Příklady 3.2.
• Počítání (indikátor) hlav při hodech mincí: X(hlava) = 1, X(orel) = 0.
• Moje výhra při hře s mincí: X(hlava) = 1, X(orel) = −1.
• Pro hráče na pokerovém turnaji je zajímavé kolik vyhrál v dané hře.
• Můžeme sledovat maximální hodnotu, která padla v n hodech kostkou.
• Můžeme měřit výšku náhodně vybraného člověka.
Příklad 3.3 (– minimum ze dvou hodů čtyřstranné kostky). Dva hody čtyřstrannou kostkou
(pravidelný čtyřstěn). Ω = {1, 2, 3, 4}2 , ω = (ω1 , ω2 ).
Uvažujeme náhodnou veličinu X(ω) = min{ω1 , ω2 }.

4 • • • •

3 • • • •
• • • •
2 • • • • 1 2 3 4 R

1 • • • •
1 2 3 4

P(X = 1) = P({ω ∈ Ω : X(ω) = 1}) =


7
= P({(1, 1), (1, 2), (1, 3), (1, 4), (2, 1), (3, 1), (4, 1)}) = .
16
Podobně:
5
P(X = 2) = P({(2, 2), (2, 3), (2, 4), (3, 2), (4, 2)}) = ,
16
3
P(X = 3) = P({(3, 3), (3, 4), (4, 3)}) = ,
16
1
P(X = 4) = P({(4, 4)}) = .
16

28
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.1 Definice náhodné veličiny, distribuční funkce

Náhodná veličina a její rozdělení

Definice 3.4. Náhodná veličina X na pravděpodobnostním prostoru (Ω, F, P) je funkce,


která každému výsledku experimentu ω ∈ Ω přiřadí hodnotu X(ω) ∈ R a pro kterou platí
podmínka měřitelnosti:
{X ≤ x} ∈ F, ∀x ∈ R.

Poznámky:

• Podrobněji pomocí vzoru množiny X −1 (·) můžeme psát {X ≤ x} = {X ∈ (−∞, x]} =


X −1 ((−∞, x]) = {ω ∈ Ω : X(ω) ∈ (−∞, x]} = {ω ∈ Ω : X(ω) ≤ x}.

• Podmínka měřitelnosti říká, že {X ≤ x} je náhodný jev, a proto jsme schopni počítat


pravděpodobnosti P(X ≤ x), P(X = x), P(X ∈ (a, b)), atp.

• Bez této podmínky se neobejdeme, avšak v praxi ji obvykle nepotřebujeme ověřovat. Je


potřebná především pro důkazy (a definice).

Definice 3.5. Distribuční funkce náhodné veličiny X je definovaná vztahem

FX (x) = P(X ≤ x).

Distribuční funkce jednoznačně určuje pravděpodobnostní rozdělení náhodné veličiny.

Distribuční funkce náhodné veličiny


Rozlišujeme mezi různými typy náhodných veličin.

• Některé mohou nabývat jen izolovaných hodnot (např. 0 nebo 1 pro hlavu a orla při
hodu mincí, hodnoty 1,...,6 při hodu kostkou).

• Některé mohou nabývat hodnot na spojité škále (např. váha novorozence, doba čekání
na autobus,...).

Takto dělíme náhodné veličiny na diskrétní a spojité. U diskrétních náhodných veličin nás
zajímají pravděpodobnosti jednotlivých hodnot, u spojitých se zajímáme o pravděpodobnosti
podintervalů. Nehledě na typ, distribuční funkce nám dá úplný popis chování náhodné veličiny.
Pro jakékoliv číslo x umíme zjistit, s jakou pravděpodobností bude náhodná veličina X menší
nebo rovna tomuto číslu. To nám umožňuje zodpovědět libovolné otázky o rovnostech či
nerovnostech.

Vlastnosti distribuční funkce

Věta 3.6. Distribuční funkce F náhodné veličiny X má následující vlastnosti:

i) F je neklesající: když x < y, pak F (x) ≤ F (y)

ii) F “začíná v 0 a končí v 1”: lim F (x) = 0 a lim F (x) = 1


x→−∞ x→∞

iii) F je spojitá zprava: lim F (y) = F (x).


y→x+


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 29
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Graf obecné distribuční funkce


1

Hodnota FX je v hornı́ části


skoku (spojitost zprava)

0
-4 0 1 4

Důkaz. i) Připomeňme si značení {X ≤ x} = {ω ∈ Ω : X(ω) ≤ x}. Použijeme disjunktní


rozklad
{X ≤ y} = {X ≤ x} ∪ {x < X ≤ y},
proto

F (y) = P(X ≤ y) = P(X ≤ x) + P(x < X ≤ y) ≥ P(X ≤ x) = F (x).

ii) Pro jednoduchost uvedeme pouze náznak důkazu pomocí posloupnosti jevů Bn = {X ≤
−n}. Ta je pro n → ∞ klesající ve smyslu inkluze s průnikem rovným ∅, t.j. Bn & ∅.
Takže dle věty o spojitosti pravděpodobnosti dostáváme P(Bn ) → P(∅) = 0. Pro důkaz
druhého tvrzení stačí vzít posloupnost An = {X ≤ n} % Ω a dle stejné věty získat
P(An ) → P(Ω) = 1.

iii) Důkaz provedeme podobně jako v ii) (viz doporučená literatura).

Poznámky:

• F je spojitá zprava, protože v její definici jsme povolili rovnost: F (x) = P(X ≤ x).

• Některé knihy používají P(X < x) a jejich distribuční funkce je pak spojitá zleva.

Použití distribuční funkce

Lemma 3.7. Pomocí distribuční funkce F náhodné veličiny X můžeme vyjádřit:

i) P(X > x) = 1 − F (x),

ii) P(X ∈ (x, y]) = P(x < X ≤ y) = F (y) − F (x),

iii) P(X < x) = lim F (y),


y→x−

iv) P(X = x) = F (x) − lim F (y).


y→x−

Důkaz. i) Pro každé x lze sestavit disjunktní rozklad Ω = {X > x} ∪ {X ≤ x}, čili
{X > x} = {X ≤ x}C .

ii) Viz důkaz bodu i) předchozí věty.

30
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.2 Diskrétní náhodné veličiny

iii) Viz literatura. Idea důkazu pomocí neklesající posloupnosti a věty o spojitosti pravdě-
podobnosti:

{X ≤ x − 1/n} % {X < x} ⇒ F (x − 1/n) = P(X ≤ x − 1/n) → P(X < x).

iv) {X ≤ x} = {X < x} ∪ {X = x} je disjunktní rozklad. Proto P(X = x) = P(X ≤ x) − P(X <


x).

Typy náhodných veličin a jejich distribuční funkce

Diskrétnı́ náhodná veličina Spojitá náhodná veličina


1 1

FX (x) FX (x)

0 0
x x
Smı́šená náhodná veličina
1

FX (x)

0
x

3.2 Diskrétní náhodné veličiny


Definice 3.8. Náhodná veličina X se nazývá diskrétní, jestliže nabývá pouze hodnot z nějaké
nejvýše spočetné množiny {x1 , x2 , . . . }.
Pravděpodobnosti možných hodnot náhodné veličiny X jsou

P(X = xk ), k = 1, 2, ....

• Nenulovou pravděpodobnost mají pouze hodnoty xk , kterých náh. vel. X nabývá.

• Pravděpodobnost P(X = x) lze chápat jako funkci x, kterou pak nazýváme pravděpo-
dobnostní funkcí nebo diskrétní hustotou náhodné veličiny X.

Distribuční funkce diskrétní náhodné veličiny X má tvar


X
FX (x) = P(X ≤ x) = P(X = xk ).
k: xk ≤x

FX (x) má “stoupající” skoky v bodech xk a mezi nimi je konstantní. V xk má FX hodnotu


již “na vyšší části skoku” (spojitost zprava). Velikost skoku v bodě xk je P(X = xk ).


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 31
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Příklad 3.9 (– hod dvěma mincemi). Prostor elementárních jevů je


Ω = {(H, H), (H, O), (O, H), (O, O)}. Nechť náhodná veličina X určuje počet hlav ve dvou
hodech. Distribuční funkce FX (x) = P(X ≤ x):
FX

H • • 1 •
3/4 •
O • •
O H 1/4 •

0 1 2 x

Distribuční funkce FX = P(X ≤ x) má tvar




 0 pro x < 0 P(∅)

 1/4 pro 0 ≤ x < 1 P({(O, O)})
FX (x) =

 3/4 pro 1 ≤ x < 2 P({(O, O), (H, O), (O, H)})


1 pro 2 ≤ x P(Ω).
Graf pravděpodobností P(X = xk ) a distribuční funkce FX (x)
P(X = x) FX

1 1 •
3/4 •
1/2 •
1/4 • • 1/4 •

0 1 2 x 0 1 2 x

Vztah pravděpodobností a distribuční funkce


Platí tzv. normalizační podmínka, kterou musíme ověřit při přiřazování pravděpodobností
hodnotám xk : X
P(X = xk ) = 1.
all xk
Obecně k výpočtu P(X ∈ B), B ⊂ R stačí znát pravděpodobnosti hodnot:
X
P({X ∈ B}) = P(X = xk ).
xk ∈B

Pro řady s nezápornými členy nezáleží na pořadí sčítanců. Proto výše uvedené řady mů-
žeme sčítat přes všechny možné hodnoty veličiny X bez předepsaného pořadí. Všimněte si
navíc, že P(X = x) > 0 platí pouze pro konečně či spočetně mnoho x.
Rozdělení X je ekvivalentně určeno pomocí FX či P(X = xk ), k = 1, 2, ...:
Předpokládejme rostoucí řazení hodnot x1 < x2 < x3 < . . . veličiny X. Potom
P(X = xk ) = FX (xk ) − FX (xk−1 ).
Výpočet pravděpodobností P(X = xk ):
Shromáždíme všechny ω pro které X(ω) = x a sečteme jejich pravděpodobnosti.
Výpočet distribuční funkce FX (x) = P(X ≤ x):
Shromáždíme všechny ω pro které X(ω) ≤ x a sečteme jejich pravděpodobnosti.

32
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.2 Diskrétní náhodné veličiny

Příklady diskrétních náhodných veličin


Poznámka 3.10. Náhodná veličina X může být diskrétní, i když samotný prostor elementár-
ních jevů diskrétní není.

Příklad 3.11. Házení šipek do terče T ⊂ R2 :

• Terč může být rozdělen na různé části. Obvykle soustředná mezikruží, označená
např. T1 , T2 , T3 , T4 , T5 .

• Pak můžeme uvažovat diskrétní náhodnou veličinu X, která určuje počet bodů za pří-
slušnou trefu.

• Např. X(ω) = 10 pro ω ∈ T5 , X(ω) = 5 pro ω ∈ T4 a X(ω) = i pro ω ∈ Ti , i = 3, 2, 1.

Příklad 3.12 (– minimum ze dvou hodů čtyřstranné kostky, pokračování).


X = min{první hod, druhý hod} :
X

4 • • • •

3 • • • •
• • • •
2 • • • • 1 2 3 4 R

1 • • • •
1 2 3 4

Pravděpodobosti hodnot: pX

7/16
4 • • • •
5/16
3 • • • •
3/16
2 • • • •
1/16
1 • • • •
1 2 3 4 1 2 3 4 x

FX
Distribuční funkce: 1
15
16
12
4 • • • • 16

3 • • • • 7
16

2 • • • •

1 • • • •
1 2 3 4 1 2 3 4 x


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 33
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Příklady diskrétních náhodných veličin


Příklad 3.13.
• Bernoulliho (Alternativní) rozdělení s parametrem p, 0 ≤ p ≤ 1, X ∼ Be(p) nebo X ∼ Alt(p):
(Jeden hod nevyváženou mincí.)
P(X = 1) = p, P(X = 0) = 1 − p.

• Binomické rozdělení s parametrem p, 0 ≤ p ≤ 1, X ∼ Binom(n, p):


(Počet hlav v n hodech nevyváženou mincí.)
 
n k
P(X = k) = p (1 − p)n−k .
k

• Geometrické rozdělení s parametrem p ∈ (0, 1), X ∼ Geom(p):


(Počet hodů nevyváženou mincí než padne první hlava.)
P(X = k) = (1 − p)k−1 p, k = 1, 2, . . .

• Poissonovo rozdělení s parametrem λ > 0, X ∼ Poisson(λ):


(V jistém smyslu limita binomického pro n → ∞.)
λk −λ
P(X = k) = e , k = 0, 1, 2, . . .
k!
Podrobně prostudujeme později.

3.3 Spojité náhodné veličiny, hustota


Spojité náhodné veličiny – motivace
V některých případech nabývá náhodná veličina nespočetně mnoha možných hodnot. Tato
situace nastává při práci se spojitými modely – měření času, vzdálenosti, souřadnic apod. Ne-
můžeme přiřadit kladnou pravděpodobnost P(X = x) každé hodnotě, protože by se nespo-
četné množství takových pravděpodobností nasčítalo na nekonečno. Proto přisuzujeme každé
izolované hodnotě nulovou pravděpodobnost (intuitivně je např. nekonečně málo pravděpo-
dobné, že budeme čekat na autobus přesně 3 : 00 : 00... minut). Místo toho potřebujeme
způsob, jak měřit pravděpodobnosti intervalů. Vzpomeňme si na případ Romea a Julie, kde
každý z nich přijde v náhodný čas, rovnoměrně zvolený z jednohodinového intervalu. Často
potřebujeme i nerovnoměrná rozdělení hodnot.
Definice 3.14. Náhodná veličina X se nazývá (absolutně) spojitá, jestliže existuje nezá-
porná funkce fX taková, že pro každé x ∈ R můžeme distribuční funkci FX vyjádřit jako
Zx
FX (x) = fX (t) dt.
−∞

Funkci fX v takovém případě nazýváme hustotou pravděpodobnosti náhodné veličiny X.


FX (x) = P (X  x) Hustota fX (x)

Distribuční funkce spojité náhodné veličiny je spojitá.

34
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.3 Spojité náhodné veličiny, hustota

Vlastnosti spojitých náhodných veličin

Věta 3.15. Pro hustotu fX spojité náhodné veličiny X platí:

+∞
Z
i) fX (x)dx = 1 ( normalizační podmínka),
−∞

ii) P(X = x) = 0 pro všechna x ∈ R,

dFX
iii) fX (x) = (x) v bodech, kde FX má derivaci,
dx

Zb
iv) P(a < X ≤ b) = fX (x) dx = FX (b) − FX (a),
a
Z
v) P(X ∈ B) = fX (x)dx pro všechny B v Borelovské σ-algebře na R, (tzn. množiny
B
{X ∈ B} jsou měřitelné), tj. pro všechny „ běžné “ množiny.

Důsledky:

• P(X ≤ x) = P(X < x) – z ii)

• fX (x)dx ≈ P(x < X < x + dx) pro dx << 1 – z iv)

+∞
Z
Důkaz. i) fX (x)dx = lim FX (x) = 1.
x→+∞
−∞

ii) Ze spojitosti distribuční funkce spojitého rozdělení a z předchozí věty: P(X = x) =


F (x) − lim F (y) = 0.
y→x−

iii) Plyne z vlastností derivace a integrálu (základní věta integrálního počtu).

Zb Za Zb
iv) P(a < X ≤ b) = F (b) − F (a) = fX (x)dx − fX (x)dx = fX (x)dx.
−∞ −∞ a

v) Z vlastností Lebesgueova integrálu – pokročilé, viz doporučená literatura.

iii) (První) základní věta integrálního počtu (first fundamental theorem of calculus).

iv) (Druhá) základní věta integrálního počtu, Newtonův vzorec, Newton-Leibnizův vzorec
(second fundamental theorem of calculus).


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 35
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Vztah hustoty a pravděpodobnosti


Zopakujme a ilustrujme důležitou vlastnost hustoty (spojité náhodné veličiny):
P (a < X  b) Hustota fX (x)

a b

Zb
P(a < X ≤ b) = fX (t) dt = F (b) − F (a)
a
Všimněme si, že u spojitých náhodných veličin nezáleží, jestli jsou nerovnosti ostré, nebo
neostré:
P(a < X ≤ b) = P(a ≤ X ≤ b) = P(a ≤ X < b) = P(a < X < b).

Romeo, Julie a rovnoměrné rozdělení


Příklad 3.16 (– rozdělení příchodu na sraz). Označme dobu, kdy přijde Romeo na místo
srazu, jako náhodnou veličinu X. Předpokládejme, že je X rovnoměrně rozdělená na intervalu
[0, 1], tedy že její hustota je na tomto intervalu konstatní a jinde nulová.
(
c pro x ∈ [0, 1]
fX (x) =
0 jinak.

Čemu se musí rovnat konstanta c, aby se skutečně jednalo o hustotu? Z normalizační pod-
mínky víme, že plocha pod grafem hustoty musí být jednotková, resp. hustota se musí nain-
tegrovat na jedničku:
Z∞ Z1
fX (x)dx = c · dx = [c · x]10 = c = 1,
−∞ 0
tedy konstanta c musí být rovna jedné.
Příklad 3.16 (– rozdělení příchodu na sraz, pokračování). Hustota rovnoměrného rozdělení
na intervalu [0, 1]:
1.2
1.0
0.8
0.6
0.4
0.2
0.0

0.0 0.2 0.4 0.6 0.8 1.0

36
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.3 Spojité náhodné veličiny, hustota

Příklad 3.16 (– rozdělení příchodu na sraz, pokračování). Jaká je pravděpodobnost, že Ro-


meo přijde mezi 12:15 a 12:45? Pravděpodobnosti týkající se intervalů získáme jako příslušnou
plochu pod grafem hustoty:

Z3/4
3/4
1dx = [x]1/4 = 3/4 − 1/4 = 1/2.
1/4

1.2
1.0
0.8
0.6
0.4
0.2
0.0

0.0 0.2 0.4 0.6 0.8 1.0

Romeo, Julie a nerovnoměrné rozdělení

Příklad 3.17 (– rozdělení příchodu na sraz, pokračování). Co když se příchody Julie na sraz
řídí rozdělením s hustotou

4y

 pro y ∈ [0, 1/2]
fY (y) = 4 − 4y pro y ∈ [1/2, 1]


0 jinak.
2.0
1.5
1.0
0.5
0.0

0.0 0.2 0.4 0.6 0.8 1.0

Jaká je pravděpodobnost, že Julie přijde mezi 12:15 a 12:45?

Příklad 3.17 (– rozdělení příchodu na sraz, pokračování). Jaká je pravděpodobnost, že Julie


přijde mezi 12:15 a 12:45? Pravděpodobnosti týkající se intervalů získáme jako příslušnou
plochu pod grafem hustoty:
Z3/4
fY (y)dy = ... = 3/4.
1/4


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 37
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

2.0
1.5
1.0
0.5
0.0
0.0 0.2 0.4 0.6 0.8 1.0

Pozor, při nerovnoměrném rozdělení příchodů už pravděpodobnost, že se potkají, nelze najít


geometricky.

3.4 Funkce náhodné veličiny


Pro náhodnou veličinu X, jejíž rozdělení známe, se často zajímáme o rozdělení hodnot nějakým
způsobem vypočtených z hodnot veličiny X, tedy Y = g(X).

Příklad 3.18 (– lineární transformace). Je-li X náhodně změřená teplota ve stupních Celsia
(◦ C), pak
Y = 1.8 X + 32
je odpovídající náhodná teplota ve stupních Fahrenheita (◦ F).
Formálně (detailně) píšeme Y (ω) = 1.8 X(ω) + 32, kde ω ∈ Ω je výsledek experimentu.

V případě diskrétní náhodné veličiny X je situace relativně jednoduchá:

• Y = g(X) je vždy náhodná veličina.

• Rozdělení náhodné veličiny Y = g(X) je vždy diskrétní.

Pokud X je spojitá náhodná veličina, nastávají následující komplikace:

• Může se stát, že Y = g(X) vůbec není náhodná veličina. Proto je třeba předpokládat
měřitelnost g.

• Navíc rozdělení náhodné veličiny Y = g(X) může být diskrétní, spojité či smíšené.

Funkce diskrétní náhodné veličiny

Lemma 3.19 (– funkce diskrétní náhodné veličiny.). Mějme funkci g : R → R a diskrétní


náhodnou veličinu X. Funkci náhodné veličiny Y = g(X) definujeme vztahem

Y (ω) = g(X)(ω) = g(X(ω)),

pro každý výsledek experimentu ω ∈ Ω.


Pak Y = g(X) je také diskrétní náhodná veličina s pravděpodobnostmi hodnot
X
P(Y = y) = P(g(X) = y) = P(X = xk )
k: g(xk )=y

V minulém příkladě Y (ω) = g(X)(ω) = (1.8 X + 32)(ω) = 1.8 X(ω) + 32.

38
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.4 Funkce náhodné veličiny

Důkaz. Rozdělení g(X) získáme ze (spočetného) disjunktního rozkladu


[
{g(X) = y} = {X = xk }.
k: g(xk )=y

Příklad 3.20. Uvažujme náhodnou veličinu X s rozdělením v tabulce níže. Najděte rozdělení Y =
X 2.
x -3 -1 0 1 3
P(X = x) 0.2 0.2 0.45 0.05 0.1

Upravíme si původní tabulku:


x -3 -1 0 1 3
P(X = x) 0.2 0.2 0.45 0.05 0.1
x2 9 1 0 1 9

Vidíme, že Y = X 2 nabývá hodnot 0, 1 a 9. Snadno spočteme


X
P(Y = 0) = P(X 2 = 0) = P(X = x) = P(X = 0) = 0.45
x: x2 =0
X
P(Y = 1) = P(X 2 = 1) = P(X = x) = P(X = −1) + P(X = 1) = 0.25
x: x2 =1
X
P(Y = 9) = P(X 2 = 9) = P(X = x) = P(X = −3) + P(X = 3) = 0.3.
x: x2 =9

Funkce obecné náhodné veličiny


Lemma 3.21 (– funkce obecné náhodné veličiny.). Mějme funkci g : R → R a libovolnou
náhodnou veličinu X na (Ω, F, P ).
Pokud funkce g je měřitelná, pak Y = g(X) je také náhodná veličina na (Ω, F, P).
Poznámka: Funkce g je měřitelná, pokud množina {x ∈ R : g(x) ≤ y} patří do Borelovské
σ-algebry B na R pro každé y ∈ R.

Důkaz. Důkaz, že Y = g(X) je náhodná veličina, spočívá v ověření, že {Y ≤ y} je náhodný


jev (čili patří do F) pro všechna y, takže lze najít P(Y ≤ y). Toto je měřitelnost Y vzhledem
k F – proto v lemmatu zdůrazňujeme pravděpodobnostní prostor (Ω, F, P).
Musíme tedy ukázat, že ∀y ∈ R platí:

{Y ≤ y} = {g(X) ≤ y} ∈ F.

Detailní důkaz viz literatura.

Poznámka 3.22. Obecně pro distribuční funkci FY (y) veličiny Y = g(X) platí

FY (y) = P(Y ≤ y) = P(g(X) ≤ y) = P {ω ∈ Ω : g(X(ω)) ≤ y} .

Pokud náhodná veličina Y je spojitá, pak dostaneme fY derivováním FY (y) podle y.


Možné zjednodušení:
• Pokud existuje g −1 a je rostoucí, potom platí

FY (y) = P(g(X) ≤ y) = P X ≤ g −1 (y) = FX g −1 (y) .


 


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 39
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

• Pokud g je na X(Ω) ryze monotónní, pak g −1 je diferencovatelná a Y = g(X) je spojitá


s
 dg −1 (y)
fY (y) = fX g −1 (y) .
dy
X Důkazy a další informace viz doporučená literatura.

3.5 Kvantilová funkce a simulace


Kvantilová funkce
Pomocí distribuční funkce umíme určit pravděpodobnost, že zkoumaná náhodná veličina
bude menší nebo rovná libovolné hodnotě x.
Někdy nás zajímá opačný přístup – pro danou pravděpodobnost α najít takovou hodnotu,
že P(X ≤ x) = α.

Definice 3.23. Nechť X je náhodná veličina s distribuční funkcí FX . Nechť α ∈ (0, 1).
Hodnota qα se nazývá α-kvantil náhodné veličiny X právě tehdy, když

qα = inf{x|FX (x) ≥ α}.

Kvantil uvažovaný jako funkce α se nazývá kvantilová funkce a značí se FX−1 (α).

Pro ryze rostoucí a spojitou FX je kvantil qα takovou hodnotou, pro kterou

FX (qα ) = P(X ≤ qα ) = α,

takže značení FX−1 odpovídá skutečné inverzní funkci k FX .

Kvantilová funkce – generování náhodných čísel

Věta 3.24. Nechť X má rozdělení s distribuční funkcí FX . Nechť U má rovnoměrné rozdělení


na intervalu [0, 1] s hustotou
(
1 pro u ∈ (0, 1)
fU (u) =
0 jinak.

Potom náhodná veličina FX−1 (U ) má stejné rozdělení jako X.

Důkaz. Pro spojitou rostoucí FX :

FZ
X (x)

P(FX−1 (U ) ≤ x) = P(U ≤ FX (x)) = 1 · du = FX (x).


0

Tímto způsobem můžeme generovat hodnoty z libovolného rozdělení tak, že vygenerujeme


hodnoty z rovnoměrného rozdělení Unif(0, 1) a najdeme příslušné kvantily.

40
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.5 Kvantilová funkce a simulace

Generování náhodných čísel


Skutečně náhodná čísla lze generovat měřením fyzikálních jevů, např. pomocí oscilátorů nebo
tepelných zařízení. Počítačové algoritmy mohou generovat pseudo-náhodná čísla, která se snaží
být od skutečně náhodných k nerozeznání. Existuje mnoho způsobů, jak pseudonáhodná čísla
generovat. Kongruentní generátor (rychlý a snadný na implementaci):

• Zvolíme velké celočíselné hodnoty a, b a m (vhodné možnosti viz literatura).

• Vyberme počáteční hodnotu X0 (seed).

• Generujeme posloupnost náhodných čísel jako Xn+1 = (aXn + b) mod m.

• Vydělíme všechny výsledky m.

Sofistikovanější generátory (používané v R, Matlabu, ...):

• Mersenne Twister

• Wichmann-Hill

• mnoho dalších.

Generování hodů kostkou


Značí-li náhodná veličina hodnotu padlou na šestistěnné kostce, zjistíme snadno, že
FX−1 (U ) = d6 · U e. Simulovali jsme 100 hodů kostkou a počítali jsme podíl každé hodnoty:

Podíl hodnot ve 100 simulovaných hodech kostkou


0.25
0.20
0.15
podíl

0.10
0.05
0.00

1 2 3 4 5 6

hodnota


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 41
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

3.6 Charakteristiky náhodných veličin


3.6.1 Střední hodnota

U náhodné veličiny nás zajímají střed, šířka a další podobné charakteristiky jejího rozdělení.
Jednou ze základních charakteristik náhodné veličiny je její střední hodnota.

Definice 3.25. Střední hodnota (expectation) diskrétní náhodné veličiny X, nabývající hod-
not x1 , x2 , ..., je definována vztahem
X
EX = xk P(X = xk ).
k

Střední hodnota spojité náhodné veličiny X s hustotou f je určena vztahem

Z∞
EX = xf (x) dx.
−∞

Nutnou podmínkou je, že uvedená suma resp. integrál absolutně konverguje. Jinak říkáme,
že střední hodnota náhodné veličiny X neexistuje (nebo je ±∞).

Poznámka k sumačnímu zápisu v definici střední hodnoty diskrétní náhodné veličiny. Díky
absolutní konvergenci nezáleží na pořadí sčítanců v obou řadách. (Obecně u nekonečné řady
na pořadí sčítanců záleží!) V první řadě proto sčítáme přes všechny možné hodnoty xk veličiny
X bez předepsaného pořadí. Je to často názornější než sčítat přes všechny indexy
X k hodnot xk
seřazených do nějaké určité sekvence. Podobně v zápisu druhé řady místo xk P(X = xk )
X k
píšeme x P(X = x). Víme totiž, že P(X = x)) > 0 platí pro konečně či spočetně
x:P(X=x)>0
mnoho x a že na pořadí sčítanců opět nezáleží.

• Analogie: Nahradíme sumu x P(X = x) integrálem xf (x) přes všechny možné hodnoty
x.

• V obou případech se jedná o vážený průměr možných hodnot náhodné veličiny X.

Interpretace střední hodnoty


Střední hodnota E X: (Expected value, Expectation)

• je vážený průměr všech možných hodnot

• je rovnovážný bod pravděpodobností či hustoty (na ose x)

• popisuje “střed” rozdělení

• hodnotu z přístího pokusu očekáváme (expect) poblíž E X

42
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin

P(X = x)
1 f(x) ... hustota
2

1
4
1
8

0 1
↑ 3E X je rovnovážný
7
bod EX je rovnovážný bod

Příklad výpočtu střední hodnoty

Příklad 3.26 (– hod dvěma mincemi). Hodíme dvěma férovými mincemi. Nechť X značí
počet padlých hlav. Najděme střední hodnotu X. Máme čtyři stejně pravděpodobné výsledky,
Ω = {OO, HO, OH, HH}. Hlav tedy může padnout 0, 1 nebo 2, a to s pravděpodobnostmi
1/4, 1/2 a 1/4.
0.6

P(X=1)=1/2
0.4

P(X=0)=1/4 P(X=2)=1/4
0.2
0.0

0.0 0.5 1.0 1.5 2.0 2.5

Střední hodnotu spočítáme jako pravděpodobnostmi vážený průměr možných hodnot:


X 1 1 1 1 2
EX = xk P(X = xk ) = 0 · + 1 · + 2 · = + = 1.
k
4 2 4 2 4

Diskrétní rovnoměrné rozdělení

Příklad 3.27 (– házení šestistěnnou kostkou). Uvažujme hod jednou vyváženou šestistěnnou
kostkou. Nechť X značí počet hozených bodů. Jaká je střední hodnota X?

k 1 2 3 4 5 6
P(X = k) 1/6 1/6 1/6 1/6 1/6 1/6

Střední hodnotu spočítáme jako pravděpodobnostmi vážený průměr možných hodnot:

6
X 1 1 1 1 1 1 21
EX = k · P(X = k) = 1 · +2· +3· +4· +5· +6· = = 3.5.
k=1
6 6 6 6 6 6 6
0.25
0.20
0.15
0.10
0.05
0.00

0 1 2 3 4 5 6 7


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 43
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Diskrétní nerovnoměrné rozdělení


Příklad 3.28 (– maximum ze dvou hodů). Hodíme dvěma vyváženými šestistěnnými kost-
kami a necháme si vyšší z výsledků. Nechť X značí počet takto hozených bodů, tedy X =
max(hod 1, hod 2). Jaká je střední hodnota X?
k 1 2 3 4 5 6
P(X = k) 1/36 3/36 5/36 7/36 9/36 11/36
Střední hodnotu spočítáme jako pravděpodobnostmi vážený průměr možných hodnot:
6
X 1 · 1 + 2 · 3 + 3 · 5 + 4 · 7 + 5 · 9 + 6 · 11 161 .
EX = k · P(X = k) = = = 4.47.
36 36
k=1
0.4
0.3
0.2
0.1
0.0

0 1 2 3 4 5 6 7

Střední hodnota funkce náhodné veličiny


Střední hodnotu funkce náhodné veličiny můžeme spočíst dvěma způsoby:
1) Určíme rozdělení náhodné veličiny Y = g(X). Pak spočteme E Y pomocí definice a prav-
děpodobností P(Y = y) či hustoty fY .

2) Spočteme E g(X) přímo pomocí funkce g a rozdělení veličiny X (čili P(X = x) či fX ).


Věta 3.29. Předpokládejme, že g je funkce a že X a Y = g(X) jsou náhodné veličiny.
i) Má-li X diskrétní rozdělení, pak
X
E Y = E g(X) = g(xk ) P(X = xk ).
k

Z∞
ii) Má-li X spojité rozdělení, pak E Y = E g(X) = g(x) fX (x)dx.
−∞

Suma resp. integrál musí absolutně konvergovat, jinak E Y neexistuje (nebo je ±∞).
Analogie: Nahradíme sumu g(x) P(X = x) integrálem g(x)f (x) přes všechna možná x.

Důkaz. i) Pokud X je diskrétní náhodná veličina, pak i Y = g(X) je diskrétní náhodná


veličina (s hodnotami yj ). Pak
X X
E(g(X)) = E Y = yj P(Y = yj ) = yj P(g(X) = yj )
all yj all yj
X X X X
= yj P(X = xk ) = yj P(X = xk )
all yj xk :g(xk )=yj all yj xk :g(xk )=yj
X X X
= g(xk ) P(X = xk ) = g(xk ) P(X = xk ).
all yj xk :g(xk )=yj all xk

44
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin

ii) Obecný důkaz pro spojitou veličinu X je složitější. Nejprve si ukážeme důkaz pro nezá-
pornou funkci g. Obecnou funkci g pak přepíšeme jako rozdíl dvou nezáporných funkcí
g = g + − g − (kladná a záporná část).

Lemma 3.30. Pro nezápornou náhodnou veličinu X (diskrétní, spojitou či smíšenou) platí
Z∞ Z∞
EX = [1 − FX (x)] dx = P(X > x) dx.
0 0

Důkaz věty – pokračování. ii) Nechť X je spojitá náhodná veličina a g je nezáporná funkce
taková, že Y = g(X) je náhodná veličina (diskrétní, spojitá či smíšená). Protože Y je
nezáporná, dle lemmatu můžeme psát
Z∞ Z∞
E(g(X)) = E Y = P(Y > y) dy = P(g(X) > y) dy
0 0
 
Z∞ Z ZZ
viz (∗) = fX (x) dx dy = fX (x) d(x, y)
 

0 {x: g(x)>y} {(x,y): 0<y<g(x)}
 
Z g(x)
Z
= fX (x) dy  dx (g(x) je nezáporná)
 

{x: 0<g(x)} 0
 
Z∞ g(x)
Z Z∞
= fX (x)  dy  dx = g(x)fX (x) dx.
 

−∞ 0 −∞
Z
(∗) Použili jsme P(X ∈ A) = fX (x) dx pro A = {x : g(x) > y}.
A
Obecnou funkci g rozložíme na její kladnou a zápornou část, které jsou obě nezáporné.
Pak píšeme E g(X) = E Y = E Y + − E Y − = E g + (X) − E g − (X) a použijeme uvedený
důkaz.

Vlastnosti střední hodnoty


Pro praktické výpočty jsou důležité následující vlastnosti střední hodnoty. Všimněme si, že
pro střední hodnotu diskrétní i spojité náhodné veličiny platí stejné vlastnosti. Zcela obecně,
tyto vlastnosti střední hodnoty nejsou závislé na typu náhodné veličiny – diskrétní, spojitá,
smíšená.
Věta 3.31. Střední hodnota náhodné veličiny X splňuje následující vlastnosti:
i) Je-li X ≥ 0, pak E(X) ≥ 0.

ii) Je-li a, b ∈ R, pak E(aX + b) = a E(X) + b (pokud X má konečnou E X).

iii) Konstantní náhodná veličina X = c ∈ R má střední hodnotu rovnou příslušné konstantě


E(X) = c.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 45
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Poznámky:

• Později si ukážeme, že střední hodnota se chová jako lineární operátor (či spíše funkci-
onál) na prostoru náhodných veličin. Prozatím ještě neznáme náhodné veličiny vzniklé
transformací souboru náhodných veličin, tedy neumíme nakládat s veličinou Z = aX +
bY
Pro diskrétní, spojité či smíšené náhodné veličiny X a Y s konečnými středními hodno-
tami platí i
E(aX + bY ) = a E X + b E Y, ∀a, b ∈ R.

• Důkaz si ukážeme později (pro smíšené n.v. viz doporučená literatura).

Tyto vlastnosti je dobré znát pro zjednodušení výpočtů.


X
Důkaz. i) Pro X ≥ 0 diskrétní platí xk P(X = xk ) ≥ 0, ∀k. Proto E(X) = xk P(X =
all xk
Z∞
xk ) ≥ 0 Pro X ≥ 0 spojitou platí fX (x) = 0 pro x < 0. Proto E(X) = xfX (x) dx ≥ 0
0

ii) Pro X diskrétní náhodnou veličinu platí


X
E(aX + b) = (axk + b) P(X = xk )
all xk
X X
=a xk P(X = xk ) + b P(X = xk )
all xk all xk
= a E(X) + b.

Pro X spojitou náhodnou veličinu se důkaz provede obdobně.

iii) Vezměme a = 0 v ii).

3.6.2 Rozptyl

Definice 3.32. Rozptyl (variance) náhodné veličiny X je definován vztahem

var X = E[(X − E X)2 ].

Směrodatná odchylka náhodné veličiny X je definována jako



sd X = var X.

Rozptyl se také označuje jako σ 2 a měří šíři rozdělení: je to průměrná čtvercová vzdálenost
od středu. Směrodatná odchylka, též označovaná jako σ, má stejné jednotky jako X.
Následující vlastnosti rozptylu jsou užitečné pro praktické výpočty.

46
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin

Vlastnosti rozptylu

Věta 3.33. Rozptyl splňuje následující vlastnosti:

i) Pro všechna a, b ∈ R a náhodnou veličinu X platí

var(aX + b) = a2 var X.

ii) Náhodná veličina konstantně rovná c ∈ R má rozptyl var c = 0.

rozptylu je často nevýhodné počítat sumu xk (xk − E X)2 P(X = xk ), resp.


P
Pro výpočet
integrál R (x − E X)2 fX (x) dx . Pomocí základních vlastností střední hodnoty pišme:
R

 
var(X) = E((X − E X)2 ) = E X 2 − 2X(E X) + (E X)2
= E(X 2 ) − E(2X(E X)) + E((E X)2 )
= E(X 2 ) − 2(E X)(E X) + (E X)2
= E(X 2 ) − (E X)2 .

Dostáváme tak vztah, který používá pouze µ1 = E X a µ2 = E(X 2 ), jež často buď známe,
nebo jež můžeme snadněji spočítat:

var(X) = E((X − E X)2 ) = E(X 2 ) − (E X)2 ,

zjednodušeně pak:
var X = E(X − E X)2 = E X 2 − (E X)2 .

Všimněme si, že var(X) je vždy nezáporný (je to střední hodnota nezáporné náhodné
veličiny (X − E X)2 ). Proto:
(E X)2 ≤ E(X 2 ).

Protože věta o základních vlastnostech střední hodnoty platí ve stejné podobě pro dis-
krétní i spojité náhodné veličiny, můžeme tyto úvahy provádět bez specifikování typu náhodné
veličiny.

Důkaz. i) Dosadíme do definičního vztahu.

var(aX + b) = E(aX + b − E(aX + b))2 = E(aX + b − a E X − b)2 =


= E(aX − a E X)2 = E a2 (X − E X)2 = a2 E(X − E X)2 = a2 var X.

ii) var a = E(a − E a)2 = E(a − a)2 = E 0 = 0.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 47
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Romeo, Julie a střední hodnota a rozptyl

Příklad 3.34 (– střední hodnota a rozptyl rovnoměrného rozdělení). Označme dobu, kdy
přijde Romeo na místo srazu, jako náhodnou veličinu X. Předpokládejme, že je X rovnoměrně
rozdělená na intervalu [0, 1], tedy s hustotou:
(
1 pro x ∈ [0, 1]
fX (x) =
0 jinak.
1.2
1.0
0.8
0.6
0.4
0.2
0.0

0.0 0.2 0.4 0.6 0.8 1.0

Jaká je střední hodnota a rozptyl doby Romeova příchodu?

Romeo, Julie a střední hodnota a rozptyl

Příklad 3.35 (– střední hodnota a rozptyl rovnoměrného rozdělení). Jaká je střední hodnota
a rozptyl doby Romeova příchodu? Střední hodnotu spočítáme z definice:

Z∞ Z1 1
1 12 02 1

EX = xfX (x)dx = x1dx = x2 = − = .
2 0 2 2 2
−∞ 0

Střední hodnotu X 2 spočítáme obdobně:

Z∞ Z1 1
1 3 13 03 1

2 2
EX = x fX (x)dx = x2 1dx = x = − = .
3 0 3 3 3
−∞ 0

Rozptyl získáme z výpočetního vzorce:

var X = E X 2 − (E X)2 = 1/3 − (1/2)2 = 4/12 − 3/12 = 1/12.

Romeo, Julie a střední hodnota a rozptyl

Příklad 3.36 (– střední hodnota a rozptyl nerovnoměrného rozdělení). Nechť se příchody


Julie na sraz řídí rozdělením s hustotou:

4y

 pro y ∈ [0, 1/2]
fY (y) = 4 − 4y pro y ∈ [1/2, 1]


0 jinak.

48
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin

2.0
1.5
1.0
0.5
0.0
0.0 0.2 0.4 0.6 0.8 1.0

Jaká je střední hodnota a rozptyl doby příchodu Julie?

Romeo, Julie a střední hodnota a rozptyl


Příklad 3.37 (– střední hodnota a rozptyl nerovnoměrného rozdělení). Jaká je střední hod-
nota a rozptyl doby příchodu Julie? Střední hodnotu spočítáme jako součet dvou integrálů,
dle funkčního předpisu hustoty:
Z∞ Z1/2 Z1  1/2  1
4 3 4 2 4 3
EY = yfY (y)dy = y(4y)dy + y(4 − 4y)dy = y + y − y
3 0 2 3 1/2
−∞ 0 1/2

= 1/6 − 0/3 + 4/2 − 4/3 − 1/2 + 1/6 = (1 + 12 − 8 − 3 + 1)/6 = 1/2.


Střední hodnotu Y 2 spočítáme obdobně:
Z∞ Z1/2 Z1
2 2 2
EY = y fY (y)dy = y (4y)dy + y 2 (4 − 4y)dy = ... = 7/24
−∞ 0 1/2

Rozptyl získáme z výpočetního vzorce:


var Y = E Y 2 − (E Y )2 = 7/24 − (1/2)2 = 7/24 − 6/24 = 1/24.
Vidíme, že střední hodnota je stejná v obou případech, ale doba Romeova příchodu má dvoj-
násobný rozptyl oproti době příchodu Julie.

3.6.3 Obecné momenty náhodné veličiny


Definice 3.38. Pro k ∈ N, přirozené číslo, definujeme k-tý moment náhodné veličiny X jako
X



xki P(X = xi ) pro X diskrétní,
all xi

µk = E(X k ) = Z∞
xk fX (x) dx pro X spojitou.





−∞

Podobně, k-tý centrální moment je


X



(xi − µ1 )k P(X = xi ) diskrétní
all xi

σk = E(X − E X)k = Z∞
(x − µ1 )k fX (x) dx spojitá.





−∞

Značení: obvykle píšeme E X k místo E(X k ) a E(X − µ1 )k místo E((X − µ1 )k ).


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 49
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Střední hodnota, rozptyl, směrodatná odchylka

• Momenty dané náhodné veličiny X nemusí existovat nebo můžou být nekonečné (pokud
příslušná suma nebo integrál nekonverguje).

• µ1 = E X je střední hodnota veličiny X (často značená jako µ nebo µX ).

• σ2 = E(X − E X)2 nazýváme rozptyl (variance) veličiny X a značíme var(X), var X, σ 2


2
nebo σX .
q
• σ = var(X) nazýváme směrodatnou odchylkou (standardní odchylka) veličiny X (též
σX ).

Poznámka 3.39. Rozptyl je kvadratickou mírou disperze, tedy má stejné jednotky jako druhá
mocnina X. Směrodatná odchylka jakožto odmocnina z rozptylu má pak stejné jednotky jako
X. Toto pozorování bude užitečné později.

Šikmost
Charakteristikou sešikmení (skewness) je koeficient šikmosti:

σ3 E(X − E X)3 E(X − E X)3


γ1 = = = .
σ3 (E(X − E X)2 )3/2 (var X)3/2

Míra asymetrie: koeficient γ1 je kladný nebo záporný podle toho, na kterou stranu se hustota
pravděpodobnosti víc odchyluje od střední hodnoty:

γ1 = 1.26 γ1 = −1.14

50
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin

Špičatost
Koeficient špičatosti (excess kurtosis):

σ4 E(X − E X)4
γ2 = 4
−3= − 3.
σ (var X)2
Špičatost porovnává tvar hustoty náhodné veličiny s normálním (Gaussovým) rozdělením,
které má γ2 = 0: γ = 0.5 . . . špičatejší
2

γ2 = 0 . . . stejně špičaté jako Gaussovo rozdělení

γ2 = −0.85 . . . méně špičaté.

3.6.4 Momentová vytvořující funkce


Definice 3.40. Momentová vytvořující (generující) funkce náhodné veličiny X je definovaná
vztahem
M (s) = MX (s) = E(esX ).
Pro diskrétní náhodnou veličinu: Pro spojitou náhodnou veličinu:
Z∞
X
M (s) = esxk P(X = xk ).
k M (s) = esx fX (x)dx.
−∞

Vytvořující funkce jednoznačně určuje hustotu fX veličiny X (resp. pravděpodobnosti


P(X = x)). Je to její tzv. Laplaceova transformace.
Momentová vytvořující funkce umožňuje snadno vypočítat momenty veličiny X:
Věta 3.41. Pro náhodnou veličinu X s momentovou vytvořující funkcí M (s) platí:

k dk
E(X ) = M (s)

dsk


s=0

Tedy můžeme počítat:


• E X = M 0 (0)

• E X 2 = M 00 (0)

• var X = M 00 (0) − (M 0 (0))2 .

Příklady vytvořujících funkcí


Příklad 3.42. Poissonovská náhodná veličina:

λk e−λ
P(X = k) = , k = 0, 1, . . .
k!

λk e−λ s
= eλ(e −1) .
X
M (s) = E(esX ) = esk
k=0
k!


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 51
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Dostáváme:
d λ(es −1) s s=0
e = λ es eλ(e −1) =⇒ E(X) = λ,
ds
d2 λ(es −1) s s=0
= (λes )2 + λes eλ(e −1) =⇒ E(X 2 ) = λ + λ2

2
e
ds
a tedy var(X) = λ.

Příklad 3.43. Exponenciální náhodná veličina:

fX (x) = λe−λx , x ≥ 0. Pak

Z∞ " #∞
sx −λx e(s−λ)x λ
M (s) = λ e e dx = λ = .
s−λ 0
λ−s
0

Všimněte si, že M (s) je definována jen pro s ∈ [0, λ). Pro s ≥ λ integrál diverguje. Odsud

d λ λ s=0 1
= =⇒ E(X) = ,
ds λ − s (λ − s)2 λ

d2 λ 2λ s=0 2 1
= =⇒ E(X 2 ) = a tedy var(X) = 2 .
ds2 λ − s (λ − s)3 λ2 λ

3.6.5 Kvantily
Mezi důležité charakteristiky rozdělení náhodných veličin patří kvantily a kritické hodnoty.
Kvantil je zobecněnou inverzí distribuční funkce.

Definice 3.44. Nechť X je náhodná veličina s distribuční funkcí FX a α ∈ (0, 1). Bod qα
nazýváme α-kvantilem veličiny X, právě když platí

qα = inf{x : FX (x) ≥ α}.

Kvantil qα , uvažovaný jako funkce α, nazýváme kvantilovou funkcí a značíme FX−1 (α). (1−α)-
kvantil nazýváme α-kritickou hodnotou: cα = q1−α .

• Pro spojitou ostře rostoucí FX je kvantilová funkce FX−1 (α) klasickou inverzí distribuční
funkce FX .

• U některých důležitých rozdělení používáme speciální značení. Např. kvantily Gaussova


rozdělení značíme uα a kritické hodnoty zα .

Některé kvantily mají speciální názvy:

• q0.25 – dolní, či první kvartil

• q0.5 – medián, či druhý kvartil

• q0.75 – horní, či třetí kvartil

52
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin

Kvantily normálního (Gaussova) rozdělení

P(X ≤ q0.5 ) = 0.5


fX

q0.5 x
fX
P(X ≤ q0.75 ) = 0.75 P(X ≥ z0.25 ) = 0.25

q0.75 = z0.25 x

Romeo, Julie a kvantily


Příklad 3.45 (– kvantily rovnoměrného rozdělení). Předpokládejme, že Romeo dorazí na
místo srazu dle rovnoměrného rozdělení na intervalu [0, 1]. Najděme 5% a 95% kvantily doby
jeho příchodů. Distribuční funkci můžeme najít jako integrál hustoty. Zkoumáme jen oblast,
kde je hustota kladná – interval [0, 1]:
Zx Zx
FX (x) = fX (t)dt = 1dt = [t]x0 = x
−∞ 0

Distribuční funkce je zde ryze rostoucí, takže můžeme snadno najít kvantilovou funkci jako
její inverzi:
FX (qα ) = α ⇒ qα = α ⇒ FX−1 (α) = α.
Hledané kvantily pak jsou:
q0.05 = 0.05 = 3 min. a q0.95 = 0.95 = 57 min.

Romeo, Julie a kvantily


Příklad 3.46 (– kvantily rovnoměrného rozdělení). S pravděpodobností 90% Romeo přijde
mezi 3. a 57. minutou.
1.2
1.0
0.8
0.6
0.4
0.2
0.0

0.0 0.2 0.4 0.6 0.8 1.0


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 53
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Romeo, Julie a kvantily


Příklad 3.47 (– kvantily nerovnoměrného rozdělení). Předpokládejme, že Julie dorazí podle
rozdělení s trojúhelníkovou hustotou shora. Najděme 5% a 95% kvantily doby jejího příchodu.
Distribuční funkci získáme jako integrál z hustoty. Pozorovaný interval musíme rozdělit
na dvě části, protože má hustota na každé z částí různý funkční předpis.
Pro y ∈ [0, 1/2]:
Zy Zy
y
4tdt = 2t2 = 2y 2 .

FY (y) = fY (t)dt = 0
−∞ 0

Pro y ∈ [1/2, 1]:


Z1/2 Zy
y
(4 − 4t)dt = 1/2 + 4t − 2t2 = 4y − 2y 2 − 1 = 1 − 2(y − 1)2 .

FY (y) = 4tdt + 1/2
0 1/2

Kvantilovou funkci najdeme invertováním distribuční funkce:


2
p .
FY (q0.05 ) = 0.05 ⇔ 2q0.05 = 0.05 ⇔ q0.05 = 0.05/2 = 0.16 = 9.5 min.

Podobně:
p .
FY (q0.95 ) = 0.95 ⇔ 1 − 2(q0.95 − 1)2 = 0.95 ⇔ q0.95 = 1 − 0.05/2 = 0.84 = 50.5 min.

Romeo, Julie a kvantily


Příklad 3.48 (– kvantily nerovnoměrného rozdělení). S pravděpodobností 90% Julie přijde
mezi 9,5. a 50,5. minutou.
2.0
1.5
1.0
0.5
0.0

0.0 0.2 0.4 0.6 0.8 1.0

Prostřední region, pokrývající čas, kdy daná osoba přijde s pravděpodobností 90%, je znatelně
užší pro Julii, než pro Romea. To odpovídá pozorování, že časy příchodu Julie mají nižší
rozptyl.

Důležité kvantily
Kvantily rozdělují populaci (tedy možné hodnoty náhodné veličiny) do skupin podle ur-
čených pravděpodobností. Důležité dělící body se nazývají:
• q0.5 – medián

• q0.25 – dolní kvartil

• q0.75 – horní kvartil.

54
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.6 Charakteristiky náhodných veličin

Tyto kvantily nám mohou dát přehled o chování zkoumané náhodné veličiny:

• Medián je mírou polohy, tedy analogií střední hodnoty.

• Interkvartilové rozpětí q0.75 − q0.25 je mírou disperze, tedy analogií k rozptylu.

Střední hodnota se někdy může od mediánu výrazně lišit, zejména u jednostranných rozdělení
s těžkými chvosty.

Střední hodnota vs. medián

Příklad 3.49 (– průměrný vs. mediánový příjem). Dle Informačního systému o průměr-
ném výdělku (www.ispv.cz) byl v ČR v prvním pololetí roku 2022 průměrný měsíční příjem
41 990 Kč. Nicméně 67% populace mělo příjmy nižší. Mediánový příjem činil 34 652 Kč:
0.030
0.025
0.020
0.015

průměrný příjem: 41 990 Kč


0.010
0.005

67% populace 33% populace


0.000

0 20 40 60 80 100

Střední hodnota vs. medián

Příklad 3.50 (– průměrný vs. mediánový příjem). Dle Informačního systému o průměr-
ném výdělku (www.ispv.cz) byl v ČR v prvním pololetí roku 2022 průměrný měsíční příjem
41 990 Kč. Nicméně 67% populace mělo příjmy nižší. Mediánový příjem činil 34 652 Kč:
0.030
0.025
0.020

mediánový příjem: 34 652 Kč


0.015

průměrný příjem: 41 990 Kč


0.010
0.005

50% populace 50% populace


0.000

0 20 40 60 80 100


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 55
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

3.7 Důležitá diskrétní rozdělení


3.7.1 Konstantní náhodná veličina
Popisuje nenáhodnou situaci, kdy máme jen jeden možný výsledek, který nastává s pravdě-
podobností 1.

Definice 3.51. Náhodná veličina X se nazývá konstantní, jestliže pro nějaké c ∈ R platí:

X(ω) = c pro všechna ω ∈ Ω.

Tedy platí:
P(X = c) = 1, P(X = x) = 0 ∀x 6= c

Říkáme, že konstantní náhodná veličina je deterministická, nebo že má degenerované roz-


dělení.
Distribuční funkce konstantní náhodné veličiny je
(
0 pro x < c
FX (x) =
1 pro x ≥ c

Konstantní náhodná veličina – střední hodnota a rozptyl

Příklad 3.52.
P(X = c) = 1, P(X = x) = 0 ∀x 6= c
Střední hodnota a rozptyl:
X
E(X) = xk P(X = xk ) = c P(x = c) = c
all xk
X
var(X) = E(X − E X)2 = E(X 2 ) − (E X)2 = x2k P(X = xk ) − (c)2 =
xk
2 2
= c − (c) = 0.

Při výpočtech používáme:

E(c) = c . . . těžiště konstanty c je c samotná.


var(c) = 0 . . . šířka grafu s jedinou hodnotou c je 0.

3.7.2 Bernoulliho (Alternativní) rozdělení


Uvažujme náhodný experiment se dvěma možnými výsledky (alternativami). Těmto možnos-
tem přiřadíme hodnoty 0 (neúspěch) a 1 (úspěch). Experimenty s opakovaným házením mince
jsou základním nástrojem pro porozumění sekvencím náhodných veličin. Stejně jako Bernoulli
obvykle volíme X(hlava) = 1 a X(orel) = 0. Výskyt “hlavy” obecně označujeme za “úspěch”.
Předpokládáme, že úspěch nastává s pravděpodobností p.

56
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.7 Důležitá diskrétní rozdělení

Definice 3.53. Náhodná veličina X má Bernoulliho (alternativní) rozdělení s parametrem


p ∈ [0, 1], jestliže platí:
P(X = 1) = p, P(X = 0) = 1 − p.

Značení: X ∼ Be(p) či X ∼ Bernoulli(p) nebo X ∼ Alt(p).

Příklad 3.54 (– hod mincí). Experimenty s opakovaným házením mince jsou základním
nástrojem pro porozumění sekvencím náhodných veličin.

• Stejně jako Bernoulli obvykle volíme X(hlava) = 1 a X(orel) = 0.

• V tomto případě výsledek “hlava” označujeme jako “úspěch”: p = P(hlava).

Bernoulliho rozdělení – graf pravděpodobností


Pravděpodobnosti hodnot Bernoulliho rozdělenı́ s p = 0.3

0.7
P(X = x)
0.5

0.3

0
−1 −0.5 0 0.5 1 1.5 2
x

Bernoulliho rozdělení – střední hodnota a rozptyl

Příklad 3.55. Bernoulliho náhodná veličina:

P(X = 1) = p ∈ [0, 1] (hlava, úspěch)


P(X = 0) = 1 − p = q (orel, neúspěch).

Střední hodnota a rozpyl:


X
E(X) = xk P(X = xk ) = 1 · p + 0 · q = p
all xk
X
E(X 2 ) = x2k P(X = xk ) = 12 · p + 02 · q = p
xk

var(X) = E(X 2 ) − (E X)2 = p − p2 = p(1 − p).


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 57
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

3.7.3 Binomické rozdělení

Při opakovaném házení mincí nás často zajímá, kolikrát z n hodů nám padne “hlava”:

• Uvažujme n nezávislých pokusů končících dvěma možnými výsledky.

• Opět předpokládejme, že každý z pokusů je úspěšný s pravděpodobností p.


n k
• Pravděpodobnost, že právě k z n pokusů skončí úspěšně, je k p (1 − p)n−k .

– Pravděpodobnost každého jednotlivého výsledku s k úspěchy (hlavami) a n − k


neúspěchy (orly) je pk (1 − p)n−k .
n
– Počet takových výsledků odpovídá možným umístěním k úspěchů do n pozic: k
(pozice k hlav v posloupnosi n hodů).

Z kombinatoriky víme, že k úspěchů v n pokusech může nastat nk různými způsoby (vlastně




vybíráme k-tici míst, kde nastane úspěch, v posloupnosti délky n), které mají stejnou prav-
děpodobnost pk (k úspěchů) krát (1 − p)n−k (a zbytek (n − k) neúspěchů).

Definice 3.56. Náhodná veličina X má binomické rozdělení s parametry n ∈ N a p ∈ [0, 1],


jestliže
!
n k
P(X = k) = p (1 − p)n−k , k = 0, 1, . . . , n.
k

Značení: X ∼ Binom(n, p) nebo X ∼ Bin(n, p).

Binomické rozdělení – normalizace


Abychom ověřili, že binomické rozdělení je definováno korektně, zkontrolujme normalizační
podmínku, tj. že součet pravděpodobností všech možných hodnot je roven 1:
n
X
P(X = k) = 1.
k=0

Připomeňme si binomickou větu:

n
!
X n k n−k
a b = (a + b)n .
k=0
k

Proto platí

n n
!
X X n k
P(X = k) = p (1 − p)n−k = (p + (1 − p))n = 1n = 1.
k=0 k=0
k

58
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.7 Důležitá diskrétní rozdělení

Binomické rozdělení – graf pravděpodobností


Pravděpodobnosti hodnot binomického rozdělenı́ pro n = 10 a p = 0.3

0.3

0.2
P(X = x)

0.1

0
0 1 2 3 4 5 6 7 8 9 10
x

Binomické rozdělení – střední hodnota a rozptyl


Při opakovaném házením mince nás zajímá, kolikrát z n hodů nám padne “hlava”. Bino-
mická náhodná veličina obecně uvažuje X = “počet úspěchů” během n identických a nezá-
vislých opakování Bernoulliho experimentu (s P(úspěch) = p).
Příklad 3.57. Binomická náhodná veličina X ∼ Bi(n, p):

! !
n k n k n−k
P(X = k) = p (1 − p)n−k = p q , k = 0, 1, . . . , n.
k k
n n
!
X X X n
EX = xk P(X = xk ) = k P(X = k) = k pk q n−k .
all xk k=0 k=0
k

Suma na pravé straně E X připomíná binomickou větu, až na násobení exponentem


k ve výrazu k pk :
n
!
X n k n−k
p q = (p + q)n .
k=0
k

Všimněme si, že (pk )0 = k pk−1 a tedy p (pk )0 = k pk .


Po derivování obou stran rovnice dle p a vynásobení p získáme výraz, který potřebujeme.
Příklad 3.58 (pokračování).
n
!
X n k n−k
= (p + q)n

p q zderivujeme dle p
k=0
k
n
!
X n
k pk−1 q n−k = n(p + q)n−1

vynásobíme p
k=0
k
n
!
X n
k pk q n−k = np(p + q)n−1
k=0
k


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 59
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Dosazením q = 1 − p získáme na levé straně rovnice sumu z předchozího vzorce pro E X.


Proto
n
!
X n
E(X) = k pk q n−k = n p (p + q)n−1 = n p (1)n−1 = np.
k=0
k

Příklad 3.59 (pokračování). Podobně pomocí opětovného derivování spočteme E(X 2 ):


n
!
2 2
X n 2 k n−k
E X = E(X ) = k p q = np + n(n − 1)p2 .
k=0
k

Proto
var(X) = E(X 2 ) − (E X)2 = np + n(n − 1)p2 − n2 p2 = n p (1 − p)

Z předchozího víme, že
n
!
X n
kpk q n−k = np(p + q)n−1 ,
k=0
k

pokud rovnost zderivujeme podle p a následně vynásobíme p dostaneme požadovanou sumu.


Tedy:
n
!
X n
kpk q n−k = np(p + q)n−1

zderivujeme dle p
k=0
k
n
!
X n 2 k−1 n−k
= n(p + q)n−1 + n(n − 1)p(p + q)n−2

k p q vynásobíme p
k=0
k
n
!
X n 2 k n−k
k p q = np(p + q)n−1 + n(n − 1)p2 (p + q)n−2
k=0
k

Dosazením q = 1 − p získáme:
n
!
X n 2 k n−k
E X2 = k p q = pn + n(n + 1)p2
k=0
k

Předchozí výpočty střední hodnoty a rozptylu přímo z definice jsou dosti náročné. Později,
až zavedeme nezávislost náhodných veličin, spočteme střední hodnotu a rozptyl binomického
rozdělení snadno jako střední hodnotu a rozptyl součtu n nezávislých náhodných veličin s Ber-
noulliho rozdělením.

Binomické rozdělení – příklad

Příklad 3.60 (– hod kostkami). Hodíme deseti nezávislými, vyváženými šestistěnnými kost-
kami. Jaký je střední počet padlých šestek? Náhodná veličina X značící počet padlých šestek
má binomické rozdělení Binom(10, 1/6). Střední hodotu jsme spočítali jako

E X = n · p = 10 · 1/6 = 10/6 = 1.66.

60
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.7 Důležitá diskrétní rozdělení

Binomické rozdělení – příklad


Příklad 3.61 (– hod kostkami). Hodíme deseti nezávislými, vyváženými šestistěnnými kost-
kami. Jaká je pravděpodobnost, že hodíme alespoň tři šestky?
Náhodná veličina X značící
! počet padlých šestek má binomické rozdělení Binom(10, 1/6).
n k
Víme, že P(X = k) = p (1 − p)n−k . Zajímá nás
k
10 10
!   
k 10−k
X X 10 1 5 .
P(X ≥ 3) = P(X = k) = = 0.224.
k=3 k=3
k 6 6

Alternativně
P(X ≥ 3) = 1 − P(X ≤ 2) = 1 − P(X = 0) − P(X = 1) − P(X = 2)
   0  10    1  9    2  8
10 1 5 10 1 5 10 1 5
=1− − −
0 6 6 1 6 6 2 6 6
510 59 58 .
=1− − 10 − 45 = 0.224.
610 610 610

3.7.4 Indikátor jevu – Bernoulliho náhodná veličina


Speciálním a důležitým příkladem Bernoulliho náhodné veličiny je indikátor jevu.
Definice 3.62. Nechť A ∈ F je náhodný jev. Náhodná veličina definovaná vztahem
(
1 pokud jev A nastal
1A =
0 pokud jev A nenastal
se nazývá indikátor jevu A.
V matematické analýze často místo indikátoru mluvíme o charakteristické funkci množiny
A. V teorii pravděpodobnosti se ale pojem charakteristická funkce používá pro jiné účely.
Pro indikátor jevu A platí:
p = P(1A = 1) = P(A),
q = P(1A = 0) = P(AC ) = 1 − P(A) = 1 − p.

Indikátor jevu – příklady


Příklady 3.63 (– hod mincí, hody mincí).

• Bernoulliho náhodná veličina X z předchozího příkladu s mincemi není nic jiného něž
indikátor jevu {H}. Tedy X = 1{H} = 1H .
• Binomickou náhodnou veličinou X odpovídající počtu hlav, které padly v n hodech,
můžeme vyjádřit jako součet
n
X
X= 1Hi ,
i=1
kde 1Hi je indikátor jevu Hi = “v i-tém hodu padla hlava”.

Poznámka: Vyjádření binomické veličiny součtem (Bernoulliho) indikátorů často vede


k významnému zjednodušení výpočtů, což uvidíme později.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 61
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

3.7.5 Geometrické rozdělení


Dalším zajímavým jevem je první výskyt úspěchu při opakovaných pokusech:

• Uvažujme posloupnost nezávislých pokusů končících dvěma možnými výsledky.

• Opět předpokládejme, že každý z pokusů je úspěšný s pravděpodobností p.

• Pravděpodobnost, že první úspěšný pokus je k-tý v pořadí, je (1 − p)k−1 p.

Definice 3.64. Náhodná veličina X má geometrické rozdělení s parametrem p ∈ (0, 1),


jestliže
P(X = k) = (1 − p)k−1 p, k = 1, 2, . . .
Značení: X ∼ Geom(p).

Normalizační podmínka je splněna:


∞ ∞ ∞
X X X p
P(X = k) = (1 − p)k−1 p = p (1 − p)m = = 1.
k=1 k=1 m=0
1 − (1 − p)

Geometrické rozdělení – distribuční funkce


Distribuční funkci geometrického rozdělení můžeme pro k ∈ N vyjádřit jako
k
X k−1
X
FX (k) = P(X ≤ k) = p (1 − p)i−1 = p (1 − p)j
i=1 j=0

1 − (1 − p)k
=p = 1 − (1 − p)k .
1 − (1 − p)

V neceločíselných x > 0 je její hodnota rovna hodnotě v bodě bxc (dolní celá část x):

FX (x) = FX (bxc) = 1 − (1 − p)bxc .

Snáze spočteme FX pomocí pravděpodobnosti, že po k pokusech ještě nenastal úspěch:

P(X > k) = (1 − p)k a tedy FX (k) = 1 − P(X > k) = 1 − (1 − p)k .

62
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.7 Důležitá diskrétní rozdělení

Geometrické rozdělení – graf pravděpodobností


Pravděpodobnosti hodnot geometrického rozdělenı́ pro p = 0.3

0.3

0.2
P(X = x)

0.1

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x

Geometrické rozdělení – střední hodnota a rozptyl

Příklad 3.65. Geometrická náhodná veličina:

P(X = k) = (1 − p)k−1 p = q k−1 p, k = 1, 2, . . .


X ∞
X ∞
X
EX = xk P(X = xk ) = k q k−1 p = p k q k−1 .
all xk k=1 k=1
P∞
Suma na pravé straně E X připomíná derivaci sumy k=0 qk :

X 1
qk =

derivujeme dle q
k=0
1−q

X 1
k q k−1 = . (člen pro k = 0 je nulový)
k=1
(1 − q)2

Zaměňovat pořadí nekonečného součtu a derivování lze jen v případě, že suma stejnoměrně
konverguje, což pro tuto sumu platí pro |q| < 1.

X p 1
Dosazením q = 1 − p získáme: E(X) = p k q k−1 = 2
= .
k=1
(1 − (1 − p)) p

Příklad 3.66 (– pokračování). Podobným postupem spočteme i E(X 2 ). Z předchozího vý-


počtu víme

X 1
k q k−1 =

vynásobíme q
k=1
(1 − q)2

X q
k qk =

zderivujeme dle q
k=1
(1 − q)2

X 1 −2q 1+q
k 2 q k−1 = 2
− 3
= .
k=1
(1 − q) (1 − q) (1 − q)3


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 63
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Dosazením q = 1 − p získáváme:
∞ ∞
X X 2−p
E(X 2 ) = k 2 pq k−1 = p k 2 q k−1 =
k=1 k=1
p2
 2
2−p 1 1−p
var(X) = E(X 2 ) − (E X)2 = − = .
p2 p p2

3.7.6 Poissonovo rozdělení – motivace


Počet náhodných událostí během určité doby se často modeluje pomocí tzv. Poissonova roz-
dělení. Běžné příklady:

• X = “počet α-částic emitovaných poloniem během 8 minut” (Rutherford, Geiger).

• X = “počet požadavků, které přijdou na server během 15 sekund”.

• X = “počet zákazníků v obchodě během polední pauzy”.

• Konečná populace: n jedinců se nezávisle rozhodne, zda jít do obchodu.

– Pak X je binomická náhodná veličina: X ∼ Binom(n, p).

• Nekonečná populace: zajímá nás rozdělení X ∼ Binom(n, p) v limitě n → ∞.

– Užitečná aproximace pro veliké populace (molekuly plynu, uživatelé internetu,


atp.).

Příklad 3.67 (– počet zákazníků v obchodě během polední pauzy).

• n je počet obyvatel ve městě

• počet obchodů je úměrný počtu lidí: no = ρn, kde ρ je hustota obchodů

• pravděpodobnost, že člověk půjde do nějakého obchodu: z

• pravděpodobnost, že člověk půjde do konkrétního obchodu: p = z/no = z/(ρn)

• počet lidí, kteří půjdou do tohoto obchodu: X ∼ Binom(n, p)

• očekávaný počet je E X = np = nz/(ρn) = z/ρ = λ . . . konstantní.

Binomické rozdělení pro n → ∞, p → 0 a np = λ (tedy p = λ/n):


! n−k
n k n! λk λ

P(X = k) = p (1 − p)n−k = 1− .
k k!(n − k)! nk n

Jednotlivé členy si vhodně přerovnáme a provedeme limitu n → ∞


n −k
n (n − 1) (n − k + 1) λk λ λ
 
P(X = k) = ··· 1− 1−
n n n k! n n
↓ ↓ ↓ ↓ ↓ ↓
λk
1 1 ··· 1 e−λ 1
k!

64
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.7 Důležitá diskrétní rozdělení

Celkově dostáváme
λk −λ
lim P(X = k) = e . . . takto definujeme Poissonovo rozdělení.
n→∞ k!

Tomuto rozdělení říkáme Poissonovo (viz níže). Pro sekvenci náhodných veličin konver-
genci, kdy
P(Xn = x) → P(X = x), n → ∞, ∀x
D
nazýváme konvergence v distribuci a značíme ji Xn → X. Tuto konvergenci budeme definovat
a používat později.

3.7.7 Poissonovo rozdělení


Definice 3.68. Náhodná veličina X má Poissonovo rozdělení s parametrem λ > 0 jestliže

λk −λ
P(X = k) = e , k = 0, 1, . . . .
k!
Značení: X ∼ Poisson(λ)

Připomeňme si dva důležité vztahy ∀x ∈ R:


n ∞
x xk
 X
x x
e = lim 1+ e =
n→∞ n k=0
k!

První vztah jsme použili v předchozím odvození. Druhý poslouží pro ověření normalizační
podmínky:
∞ ∞ ∞
λk −λ λk
e = e−λ = e−λ eλ = 1.
X X X
P(X = k) =
k=0 k=0
k! k=0
k!

Poissonovo rozdělení – graf pravděpodobností


Pravděpodobnosti hodnot Poissonova rozdělenı́ pro λ = 1.8
0.4

0.3

P(X = x) 0.2

0.1

0
0 1 2 3 4 5 6 7 8 9 10
x


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 65
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Poissonovo rozdělení – střední hodnota a rozptyl

Příklad 3.69. Poissonova náhodná veličina s parametrem λ > 0:


λk −λ
P(X = k) = e , k = 0, 1, 2, . . .
k!
∞ ∞
λk
k e−λ
X X
EX = k P(X = k) =
k=0 k=0
k!

λk−1
= λ e−λ
X

k=1
(k − 1)!

λm
= λ e−λ
X

m=0
m!
−λ λ
= λe e = λ.

Příklad 3.70 (pokračování). Podobně spočteme i E(X 2 ):


∞ ∞
λk −λ λk−1
e = λe−λ
X X X
E(X 2 ) = x2k P(X = xk ) = k2 k2
all xk k=0
k! k=1
k(k − 1)!
∞ ∞
!
−λ
X λk−1 λk−1
X
= λe (k − 1) +
k=1
(k − 1)! k=1 (k − 1)!
∞ ∞
!
−λ
X λm X λm
= λe m +
m=0
m! m=0 m!
 
= λe−λ eλ E X + eλ = λ (λ + 1) = λ2 + λ

var(X) = E(X 2 ) − (E(X)2 ) = λ2 + λ − λ2 = λ.

Poissonovo rozdělení – příklad

Příklad 3.71 (– překlepy v textu). Autor v průměru udělá jeden překlep na tisíc znaků. Jaký
je střední počet překlepů na normostraně textu (30 řádků po 60 znacích)? Použijte Poissonovu
aproximaci. Máme n = 30·60 = 1800, p = 1/1000 a λ = n·p = 1800/1000 = 1.8. Náhodná ve-
ličina X značící počet překlepů má aproximativně Poissonovo rozdělení Poisson(1.8). Střední
hodnotu získáme jako
E X = λ = 1.8.
Jaká je pravděpodobnost, že na jedné normostraně textu autor neudělá ani jeden překlep?
λk −λ
Víme, že P(X = k) = e . Tedy
k!
(1.8)0 −1.8
P(X = 0) = e = e−1.8 = 0.165.
0!

66
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.8 Důležitá spojitá rozdělení

3.7.8 Shrnutí důležitých diskrétních rozdělení


• Bernoulliho (Alternativní) rozdělení s parametrem p, 0 ≤ p ≤ 1, X ∼ Be(p):
(jiná běžná značení X ∼ Bernoulli(p), X ∼ Alt(p))
(Jeden hod nevyvážnou mincí s pravděpodobností hlavy p.)

P(1) = p, P(0) = q = 1 − p, E X = p, var X = p(1 − p).

• Binomické rozdělení s parametrem p, 0 ≤ p ≤ 1, X ∼ Binom(n, p), Bin(n, p):


(Počet hlav v n hodech nevyvážnou mincí.)
!
n k
P(X = k) = p (1 − p)n−k , E X = np, var X = np(1 − p).
k

• Geometrické rozdělení s parametrem p, 0 < p < 1, X ∼ Geom(p):


(Počet hodů nevyvážnou mincí, než padne první hlava.)
1 1−p
P(X = k) = (1 − p)k−1 p, k = 1, 2, . . . , EX = , var X = .
p p2

• Poissonovo rozdělení s parametrem λ > 0, X ∼ Poisson(λ):


(V jistém smyslu limita binomického pro n → ∞.)

λk −λ
P(X = k) = e , k = 0, 1, 2, . . . , E X = var X = λ.
k!

3.8 Důležitá spojitá rozdělení


3.8.1 Rovnoměrné rozdělení

Definice 3.72. Náhodná veličina X má rovnoměrné (uniformní) rozdělení na intervalu (a, b),
kde a < b, pokud je její hustota na tomto intervalu konstantní:

1
pro x ∈ (a, b),


fX (x) = b−a

 0 jinde.

Značení: X ∼ Unif(a, b), X ∼ U(a, b).

Normalizace: Ověříme snadno, plocha pod grafem hustoty musí být rovna jedné:

Z∞ Zb b
1 x b−a

fX (x) dx = dx = = = 1.
b−a b−a a b−a
−∞ a

Distribuční funkce:
Zx x
1 t x−a

FX (x) = dt = = pro x ∈ [a, b].
b−a b−a a b−a
a


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 67
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

Rovnoměrné rozdělení – graf hustoty


fX

1
b−a

a b
x

Rovnoměrné rozdělení – střední hodnota a rozptyl


Příklad 3.73. Rovnoměrná náhodná veličina X ∼ U(a, b):

1
pro x ∈ (a, b),


fX (x) = b−a

 0 jinde.

Z∞ Zb " #b
x x2 b2 − a2 a+b
EX = x fX (x) dx = dx = = = .
b−a 2(b − a) a
2(b − a) 2
−∞ a

Z∞ Zb " #b
x2 x3 a2 + ab + b2
E(X 2 ) = x2 fX (x) dx = dx = = ··· = .
b−a 3(b − a) a
3
−∞ a

a2 + ab + b2 (a + b)2 (b − a)2
var(X) = E(X 2 ) − (E X)2 = − = ··· = .
3 4 12

3.8.2 Exponenciální rozdělení


Často se používá pro modelování času, v teorii náhodných procesů a systémů hromadné ob-
sluhy – tzv. Poissonův proces má nezávislé exponenciální časy mezi událostmi.
Definice 3.74. Náhodná veličina X má exponenciální rozdělení s parametrem λ > 0, jestliže
má její hustota tvar:
 λe−λx pro x ∈ [0, ∞),

fX (x) =
0 jinde.

Značení: X ∼ Exp(λ).
Normalizace:
Z∞ Z∞ " #∞
−λx e−λx λ
fX (x)dx = λe dx = λ =0− = 1.
−λ 0
−λ
−∞ 0
Distribuční funkce:
Zx " #x
−λt e−λt
FX (x) = λe dt = λ = 1 − e−λx .
−λ 0
0

68
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.8 Důležitá spojitá rozdělení

Exponenciální rozdělení – graf hustoty

2
fX fX = λe−λx

λ=2
1

1 λ=1
2
1
λ= 2

0
x

Exponenciální rozdělení – střední hodnota a rozptyl

Příklad 3.75. Exponenciální náhodná veličina X ∼ Exp(λ):

 λe−λx

pro x ≥ 0,
fX (x) =
0 jinde.

Z∞ Z∞ Z∞  −λx ∞
−λx per partes ∞ e 1
−xe−λx 0 + e−λx dx = −

E(X) = x fX (x) dx = xλe dx = =
λ 0 λ
0 0 0
Z∞ Z∞ Z∞ Z∞
−λx per partes
 2 −λx ∞ −λx 2 2
2
E(X ) = 2
x fX (x) dx = x λe2
= −x e + 2xe dx = xλe−λx =
0 λ λ2
0 0 0 0
2 2 12 1
var(X) = E(X ) − (E(X)) = 2 − 2 = 2
λ λ λ

Exponenciální rozdělení – příklad

Příklad 3.76 (– životnost lampy projektoru). Doba, po kterou vydrží svítit lampa projek-
1
toru, než se porouchá, se řídí exponenciálním rozdělením s parametrem λ = 100 (počítáno
v hodinách). Jaká je střední doba do poruchy lampy? Víme, že

1 1
EX = = 1 = 100 hodin.
λ 100

Jaká je pravděpodobnost, že lampa vydrží svítit déle než 50 hodin? Hledáme

Z∞ " #∞
−λt e−λt 1 .
P(X > 50) = λe dt = λ = e− 100 50 = e−1/2 = 0.606.
−λ 50
50


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 69
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

3.8.3 Normální rozdělení


Normální rozdělení se používá pro modelování veličin pozorovatelných v přírodě, jako je výška
nebo váha. Zároveň jej lze použít pro aproximaci chování součtů či průměrů náhodných veličin
– více později.

Definice 3.77. Náhodná veličina X má normální (Gaussovo) rozdělení s parametry µ ∈ R


a σ 2 > 0, jestliže platí:

1 (x−µ)2
fX (x) = √ e− 2σ 2 pro x ∈ (−∞, ∞).
2πσ 2

Značení: X ∼ N(µ, σ 2 ).

• Pozor: některé knihy a programy používají X ∼ N(µ, σ).



• Symbolem σ v dalším textu myslíme σ 2 .

• N(0, 1) nazýváme standardní normální rozdělení.

Distribuční funkce:
Nelze vyjádřit analyticky, pouze vypočítat numericky. Distribuční funkce pro standardní
normální rozdělení se značí Φ a její hodnoty jsou tabelovány.

Standardní normální rozdělení N(0, 1) – graf hustoty

0.5 fX (x)

0.4

x 2
0.3 √1 e− 2

0.2

0.1

−4 −3 −2 −1 0 1 2 3 4
x

Hustota normálního rozdělení: X ∼ N(µ, σ 2 )

70
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.8 Důležitá spojitá rozdělení

Hustota normálního rozdělení: X ∼ N(µ, σ 2 )

Μ�3Σ Μ�2Σ Μ�Σ Μ Μ�Σ Μ�2Σ Μ�3Σ

Hustota normálního rozdělení: Z ∼ N(0, 1)

�3 �2 �1 0 1 2 3

Hustoty normálního rozdělení

N(5,1/4)
0.8

N(0,1)
N(-1,4)

�6 �4 �2 2 4 6

Normální rozdělení – střední hodnota a rozptyl

Příklad 3.78. Normální náhodná veličina X ∼ N(µ, σ 2 ):

1 (x−µ)2
fX (x) = √ e− 2σ 2 pro x ∈ (−∞, ∞).
2πσ 2

Z∞ (x−µ)2
1 substituce
E(X) = x√ e− 2σ 2 dx = µ
2πσ 2
−∞

var(X) = σ 2 .

Toto je opět složitý výpočet, stejně jak normalizace normálního rozdělení, který s matemati-
kou, kterou máme, neumíme provést.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 71
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

3.8.4 Standardizace obecné náhodné veličiny


Mějme náhodnou veličinu X se střední hodnotou E X = µ a rozptylem var X = σ 2 . Tato
veličina nemusí být spojitá.
Pokusme se ji co nejjednodušeji převést na veličinu Z s parametry E Z = 0 a var Z = 1
(standardizace):

• Odečteme střední hodnotu µ. Potom

E(X − µ) = E X − µ = 0 a var(X − µ) = var X = σ 2 .



• Přeškálujeme hodnotou σ = var X
X −µ E(X − µ) X −µ var(X − µ) σ2
   
E = =0 a var = = = 1.
σ σ σ σ2 σ2

Hledaná transformace je tedy lineární a náhodná veličina


X −µ
Z=
σ
má skutečně nulovou střední hodnotu a jednotkový rozptyl.

3.8.5 Standardizace normální náhodné veličiny


Pro praktické použití nás bude nejvíce zajímat standardizování náhodné veličiny s normálním
rozdělením.
Věta 3.79. Nechť náhodná veličina X má normální rozdělení X ∼ N(µ, σ 2 ). Pak náhodná
veličina
X −µ
Z=
σ
má standardní normální rozdělení, tedy Z ∼ N(0, 1).
Důkaz.
X −µ
 
FZ (z) = P(Z ≤ z) = P ≤ z = P (X ≤ σz + µ) = FX (σz + µ)
σ
∂FZ ∂FX
fZ (z) = (z) = (σz + µ) = σfX (σz + µ)
∂z ∂z
1 (σz+µ−µ)2 1 z2
= σ√ e− 2σ 2 = √ e− 2 .
2πσ 2 2π
Poznámka 3.80. Předchozí věta:
Pokud X ∼ N(µ, σ 2 ), pak Z = X−µ
σ ∼ N(0, 1).
se používá pro získání hodnot distribuční funkce X z tabulek pro standardní normální
veličinu Z:
X −µ x−µ
 
FX (x) = P(X ≤ x) = P ≤
σ σ
x−µ x−µ
   
=P Z≤ =Φ .
σ σ

72
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 3.8 Důležitá spojitá rozdělení

Standardizace normálního rozdělení – graf

(X-3)/2 ~ N(0,1)

X-3~N(0,4) X~N(3,4)

�6 �4 �2 2 4 6 8

Normální rozdělení – příklad

Příklad 3.81 (– výlov). Hmotnost kaprů v rybníce se řídí normálním rozdělením se střední
hodnotou 2.5 kg a směrodatnou odchylkou 300 g. Jaká je pravděpodobnost, že vylovíme
většího než tříkilového kapra? Hmotnost náhodně vyloveného kapra má rozdělení N(µ, σ 2 ),
kde µ = 2.5 a σ 2 = (0.3)2 . Víme, že Z = X−µ
σ má standardní normální rozdělení N(0, 1).

P(X > 3) = 1 − P(X ≤ 3) doplňek


X −µ 3−µ
 
=1−P ≤ standardizace
σ σ
3 − 2.5 .
= 1 − P(Z ≤ ) = 1 − P(Z ≤ 1.67) dosazení
0.3
= 1 − Φ(1.67) Z ∼ N(0, 1)
.
= 1 − 0.9525 = 0.0475 tabulky.

Tabulka hodnot distribuční funkce Φ standardního normálního rozdělení N(0, 1)

Φ(x)

x
.00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7703 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 73
3 NÁHODNÉ VELIČINY BI-PST, ZS 2022/23, Přednáška 1-12

3.8.6 Shrnutí důležitých spojitých rozdělení


• Rovnoměrné rozdělení na intervalu [a, b], X ∼ Unif(a, b):

1 a+b (b − a)2
fX (x) = , x ∈ [a, b] EX = , var X = .
b−a 2 12

• Exponenciální rozdělení s parametrem λ > 0, X ∼ Exp(λ):


1 1
fX (x) = λe−λx , x ∈ [0, ∞) EX = , var X = 2 .
λ λ

• Normální (Gaussovo) rozdělení s parametry µ ∈ R a σ 2 > 0, X ∼ N(µ, σ 2 ):

1 (x−µ)2
fX (x) = √ e− 2σ 2 , x ∈ (−∞, ∞) E X = µ, var X = σ 2 .
2πσ 2

74
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12

4 Náhodné vektory
Někdy měříme na jednom výsledku experimentu několik náhodných veličin najednou. Např.
hmotnost a výšku náhodně vybraného studenta.
Tyto soubory náhodných veličin označujeme jako náhodné vektory. Jednotlivé veličiny
mohou mít různá rozdělení a hodnoty veličin na sobě mohou silně záviset. Je tedy vhodné
zkoumat jejich rozdělení společně jako tzv. sdružené rozdělení.
Definice 4.1. Máme-li dvě náhodné veličiny X a Y definované na stejném pravděpodob-
nostním prostoru (Ω, F, P), pak definujeme jejich sdruženou distribuční funkci FX,Y (x, y)
vztahem
FX,Y (x, y) = P(X ≤ x ∩ Y ≤ y).
Pro n náhodných veličin X1 , X2 , . . . , Xn definujeme sdruženou distribuční funkci

FX (x) = P(X ≤ x) = P(X1 ≤ x1 ∩ . . . ∩ Xn ≤ xn ).

Zde používáme pro vektory značení x = (x1 , . . . , xn ) a X = (X1 , . . . , Xn ). Dvojici (X, Y )


resp. n-tici X = (X1 , . . . , Xn ) nazýváme náhodným vektorem.
Příklad 4.2. Nechť náhodné veličiny X a Y mají následující pravděpodobnosti jednotlivých
kombinací hodnot:
x
P(X = x ∩ Y = y) 0.5 1 2
1 0.3 0.1 0.3
y
2 0 0.1 0.2
Určete sdruženou distribuční funkci FX,Y (x, y) = P(X ≤ x ∩ Y ≤ y).
y
0 0.3 0.5 1
2
0 0.3 0.4 0.7
1
0 0 0 0
0 0.5 1 2 x

Vlastnosti sdružené distribuční funkce


Sdružená distribuční funkce má analogické vlastnosti jako klasická distribuční funkce:
Věta 4.3. Distribuční funkce FX,Y náhodných veličin X a Y má následující vlastnosti:
i) Když x1 < x2 a y1 < y2 tak FX,Y (x1 , y1 ) ≤ FX,Y (x2 , y2 )
ii) ∀y ∈ R, lim FX,Y (x, y) = 0 a
x→−∞
∀x ∈ R, lim FX,Y (x, y) = 0
y→−∞

iii) ∀y ∈ R, lim FX,Y (x, y) = FY (y) a


x→∞
∀x ∈ R, lim FX,Y (x, y) = FX (x).
y→∞

Důkaz. Analogicky jako u jedné proměnné.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 75
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12

4.1 Diskrétní náhodné vektory


4.1.1 Diskrétní sdružené rozdělení
Jsou-li veličiny X a Y diskrétní, je často výhodné popisovat jejich rozdělení pomocí pravdě-
podobností jednotlivých kombinací hodnot.

Definice 4.4. Diskrétní náhodné veličiny X a Y mají sdružené pravděpodobnosti možných


hodnot
P(X = x ∩ Y = y) = P({X = x} ∩ {Y = y}).

Sdružené pravděpodobnosti lze uvažovat jako funkci x a y. Té pak říkáme sdružená prav-
děpodobnostní funkce (X, Y ).
Sdružené rozdělení diskrétního náhodného vektoru tak lze ekvivalentně zadat buďto po-
mocí sdružené distribuční funkce, nebo pomocí sdružených pravděpodobností.
Sdružená distribuční funkce diskrétních náhodných veličin má tvar
X X
FX,Y (x, y) = P(X ≤ x ∩ Y ≤ y) = P(X = xi ∩ Y = yj )
{i: xi ≤x} {j: yj ≤y}

Z toho vidíme, že FX,Y (x, y) má v diskrétním případě “schodovitou” strukturu.

Pro diskrétní sdružené rozdělení platí normalizační podmínka podobně jako v jednoroz-
měrném případě:
X X X  
P(X = xi ∩ Y = yj ) = P {X = xi } ∩ all yj {Y = yj }
S

all xi all yj all xi


X X
= P ({X = xi } ∩ {Y ∈ R}) = P (X = xi ) = 1
all xi all xi
 S  
podrobněji: = P all xi {X = xi } = P ({X ∈ R}) = P(Ω) = 1

Diskrétní sdružené rozdělení – vizualizace

Sdružené pravděpodobnosti Sdružená distribučnı́ funkce

0.4 1
P(X = x ∩ Y = y)
FX,Y
0.2 0.5
0.3
0 0
3.5
2 2 3.5
1 2 1 2
y 0.5 1 y 0 0 0.5 1
x x
y
0 0.3 0.5 1
2
x 0 0.3 0.4 0.7
1
P(X = x ∩ Y = y) 0.5 1 2
0 0 0 0
2 0 0.1 0.2
y 0 0.5 1 2 x
1 0.3 0.1 0.3

76
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.1 Diskrétní náhodné vektory

4.1.2 Diskrétní marginální rozdělení


Někdy známe sdružené rozdělení náhodných veličin X a Y , ale potřebujeme pouze rozdělení
veličiny X. Takto získané rozdělení nazýváme marginální rozdělení náhodné veličiny X.
Věta 4.5. Uvažujme diskrétní náhodné veličiny X a Y se sdruženými pravděpodobnostmi
P(X = x ∩ Y = y). Marginální rozdělení diskrétní náhodné veličiny X je určeno pravděpo-
dobnostmi
X
P(X = x) = P(X = x ∩ Y = yj )
all yj
X
Podobně P(Y = y) = P(X = xi ∩ Y = y).
all xi

Důkaz. Všechny jevy {Y = yj } tvoří nejvýše spočetný disjunktní rozklad Ω = j {Y = yj }:


S

P(X = x) = P({X = x} ∩ {Y ∈ R}) = P({X = x} ∩ ( j {Y = yj })) =


S
[  X
=P ({X = x} ∩ {Y = yj }) = P({X = x} ∩ {Y = yj }).
j j

Příklad 4.6. Nechť náhodné veličiny X a Y mají následující sdružené pravděpodobnosti:


x
P(X = x ∩ Y = y) 0.5 1 2 P(Y = y)
2 0 0.1 0.2 0.3
y
1 0.3 0.1 0.3 0.7
P(X = x) 0.3 0.2 0.5
Určete marginální pravděpodobnosti P(X = x) a P(Y = y).

 0.7 pro y = 1

P(Y = y) = 0.3 pro y = 2

 0 jinde

 0.3 pro x = 0.5


 0.2 pro x = 1
P(X = x) =
 0.5 pro x = 2



0 jinde.

4.1.3 Nezávislost diskrétních náhodných veličin


Stejně jako u náhodných jevů, často se nám hodí prozkoumat, zda znalost hodnoty jedné
náhodné veličiny může ovlivnit rozdělení veličiny druhé.
Definice 4.7. Náhodné veličiny X a Y nazýváme nezávislé, pokud pro všechna x, y ∈ R
jsou jevy {X ≤ x} a {Y ≤ y} nezávislé. Tedy pokud pro všechna x, y ∈ R platí rovnost
P(X ≤ x ∩ Y ≤ y) = P(X ≤ x) · P(Y ≤ y).
Náhodné veličiny X1 , . . . , Xn nazýváme nezávislé, jestliže pro každé x ∈ Rn platí rovnost
n
Y
P(X ≤ x) = P(Xi ≤ xi ).
i=1


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 77
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12

Náhodné veličiny X1 , X2 , . . . tvořící spočetnou kolekci nazýváme nezávislé, pokud je každá


konečná n-tice Xi1 , . . . , Xin nezávislá.
Pro diskrétní a spojité náhodné veličiny je možno ověření nezávislosti zjednodušit pomocí
pravděpodobností a hustot.
Věta 4.8. Diskrétní náhodné veličiny X a Y jsou nezávislé, pokud pro všechna x, y ∈ R jsou
jevy {X = x} a {Y = y} nezávislé. Tedy pokud pro všechna x, y ∈ R platí rovnost

P(X = x ∩ Y = y) = P(X = x) · P(Y = y).

Náhodné veličiny X1 , . . . , Xn jsou nezávislé, jestliže pro každé x ∈ Rn platí rovnost


n
Y
P(X = x) = P(Xi = xi ).
i=1

Důkaz. Pokud platí podmínka pro rovnosti, musí platit i pro nerovnosti (součet pravděpo-
dobností disjunktních jevů).
Pokud platí podmínka pro nerovnosti, musí platit i pro rovnosti (rozdíl pravděpodobností
vhodných nerovností dá rovnosti).

Příklad 4.9 (– pokračování). Náhodné veličiny X a Y mají následující sdružené a marginální


pravděpodobnosti:
x
P(X = x ∩ Y = y) 0.5 1 2 P(Y = y)
2 0 0.1 0.2 0.3
y
1 0.3 0.1 0.3 0.7
P(X = x) 0.3 0.2 0.5
Jsou X a Y nezávislé? Nejsou, protože pro x = 0.5 a y = 2 platí

0 = P(X = 0.5 ∩ Y = 2) 6= P(X = 0.5) · P(Y = 2) = 0.3 · 0.3 = 0.09.


Příklad 4.10 (– Alice, Bob a sázka na hod kostkou). Alice a Bob sází na výsledek hodu kostkou.
Alice sází na sudé (2,4,6), Bob sází na vysoké hodnoty (4,5,6). Padne-li vsazená hodnota, příslušná
osoba získá jednu korunu z banku, jinak jednu korunu prohraje. Nechť X je náhodná veličina, značící
zisk či ztrátu Alice po jednom kole hry a Y totéž pro Boba. Najděte sdružené rozdělení vektoru (X, Y ).
Na základě výsledku hodů kostkou každý z hráčů buď získá, nebo ztratí. Rozepišme možné výsledky:
Hodnota na kostce 1 2 3 4 5 6
Pravděpodobnost 1/6 1/6 1/6 1/6 1/6 1/6
Výhra Alice (X) -1 1 -1 1 -1 1
Výhra Boba (Y ) -1 -1 -1 1 1 1
Pro jednotlivé kombinace hodnot −1 a 1 můžeme najít sdružené pravděpodobnosti:
x
P(X = x ∩ Y = y) −1 1
−1 2/6 1/6
y
1 1/6 2/6

Příklad 4.10 (– Alice, Bob a sázka na hod kostkou). Najděte marginální rozdělení výhry pro
Alici a Boba zvlášť.
Marginální rozdělení získáme řádkovými a sloupcovými součty:

78
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.1 Diskrétní náhodné vektory

x
P(X = x ∩ Y = y) −1 1 P(Y = y)
−1 2/6 1/6 1/2
y
1 1/6 2/6 1/2
P(X = x) 1/2 1/2
Výsledek bychom dokázali získat i bez znalosti teorie náhodných vektorů. Marginální rozdělení je
jednorozměrné rozdělení náhodné veličiny, tak jak ho známe z dřívějška, bez ohledu na druhou veličinu.
Zde můžeme snadno říct, že např. Alice má stejnou šanci na výhru i prohru, tedy 50:50.
Jsou hodnoty výhry Alice a Boba nezávislé? Ne, snadno ověříme, že např.
1/3 = P(X = 1 ∩ Y = 1) 6= P(X = 1) · P(Y = 1) = 1/2 · 1/2 = 1/4.

4.1.4 Diskrétní podmíněné rozdělení


Zabývejme se nyní rozdělením náhodné veličiny X za předpokladu, že známe hodnotu náhodné
veličiny Y = y. Zajímáme se, jak částečná informace o výsledku experimentu změní naše
úvahy. Obecně se podmíněné rozdělení definuje pomocí podmíněné distribuční funkce. My se
však budeme zabývat vzlášť diskrétními a spojitými náhodnými veličinami.
Pro diskrétní veličiny zavedeme podmíněné rozdělení pomocí podmíněné pravděpodobnosti
za podmínky, že nastal jev {Y = y}:
Definice 4.11. Nechť P(Y = y) > 0. Potom je podmíněná distribuční funkce FX|Y (·|y)
veličiny X dáno (za podmínky) Y = y určena vztahem
P(X ≤ x ∩ Y = y)
FX|Y (x|y) = P(X ≤ x|Y = y) = .
P(Y = y)
Podmíněné pravděpodobnosti hodnot X dáno (za podmínky) Y = y jsou analogicky
P(X = x ∩ Y = y)
P(X = x|Y = y) = .
P(Y = y)

Ilustrace podmíněných pravděpodobností P(X = x|Y = y)

P(X=x|Y=3)

P(X=x∩Y=y)

y
P(X=x|Y=2)
y=3

y=2 x
x=3
y=1 x=2
x=1

P(X=x|Y=1)


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 79
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12

4.1.5 Podmíněná střední hodnota diskrétní náhodné veličiny


Podmíněné pravděpodobnosti:
P(X = x ∩ Y = y)
P(X = x|Y = y) = .
P(Y = y)
Definice 4.12. Podmíněnou střední hodnotu náhodné veličiny X při daném {Y = y} značíme
E(X|Y = y) a definujeme ji jako střední hodnotu náhodné veličiny s podmíněnými pravdě-
podobnostmi P(X = x|Y = y). Nutným předpokladem je P(Y = y) > 0.
Tato podmíněná střední hodnota je určitou funkcí g hodnoty y:
X X P(X = xi ∩ Y = y)
E(X|Y = y) = xi P(X = xi |Y = y) = xi = g(y).
i i
P(Y = y)

Příklad – Alice, Bob a sázka na hod kostkou


Příklad 4.13 (– podmíněné rozdělení). Alice a Bob sází na výsledek hodu kostkou. Alice sází
na sudé (2,4,6), Bob sází na vysoké hodnoty (4,5,6). Padne-li vsazená hodnota, příslušná osoba
získá jednu korunu z banku, jinak jednu korunu prohraje. Nechť X je náhodná veličina, značící
zisk či ztrátu Alice po jednom kole hry a Y totéž pro Boba. Najděte podmíněné rozdělení X
při daném Y = y. Sdružené a marginální rozdělení jsme spočítali minule:
y
P(X = x ∩ Y = y) −1 1 P(X = x)
−1 2/6 1/6 1/2
x
1 1/6 2/6 1/2
P(Y = y) 1/2 1/2
Podmíněné rozdělení získáme vyjádřením pravděpodobností
P(X = x ∩ Y = y)
P(X = x|Y = y) = .
P(Y = y)
Příklad 4.13 (– podmíněné rozdělení, pokračování). Podmíněné rozdělení získáme vyjádře-
ním pravděpodobností
P(X = x ∩ Y = y)
P(X = x|Y = y) = .
P(Y = y)
Potřebujeme vzít sdružené pravděpodobnosti z tabulky a podělit je marginálními pravděpo-
dobnostmi hodnot Y :
y
P(X = x|Y = y) −1 1
2/6 1/6
−1 = 2/3 = 1/3
x 1/2 1/2
1/6 2/6
1 = 1/3 = 2/3
1/2 1/2
Pokud víme, že Bob vyhrál, má Alice pravděpodobnost na výhru 2/3 a na prohru 1/3.
Pokud víme, že Bob prohrál, má Alice pravděpodobnost na výhru 1/3 a na prohru 2/3.
Výsledek bychom zvládli odvodit i intuitivně. Bob vyhrál, pokud padlo číslo 4, 5 nebo 6.
Ve dvou z těchto tří možností Alice taky vyhraje a v jedné prohraje.

80
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.2 Spojité náhodné vektory

Příklad – Alice, Bob a sázka na hod kostkou


Příklad 4.14 (– podmíněná střední hodnota). Nalezněte podmíněnou střední hodnotu výhry Alice,
když známe výhru Boba. Porovnejte ji se situací, kdy o výhře Boba nic nevíme. Podmíněné rozdělení
jsme už našli.

y
P(X = x|Y = y) −1 1
−1 2/3 1/3
x
1 1/3 2/3

Podmíněnou střední hodnotu pro jednotlivé případy vyjádříme jako


X
E[X|Y = y] = x P(X = x|Y = y).
x

Tedy
E[X|Y = −1] = −1 P(X = −1|Y = −1) + 1 P(X = 1|Y = −1) = −1 · 2/3 + 1 · 1/3 = −1/3,
E[X|Y = 1] = −1 P(X = −1|Y = 1) + 1 P(X = 1|Y = 1) = −1 · 1/3 + 1 · 2/3 = 1/3,
X
E[X] = x P(X = x) = −1 · 1/2 + 1 · 1/2 = 0.
x

Vidíme, že znalost hodnoty jedné veličiny nám ovlivňuje podmíněnou střední hodnotu druhé.

4.2 Spojité náhodné vektory


4.2.1 Spojité sdružené rozdělení
Soubory spojitých náhodných veličin
Rozdělení náhodných veličin X a Y na stejném pravděpodobnostním prostoru popisujeme
pomocí sdružené distribuční funkce

FX,Y (x, y) = P(X ≤ x ∩ Y ≤ y).

Jsou-li veličiny X a Y spojité, je běžné popisovat jejich rozdělení pomocí sdružené hustoty
pravděpodobnosti.

Definice 4.15. Náhodné veličiny X a Y mají sdružené (absolutně) spojité rozdělení, jestliže
existuje nezáporná funkce fX,Y : R2 → [0, ∞) taková, že pro každé x, y ∈ R platí

Zy Zx
FX,Y (x, y) = fX,Y (u, v) du dv.
−∞ −∞

Funkci fX,Y v takovém případě nazýváme sdruženou hustotou pravděpodobnosti náhod-


ných veličin X, Y resp. náhodného vektoru (X, Y ).

Zy Zx
FX,Y (x, y) = fX,Y (u, v) du dv.
−∞ −∞

Podobně jako v jednorozměrném případě platí:


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 81
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12

• V bodech (x, y), kde derivace existuje, platí

∂ 2 FX,Y
fX,Y (x, y) = (x, y).
∂x∂y

• Sdružená distribuční funkce je spojitá.

• Normalizační podmínka
Z∞ Z∞
fX,Y (x, y)dxdy = 1.
−∞ −∞

• Pro všechna x, y ∈ R a všechny A, B ∈ B (Borelovské podmnožiny R):

P(X = x ∩ Y ∈ B) = P(X ∈ A ∩ Y = y) = P(X = x ∩ Y = y) = 0.

Zd Zb
• P(a < X ≤ b ∩ c < Y ≤ d) = fX,Y (x, y) dx dy.
c a

• Pro každou B Borelovskou podmnožinu R2 : (tj. každou „ běžnou“ podmnožinu)


ZZ

P (X, Y ) ∈ B = fX,Y (x, y) d (x, y).
B

Spojité sdružené rozdělení – vizualizace

Sdružená hustota Sdružená distribučnı́ funkce

fX,Y 0.2 FX,Y


0.5

0 0
2 2
0 2 0 2
0 0
y −2 −2 y −2 −2
x x

1 − x2 −2y2 Zy Zx
fX,Y (x, y) = e 2 1 − u2 −2v2
π FX,Y (x, y) = e 2 du dv
π
−∞ −∞

4.2.2 Spojité marginální rozdělení


Pro určení marginálních rozdělení veličin X a Y ze sdružené hustoty lze použít vztah analo-
gický diskrétnímu rozdělení:
X
P(X = x) = P(X = x ∩ Y = yj ).
all yj

82
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.2 Spojité náhodné vektory

Věta 4.16. Nechť náhodné veličiny X a Y mají sdružené spojité rozdělení s hustotou fX,Y .
Náhodné veličiny X a Y jsou potom také spojité s marginálními hustotami
Z∞ Z∞
fX (x) = fX,Y (x, y) dy, fY (y) = fX,Y (x, y) dx
−∞ −∞

Důkaz.
 ∞
Zx

Z
FX (x) = P(X ≤ x) = P(X ≤ x ∩ Y ∈ R) =  fX,Y (u, v) dv  du.
−∞ −∞

x R
Hustota fX je dle definice jakákoliv nezáporná funkce taková, že FX (x) = −∞ fX (u) du.
Výraz v závorce je tedy hustota fX . Druhou část tvrzení pro fY dokážeme analogicky.

4.2.3 Nezávislost spojitých náhodných veličin


Nezávislost spojitých náhodných veličin ověřujeme pomocí hustot.

Věta 4.17. Spojité náhodné veličiny X a Y jsou nezávislé právě tehdy, když pro všechna
x, y ∈ R platí rovnost
fX,Y (x, y) = fX (x) · fY (y).
Náhodné veličiny X1 , . . . , Xn jsou nezávislé právě tehdy, když pro každé x ∈ Rn platí
n
Y
fX (x) = fXi (xi ).
i=1

Důkaz. Jsou-li X a Y nezávislé, platí

FX,Y (x, y) = FX (x)FY (y).

Derivováním obou stran podle x i y získáme rovnost hustot. Opačnou implikaci získáme
naopak integrováním obou stran rovnosti pro hustoty.

Při zkoumání nezávislosti spojitých náhodných veličin X a Y můžeme s výhodou použít


následujícího zjednodušení:
Poznámka 4.18. Jestliže se nám povede rozložit fX,Y do tvaru

fX,Y (x, y) = g(x) · h(y), ∀x, y ∈ R,

kde g(x) a h(y) jsou nezáporné funkce, pak veličiny X a Y jsou nezávislé. Uvědomme si, že ale
funkce g(x) nemusí být přímo hustotou fX (x) a funkce h(y) hustotou fY (y), mohou se od nich
lišit multiplikativní konstantou. Tedy v případě, že najdeme rozklad fX,Y (x, y) = g(x) · h(y),
pak víme, že náhodné veličiny X a Y jsou nezávislé a jejich hustoty mají tvar fX (x) = k · g(x)
1
a fY (y) = h(y), kde konstantu k je třeba určit z normalizační podmínky.
k
X Důkaz proveďte sami dosazením do vztahu pro výpočet marginálních hustot.
Toto tvrzení můžeme formulovat i pro nezávislost více náhodných veličin X1 , . . . , Xn .


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 83
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12

Příklad – marginální rozdělení a nezávislost


Příklad 4.19. Nechť náhodné veličiny X a Y mají sdruženou hustotu

fX,Y (x, y) = ye−2x pro x ∈ [0, ∞) a y ∈ [0, 2], 0 jinak.

Jsou veličiny X a Y nezávislé?


Marginální hustoty:

Z2 Z2 " #2
y2 4
 
−2x −2x −2x
fX (x) = ye dy = e ydy = e = e−2x − 0 = 2e−2x .
2 0
2
0 0
Z∞ Z∞ " #∞
e−2x 1 y
 
−2x −2x
fY (y) = ye dx = y e dx = y =y 0− = .
−2 0
−2 2
0 0
Ověření nezávislosti:
y
ye−2x = fX,Y (x, y) = fX (x) · fY (y) = 2e−2x · = ye−2x .
2
Ano, jsou nezávislé.

4.2.4 Spojité podmíněné rozdělení


V případě spojitých náhodných veličin X a Y není možné podmiňovat jevem {Y = y}, protože
P(Y = y) = 0. Definici proto zavedeme pomocí zmenšujícího se okolí bodu y.
Připomenutí: Hustota náhodné veličiny je derivací její distribuční funkce:
FY (y + ∆y) − FY (y)
fY (y) = FY0 (y) = lim .
∆y→0+ ∆y
Proto pro malé ∆y > 0
FY (y + ∆y) − FY (y)
fY (y) ≈
∆y
fY (y) ∆y ≈ FY (y + ∆y) − FY (y)
fY (y) ∆y ≈ P(y ≤ Y ≤ y + ∆y)
R y+∆y
fY (y) ∆y ≈ y fY (v) dv.

Obecně
R y+∆y
g(y) ∆y ≈ y g(v) dv,

tedy i pro každé u:


R y+∆y
fX,Y (u, y) ∆y ≈ y fX,Y (u, v) dv.

Použijeme:
R y+∆y
fX,Y (u, y) ∆y ≈ y fX,Y (u, v) dv,
R y+∆y
fY (y) ∆y ≈ y fY (v) dv.

84
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.2 Spojité náhodné vektory

Motivace pro podmíněnou hustotu: Když fY (y) > 0, pro malé ∆y > 0 dostaneme

P(X ≤ x ∩ y ≤ Y ≤ y + ∆y)
P(X ≤ x|y ≤ Y ≤ y + ∆y) = =
P(y ≤ Y ≤ y + ∆y)
RxR y+∆y Rx
−∞ y fX,Y (u, v) dv du −∞ fX,Y (u, y) ∆y du
= R y+∆y ≈ =
y fY (v) dv fY (y) ∆y
Zx
fX,Y (u, y)
= du.
fY (y)
−∞

Po provedení limity ∆y → 0 intuitivně dostaneme vzorec pro podmíněnou distribuční


funkci a tím i pro podmíněnou hustotu
Zx
fX,Y (u, y)
P(X ≤ x|Y = y) = du.
fY (y)
−∞

Jedná se o značení a ne o podmíněnou pravděpodobnost, protože P(Y = y) = 0.


Definice 4.20. Podmíněnou distribuční funkci veličiny X dáno (za podmínky) Y = y zavá-
díme vztahem
Zx
fX,Y (u, y)
FX|Y (x|y) = du,
fY (y)
−∞

pro všechna y taková, že fY (y) > 0. Značíme ji též P(X ≤ x|Y = y) = FX|Y (x|y).
Připomeneme: Jedná se o značení a ne o podmíněnou pravděpodobnost, protože P(Y =
y) = 0.
Pomocí podmíněné distribuční funkce definujeme i podmíněnou hustotu:
Definice 4.21. Podmíněná hustota X dáno (za podmínky) Y = y je určena vztahem
fX,Y (x, y)
fX|Y (x|y) = ,
fY (y)
pro všechna y taková, že fY (y) > 0.

4.2.5 Podmíněná střední hodnota spojité náhodné veličiny


Analogicky jako u diskrétních náhodných veličin definujeme podmíněnou střední hodnotu pro
spojité náhodné veličiny:
Definice 4.22. Nechť fY (y) > 0. Střední hodnotu náhodné veličiny s hustotou fX|Y (x|y)
nazýváme podmíněnou střední hodnotou X dáno {Y = y} a značíme E(X|Y = y).
Podmíněnou střední hodnotu pro danou hodnotu y spočítáme jako
Z∞ Z∞
fX,Y (x, y)
E(X|Y = y) = x fX|Y (x|y) dx = x dx = g(y),
fY (y)
−∞ −∞

tedy se jedná o určitou funkci hodnoty y.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 85
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12

4.3 Funkce náhodného vektoru


Obdobné vztahy jako pro funkci jedné náhodné veličiny platí i pro funkce více náhodných
veličin. Mějme
Y = h(X1 , . . . , Xn ) = h(X).

• Když mají veličiny X1 , . . . , Xn sdružené diskrétní rozdělení s pravděpodobnostmi hodnot


P(X = x), pak pro distribuční funkci Y platí vztah
X X
FY (y) = P(Y ≤ y) = P(X1 = x1 ∩ . . . ∩ Xn = xn ) = P(X = x).
h(x1 ,...,xn )≤y {x∈Rn : h(x)≤y}

• Když veličiny X1 , . . . , Xn mají sdružené spojité rozdělení s hustotou fX (x), pak


Z Z
FY (y) = P(Y ≤ y) = ··· fX (x) dx1 · · · dxn .
{x∈Rn : h(x)≤y}

Ve spojitém případě funkce h musí být měřitelná, aby Y byla náhodná veličina.

4.3.1 Součet náhodných veličin

Speciálním případem funkce více náhodných veličin je jejich součet

Z = h(X) = h(X1 , . . . , Xn ) = X1 + · · · + Xn .

Uvažujme pro jednoduchost součet dvou náhodných veličin:

• Když náhodné veličiny X a Y jsou diskrétní a nezávislé, pak pro Z = X + Y platí


X
P(Z = z) = P(X = x) · P(Y = z − x) (diskrétní konvoluce).
x

Poznámka: P(X = x) · P(Y = z − x) > 0 jen pro konečně či spočetně mnoho x.

• Když jsou náhodné veličiny X a Y spojité a nezávislé, pak pro Z = X + Y platí

Z∞
fZ (z) = fX (x)fY (z − x) dx (konvoluce fX a fY ).
−∞

Součet náhodných veličin – odvození


Vztah pro součet diskrétních nezávislých náhodných veličin X a Y odvodíme snadno:
X
P(Z = z) = P(X + Y = z) = P(X = xk ∩ Y = yj )
{(xk ,yj ): xk +yj =z}
X
= P(X = xk ) P(Y = z − xk ).
all xk

86
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.3 Funkce náhodného vektoru

Odvození vztahu pro součet spojitých nezávislých náhodných veličin X a Y :


ZZ
FZ (z) = P(X + Y ≤ z) = fX,Y (x, y) d (x, y)
{(x,y): x+y≤z}
Z∞ Z∞
 z−x   z 
Z Z
y=u−x
=  fX,Y (x, y) dy dx =  fX,Y (x, u − x) dudx
−∞ −∞ −∞ −∞
 ∞  ∞
Zz Zz
 
Z Z
=  fX,Y (x, u − x) dxdu =  fX (x)fY (u − x) dxdu.
−∞ −∞ −∞ −∞
z R
Hustota fZ je jakákoliv nezáporná funkce R∞
taková, že FZ (z) = −∞ fZ (u) du. Výraz v závorce
je tedy hustota veličiny Z, čili fZ (z) = −∞ fX (x)fY (z − x) dx.

Součet náhodných veličin – normální rozdělení


Příklad 4.23 (– součet normálních rozdělení). Mějme nezávislé náhodné veličiny X a Y ,
obě s normálním rozdělením N(µ, 1). Hledáme rozdělení veličiny Z = X + Y . Hustoty X a Y
odpovídají normálnímu rozdělení s rozptylem σ 2 = 1:
1 (x−µ)2 1 (y−µ)2
fX (x) = √ e− 2 , fY (y) = √ e− 2 x, y ∈ R.
2π 2π
Hustotu součtu získáme z předchozího:
Z∞ Z∞
1 (x−µ)2 1 (z−x−µ)2
fZ (z) = fX (x)fY (z − x)dx = √ e− 2 √ e− 2 dx
2π 2π
−∞ −∞
Z∞
1 − 1 ((x−µ)2 +(z−x−µ)2 )
= e 2 dx.

−∞

Součet náhodných veličin – normální rozdělení


Příklad 4.23 (– součet normálních rozdělení, pokračování). Výraz v exponentu upravíme na
(x − µ)2 + (z − x − µ)2 = x2 − 2µx + µ2 + z 2 + x2 + µ2 − 2zx − 2µz + 2µx
 z 2 1 2
=2 x− + (z − 2µ) .
2 2
Výraz pod integrálem se tak dá rozdělit na dvě multiplikativní části, z nichž jedna nezávisí
na x a druhá se vyintegruje na jedničku:
Z∞
1 − 2(x−z/2)2 − (z−2µ)2
fZ (z) = e 2 e 2·2 dx

−∞
Z∞
1 (z−2µ)2 1 (x−z/2)2
=√ e− 2·2 p e− 2·(1/2) dx
2π2 2π(1/2)
−∞
1 (z−2µ)2
=√ e− 2·2 .
2π2
Tedy Z = X + Y má normální rozdělení N(2µ, 2). Obecně lze ukázat, že součet n nezávislých
náhodných veličin N(µ, σ 2 ) má normální rozdělení N(nµ, nσ 2 ).


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 87
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12

Příklad 4.24. Mějme nezávislé náhodné veličiny X a Y s Poissonovým rozdělením s para-


metry λ a µ. Najděte rozdělení veličiny Z = X + Y .
λj µl
P(X = j) = e−λ , P(Y = l) = e−µ , j, l = 0, 1, . . .
j! l!
Z předchozího víme, že pro k = 0, 1, . . . :

X k
X
P(Z = k) = P(X = j) P(Y = l) = P(X = j) P(Y = k − j)
{(j,l)∈N20 : j+l=k} j=0

k j k
X
−λ λ −µ µk−j −(λ+µ) 1
X k!
= e e =e λj µk−j
j=0
j! (k − j)! k! j=0 j!(k − j)!

(λ + µ)k −(λ+µ)
= e . . . Poissonovo rozdělení s parametrem λ + µ.
k!
X Snadněji lze odvodit pomocí vytvořujících funkcí náhodných veličin.

4.3.2 Součet náhodných veličin – momentová vytvořující funkce


Připomeňme dříve zavedenou momentovou vytvořující funkci, kterou lze využít k výpočtu
momentů náhodné veličiny. Sčítání nezávislých náhodných veličin odpovídá násobení jejich
vytvořujících funkcí. Pro Z = X + Y máme:

MZ (s) = E(esZ ) = E(es(X+Y ) ) = E(esX esY )

= E(esX ) E(esY ) = MX (s)MY (s).


Využili jsme toho, že pro nezávislé náhodné veličiny je střední hodnota součinu rovna součinu
středních hodnot, což bude dokázáno později. Obecně pro nezávislý soubor náhodných veličin
X1 , . . . , Xn platí:

Z = X1 + · · · + Xn =⇒ MZ (s) = MX1 (s) · · · MXn (s).

Příklad 4.25. Nechť X1 , . . . , Xn jsou nezávislé Bernoulliho náhodné veličiny s parametrem


p.
Pak MXi (s) = (1 − p)e0s + pe1s = 1 − p + pes , i = 1, . . . , n.
Náhodná veličina Z = X1 + · · · + Xn má binomické rozdělení s parametry n a p.
Její vytvořující funkce je n
MZ (s) = 1 − p + pes .
Příklad 4.26. Nechť X a Y jsou nezávislé náhodné veličiny s Poissonovým rozdělením s pa-
rametry λ a µ a nechť Z = X + Y . MX (s) pro Poissonovo rozdělení jsme spočetli dříve.
Pak
s s s
MZ (s) = MX (s)MY (s) = eλ(e −1) eµ(e −1) = e(λ+µ)(e −1) .
Toto je momentová vytvořující funkce Poissonova rozdělení s parametrem λ + µ. Momen-
tová vytvořující funkce jednoznačně určuje pravděpodobnosti hodnot (nebo hustotu u spojité
veličiny).

88
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.3 Funkce náhodného vektoru

Z je proto náhodná veličina s Poissonovým rozdělením s parametrem λ + µ:

(λ + µ)k −(λ+µ)
P(Z = k) = e .
k!
Porovnejte s obtížností přímého výpočtu.

4.3.3 Střední hodnota funkce náhodných veličin


Střední hodnotu E h(X, Y ) reálné funkce h náhodných veličin X a Y můžeme podobně jako
u funkce jedné náhodné veličiny spočíst bez určování rozdělení veličiny h(X, Y ).

• Pro diskrétní náhodné veličiny X a Y platí


X
E h(X, Y ) = h(xi , yj ) P(X = xi ∩ Y = yj ),
i,j

pokud řada absolutně konverguje.

• Pro spojité náhodné veličiny X a Y platí


Z∞ Z∞
E h(X, Y ) = h(x, y) fX,Y (x, y) dx dy,
−∞ −∞

pokud integrál absolutně konverguje.

4.3.4 Střední hodnota součtu náhodných veličin


Nyní můžeme dokázat linearitu střední hodnoty:

Věta 4.27 (– linearita střední hodnoty). Pro všechny a, b ∈ R a náhodné veličiny X a Y


platí
E(aX + bY ) = a E X + b E Y.

Důsledek:
• E(aX + b) = a E X + b, což jsme dokázali samostatně již dříve.
Tato vlastnost často výrazně zjednodušuje výpočty.

Důkaz. Rozepsáním střední hodnoty funkce a výpočtem marginálních rozdělení plyne pro
diskrétní X a Y :
X
E(aX + bY ) = (axi + byj ) P(X = xi ∩ Y = yj )
i,j
X X
= axi P(X = xi ∩ Y = yj ) + byj P(X = xi ∩ Y = yj )
i,j i,j
X X X X
=a xi P(X = xi ∩ Y = yj ) + b yj P(X = xi ∩ Y = yj )
i j j i
X X
=a xi P(X = xi ) + b yj P(Y = yj ) = a E X + b E Y.
i j


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 89
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12

Pro spojité X a Y je důkaz analogický:

Z∞ Z∞ Z∞ Z∞
E(aX + bY ) = (ax + by)fX,Y (x, y) dx dy = axfX,Y (x, y) dx dy+
−∞ −∞ −∞ −∞
Z∞ Z∞ Z∞
 ∞
Z∞
  ∞ 
Z Z
+ byfX,Y (x, y) dx dy = a x fX,Y (x, y) dy dx + b y bfX,Y (x, y) dxdy
−∞ −∞ −∞ −∞ −∞ −∞
Z∞ Z∞
=a xfX (x) dx + b yfY (y) dy = a E X + b E Y.
−∞ −∞

4.4 Kovariance a korelace


Míru vzájemné lineární závislosti náhodných veličin X a Y můžeme popsat pomocí korelač-
ního koeficientu. Obecnou nelineární závislost pak popíšeme pomocí entropie v magisterském
studiu.

Definice 4.28. Nechť X a Y jsou náhodné veličiny s konečnými druhými momenty. Pak
definujeme kovarianci náhodných veličin X a Y vztahem

cov(X, Y ) = E[(X − E X)(Y − E Y )].

Pokud mají X a Y kladné rozptyly, definujeme korelační koeficient jako

cov(X, Y ) cov(X, Y )
ρ(X, Y ) = =√ √ .
σX σY var X var Y
h i
X−E X Y −E Y
• ρ(X, Y ) je kovariance standardizovaných veličin: ρ(X, Y ) = E σX σY .

Definice 4.29. Náhodné veličiny X a Y nazýváme nekorelované, pokud cov(X, Y ) = 0.

Kovariance & korelace – vlastnosti

Věta 4.30. Kovariance a korelační koeficient mají následující vlastnosti:

i) cov(X, Y ) = E[XY ] − E X E Y .

ii) X a Y jsou nekorelované, právě když E[XY ] = E X E Y .

iii) −1 ≤ ρ(X, Y ) ≤ 1.

iv) ρ(aX + b, cY + d) = ρ(X, Y ) pro všechny a, c > 0 a b, d ∈ R.

v) ρ(X, Y ) = ±1, právě když existují a, b ∈ R, a > 0 tak, že Y = ±aX + b.

Důkaz.

90
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.4 Kovariance a korelace

i) cov(X, Y ) = E ((X − E X)(Y − E Y )) = E (XY − X E Y − Y E X + E X E Y )


= E XY − E(X E Y ) − E(Y E X) + E(E X E Y )
= E XY − E X E Y − E Y E X + E X E Y
= E XY − E X E Y

ii) Důsledek předchozího bodu. Pokud jsou X a Y nekorelované, je cov(X, Y ) = 0. To


znamená podle předchozího bodu, že E XY − E X E Y = 0, po úpravě pak E XY =
E X E Y . Opačně, je-li E XY = E X E Y , pak E XY − E X E Y = cov(X, Y ) = 0, tedy
jsou nekorelované.

iii) Ze Schwarzovy nerovnosti, viz literatura.

iv) Přímý výpočet z definice. Nejprve si spočteme cov(aX +b, cY +d), var(aX +b) a var(cY +
d)

cov(aX + b, cY + d) = E[(aX + b − E(aX + b))(cY + d − E(cY + d))]


= E[a(X − E X)c(Y − E Y )] = ac cov(X, Y )
var(aX + b) = E(aX + b − E(aX + b))2 = E(a(X − E x))2 = a2 var(X)
var(cY + d) = c2 var(Y )

Dosazením do definičního vztahu


cov(aX + b, cY + d) ac cov(X, Y )
ρ(aX + b, cY + d) = p p =p 2 p = ρ(X, Y ).
var(aX + b) var(cY + d) a var(X) c2 var(Y )

v) Z důkazu Schwarzovy nerovnosti, viz literatura.

4.4.1 Nekorelované náhodné veličiny


Zabývejme se nyní střední hodnotou součinu XY náhodných veličin X a Y :

Definice 4.31 (– alternativně uváděná v literatuře). Náhodné veličiny X a Y se nazývají


nekorelované, pokud platí E XY = E X E Y .

Věta 4.32. Jestliže jsou X a Y nezávislé, pak jsou i nekorelované.

Důkaz. Dokážeme pro spojité X a Y . Nezávislost znamená fX,Y (x, y) = fX (x) fY (y). Do-
staneme tak
Z∞ Z∞ Z∞ Z∞
E XY = xy fX,Y (x, y) dx dy = xy fX (x) fY (y) dx dy =
−∞ −∞ −∞ −∞
 ∞  ∞ 
Z Z
= x fX (x) dx  y fY (y) dy  = E X E Y.
−∞ −∞

Pro diskrétní náhodné veličiny obdobně.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 91
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12

4.4.2 Rozptyl součtu náhodných veličin

Rozptyl součtu náhodných veličin lze vyjádřit jako součet rozptylů, ale ne vždy.

Věta 4.33. Rozptyl splňuje následující vlastnosti:

i) cov(X, X) = var X.

ii) Pro X a Y s konečnými druhými momenty platí

var(X ± Y ) = var X + var Y ± 2 cov(X, Y ).

iii) Pro nekorelované (a tedy i pro nezávislé) náhodné veličiny platí

var(X ± Y ) = var X + var Y.

Vlastnosti rozptylu

Důkaz.

i) cov(X, X) = E[X · X] − E X · E X = E[X 2 ] − (E X)2 = var X.

ii) Pro obecné X a Y :

var(X ± Y ) = E(X ± Y )2 − (E(X ± Y ))2 = E(X 2 ± 2XY + Y 2 ) − (E X ± E Y )2


= E X 2 ± 2 E XY + E Y 2 − (E X)2 ∓ 2 E X E Y − (E Y )2
= var X + var Y ± (2 E XY − 2 E X E Y ) = var X + var Y ± 2 cov(X, Y ).

iii) Nekorelované (nebo nezávislé) náhodné veličiny mají v předchozím výsledku kovarianci
rovnou nule.

Korelace – 1000 simulovaných hodnot

10 Y
ρ=0

X
−4 −3 −2 −1 1 2 3 4

−5

−10

92
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.4 Kovariance a korelace

Korelace – 1000 simulovaných hodnot


10 Y
ρ = 0.7

X
−4 −3 −2 −1 1 2 3 4

−5

−10

Příklad – Alice, Bob a sázka na hod kostkou


Příklad 4.34 (– kovariance). Alice a Bob sází na výsledek hodu kostkou. Alice sází na sudé
(2,4,6), Bob sází na vysoké hodnoty (4,5,6). Padne-li vsazená hodnota, příslušná osoba získá
jednu korunu z banku, jinak jednu korunu prohraje. Nechť X je náhodná veličina, značící
zisk či ztrátu Alice po jednom kole hry a Y totéž pro Boba. Najděte kovarianci a korelační
koeficient X a Y . Sdružené a marginální rozdělení jsme spočítali minule:
y
P(X = x ∩ Y = y) −1 1 P(X = x)
−1 2/6 1/6 1/2
x
1 1/6 2/6 1/2
P(Y = y) 1/2 1/2
Kovarianci lze spočítat jako
cov(X, Y ) = E[XY ] − E X E Y,
potřebujeme tedy získat příslušné střední hodnoty.

Příklad 4.34 (– kovariance, pokračování). Střední hodnoty X a Y zvlášť spočítáme z marginálních


rozdělení:
X
EX = x P(X = x) = −1 · P(X = −1) + 1 · P(X = 1) = −1 · 1/2 + 1 · 1/2 = 0.
x

Stejně tak E Y = 0. Pro Alici i Boba se tedy jedná o spravedlivou hru. Jejím opakovaným hraním
nebude ani jeden systematicky bohatnout či chudnout.
Střední hodnotu součinu rozepíšeme na jednotlivé případy:
XX
E[XY ] = x · y · P(X = x ∩ Y = y)
x y

=(−1)(−1) P(X = −1 ∩ Y = −1) + (−1)(1) P(X = −1 ∩ Y = 1)


+ (1)(−1) P(X = 1 ∩ Y = −1) + (1)(1) P(X = 1 ∩ Y = 1)
=1 · 1/3 − 1 · 1/6 − 1 · 1/6 + 1 · 1/3 = 1/3
Tedy
cov(X, Y ) = E[XY ] − E X E Y = 1/3 − 0 · 0 = 1/3.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 93
4 NÁHODNÉ VEKTORY BI-PST, ZS 2022/23, Přednáška 1-12

Příklad 4.34 (– kovariance, pokračování). Protože


X 1 1
E[X 2 ] = x2 P(X = x) = (−1)2 · P(X = −1) + 12 · P(X = 1) = 1 · + 1 · = 1
x
2 2

a stejně pro E[Y 2 ], získáme jednotkové rozptyly


var X = E[X 2 ] − (E X)2 = 1 = var Y.
Korelační koeficient tak bude roven
cov(X, Y ) 1/3
ρ(X, Y ) = √ √ = √ √ = 1/3.
var X var Y 1 1
Mezi výhrami Alice a Boba je tedy pozitivní korelace. Vidíme-li Alici, kterak vyhrála či prohrála, je
větší šance, že Bob je na tom stejně, než že je na tom opačně.

Shrnutí
Diskrétní náhodná veličina X Spojitá náhodná veličina X

Pravděpodobnosti hodnot X: Hustota X:


P(X = x) fX (x)
Distribuční funkce:
X Zx
F (x) = P(X = u) F (x) = fX (u) du
all u≤x −∞
Pravděpodobnost X ∈ A: Z
X
P(X ∈ A) = P(X = x) P(X ∈ A) = fX (x) dx
all x∈A A
Střední hodnota X:
X Z∞
EX = x P(X = x) EX = x fX (x) dx
all x −∞
Střední hodnota g(X):
X Z∞
E g(X) = g(x) P(X = x) E g(X) = g(x) fX (x) dx
all x −∞

Diskrétní náhodná veličina X Spojitá náhodná veličina X

Rozptyl X:

var(X) = E(X − E X)2 var(X) = E(X − E X)2

X Z∞
2
= (x − E X) P(X = x) = (x − E X)2 fX (x) dx
all x −∞

Výpočetní vzorec pro rozptyl:

var(X) = E(X − E X)2 = E[X 2 ] − (E X)2 .

94
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 4.4 Kovariance a korelace

Sdružená distribuční funkce náhodného vektoru (X, Y ):


FX,Y (x, y) = P(X ≤ x ∩ Y ≤ y).
Diskrétní náhodné veličiny X a Y Spojité náhodné veličiny X a Y
Sdružené pravděpodobnosti hodnot: Sdružená hustota:
P(X = x ∩ Y = y) fX,Y (x, y)
Marginální rozdělení:
X Z∞
P(X = x) = P(X = x ∩ Y = y) fX (x) = fX,Y (x, y) dy
all y −∞
X Z∞
P(Y = y) = P(X = x ∩ Y = y) fY (y) = fX,Y (x, y) dx
all x −∞

Nezávislost X a Y :
P(X = x ∩ Y = y) = P(X = x) P(Y = y) fX,Y (x, y) = fX (x) fY (y)
Kovariance X a Y :
cov(X, Y ) = E[(X − E X)(Y − E Y )] = E[XY ] − E X E Y
X a Y jsou nekorelované právě tehdy, když cov(X, Y ) = 0.
Když jsou X a Y nezávislé, pak jsou i nekorelované.

Diskrétní náhodné veličiny X a Y Spojité náhodné veličiny X a Y

Podmíněné pravděpodobnosti / podmíněná hustota X za podmínky Y = y:


P(X = x ∩ Y = y) fX,Y (x, y)
P(X = x|Y = y) = fX|Y (x|y) =
P(Y = y) fY (y)
Normalizace podmíněné hustoty:
X Z∞
P(X = x|Y = y) = 1 fX|Y (x|y) dx = 1
all x −∞

Podmíněná střední hodnota X za podmínky Y = y:


X Z∞
E(X|Y = y) = x P(X = x|Y = y) E(X|Y = y) = x fX|Y (x|y) dx
all x −∞


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 95
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12

5 Limitní věty
Doposud jsme studovali jednotlivé náhodné veličiny a vektory. Nyní se zaměříme na chování
posloupností náhodných veličin, které vznikly na základě opakovaného provádění experimentu.
Naším cílem je studovat vlastnosti tohoto náhodného experimentu na základě jeho opakování.
Hlavní otázkou je, zda a jak se odhady vlastností experimentu zlepšují s nárůstem jeho
opakování. Hlavními výsledky jsou zde zákon velkých čísel a centrální limitní věta, které
popisují vlastnosti průměru napozorovaných hodnot, který slouží jako základní odhad střední
hodnoty náhodné veličiny.

5.1 Odhadování vlastností experimentu


Experiment v tomto případě popisujeme pomocí rozdělení výsledné náhodné veličiny a sna-
žíme se odhadnout buď celé její rozdělení, nebo alespoň některé jeho parametry. Ze začátku
se omezíme na odhady střední hodnoty, rozptylu a dalších momentů.
Odhadovat celé rozdělení je nepoměrně složitější, proto se mu budeme věnovat později.
Použít můžeme empirické distribuční funkce, histogramu, jádrového odhadu hustoty, apod.
Pokud známe typ rozdělení, stačí často odhadnout jeho parametry. Např. pro exponenciální
rozdělení Exp(λ) odhadujeme parametr λ. V případě diskrétního rozdělení můžeme odhado-
vat pravděpodobnosti jeho jednotlivých hodnot jebo elemetárních jevů. Např. u hodu mincí
obvykle stačí odhadnout P(Hlava). Některé z těchto postupů si popíšeme v druhé části kurzu
a v magisterském studiu.

5.1.1 Odhadování střední hodnoty


Nejprve se budeme zabývat vlivem počtu opakování experimentu na intuitivně přirozený
odhad střední hodnoty. Odvození tohoto odhadu si uvedeme později. Konkrétně nám jde
především o (aritmetický) průměr
n
1X
X̄n = Xi ,
n i=1

případně součet
n
X
Sn = Xi ,
i=1

kde X1 , . . . , Xn jsou nezávislé náhodné veličiny se stejným rozdělením. Značení: i.i.d. – in-
dependent and identically distributed.
Limitní věty hovoří o chování X̄n případně Sn v limitě při n → ∞.

5.2 Základní nerovnosti pro důkaz slabého zákona velkých čísel


5.2.1 Markovova nerovnost
Nejprve si odvodíme první důležitou nerovnost:

Věta 5.2 (– Markovova nerovnost). Nechť X je náhodná veličina s konečnou střední hodnotou.
Potom platí
E |X|
P(|X| ≥ a) ≤ pro každé a > 0.
a

96
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 5.2 Základní nerovnosti pro důkaz slabého ZVČ

Důkaz. Označme jev A = {|X| ≥ a}. Potom (pro každé ω) platí |X| ≥ a1A , kde 1A je
indikátor jevu A. Aplikujeme střední hodnotu na obě strany této nerovnosti a dostaneme

E |X| ≥ a E(1A ) = a P(A) = a P(|X| ≥ a).

Vydělením a dostáváme tvrzení věty.

Markovova nerovnost – příklad

Příklad 5.3 (– čekání na autobus). Nechť doba T čekání na autobus má exponenciální rozdě-
lení se střední hodnotou 3 minuty. Najděte horní mez pro pravděpodobnost, že budeme čekat
déle než 10 minut. Porovnejte odhad se skutečnou pravděpodobností.
Protože doba čekání T je nezáporná a tedy T = |T |, z Markovovy nerovnosti získáme

E |T | 3
P(T ≥ 10) = P(|T | ≥ 10) ≤ = = 0.3.
10 10
Střední hodnota exponenciálně rozdělené náhodné veličiny je E T = 1/λ = 3, tedy parametr
λ je roven 1/3. Skutečná pravděpodobnost je pak
Z∞ i∞
h 1 .
P(T ≥ 10) = λe−λt dt = −e−λt = e− 3 ·10 = 0.036.
10
10

Vidíme, že Markovova nerovnost poskytuje snadný způsob získání horní meze pro pravděpo-
dobnost týkající se chvostu rozdělení.

5.2.2 Čebyševova nerovnost


Z Markovovy nerovnosti plyne Čebyševova nerovnost:

Věta 5.4 (– Čebyševova nerovnost). Nechť X je náhodná veličina s konečnou střední hodnotou
a konečným rozptylem. Potom platí

var X
P(|X − E X| ≥ ) ≤ pro každé  > 0.
2

Důkaz. Buďto přímo, podobně jako pro Markovovu nerovnost (pro (X − E X)2 ), nebo dosa-
zením (X − E X)2 místo X a 2 místo a do Markovovy nerovnosti. Dostaneme
E |(X − E X)2 |
P(|(X − E X)2 | ≥ 2 ) ≤ .
2
Protože |(X − E X)2 | = (X −E X)2 = |X − E X|2 a kvadratická funkce je pro kladné hodnoty
argumentu rostoucí, platí
|X − E X|2 ≥ 2 ⇔ |X − E X| ≥ .
Výsledně dostáváme
var X
P(|X − E X| ≥ ) ≤ .
2


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 97
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12

Čebyševova nerovnost – příklad


Příklad 5.5 (– čekání na autobus). Nechť doba T čekání na autobus má exponenciální roz-
dělení se střední hodnotou 3 minuty. Pomocí Čebyševovy nerovnosti najděte horní mez pro
pravděpodobnost, že budeme čekat déle než 10 minut. Porovnejte s výsledkem z Markovovy
nerovnosti a se skutečnou pravděpodobností. Protože T ∼ Exp(λ) s parametrem λ = 1/3,
dostaneme E T = 1/λ = 3 a var T = 1/λ2 = 9. Z Čebyševovy nerovnosti pak

var T 9 .
P(T ≥ 10) = P(T − E T ≥ 10 − 3) ≤ P(|T − E T | ≥ 7) ≤ 2
= = 0.184.
7 49
Markovova nerovnost nám dala odhad P(T ≥ 10) ≤ 0.3, takže odhad pomocí Čebyševovy
nerovnosti je o něco blíže skutečné pravděpodobnosti P(T ≥ 10) = 0.036.

Pravděpodobnosti chování chvostu rozdělení – příklad


Příklad 5.6 (– čekání na autobus a na tramvaj). Cestou domů musíme jednak čekat na
autobus a pak na přestupu čekat na tramvaj. Čas T1 čekání na autobus se řídí exp. rozdělením
se stř. hodnotou 3 minuty, čas T2 čekání na tramvaj se řídí exp. rozdělením se stř. hodnotou
2 minuty. Doby čekání jsou nezávislé.
Najděte horní mez pravěpodobnosti, že celková doba čekání, tedy T = T1 + T2 , bude delší
než 15 minut. Použijte Markovovu i Čebyševovu nerovnost a porovnejte odhady se skutečnou
pravděpodobností.
Nejprve najdeme střední hodnotu a rozptyl T1 , T2 a T .

T1 ∼ Exp(λ), E T1 = 1/λ = 3, λ = 1/3, var T1 = 1/λ2 = 9.


T2 ∼ Exp(µ), E T2 = 1/µ = 2, µ = 1/2, var T2 = 1/µ2 = 4.
Použitím linearity střední hodnoty a nezávislosti dob čekání získáme:
linearita
E T = E(T1 + T2 ) = E T1 + E T2 = 3 + 2 = 5.
nezávislost
var T = var(T1 + T2 ) = var T1 + var T2 = 9 + 4 = 13.
Příklad 5.6 (– čekání na autobus a na tramvaj, pokračování). Užitím Markovovy nerovnosti
získáme:

E |T | 5 .
P(T ≥ 15) = P(|T | ≥ 15) ≤ = = 0.333.
15 15
Z Čebyševovy nerovnosti pak

var T 13
P(T ≥ 15) = P(T − E T ≥ 15 − 5) ≤ P(|T − E T | ≥ 10) ≤ 2
= = 0.13.
10 100
Získat rozdělení součtu je složitější, než pracovat s rozdělením jedné náhodné veličiny. Užitím
konvoluce získáme:
Z∞ Zt
µe−λ·15 − λe−µ·15 .
P(T ≥ 15) = λe−λu µe−µ·(t−u) dudt = ... = = 0.019.
µ−λ
15 0
Horní meze získané pomocí nerovností jsou orientační, ale je snadné je spočítat, protože
potřebujeme jen střední hodnoty a rozptyly.

98
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 5.3 Zákony velkých čísel

5.3 Zákony velkých čísel


5.3.1 Charakteristiky průměru náhodných veličin
Spočtěme střední hodnotu a rozptyl průměru
n
1X
X̄n = Xi ,
n i=1

kde X1 , . . . , Xn jsou i.i.d. náhodné veličiny s E Xi = µ a var Xi = σ 2 .

• Střední hodnota
n n n
1X 1 X 1X nµ
E X̄n = E Xi = E Xi = E Xi = = µ.
n i=1 n i=1 n i=1 n

• Rozptyl
n n n
1X 1 X 1 X nσ 2 σ2
var X̄n = var Xi = 2 var Xi = 2 var Xi = 2 = .
n i=1 n i=1
n i=1 n n

Využili jsme linearitu střední hodnoty a vlastnosti rozptylu nezávislých náhodných veličin.

5.3.2 Slabý zákon velkých čísel


Dosadíme-li nyní X̄n do Čebyševovy nerovnosti, dostaneme slabý zákon velkých čísel:
Věta 5.7 (– slabý zákon velkých čísel). Nechť X1 , X2 , . . . jsou i.i.d. náhodné veličiny s ko-
nečnou střední hodnotou E Xi = µ a konečným rozptylem σ 2 . Potom X̄n konverguje k µ
v pravděpodobnosti:
P
X̄n −
→µ pro n → ∞.
To znamená, že pro každé  > 0 je lim P(|X̄n − µ| ≥ ) = 0.
n→∞

Důkaz. Použijme Čebyševovu nerovnost pro aritmetický průměr X̄n :

var X̄n σ2
0 ≤ P(|X̄n − µ| ≥ ) = P(|X̄n − E X̄n | ≥ ) ≤ = →0 pro n → ∞.
2 n2
Z věty o limitě sevřené posloupnosti (věta o dvou strážnících) plyne tvrzení věty.

5.3.3 Silný zákon velkých čísel


Věta 5.8 (– silný zákon velkých čísel (SZVČ, SLLN)). Nechť X1 , X2 , . . . jsou i.i.d. náhodné
veličiny se střední hodnotou E Xi = µ (ne nutně konečnou). Potom X̄n konverguje k µ skoro
jistě (s pravděpodobností 1, almost surely):
a.s.
X̄n −−→ µ pro n → ∞.

To znamená, že množina ω ∈ Ω, kde Xn (ω) konverguje jako číselná posloupnost, má pravdě-


podobnost 1:
P({ω ∈ Ω : X̄n (ω) → µ při n → ∞}) = 1.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 99
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12

Důkaz. Komplikovanější, viz literatura.

V čem je tento zákon velkých čísel ‘’silnější ‘’?

• Stačí aby existovala střední hodnota. Ta i rozptyl můžou být nekonečné.

• Konvergence skoro jistě implikuje konvergenci v pravděpodobnosti.

Silný zákon velkých čísel – ilustrace

Aritmetický průměr indikátorů hlavy při hodu mincı́


1

0.8

X̄n
0.6

0.4

0 20 40 60 80 100 120 140


n

Silný zákon velkých čísel – ilustrace

Aritmetický průměr hodnot z Cauchyho rozdělenı́ s nedefinovanou střednı́ hodnotou


6

2
X̄n
0

−2

−4
0 50 100 150 200 250 300 350 400 450 500
n

Charakteristiky součtu náhodných veličin


Připomeňme si, že pro aritmetický průměr X̄n i.i.d. náhodných veličin se střední hodnotou
E Xi = µ a rozptylem var Xi = σ 2 máme

σ2
E X̄n = µ, var X̄n = .
n

100
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 5.4 Centrální limitní věta

Najděme nyní charakteristiky součtu:


n
X
Sn = Xi .
i=1

• Střední hodnota
n n n
X linearita X X
E Sn = E Xi = E Xi = µ = nµ.
i=1 i=1 i=1

• Rozptyl
n n n
X nezávislost X X
var Sn = var Xi = var Xi = σ 2 = nσ 2 .
i=1 i=1 i=1

Alternativně tyto vlastnosti získáme, když si uvědomíme, že Sn = n · X̄n a aplikujeme


střední hodnotu a rozptyl.

5.4 Centrální limitní věta


V zákonech velkých čísel se hovoří o konvergenci průměru ke střední hodnotě. Tedy průměr
pro velká n představuje dobrý odhad střední hodnoty. Což koresponduje s tím, že střední
hodnotu lze chápat jako ideální průměr nekonečného množství pokusů.
Jak je to ale s přesností tohoto odhadu? Jaké rozdělení mají jeho chyby? To souvisí
s rozdělením průměru, případně součtu, jako náhodné veličiny. Centrální limitní věta (CLV)
říká, že za jistých podmínek lze toto rozdělení aproximovat normálním rozdělením.

Rozdělení součtu hodů kostkou


Rozdělení hodnot jednoho hodu kostkou (simulace).
0.15
0.10
probability

0.05
0.00

1 2 3 4 5 6

result


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 101
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12

Rozdělení součtu hodů kostkou


Rozdělení součtu hodnot hodu dvěma kostkami (simulace).
0.15
0.10
probability

0.05
0.00

2 4 6 8 10 12

result

Rozdělení součtu hodů kostkou


Rozdělení součtu hodnot hodu čtyřmi kostkami (simulace).
0.10
0.08
probability

0.06
0.04
0.02
0.00

5 10 15 20 25

result

102
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 5.4 Centrální limitní věta

Rozdělení součtu hodů kostkou


Rozdělení součtu hodnot hodu deseti kostkami (simulace).
0.06
probability

0.04
0.02
0.00

10 20 30 40 50 60

result

5.4.1 Konvergence v distribuci


K formulaci tvrzení CLV potřebujeme zavést pojem konvergence v distribuci:
Definice 5.9. Nechť X1 , X2 , . . . je posloupnost náhodných veličin s distribučními funkcemi
FX1 , FX2 , . . . a X je náhodná veličina s distribuční funkcí FX . Říkáme, že veličiny Xi konver-
gují k X v distribuci,
D
Xn − →X pro n → ∞,
jestliže
lim FXn (x) = FX (x)
n→∞
ve všech bodech spojitosti distribuční funkce FX .
V případě, že X má spojité rozdělení, můžeme pro velká n uvažovat:
• P(Xn ≤ x) = FXn (x) ≈ FX (x) = P(X ≤ x),

• P(Xn > x) = 1 − FXn (x) ≈ 1 − FX (x) = P(X > x),

• P(a < Xn ≤ b) = FXn (b) − FXn (a) ≈ FX (b) − FX (a) = P(a < X ≤ b).

5.4.2 Centrální limitní věta


Věta 5.10 (– Centrální limitní věta (CLV, CLT)). Nechť X1 , X2 , . . . je posloupnost i.i.d. ná-
hodných veličin s konečnou střední hodnotou E Xi = µ a konečným rozptylem var Xi = σ 2 > 0.
Potom
X̄n − µ D
√ −→ N(0, 1) pro n → ∞.
σ/ n


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 103
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12

Podobně
Sn − nµ D
√ −→ N(0, 1) pro n → ∞.
σ n

Důkaz. Viz doporučená literatura.

Symbolem N(0, 1) zde pro stručnost značíme náhodnou veličinu se standardním normálním
rozdělením.
Připomeňme, že pro součet a průměr náhodných veličin je

E Sn = n · µ, E X̄n = µ,

var Sn = n · σ 2 , var X̄n = σ 2 /n.

Centrální limitní věta říká, že když vezmeme standardizovaný průměr nebo standardizovaný
součet náhodných veličin

Sn − E Sn X̄n − E X̄n
Zn = √ = q
var Sn var X̄n
Sn − nµ X̄n − µ
= √ = p 2 ,
nσ 2 σ /n

výsledná náhodná veličina konverguje ke standardnímu normálnímu rozdělení. Pro všechna


z ∈ R tak:
n→∞
P(Zn ≤ z) −→ P(Z ≤ z) = Φ(z).

To nám umožňuje snadno odhadovat chování součtů a průměrů náhodných veličin. Větu
lze využít bez ohledu na rozdělení sčítaných či průměrovaných veličin, tedy i když je zcela
neznámé. Přesnost aproximace pak závisí na počtu zkoumaných veličin a na vzdálenosti jejich
rozdělení od normálního rozdělení.
CLV nám umožňuje vyjádřit pravděpodobnosti typu P(X̄n < x), P(X̄n > x) apod. pomocí
distribuční funkce Φ standardního normálního rozdělení,

Φ(z) = P(Z ≤ z) pro Z ∼ N(0, 1).

Výhodou je, že hodnoty Φ jsou tabelovány.

Jiné varianty téhož tvrzení:

X̄n − µ √ D
• n −→ N(0, 1),
σ
!
approx. σ2
• X̄n ∼ N µ, pro velká n,
n

approx.
• Sn ∼ N(nµ, nσ 2 ) pro velká n.

104
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 5.4 Centrální limitní věta

Centrální limitní věta – ilustrace


Odhad hustoty aritmetického průměru n hodů mincı́ (1000 realizacı́)
0.5

0.4
n = 10

0.3
fXn
0.2

0.1

0
−4 −3 −2 −1 0 1 2 3 4
Xn

Centrální limitní věta – ilustrace


Odhad hustoty aritmetického průměru n hodů mincı́ (1000 realizacı́)
0.5

0.4
n = 50

0.3
fXn
0.2

0.1

0
−4 −3 −2 −1 0 1 2 3 4
Xn

Centrální limitní věta – ilustrace


Odhad hustoty aritmetického průměru n hodů mincı́ (1000 realizacı́)
0.5

0.4
n = 100

0.3
fXn
0.2

0.1

0
−4 −3 −2 −1 0 1 2 3 4
Xn


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 105
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12

Centrální limitní věta – příklad


Příklad 5.11 (– CLV vs. Markovova a Čebyševova nerovnost). Pomocí nákladního výtahu
s nosností 600 kg potřebujeme vyvézt 25 balíků. Balíky jsou nezávislé, se střední váhou 20 kg
a směrodatnou odchylkou 8 kg. Jaká je pravděpodobnost, že výtah přetížíme? Použijte Mar-
kovovu a Čebyševovu nerovnost i CLV.
Nechť Xi je váha i-tého balíku. Pak
E Xi = µ = 20 a var Xi = σ 2 = 82 = 64.
Pn
Celková váha všech n = 25 balíků Sn = i=1 Xi má střední hodnotu a rozptyl
E Sn = nµ = 25 · 20 = 500 a var Sn = nσ 2 = 25 · 64 = 1600.

Centrální limitní věta – příklad


Příklad 5.11 (– CLV vs. Markovova a Čebyševova nerovnost, pokračování). Váhy balíků
jsou jistě nezáporné, tedy z Markovovy nerovnosti získáme:

E |Sn | 500 .
P(Sn ≥ 600) = P(|Sn | ≥ 600) ≤ = = 0.83.
600 600
Užitím Čebyševovy nerovnosti:

var Sn 1600
P(Sn ≥ 600) ≤ P(|Sn − E Sn| ≥ 600 − 500) ≤ 2
= = 0.16.
100 10000
Z CLV pak:

Sn − E Sn 600 − 500
 
P(Sn > 600) = 1 − P(Sn ≤ 600) = 1 − P √ ≤ √
var Sn 1600
100
 
= 1 − P Zn ≤ ≈ 1 − Φ(2.5) = 0.0062.
40
Mohli jsme použít nerovnosti a centrální limitní větu, i když jsme neznali skutečné rozdělení
vah balíků.

Moivre-Laplaceova CLV
Centrální limitní věta byla odvozena prvně pro Binomické rozdělení, tedy pro rozdělení
počtu zdarů v n pokusech. Pokud provedeme n nezávislých pokusů za stejných podmínek,
přičemž v každém pokusu může nastat zdar s pravděpodobností p ∈ (0, 1) a počet zdarů
označíme jako X, je X ∼ Binom(n, p) s pravděpodobnostmi
!
n k
P(X = k) = p (1 − p)n−k .
k
Střední hodnota je pak E X = np a rozptyl var X = np(1 − p). Označme
(
1 v i-tém pokusu zdar,
Xi =
0 v i-tém pokusu nezdar.
Pn
Součet Sn = i=1 Xi značí opět počet zdarů v n pokusech, tedy totéž, co X. Tedy
Sn − np n→∞
p −→ N(0, 1).
np(1 − p)

106
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 5.4 Centrální limitní věta

Rozdělení hodů mincí


Rozdělení počtů hlav v pěti hodech mincí (simulace).

0.30
0.25
0.20
probability

0.15
0.10
0.05
0.00

0 1 2 3 4 5

result

Rozdělení počtů hlav v deseti hodech mincí (simulace).


0.25
0.20
0.15
probability

0.10
0.05
0.00

0 2 4 6 8 10

result

Rozdělení počtů hlav ve sto hodech mincí (simulace).


0.08
0.06
probability

0.04
0.02
0.00

0 20 40 60 80 100

result


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 107
5 LIMITNÍ VĚTY BI-PST, ZS 2022/23, Přednáška 1-12

Příklad 5.12. S jakou pravděpodobností z 1000 nezávislých hodů vyváženou mincí padne
hlava více než 525 krát?
Nechť Xi je indikátorová veličina, značící, zda v i-tém hodu padla Hlava (Xi = 1), nebo
ne (Xi = 0). Součet takových veličin pak dá počet hlav v n hodech a má binomické rozdělení
Binom(n, p) s parametry n = 1000 a p = 1/2. Výpočet pravděpodobnosti přímo by byl složitý.
Místo pravděpodobností z binomického rozdělení použijeme CLV. Pro hod mincí je E Xi =
p = 1/2 a var Xi = p(1−p) = 1/4. Pro součet pak E Sn = np = 500 a var Sn = np(1−p) = 250.
Dostáváme

1000
!
S1000 − 500 25
X  
P Xi > 525 √
= P(S1000 − 500 > 525 − 500) = P >√ =
i=1 250 250
S1000 − 500 5 5
   
=1−P √ ≤√ ≈1−Φ √ = 1 − Φ(1.58) = 0.0571.
250 10 10

108
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12

6 Základní pojmy statistiky


6.1 Statistické metody
Úvod do statistiky
Doposud jsme pracovali s pravděpodobnostními problémy se známými parametry. Napří-
klad pokud máme urnu s r červenými a b modrými kuličkami, můžeme:

• najít pravděpodobnost, že vytáhneme modrou kuličku,

• najít pravděpodobnost, že mezi třemi tahy s vracením či bez vracení bude určitý počet
modrých kuliček,

• najít střední hodnotu počtu modrých kuliček v deseti tazích s vracením,

• zkoumat chování posloupnosti 1000 tahů,

• apod.

Dále budeme řešit statistické problémy. Např. když máme urnu s neznámým počtem červených
a modrých kuliček, můžeme na základě náhodného výběru:

• odhadnout podíl červených a modrých,

• testovat, zda je v urně 50% modrých kuliček nebo více,

• testovat, zda je ve dvou různých urnách stejný poměr červených a modrých nebo ne,

• apod.

V teorii pravděpodobnosti vytváříme matematické modely procesů (experimentů, testů


apod.) jejichž výsledek je náhodný. Tyto modely pak využíváme k predikci možných výsledků,
tj. určujeme pravděpodobnosti jevů, rozdělení a střední hodnoty náhodných veličin apod.

Matematická statistika postupuje do jisté míry opačně. Na základě skutečných výsledků


vybíráme vhodný model, odhadujeme hodnoty jeho parametrů, testujeme hypotézy o těchto
parametrech a ověřujeme shodu modelu se skutečností.

6.2 Náhodný výběr


Definice 6.1. n-tice stejně rozdělených nezávislých náhodných veličin (i.i.d.) X1 , . . . , Xn
s distribuční funkcí F se nazývá náhodný výběr z rozdělení F .

Příklady 6.2.

• Měření určité fyzikální veličiny při n nezávislých opakováních experimentu.

• Délka běhu algoritmu při n opakovaných spuštěních.

• Měření výšky n náhodně vybraných lidí.

Definice 6.3. Realizace náhodného výběru (vektor náhodných pozorování, případně jen data)
je n-tice konkrétních pozorovaných čísel x1 , . . . , xn .


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 109
6 ZÁKLADNÍ POJMY STATISTIKY BI-PST, ZS 2022/23, Přednáška 1-12

6.2.1 Kroky statistického uvažování


Mějme náhodný výběr z neznámého rozdělení. Na základě naměřených dat (realizace náhod-
ného výběru) chceme o tomto rozdělení zjistit co nejvíce.

Typické kroky při statistickém zkoumání:

• Odhad tvaru rozdělení – zúžení úvah na třídu rozdělení Fθ určenou neznámým parame-
trem θ. Vychází z apriorní znalosti, intuice nebo zkušenosti.

• Odhad parametrů rozdělení

– Bodový odhad – určení “nejpravděpodobnější” hodnoty θ.


– Intervalový odhad – určení intervalu, ve kterém θ leží s danou vysokou pravděpo-
dobností.

• Ověření správnosti modelu – testování hypotéz

– Testy dobré shody – ověřujeme hypotézy o tvaru pravděpodobnostního rozdělení.


Např. jestli má zkoumaná veličina normální rozdělení.
– Parametrické testy – vytvoříme hypotézu o parametru θ (např. θ = 0) a na základě
dat se snažíme rozhodnout, zda je nebo není možné tuto hypotézu zamítnout.

6.3 Odhad tvaru rozdělení


Odhad tvaru rozdělení – volba modelu
Rozdělení zkoumané náhodné veličiny většinou nemůže být zcela libovolné.
Na základě předchozí zkušenosti, intuice nebo povahy problému často

• tušíme, zda je sledovaná veličina diskrétní nebo spojitá,

• známe přibližný tvar jejího rozdělení (např. exponenciální, normální,...),

• případně i další určující vlastnosti (rozpětí hodnot dat, nulová střední hodnota,...).

Tyto informace nás vedou k volbě určitého modelu, tedy k

• volbě parametrické třídy rozdělení {Fθ (x)|θ ∈ Θ}, kde Θ je množina všech možných
hodnot parametru θ

• a předpokladu, že náš náhodný výběr pochází z rozdělení, které je v této rodině.

Příklady možných modelů

• Bernoulliho rozdělení – házení neznámou mincí

{Be(p)|p ∈ [0, 1]}

Parametr θ = p a Θ = [0, 1].

110
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 6.3 Odhad tvaru rozdělení

• Exponenciální rozdělení – časy mezi dvěma příchozími požadavky na databázový server


{Exp(λ)|λ ∈ (0, +∞)}
Parametr θ = λ a Θ = (0, +∞).
• Normální rozdělení – výsledky IQ testu v dané populaci
{N(µ, σ 2 )|µ ∈ (−∞, +∞), σ 2 ∈ (0, +∞)}
Odpovídá dvourozměrnému parametru θ = (µ, σ 2 ) a Θ = (−∞, +∞) × (0, +∞).

6.3.1 Histogram
Hustotu můžeme odhadovat pomocí histogramu.
4
1 · 10
0.4 3
1 · 10
2
1 · 10
0.2 1
1 · 10

xmin xmax
0
2 2.5 3 3.5 4 4.5 5 5.5 6

• Určíme rozsah dat.


• Zvolíme počet “přihrádek” k a jejich velikost h (zde k = 4 a h = 1).
• Nad každou přihrádkou nakreslíme sloupeček velikosti

počet pozorování v přihrádce ozn. mi


= .
h · počet všech pozorování h·n
Všimněme si, že plocha pod histogramem je rovna 1. A to díky dělení celkovým počtem
pozorování n. (To se ne vždy provádí.) V takovém případě se nám bude histogram dobře
vizuálně porovnávat s hustotami známých rozdělení. Otázkou ovšem zůstává, jak volit počet
a umístění přihrádek a mají-li být stejně velké. To není vždy jednoduchá otázka a při nevhodné
volbě nám histogram moc neřekne. Velmi spolehlivou vizualizací je vždy empirická distribuční
funkce.
Příklad 6.4. Naměřili jsme 1000 hodnot z neznámého rozdělení. Histogram hodnot:

0.4 N(µ, σ 2 )

0.3

fX
0.2

0.1

0
−4 −3 −2 −1 0 1 2 3 4
x


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 111
6 ZÁKLADNÍ POJMY STATISTIKY BI-PST, ZS 2022/23, Přednáška 1-12

Můžeme předpokládat, že se jedná o hodnoty z normálního rozdělení s neznámými parametry


µ a σ2.

6.3.2 Empirická distribuční funkce


Distribuční funkci můžeme odhadovat pomocí empirické distribuční funkce.
n
1X
Fn (x, X1 , . . . , Xn ) = Fn (x) = 1 ,
n i=1 {Xi ≤x}
Jinými slovy pravděpodobnost, že zkoumaná veličina bude menší nebo rovná x, můžeme
odhadnout jako podíl pozorovaných dat, která jsou menší nebo rovná x:

0.5 1 1
=
n 10

0 xmin xmax

X Empirická distribuční funkce je po částech konstantní se skoky velikosti n1 v pozoro-


vaných hodnotách. Později uvidíme, že je dobrým odhadem distribuční funkce rozdělení ze
kterého náhodný výběr pochází.
Příklad 6.5. Naměřili jsme 100 a 1000 hodnot z neznámého rozdělení. Empirická distribuční
funkce:
1

0.8

0.6

0.4

0.2
N(µ, σ 2 )
0
−4 −2 0 2 4 6

Můžeme předpokládát, že se jedná o hodnoty z normálního rozdělení s neznámými parametry


µ a σ2.

Odhad tvaru rozdělení – příklad


Příklad 6.6 (– čekání na autobus). Každé ráno změříme, jak dlouho jsme čekali na autobus
cestou do školy. Za 15 dní jsme napozorovali následující data (v minutách, seřazené):
0.1 0.3 0.5 0.7 1.0
1.9 2.8 3.4 3.5 3.8
5.3 7.7 8.6 8.7 11.1
Předpokládejme, že doby čekání tvoří náhodný výběr (X1 , ..., X15 ) z neznámého rozdělení.
Najděme histogram a empirickou distribuční funkci tohoto rozdělení.

112
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 6.3 Odhad tvaru rozdělení

Odhad tvaru rozdělení – příklad

Příklad 6.6 (– čekání na autobus – histogram). Data jsou z intervalu [0, 12]. Pokud zvolíme
počet přihrádek k pro histogram příliš malý nebo velký, odhad bude nepřesný:
0.1 0.3 0.5 0.7 1.0 1.9 2.8 3.4 3.5 3.8 5.3 7.7 8.6 8.7 11.1
>hist(waiting_time,prob=T,breaks=12)
0.25
0.20
0.15
Density

0.10
0.05
0.00

0 2 4 6 8 10 12

waiting_time

Počet přihrádek je patrně příliš velký, odhad je kostrbatý.

Odhad tvaru rozdělení – příklad

Příklad 6.6 (– čekání na autobus – histogram). Data jsou z intervalu [0, 12]. Pokud zvolíme
počet přihrádek k pro histogram příliš malý nebo velký, odhad bude nepřesný:
0.1 0.3 0.5 0.7 1.0 1.9 2.8 3.4 3.5 3.8 5.3 7.7 8.6 8.7 11.1
>hist(waiting_time,prob=T,breaks=2)
0.12
0.10
0.08
Density

0.06
0.04
0.02
0.00

0 5 10 15

waiting_time

Počet přihrádek je patrně příliš malý, odhad je pouze hrubý.

Odhad tvaru rozdělení – příklad

Příklad 6.6 (– čekání na autobus – histogram). Data jsou z intervalu [0, 12]. Zdá se být rozumné
1 1
rozdělit interval na šest částí po dvou minutách. Každé pozorování přidá do histogramu h·n = 2·15 =
¯
0.033:
0.1 0.3 0.5 0.7 1.0 1.9 2.8 3.4 3.5 3.8 5.3 7.7 8.6 8.7 11.1
>hist(waiting_time,prob=T)


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 113
6 ZÁKLADNÍ POJMY STATISTIKY BI-PST, ZS 2022/23, Přednáška 1-12

0.20
0.15
Density

0.10
0.05
0.00

●● ● ● ● ● ● ●● ● ● ● ●
● ●

0 2 4 6 8 10 12

waiting_time

Histogram připomíná exponenciální rozdělení.


Příklad 6.6 (– čekání na autobus – empirická distribuční funkce). Pro Fn Postupujeme zleva
doprava, v každém pozorovaném bodě přidáváme skok o velikosti 1/15:
>plot(ecdf(waiting_time))
1.0


0.8


0.6


Fn(x)


0.4


0.2


0.0

0 2 4 6 8 10 12

waiting_time

Nyní můžeme odhadovat pravděpodobnosti tvaru P(X ≤ x) pomocí Fn (x). Např. pravděpo-
.
dobnost, že nebudeme čekat déle než šest minut, odhadneme pomocí Fn (6) = 11/15 = 0.733.
Tedy jde o podíl pozorování, která jsou menší nebo rovna 6.

Odhad tvaru rozdělení – kvantily


Kvantily qα rozdělují populaci tak, že pod α-kvantilem by mělo být α% hodnot a nad ním
(1 − α)% hodnot. Medián, tedy 50%-kvantil, dělí populaci na dvě stejně velké části co do
pravděpodobnosti. Označíme-li seřazená data jako
 
x(1) , x(2) , ..., x(n) ,

můžeme α%-kvantil odhadnout jako x(dnαe) . Medián q0.5 tak odhadneme jako prostřední hod-
notu ze seřazených dat, x(d n2 e) . Jedná se tak o inverzi empirické distribuční funkce. Je-li počet
dat sudý, některý software odhaduje medián jako průměr x( n2 ) a x( n2 +1) .

Příklad 6.7 (– čekání na autobus – medián). Odhadněme medián doby čekání na autobus z po-
zorovaných dat:
0.1 0.3 0.5 0.7 1.0 1.9 2.8 3.4 3.5 3.8 5.3 7.7 8.6 8.7 11.1
Medián odhadneme jako prostřední pozorovanou hodnotu. Tedy s pravděpodobností přibližně 50%
budeme čekat méně než 3.4 minuty a též více než 3.4 minuty.

114
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12

7 Bodové odhady
7.1 Úvod
Z naměřených dat můžeme sestrojit aproximaci hodnot parametru θ, kterou nazýváme bodo-
vým odhadem.
Definice 7.1. Bodový odhad parametru θ je funkce θ̂n (X1 , . . . , Xn ) náhodného výběru, která
nezávisí na hodnotách θ.
Poznámky:
• Bodový odhad je příkladem tzv. statistiky, což je libovolná funkce náhodného výběru,
která nezávisí na parametru θ.

• Obecně můžeme sestrojit také bodový odhad nějaké funkce parametru g(θ).
1
• Typickým příkladem je g(λ) = = E X pro X mající exponenciální rozdělení.
λ

7.1.1 Nejužívanější bodové odhady


• Výběrový průměr – bodový odhad střední hodnoty E X:
n
1X
X̄n = Xi .
n i=1

• Výběrový rozptyl – bodový odhad rozptylu var X:


n
1 X
s2n = s2X = (Xi − X̄n )2 .
n − 1 i=1

• Výběrová směrodatná odchylka – bodový odhad směrodatné odchylky var X:
q
sn = s2n .

• k-tý výběrový moment – bodový odhad k-tého momentu µk = E X k :


n
1X
mk = Xk.
n i=1 i

• Výběrová kovariance – bodový odhad kovariance:


n
1 X
sX,Y = (Xi − X̄n )(Yi − Ȳn ).
n − 1 i=1

• Výběrový korelační koeficient – bodový odhad korelačního koeficientu:


sX,Y
rX,Y = r = ,
sX sY
kde sX a sY jsou odmocniny z výběrových rozptylů X a Y .


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 115
7 BODOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12

7.2 Vlastnosti bodových odhadů


Bodový odhad, jakožto funkce náhodného výběru, je také náhodnou veličinou s nějakým
rozdělením, které zřejmě závisí na parametru θ.
“Kvalitní” odhad θ̂n by měl být pro každou hodnotu θ a pro každou realizaci náhodného
výběru z Fθ blízký skutečné hodnotě θ. Problematika hledání vhodných odhadů je široká.
Obvykle požadujeme, aby odhad byl nestranný:

Definice 7.2. Odhad θ̂n parametru θ se nazývá nestranný (nevychýlený), jestliže

E θ̂n = θ, pro všechna θ ∈ Θ.

Nestrannost znamená, že odhad není zatížen systematickou chybou, tedy že odhadovanou


hodnotu systematicky nepřestřeluje ani nepodhodnocuje.
Další důležitá vlastnost odhadu je konzistence:

Definice 7.3. Odhad θ̂n parametru θ se nazývá konzistentní, jestliže pro každé θ ∈ Θ:

P
θ̂n −→ θ pro n → ∞.

Tedy, že pro ∀ε > 0: P(|θ̂n (X1 , . . . , Xn ) − θ| ≥ ε) → 0. Konzistence znamená, že volbou


velkého n lze učinit chybu dostatečně malou.

Věta 7.4. Nechť E θ̂n2 < +∞ pro každé n. Pokud pro n → +∞ platí

E θ̂n → θ a var θ̂n → 0,

pak je θ̂n konzistentní.

Důkaz. Viz literatura.

7.2.1 Výběrový průměr


Uvažujme náhodný výběr X1 , . . . , Xn z rozdělení F(µ,σ2 ) , kde E Xi = µ a var Xi = σ 2 . Střední
hodnotu µ odhadneme pomocí výběrového průměru X̄n .

• Nestrannost:
n n n
1X 1 X 1X
E X̄n = E Xi = E Xi = E Xi = µ.
n i=1 n i=1 n i=1

• Konzistence: ze slabého zákona velkých čísel

P
X̄n −→ µ pro n → ∞.

σ2
• To samé plyne z předchozí věty a faktu, že var X̄n = → 0.
n

Výběrový průměr X̄n je tedy nestranným a konzistentním odhadem parametru µ.

116
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 7.2 Vlastnosti bodových odhadů

Rozdělení výběrového průměru


Histogram podílu hlav v 10 hodech mincí (1000 simulací).
2.5
2.0
1.5
Density

1.0
0.5
0.0

0.0 0.2 0.4 0.6 0.8 1.0

Xbar

Histogram podílu hlav ve 20 hodech mincí (1000 simulací).


3
Density

2
1
0

0.0 0.2 0.4 0.6 0.8 1.0

Xbar

Histogram podílu hlav ve 100 hodech mincí (1000 simulací).


7
6
5
Density

4
3
2
1
0

0.0 0.2 0.4 0.6 0.8 1.0

Xbar


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 117
7 BODOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12

7.2.2 Výběrový rozptyl


Uvažujme náhodný výběr X1 , . . . , Xn z rozdělení F(µ,σ2 ) , kde E Xi = µ a var Xi = σ 2 . Rozptyl
σ 2 chceme odhadnout pomocí výběrového rozptylu s2n . Nejprve s2n přepíšeme jako
n
1 X
s2n = (Xi − X̄n )2
n − 1 i=1
n 
1 X 
= Xi2 − 2Xi X̄n + X̄n2
n − 1 i=1
n n
!
1 X X
= Xi2 − 2 Xi X̄n + nX̄n2
n − 1 i=1 i=1
n
!
1 X
= X 2 − nX̄n2 .
n − 1 i=1 i

• Nestrannost: Protože E Xi2 = σ 2 + µ2 a E X̄n2 = σ 2 /n + µ2 , dostaneme


!
1 X 1  
E s2n = E Xi2 − nX̄n2 = n E Xi2 − n E X̄n2
n−1 i
n−1
1  2  1
= nσ + nµ2 − nσ 2 /n − nµ2 = (n − 1)σ 2 = σ 2 .
n−1 n−1
To je důvod, proč dělíme číslem n − 1 a ne n, které by bylo na první pohled přirozenější.
Ale takový odhad by nebyl nestranný, ale pouze asymptoticky nestranný.
n→∞ 1 2 n→∞
• Konzistence: Ze zákona velkých čísel platí X̄n −→ µ = E Xi a zároveň i Xi −→
P
n
E Xi2 . Získáme tak
! !
1 X n 1X 2
s2n = Xi2 − nX̄n2 = Xi − X̄n2
n−1 i
n−1 n i
n→∞
−→ 1 · (E Xi2 − µ2 ) = E Xi2 − (E Xi )2 = var Xi = σ 2 .

Výběrový rozptyl s2n je tedy nestranným a konzistentním odhadem parametru σ 2 .


Často existuje více nestranných odhadů daného parametru. V takovém případě se snažíme
najít takový nestranný odhad, který má nejmenší rozptyl.
Definice 7.5. Odhad θbnbest (X1 , . . . , Xn ) se nazývá nejlepší nestranný odhad parametru θ,
pokud je nestranný a pro každý jiný nestranný odhad θbn platí

var(θbn ) ≥ var(θbnbest ) pro všechna θ ∈ Θ .

Pro každý případ existuje dolní mez pod kterou rozptyl žádného nestranného odhadu
nemůže klesnout (Rao - Cramerova mez). Pokud najdeme odhad s rozptylem rovným této
dolní mezi, máme nejlepší nestranný odhad.
Věta 7.6. Pro binomické, Poissonovo, exponenciální a normální rozdělení je výběrový průměr
nejlepším nestranným odhadem střední hodnoty. Pro normální rozdělení je výběrový rozptyl
nejlepším nestranným odhadem rozptylu.

118
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 7.3 Metoda momentů

7.3 Metoda momentů


Pro rychlý a jednoduchý (ale často ne optimální) odhad parametrů můžeme použít metodu
momentů. Uvažujme náhodný výběr X1 , . . . , Xn z rozdělení určeného d-rozměrným parame-
trem θ = (θ1 , . . . , θd ).
Postup metody momentů

• Napočítáme teoretické momenty E Xik , k = 1, ..., d.

• Vyjádříme parametry jako funkce momentů.

• Odhadneme teoretické momenty pomocí jejich empirických verzí:


n
[ 1X
E Xik = mk = Xk.
n i=1 i

• Dosadíme odhadnuté momenty do vztahů mezi parametry a teoretickými momenty.


Odhady parametrů sestavíme řešením příslušné soustavy rovnic.

Metoda dává rozumné odhady, protože ze zákona velkých čísel konvergují empirické mo-
menty ke skutečným, mk → E Xik pro n → +∞. Odhady jsou tak vždy konzistentní. Po-
známka: Pro pokrytí všech parametrů je někdy potřeba vyjádřit i momenty vyšších řádů.

7.3.1 Odhad rozptylu metodou momentů

Uvažujme X1 , . . . , Xn náhodný výběr z rozdělení F(µ,σ2 ) , kde E Xi = µ a var Xi = σ 2 .

• První dva momenty jsou:

E Xi = µ, E Xi2 = var Xi + (E Xi )2 = σ 2 + µ2 .

• Parametry lze vyjádřit jako funkce momentů: µ = E Xi , σ 2 = E Xi2 − (E Xi )2 .

• Odhadneme E Xi pomocí m1 a E Xi2 pomocí m2 .

• Získáme odhad rozptylu

σ̂n2 = m2 − m21
n
1X
= X 2 − (X̄n )2 .
n i=1 i

• Po úpravě
n
!
1 X n−1 2
σ̂n2 = X 2 − n(X̄n )2 = s .
n i=1 i n n

Tento odhad není nestranný, ale jeho vychýlení bude s rostoucím počtem pozorování klesat.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 119
7 BODOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12

7.4 Metoda maximální věrohodnosti


Příklad 7.7. Ze čtyř nezávislých hodů mincí nám padlo Hlava, Orel, Hlava, Hlava. Jak
můžeme odhadnout pravděpodobnost, že na této minci padne Hlava? Hody X1 , X2 , X3 , X4
tvoří náhodný výběr z Bernoulliho rozdělení s parametrem p a realizacemi 1, 0, 1, 1. Pravdě-
podobnost právě takového výsledku je:
L(p) = P(H,O,H,H) = P(X1 = 1 ∩ X2 = 0 ∩ X3 = 1 ∩ X4 = 1) = p3 (1 − p).
Jako odhad parametru p vezmeme takovou hodnotu, pro kterou je získaná realizace nejprav-
děpodobnější. Tedy najdeme maximum funkce L(p).
dL d 3
(p) = (p − p4 ) = 3p2 − 4p3 = p2 (3 − 4p) = 0.
dp dp
Stacionární body jsou 0 a 34 , přičemž maxima funkce nabývá v bodě 43 . Dostáváme tedy odhad
pbn = 34 , což lze předvídat přímo ze zadání.
Konzistentní odhady s dobrými vlastnostmi je možné získat metodou maximální věrohod-
nosti. Cílem je maximalizovat věrohodnostní funkci pro dané naměřené hodnoty.
Definice 7.8. Uvažujme náhodný výběr X1 , . . . , Xn se sdruženou
n
Y
hustotou fθ (x) = fθ (xi ) pro spojité rozdělení, resp.
i=1
Yn
pravděpodobnostmi pθ (x) = Pθ (Xi = xi ) pro diskrétní rozdělení.
i=1

Při pevných hodnotách pozorovaných dat x = (x1 , . . . , xn ) se fθ (x) resp. pθ (x) jakožto funkce
θ nazývá věrohodnostní funkcí a značí se L(θ; x), případně jen L(θ).
Věrohodnostní funkce závisí pouze na parametru θ. Hodnoty x1 , . . . , xn jsou považovány
za známé a pevné.
Definice 7.9. Hodnota θ̂n parametru θ, která maximalizuje věrohodnostní funkci L(θ; x) pro
dané X = x, se nazývá maximálně věrohodný odhad (MLE) parametru θ. To znamená, že
L(θ̂n ; x) ≥ L(θ; x) pro všechna θ ∈ Θ.
Poznámky:
• Jako maximálně věrohodný odhad funkce parametru g(θ) lze vzít g(θ̂n ).
• Často je výhodné maximalizovat logaritmickou věrohodnostní funkci ln L(θ; x), protože
se součin změní na součet.
• V případě k-rozměrného parametru θ = (θ1 , . . . , θk ) tak obvykle řešíme soustavu rovnic
∂ ln L(θ1 , . . . , θk ; x)
= 0 pro j = 1, . . . , k.
∂θj

• Jsou-li splněny tzv. podmínky regularity (viz literatura), odhady získané metodou ma-
ximální věrohodnosti jsou konzistentní, asymptoticky nestranné a mají asymptoticky
normální rozdělení.

120
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 7.4 Metoda maximální věrohodnosti

7.4.1 Odhad parametrů normálního rozdělení


Příklad 7.10 (– parametry normálního rozdělení). Sestrojme MLE odhad parametrů µ a σ 2 normál-
ního rozdělení N(µ, σ 2 ).
Označme τ = σ 2 . Věrohodnostní funkce pro n naměřených hodnot x1 , . . . , xn je:
n
Y 1 (xi −µ)2
L(µ, τ ; x) = √ e− 2τ .
i=1
2πτ
V tomto případě je výhodné maximalizovat log-věrohodnost
n n 
(xi − µ)2
  
X 1 (xi −µ)2 X 1
ln L(µ, τ ) = ln √ e− 2τ = ln(2πτ )− 2 − .
i=1
2πτ i=1

Derivováním podle µ dostaneme
Pn
∂ ln L(µ, τ ) 2 i=1 (xi − µ)
= = 0,
∂µ 2τ
n
X
což lze převést na rovnost xi − nµ = 0. Řešením této rovnice je maximálně věrohodný odhad
i=1
µ̂n = X̄n .

Příklad 7.10 (– parametry normálního rozdělení – pokračování). Sestrojme MLE odhad parametrů
µ a σ 2 normálního rozdělení N(µ, σ 2 ).
Derivujeme-li log-věrohodnost
n 
(xi − µ)2

X 1
ln L(µ, τ ) = − ln(2πτ ) −
i=1
2 2τ
podle τ , dostaneme
Pn
∂ ln L(µ, τ ) 1 2π i=1 (xi − µ)2
= −n + = 0,
∂τ 2 2πτ 2τ 2
což lze převést na rovnost Pn
i=1 (xi − µ)2
−n + = 0.
τ
n
1X
Tedy τ = (xi − µ)2 . Dosazením odhadu µ získáme maximálně věrohodný odhad
n i=1
n
1X
σ̂n2 = τ̂n = (Xi − X̄n )2 .
n i=1

Odhad rozdělení – příklad

Příklad 7.11 (– čekání na autobus – srovnání rozdělení). Odhadněme parametry známých


spojitých rozdělení pro pozorované doby čekání na autobus. Porovnejme hustoty s odhadnutými
paramery s histogramem.

0.1 0.3 0.5 0.7 1.0 1.9 2.8 3.4 3.5 3.8 5.3 7.7 8.6 8.7 11.1

Odhadneme parametry rovnoměrného Unif(0, b), exponenciálního Exp(λ) a normálního roz-


dělení N(µ, σ 2 ) pomocí metody maximální věrohodnosti. Pro rovnoměrné a exponenciální
rozdělení viz cvičení:


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 121
7 BODOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12

Rozdělení Odhadnuté parametry


Rovnoměrné a=0 b̂n = 11.1
Exponenciální λ̂n = 0.25 −
2
Normální µ̂n = 3.96 σ̂n = 11.7.

Odhad rozdělení – příklad

Příklad 7.11 (– čekání na autobus – srovnání rozdělení, pokračování). Porovnejme histogram


s hustotami s odhadnutými parametry:
0.20
0.15
Density

0.10
0.05
0.00

0 2 4 6 8 10 12

waiting_time

Histogramu je nejblíže exponenciální rozdělení.

122
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12

8 Intervalové odhady
8.1 Intervaly spolehlivosti
Místo bodového odhadu parametru θ nás může zajímat interval, ve kterém leží skutečná
hodnota parametru s danou vysokou pravděpodobností 1 − α:

Definice 8.1. Nechť X1 , . . . , Xn je náhodný výběr z rozdělení určeného parametrem θ. Inter-


val (L, U ) s krajními body určenými statistikami L ≡ L(X) ≡ L(X1 , . . . , Xn ) a U ≡ U (X) ≡
U (X1 , . . . , Xn ) splňující

P L<θ <U =1−α

se nazývá 100·(1−α)% interval spolehlivosti, případně konfidenční interval. Statistika L resp.


U se nazývá dolní resp. horní mez intervalu spolehlivosti. Číslo (1 − α) se nazývá hladina
spolehlivosti.

Intervaly spolehlivosti – poznámky

• Platí tedy

P θ ∈ (L, U ) = 1 − α.

• To znamená, že

P θ∈
/ (L, U ) = α.

• Pro oboustranný (symetrický) interval spolehlivosti volíme L a U tak, aby platilo

α α
P(θ < L) = a P(U < θ) = .
2 2

• Nejčastěji se používají hodnoty α = 0.05 nebo α = 0.01, tj. hledáme 95% nebo 99%
interval spolehlivosti.

8.1.1 Jednostranné intervaly spolehlivosti

Pokud nás zajímá jen dolní resp. horní mez, konstruujeme statistiky L resp. U tak, aby
 
P L<θ =1−α resp. P θ < U = 1 − α,

neboli
 
P θ<L =α resp. P U < θ = α.

Interval (L, +∞) nazýváme horní interval spolehlivosti. Interval (−∞, U ) nazýváme dolní
interval spolehlivosti.
Hovoříme pak o jednostranných intervalech spolehlivosti.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 123
8 INTERVALOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12

8.1.2 Obecný postup sestavení intervalů spolehlivosti

Postup sestavení intervalů spolehlivosti


Existuje více možností, jak sestavit konfidenční intervaly, v závislosti na sledovaném roz-
dělení a významu parametrů. Budeme používat následující obecný postup:

• Najděme statistiku H(θ), která:

– závisí na odhadovaném parametru θ,


– závisí na náhodném výběru X1 , ..., Xn ,
– má známé rozdělení.

• Nalezneme takové meze hL a hU , pro které



P hL < H(θ) < hU = 1 − α.

• Úpravou nerovností osamostatníme θ a získáme



P L < θ < U = 1 − α.

Statistiku H(θ) často volíme s ohledem na rozdělení příslušného bodového odhadu θ, např.
výběrového průměru pro střední hodnotu a výběrového rozptylu pro rozptyl.

8.2 Intervaly spolehlivosti pro střední hodnotu


8.2.1 Při známém rozptylu

Věta 8.2. Uvažujme náhodný výběr X1 , . . . , Xn z normálního rozdělení N(µ, σ 2 ) a předpoklá-


dejme, že známe rozptyl σ 2 . Oboustranný 100 · (1 − α)% interval spolehlivosti pro µ je

σ σ
 
X̄n − zα/2 √ , X̄n + zα/2 √ ,
n n

kde zα/2 = Φ−1 (1 − α/2) je kritická hodnota standardního normálního rozdělení, tj. číslo, pro
které platí P(Z > zα/2 ) = α/2 pro Z ∼ N(0, 1).
Jednostranné 100 · (1 − α)% intervaly spolehlivosti pro µ jsou pak

σ σ
   
X̄n − zα √ , +∞ a −∞ , X̄n + zα √
n n

při stejném značení.

Důkaz. Nejprve ukážeme, že průměr i.i.d. náhodných veličin z normálního rozdělení má také
normální rozdělení, ale s jinými parametry. Pro důkaz využijeme momentovou vytvořující
funkci MX (s) = E[esX ].

124
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 8.2 Intervaly spolehlivosti pro střední hodnotu

Momentová vytvořující funkce normálního rozdělení s parametry µ a σ 2 je:


+∞ +∞
1 (x−µ)2 1 x2 −2xµ+µ2 −2σ 2 sx
Z Z

MX (s) = E[e sX
]= e sx
·√ e 2σ 2 dx = √ e− 2σ 2 dx
2πσ 2 2πσ 2
−∞ −∞
+∞ 2
x−(µ+σ 2 s) +µ2 −(µ+σ 2 s)2
Z
1 ( )
= √ e− 2σ 2 dx
2πσ 2
−∞
+∞ 2
2 2
Z
1 (x−(µ+σ2 s)) σ 2 s2
µs− σ 2s −
=e √ e 2σ 2 dx = eµs− 2
2πσ 2
−∞
| {z }
1

Důkaz. Momentová vytvořující funkce součtu nezávislých veličin je součinem jejich vytvořu-
jících funkcí. Pro součet i.i.d. normáně rozdělených veličin tak:
Pn
nezávislost
Msum (s) = E[es i=1
Xi
] = E[esX1 · ... · esXn ] = E[esX1 ] · ... · E[esXn ]
n
Y stejné rozdělení
= Mi (s) = (M (s))n
i=1
 2 2
n
nσ 2 s2
µs− σ 2s
= e = enµs− 2 .

Porovnáme-li s vytvořující funkcí jedné normálně rozdělené veličiny, vidíme, že vytvořující


funkce součtu odpovídá normálnímu rozdělení N(nµ, nσ 2 ).
n
! !
X
2 nσ 2 σ2
Důkaz. Tedy Xi ∼ N(nµ, nσ ) a proto X̄n ∼ N µ, 2 = N µ, . Tudíž po prove-
i=1
n n
dení standardizace je
X̄n − µ
Z= √ ∼ N(0, 1).
σ/ n
Z definice kritické hodnoty zα/2 : P(Z > zα/2 ) = α/2 plyne, že P(Z < zα/2 ) = 1 − P(Z >
zα/2 ) = 1 − α/2. To znamená, že

P(z1−α/2 < Z < zα/2 ) = P(Z < zα/2 ) − P(Z < z1−α/2 ) = 1 − α/2 − (1 − 1 + α/2) = 1 − α.

Ze symetrie N(0, 1) plyne z1−α/2 = −zα/2 . Po dosazení dostaneme


!
X̄n − µ
1 − α = P(z1−α/2 < Z < zα/2 ) = P −zα/2 < √ < zα/2
σ/ n
σ σ σ σ
   
= P −zα/2 √ < X̄n − µ < zα/2 √ = P zα/2 √ > µ − X̄n > −zα/2 √
n n n n
σ σ σ σ
   
= P −zα/2 √ < µ − X̄n < zα/2 √ = P X̄n − zα/2 √ < µ < X̄n + zα/2 √ .
n n n n


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 125
8 INTERVALOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12

Poznámky a shrnutí
−µ
X̄n√
Z= σ/ n
∼ N(0, 1)
Oboustranný

1−α
α/2 α/2

−zα/2 = z1−α/2 0 zα/2

Jednostranný
1−α
α

−∞ 0 zα

Příklad 8.3 (– IQ žáků 8.třídy). IQ žáků osmé třídy se řídí normálním rozdělením N(µ, σ 2 )
s rozptylem σ 2 = 9 známým ze zkušenosti. Chceme získat oboustranný intervalový odhad pro střední
hodnotu IQ o spolehlivosti 95%. Testů se zůčastnilo 16 žáků, naměřili jsme tyto hodnoty:
111, 116, 105, 111, 110, 114, 108, 106, 112, 108, 112, 111, 105, 111, 108, 110.
. √
Pro intervalový odhad potřebujeme výběrový průměr X̄n = 109.9, směrodatnou odchylku σ = σ 2 = 3
a příslušnou kritickou hodnotu. Protože spolehlivost intervalu má být 95%, máme

1 − α = 0.95 ⇔ α = 0.05 ⇔ α/2 = 0.025.


Kritickou hodnotu získáme z tabulek jako
.
zα/2 = z0.025 = Φ−1 (0.975) = 1.96.
95% oboustranný interval spolehlivosti pak je

 
σ σ
(L, U ) = X̄n − zα/2 √ , X̄n + zα/2 √
n n
 
. 3 3 .
= 109.9 − 1.96 √ , 109.9 + 1.96 √ = (108.4, 111.3).
16 16

Intervalové odhady založené na CLV


Pro získání intervalů spolehlivosti pro střední hodnotu jsme použili faktu, že standardizovaný
výběrový průměr má pro Xi ∼ N(µ, σ 2 ) standardní normální rozdělení:

X̄n − µ
√ ∼ N(0, 1).
σ/ n
Centrální limitní věta nám říká, že výběrový průměr veličin z libovolného rozdělení se střední
hodnotou µ a konečným rozptylem σ 2 konverguje k normálnímu rozdělení:

X̄n − µ n→∞
√ −→ N(0, 1).
σ/ n

126
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 8.2 Intervaly spolehlivosti pro střední hodnotu

Toho využijeme pro konstrukci konfidenčních intervalů pro jiná než normální rozdělení.
V důsledku centrální limitní věty můžeme pro velké n stejné intervaly spolehlivosti použít
přibližně i pro náhodný výběr z libovolného rozdělení.
Uvažujme náhodný výběr X1 , . . . , Xn z rozdělení s E Xi = µ a var Xi = σ 2 a předpoklá-
dejme, že známe rozptyl σ 2 .
Oboustranný 100 · (1 − α)% interval spolehlivosti pro µ můžeme při dostatečně velkém n
určit stejně, jako pro výběr z normálního rozdělení:

σ σ
 
X̄n − zα/2 √ , X̄n + zα/2 √ ,
n n

kde zα/2 je kritická hodnota N(0, 1). Jednostranné intervaly analogicky.

• Přibližná spolehlivost intervalu je pak 1 − α.

• Dostatečný rozsah výběru obvykle znamená n = 30 či n = 50. V případě rozdělení


výrazně odlišných od normálního (více vrcholů hustoty, šikmost) musí často být n ještě
vyšší.

Odhad střední hodnoty pro jiné než normální rozdělení

Příklad 8.4 (– volební účast). Provedli jsme průzkum z cílem zjistit předpokládanou volební účast.
Z 400 respondentů 240 odpovědělo, že volit půjde, zbytek že nepůjde.
Odhadněme volební účast a sestavme příslušný 95% konfidenční interval. Odpovědi si můžeme
představit jako Bernoulliho náhodné veličiny:
(
1 pokud i-tý respondent řekl, že půjde volit
Xi =
0 pokud i-tý respondent řekl, že nepůjde volit.

Víme, že pak
µ = E Xi = p, σ 2 = var Xi = p(1 − p).

Pravděpodobnost p, že náhodný člověk půjde volit, je střední hodnotou rozdělení. Odhadneme ji


výběrovým průměrem:

n
1X 240 6
p̂n = Xi = = = 60%.
n i=1 400 10

Rozptyl pak můžeme odhadnout jako

6 4 24
σ̂n2 = p̂n (1 − p̂n ) = · = .
10 10 100

Příklad 8.4 (– volební účast, pokračování). Přibližný interval spolehlivosti pro µ můžeme
sestavit na základě CLV i pro Bernoulliho rozdělení jako

σ σ
 
(L, U ) = X̄n − zα/2 √ , X̄n + zα/2 √ .
n n


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 127
8 INTERVALOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12

Rozptyl σ 2 neznáme, ale můžeme jej za cenu určité ztráty přesnosti nahradit odhadem σ̂n2 =
p̂n (1 − p̂n ). Přibližný konfidenční interval pak bude
p p !
p̂n (1 − p̂n ) p̂n (1 − p̂n )
(L, U ) = p̂n − zα/2 √ , p̂n + zα/2 √
n n
p p !
6 24/100 6 24/100
= − 1.96 √ , + 1.96 √
10 400 10 400
= (0.552, 0.648) .

Tedy s přibližně 95% spolehlivostí můžeme říct, že k volbám půjde něco mezi 55.2% a 64.8%
obyvatel.

8.2.2 Při neznámém rozptylu

Často ale rozptyl σ 2 neznáme a máme k dispozici jen pozorovaná data.

V minulém příkladě jsme rozptyl odhadli za cenu ztráty přesnosti.

Nabízí se, neznámý rozptyl odhadnout pomocí výběrového rozptylu:

n
1 X
s2n = (Xi − X̄n )2 .
n − 1 i=1

Prozkoumáme, jak intervaly spolehlivosti příslušně upravit, aby jejich přesnost byla právě
1 − α.

Chí-kvadrát a Studentovo rozdělení


Použijeme následující dvě rozdělení, jejichž kritické hodnoty lze najít v tabulkách:

Definice 8.5. Uvažujme náhodný výběr Y1 , . . . , Yn z normálního rozdělení N(0, 1). Pak ří-
káme, že náhodná veličina
n
X
Y = Yi2
i=1

má chí-kvadrát (χ2 ) rozdělení s n stupni volnosti.


Pn 2
Definice 8.6. Uvažujme náhodný výběr Y1 , . . . , Yn z N(0, 1), veličinu Y = i=1 Yi a s ní
nezávislou veličinu Z, také z N(0, 1). Pak říkáme, že náhodná veličina

Z
T =q
Y
n

má Studentovo t-rozdělení s n stupni volnosti.

128
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 8.2 Intervaly spolehlivosti pro střední hodnotu

Chí-kvadrát rozdělení a výběrový rozptyl


Odhadneme neznámý rozptyl σ 2 pomocí výběrového rozptylu
n
1 X
s2n = (Xi − X̄n )2 .
n − 1 i=1

Rozdělení výběrového rozptylu souvisí s chí-kvadrát rozdělením:


Věta 8.7. Uvažujme náhodný výběr X1 , . . . , Xn z normálního rozdělení N(µ, σ 2 ). Potom

(n − 1)s2n
σ2
má chí-kvadrát rozdělení s n − 1 stupni volnosti.
Důkaz. Viz literatura.

Studentovo t-rozdělení a výběrový průměr q


Rozdělení výběrového průměru se σ odhadnutým pomocí sn = s2n souvisí s t-rozdělením:

Věta 8.8. Uvažujme náhodný výběr X1 , . . . , Xn z normálního rozdělení N(µ, σ 2 ). Potom

X̄n − µ
T = √
sn / n
má Studentovo t-rozdělení s n − 1 stupni volnosti
Důkaz. Můžeme přepsat T jako:

√ X̄n −µ
X̄n − µ σ/ n
T = p 2 =r .
sn /n (n−1)s2n
σ 2 (n−1)

Čitatel má standardní normální rozdělení N(0, 1), ve jmenovateli máme odmocninu z χ2n−1
vyděleného n − 1. Rozdělení X̄n a s2n jsou nezávislá (viz literatura), tedy celý zlomek má
skutečně rozdělení tn−1 .
q
Neznáme-li rozptyl, odhadneme hodnotu σ odmocninou z výběrového rozptylu sn = s2n .
Standardizace X̄n s použitím sn vede na Studentovo t-rozdělení.
Věta 8.9. Uvažujme náhodný výběr X1 , . . . , Xn z normálního rozdělení N(µ, σ 2 ). Oboustranný
100 · (1 − α)% interval spolehlivosti pro µ je
sn sn
 
X̄n − tα/2,n−1 √ , X̄n + tα/2,n−1 √ ,
n n
kde tα/2,n−1 je kritická hodnota Studentova t-rozdělení s n − 1 stupni volnosti. Jednostranné
100 · (1 − α)% intervaly spolehlivosti pro µ jsou pak
sn sn
   
X̄n − tα,n−1 √ , +∞ a −∞ , X̄n + tα,n−1 √
n n
při stejném značení.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 129
8 INTERVALOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12

Poznámky a shrnutí
V důsledku centrální limitní věty můžeme pro velké n stejné intervaly spolehlivosti použít
přibližně i pro náhodný výběr z libovolného rozdělení.
Uvažujme náhodný výběr X1 , . . . , Xn z rozdělení s E Xi = µ a var Xi = σ 2 a předpoklá-
dejme, že neznáme rozptyl σ 2 .
Oboustranný 100 · (1 − α)% interval spolehlivosti pro µ můžeme při dostatečně velkém n
určit stejně, jako pro výběr z normálního rozdělení:
sn sn
 
X̄n − tα/2,n−1 √ , X̄n + tα/2,n−1 √ ,
n n
kde tα/2,n−1 je kritická hodnota Studentova t-rozdělení s n-1 stupni volnosti. Jednostranné
intervaly analogicky.

• Přibližná spolehlivost intervalu je pak 1 − α.

• Dostatečný rozsah výběru obvykle znamená n = 30 či n = 50. V případě rozdělení


výrazně odlišných od normálního (více vrcholů hustoty, šikmost) musí často být n ještě
vyšší.

X̄n −µ
T = √
sn / n
∼ tn−1
Oboustranný

1−α
α/2 α/2

−tα/2,n−1 0 tα/2,n−1

Jednostranný
1−α
α

−∞ 0 tα,n−1

1−α
α/2 α/2

−zα/2 0 zα/2
−tα/2,n−1 tα/2,n−1

• Intervaly spolehlivosti µ pro neznámé σ 2 jsou širší než pro známé σ 2 .

130
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 8.2 Intervaly spolehlivosti pro střední hodnotu

• V limitě n → +∞ obě rozdělení (a tedy i kritické hodnoty) splývají.

Příklad 8.10 (– hmotnost kaprů). Hmotnosti kaprů při výlovu rybníka jsou náhodné veličiny
s normálním rozdělením N(µ, σ 2 ). Z deseti vylovených kaprů jsme zjistili:
10
X 10
X
Xi = 45.65 kg a Xi2 = 208.70 kg2 .
i=1 i=1

Najděme bodové odhady pro střední hodnotu µ a rozptyl σ 2 .


Bodové odhady:
10
1 X 45.65
• X̄10 = Xi = = 4.565 kg.
10 i=1 10
n n
1 X 1 X
• s2n = (Xi − X̄n )2 = Xi2 − n(X̄n )2 .

n − 1 i=1 n − 1 i=1

1 
• s210 = 208.7 − 10 · (4.565)2 = 0.0342 kg2 .
9

Odhad µ a σ 2 normálního rozdělení – příklad


Příklad 8.10 (– hmotnost kaprů, pokračování). Najděme oboustranný 90% konfidenční in-
terval pro µ.
X̄10 = 4.565 kg
sn sn
 
X̄n − tα/2,n−1 √ , X̄n + tα/2,n−1 √ s210 = 0.0342 kg2
n n
√ √ ! α = 10% = 0.1
0.0342 0.0342
4.565 − 1.833 √ , 4.565 + 1.833 √ t0.05,9 = 1.833
10 10

Oboustranný 90% konfidenční interval pro µ je tedy

(4.458, 4.672) kg.

Příklad 8.10 (– hmotnost kaprů, pokračování). Najděme dolní 90% konfidenční interval pro
µ.
sn X̄10 = 4.565 kg
 
−∞ , X̄n + tα,n−1 √
n s210 = 0.0342 kg2
√ ! α = 10% = 0.1
0.0342
−∞ , 4.565 + 1.383 √
10 t0.1,9 = 1.383

Dolní 90% konfidenční interval pro µ je tedy

(−∞, 4.646) kg.

Pokud by nám například prodejce tvrdil, že střední váha kaprů je 4.8 kg, můžeme s 90% jisto-
tou říct, že nemá pravdu. Takové úvahy jsou základem testování hypotéz, viz příští přednášku.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 131
8 INTERVALOVÉ ODHADY BI-PST, ZS 2022/23, Přednáška 1-12

8.3 Intervaly spolehlivosti pro rozptyl


Věta 8.11. Uvažujme náhodný výběr X1 , . . . , Xn z normálního rozdělení N(µ, σ 2 ). Obou-
stranný 100 · (1 − α)% interval spolehlivosti pro rozptyl σ 2 je
!
(n − 1)s2n (n − 1)s2n
, ,
χ2α/2,n−1 χ21−α/2,n−1

kde χ2α/2,n−1 je kritická hodnota rozdělení χ2 s n − 1 stupni volnosti, tj. P(X > χ2α/2,n−1 ) =
α/2 pokud X ∼ χ2n−1 . Jednostranné 100 · (1 − α)% intervaly spolehlivosti pro σ 2 jsou pak
! !
(n − 1)s2n (n − 1)s2n
, +∞ a 0, 2 .
χ2α,n−1 χ1−α,n−1

X Platí pouze pro normální rozdělení!

Důkaz. Víme, že
(n − 1)s2n
σ2
má chí-kvadrát rozdělení χ2n−1 . Konfidenční interval sestavíme pomocí odpovídajících kritic-
kých hodnot: !
2 (n − 1)s2n 2
P χ1−α/2,n−1 < < χα/2,n−1 = 1 − α.
σ2

Vynásobením všech členů σ 2 a vydělením nerovností kritickými hodnotami osamostatníme σ 2


a získáme: !
(n − 1)s2n 2 (n − 1)s2n
P <σ < 2 = 1 − α.
χ2α/2,n−1 χ1−α/2,n−1

(n−1)s2n
σ2 ∼ χ2n−1

1−α
α/2 α/2

0 χ21−α/2,n−1 χ2α/2,n−1

(n−1)s2 (n−1)s2
σ2
n
< χ2α,n−1 ⇒ χ2
n
< σ2
α,n−1

1−α
α

0 χ2α,n−1

132
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 8.3 Intervaly spolehlivosti pro rozptyl

Odhad µ a σ 2 z normálního rozdělení – příklad

Příklad 8.12 (– hmotnost kaprů, pokračování). Najděme oboustranný 90% konfidenční in-
terval pro rozptyl hmotnosti kaprů v rybníce σ 2 :
s210 = 0.0342 kg2
!
(n − 1)s2n (n − 1)s2n
, 2
χ2α/2,n−1 χ1−α/2,n−1 α = 10% = 0.1
χ20.05,9 = 16.919
9 · 0.0342 9 · 0.0342
 
,
16.919 3.325 χ20.95,9 = 3.325
Oboustranný 90% konfidenční interval pro σ 2 je tedy

(0.0182, 0.0926) kg2 .

Příklad 8.12 (– hmotnost kaprů, pokračování). Najděme horní jednostranný 90% konfi-
denční interval pro rozptyl hmotnosti kaprů v rybníce σ 2 :
!
(n − 1)s2n s210 = 0.0342 kg2
, +∞
χ2α,n−1
α = 10% = 0.1
9 · 0.0342
 
, +∞ χ20.1,9 = 14.684
14.684
Horní jednostranný 90% konfidenční interval pro σ 2 je tedy

(0.0210, +∞) kg2 .

Pokud by nám například prodejce tvrdil, že rozptyl váhy kaprů je 0.01 kg2 , tedy že směro-
datná odchylka je 100 gramů, můžeme s 90% jistotou říct, že nemá pravdu.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 133
9 TESTOVÁNÍ HYPOTÉZ BI-PST, ZS 2022/23, Přednáška 1-12

9 Testování hypotéz
9.1 Princip testování hypotéz
Testování hypotéz – motivace
Často potřebujeme ověřit nějaké tvrzení o zkoumaném rozdělení dat, přičemž k dispozici
máme jen náhodný výběr.

Příjem dodávky zboží


Dodávku zboží přijmeme, pokud bude procento vadných výrobků menší než určitá hranice,
např. 5%.
Často není možné prověřit všechny výrobky. Provedeme tedy náhodný výběr a otestujeme
jejich funkčnost. Na základě výsledků máme rozhodnout, zda dodávku přijmout, či ne.

Zlepšení technologického procesu


Byl navržen nový způsob výroby. Než se uvede do provozu, je nutno rozhodnout, zda je
skutečně lepší, než ten současný.
Naměříme n1 vzorků vyrobených původní metodou a n2 vzorků vyrobených novou meto-
dou. Na jejich základě máme rozhodnout, zda je nová metoda lepší, či ne.

Testování hypotéz – hypotézy


Mějme náhodný výběr z nějakého rozdělení. Tvrzení o tomto rozdělení, která nemůžeme
s jistotou potvrdit, nazýváme hypotézy.
Mechanismus, jak na základě napozorovaných dat ověřovat platnost takových tvrzení,
nazýváme testování hypotéz.
Používáme dva základní pojmy:

• Nulová hypotéza H0 označuje tvrzení, které chceme potvrdit nebo zamítnout.

• Alternativní hypotéza HA je opačné tvrzení, které stavíme proti H0 .

Typy hypotéz:

• Neparametrické – výběr z obecného rozdělení. Tvrzení se týkají různých vlastností roz-


dělení (např. mediánu), případně tvaru celého rozdělení (testy dobré shody).

• Parametrické – náhodný výběr z rozdělení s parametrem θ ∈ Rd . Tvrzení se týkají


hodnoty θ.

Testování hypotéz – chyby testování


Test nulové hypotézy H0 proti alternativní hypotéze HA je tedy rozhodovací proces, na
jehož základě zamítneme nebo nezamítneme hypotézu H0 .

Při rozhodování se můžeme dopustit jedné ze dvou chyb:

• Zamítneme H0 , ačkoli platí – chyba prvního druhu.

• Nezamítneme H0 , ačkoli neplatí (platí HA ) – chyba druhého druhu.

134
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 9.2 Parametrické testy

Většinou lze mít pod kontrolou pouze pravědpodobnost jedné z těchto chyb.
• Chceme, aby pravděpodobnost chyby prvního druhu byla nejvýš rovna zvolené hodnotě
α, kterou nazýváme hladinou významnosti testu.
• Běžně volíme α = 5% nebo α = 1%.
• Chyba druhého druhu pak může být vysoká či nízká, v závislosti na rozsahu zkoumaného
výběru a dalších faktorech.
• Hodnota 1 − P(chyba druhého druhu) se nazývá síla testu.

Testování hypotéz – možné výsledky


Možné výsledky testování:
• Zamítáme hypotézu H0 (přijímáme HA ) – s možnou malou pravděpodobností chyby α.
• Nezamítáme H0 .

Postavení obou hypotéz je tak asymetrické.


Za nulovou hypotézu volíme tu, jejíž neoprávněné zamítnutí (tedy chyba prvního druhu)
by bylo závažnější.
Hypotézu, kterou potřebujeme prověřit, volíme jako alternativní hypotézu HA . Zamítnutí
H0 ve prospěch HA je silný výsledek.

Testování hypotéz – možné výsledky


Celkově tedy říkáme, že “testujeme hypotézu H0 proti alternativě HA na hladině význam-
nosti α”.

• Jestliže zamítáme hypotézu H0 , můžeme tedy s velkou spolehlivostí tvrdit, že platí


alternativa HA . Říkáme, že tvrzení HA je “statisticky významné”.
• Pokud H0 nezamítáme, nazýváme tvrzení HA “statisticky nevýznamné”.

9.2 Parametrické testy


Parametrické testy a intervaly spolehlivosti
Nechť X1 , . . . , Xn je náhodný výběr z rozdělení s parametrem θ.
Chceme testovat parametrickou hypotézu proti oboustranné alternativě :
H0 : θ = θ0 proti HA : θ 6= θ0 ,
pro konkrétní hodnotu θ0 . 
Vezměmě L(X), U (X) oboustranný 100(1 − α)% interval spolehlivosti pro θ, sestavený
na základě náhodného výběru. Pak platí

P θ ∈ (L, U ) = 1 − α.
Rozhodneme se následovně:
• Zamítneme hypotézu H0 , jestliže θ0 ∈
/ (L, U ).
• Nezamítneme H0 , jestliže θ0 ∈ (L, U ).


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 135
9 TESTOVÁNÍ HYPOTÉZ BI-PST, ZS 2022/23, Přednáška 1-12

Parametrické testy a intervaly spolehlivosti


Ověřme, že se jedná o test na požadované hladině významnosti α:

Za platnosti nulové hypotézy H0 , tj. θ = θ0 , je pravděpodobnost chyby prvního druhu


rovna
 
P(zamítneme H0 |H0 platí) = P θ0 ∈
/ (L, U )|θ = θ0 = P θ ∈
/ (L, U )

= 1 − P θ ∈ (L, U ) = 1 − (1 − α) = α,

protože (L, U ) je konfidenční interval pro θ o spolehlivosti 1 − α. Hladina významnosti našeho

testu je tedy skutečně α. Rozhodovací pravidlo (test) lze volit mnoha způsoby. Dá se ale

ukázat (viz literatura), že pro širokou třídu rozdělení dostaneme testováním pomocí (1 −
α)% konfidenčních intervalů nejnižší pravděpodobnost chyby druhého druhu při dané hladině
významnosti α. Získáváme tak nejsilnější test proti příslušné alternativě.

Parametrické testy a intervaly spolehlivosti


Nyní chceme testovat parametrickou hypotézu proti jednostranné alternativě :

H0 : θ = θ0 proti HA : θ > θ0 .

K testování použijeme typ intervalu odpovídající alternativní hypotéze, tj. horní 100(1 −
α)% interval spolehlivosti (L, +∞) pro θ. Platí

P θ ∈ (L, +∞) = P(L < θ) = 1 − α.

Pokud bude θ0 mimo tento interval, platí s velkou pravděpodobností HA . Test volíme násle-
dovně:

• Zamítneme hypotézu H0 , jestliže θ0 ∈


/ (L, +∞), tj. θ0 < L.

• Nezamítneme H0 , jestliže θ0 ∈ (L, +∞), tj. θ0 ≥ L.

Poznámky:

• Hladina významnosti je opět α.

• Analogicky postupujeme v případě opačné alternativy HA : θ < θ0 .

• Někdy se uvádí nulová hypotéza ve složeném tvaru jako:

H0 : θ ≤ θ0 proti HA : θ > θ0 .

Dá se ukázat, že se postup testování založený na intervalech spolehlivosti dá použít


stejným způsobem a pro obě formulace tak získáme nejsilnější test.

136
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 9.3 Testy o parametrech normálního rozdělení

Parametrické testy – ilustrace


Zamítneme H0 : θ = θ0 ve prospěch oboustranné alternativy HA : θ 6= θ0 , pokud testovaná
hodnota θ0 neleží v oboustranném konfidenčním intervalu.

L U

Zamítneme H0 : θ = θ0 ve prospěch jednostranné alternativy HA : θ > θ0 , pokud testovaná


hodnota θ0 neleží v horním jednostranném konfidenčním intervalu.

Zamítneme H0 : θ = θ0 ve prospěch jednostranné alternativy HA : θ < θ0 , pokud testovaná


hodnota θ0 neleží v dolním jednostranném konfidenčním intervalu.

Parametrické testy – průběh testu


Průběh testu:
• Zvolíme hladinu významnosti α.
• Napozorujeme realizace náhodného výběru.
• Zkonstruujeme konfidenční interval o spolehlivosti 1 − α, odpovídající alternativní hy-
potéze HA .
• Zamítneme H0 , pokud testovaná hodnota θ0 neleží v tomto intervalu spolehlivosti.

9.3 Testy o parametrech normálního rozdělení


Testy o parametrech normálního rozdělení
Nechť X1 , . . . , Xn je náhodný výběr z N(µ, σ 2 ).
Test H0 : µ = µ0 proti alternativě HA : µ 6= µ0 na hladině významnosti α:
• Při známém rozptylu σ 2 hypotézu H0 zamítneme, pokud µ0 neleží v intervalu
σ σ
 
X̄n − zα/2 √ , X̄n + zα/2 √ .
n n

• Při neznámém rozptylu σ 2 hypotézu H0 zamítneme, pokud µ0 neleží v intervalu


sn sn
 
X̄n − tα/2,n−1 √ , X̄n + tα/2,n−1 √ .
n n

Test H0 : σ 2 = σ02 proti alternativě HA : σ 2 6= σ02 na hladině významnosti α:


• Hypotézu H0 zamítneme, pokud σ02 neleží v intervalu
!
(n − 1)s2n (n − 1)s2n
, .
χ2α/2,n−1 χ21−α/2,n−1


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 137
9 TESTOVÁNÍ HYPOTÉZ BI-PST, ZS 2022/23, Přednáška 1-12

Testy o parametrech normálního rozdělení


Nechť X1 , . . . , Xn je náhodný výběr z N(µ, σ 2 ).
Test H0 : µ = µ0 proti alternativě HA : µ > µ0 na hladině významnosti α:
• Při známém rozptylu σ 2 hypotézu H0 zamítneme, pokud µ0 neleží v intervalu
σ
 
X̄n − zα √ , +∞ .
n

• Při neznámém rozptylu σ 2 hypotézu H0 zamítneme, pokud µ0 neleží v intervalu


sn
 
X̄n − tα,n−1 √ , +∞ .
n

Test H0 : σ 2 = σ02 proti alternativě HA : σ 2 > σ02 na hladině významnosti α:


• Hypotézu H0 zamítneme, pokud σ02 neleží v intervalu
!
(n − 1)s2n
, +∞ .
χ2α,n−1

Testy o parametrech normálního rozdělení – příklad


Příklad 9.1 (– váha kaprů). Na základě dat o vylovených kaprech z minula chceme na hladině
významnosti 5% otestovat, jestli je střední váha kaprů 4.7 kg, nebo jestli je významně nižší. Váhy
kaprů považujeme za nezávislé s normálním rozdělením N(µ, σ 2 ). Zvážením deseti kaprů jsme spočítali
výběrový průměr a výběrový rozptyl jako
X̄n = 4.565 kg a s2n = 0.0342 kg2 .
Chceme testovat H0 : µ = 4.7 proti HA : µ < 4.7
• Testujeme proti jednostranné alternativě typu “menší než” na hladině α = 5%, takže potřebu-
jeme dolní 95% interval spolehlivosti.
• Testujeme hypotézu o střední hodnotě s neznámým rozptylem, tedy použijeme interval založený
na Studentově t-rozdělení.
Příslušný interval spolehlivosti pak je:

   √ 
sn 0.0342
(L, U ) = −∞ , X̄n + tα,n−1 √ = −∞ , 4.565 + 1.833 √ = (−∞, 4.672).
n 10
Testovaná hodnota µ0 = 4.7 v intervalu neleží, tedy na hladině významnosti 5% nulovou hypotézu
zamítneme ve prospěch alternativy, že je skutečná střední váha kaprů významně nižší než 4.7 kg.

9.4 Testy hypotéz založené na CLV


Testování hypotéz založené na CLV
Pokud má náhodný výběr jiné než normální rozdělení, můžeme postupovat přibližně.
Z centrální limitní věty víme, že výběrový průměr X̄n má v limitě normální rozdělení.
Přibližné konfidenční intervaly pro střední hodnotu tak lze sestavit stejně, jako pro výběr
z normálního rozdělení.
Testy založené na konfidenčních intervalech pak mají asymptotickou hladinu významnosti
α.

138
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 9.5 Kritické obory a testové statistiky

Testování hypotéz založené na CLV

Příklad 9.2 (– test vyváženosti mince). Z dvaceti hodů mincí nám padla jen čtyřikrát hlava.
Je mince nevyvážená? Testujme na hladině významnosti 5%. Hody mincí můžeme reprezentovat jako
Bernoulliho náhodné veličiny:
(
1 v i-tém hodu hlava
Xi =
0 v i-tém hodu orel.

Víme, že pak
µ = E Xi = p, σ 2 = var Xi = p(1 − p).

Pravděpodobnost p, že padne hlava je střední hodnotou rozdělení. Odhadneme ji výběrovým průmě-


rem:

n
1X 4 1
p̂n = Xi = = .
n i=1 20 5

Rozptyl pak můžeme odhadnout jako

n
1 X n 20 1 4 .
s2n = (Xi − X̄n )2 = p̂n (1 − p̂n ) = · · = 0.168.
n − 1 i=1 n−1 19 5 5

Za cenu určité ztráty přesnosti lze použít i odhad σ̂n2 = p̂n (1 − p̂n ) jako minule.

Testování hypotéz založené na CLV

Příklad 9.2 (– test vyváženosti mince, pokračování). Testujeme H0 : p = 0.5 proti HA : p 6=


0.5 na hladině významnosti 5%. Přibližný 95% oboustranný interval spolehlivosti sestavíme
jako

sn sn
 
(L, U ) = X̄n − tα/2,n−1 √ , X̄n + tα/2,n−1 √
n n
√ √ !
1 0.168 1 0.168
= − 2.093 √ , + 2.093 √
5 20 5 20
= (0.008, 0.392) .

Testovaná hodnota p0 = 0.5 v intervalu neleží, takže můžeme hypotézu vyváženosti na hladině
významnosti 5 % zamítnout ve prospěch alternativy, že je pravděpodobnost, že padne hlava,
významně odlišná od 0.5.

9.5 Kritické obory a testové statistiky


Následující část týkající se testových statistik není potřeba znát ke zkoušce, jsou ovšem po-
třeba pro vyřešení domácího úkolu. Tento přístup bude využíván v navazujícím předmětu
MI-SPI a případně i v dalších pokročilých kurzech. Hodí se též pro řešení konkrétních pro-
blémů z praxe, kdy je potřeba statistického vyhodnocení dat.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 139
9 TESTOVÁNÍ HYPOTÉZ BI-PST, ZS 2022/23, Přednáška 1-12

Testování hypotéz pomocí testových statistik


Pro testování můžeme využít alternativní přístup, založený na porovnávání testované hod-
noty s jejím bodovým odhadem. Například když pozorujeme náhodný výběr z normálního
rozdělení N(µ, σ 2 ), mohli bychom zamítnout hypotézu H0 : µ = µ0 , pokud by se výběrový
průměr X̄n a testovaná hodnota µ0 významně lišily. Jaký rozdíl je ale dostatečný pro zamít-
nutí? Víme, že když platí H0 a rozptyl σ 2 je známý, platí
X̄n − µ0 √
n ∼ N(0, 1).
σ
Tedy s vysokou pravděpodobností 1 − α by měla standardizovaná vzdálenost výběrového
průměru a testované hodnoty být uvnitř mezí daných kritickými hodnotami N(0, 1). Tedy
bychom mohli zamítnout H0 : µ = µ0 ve prospěch HA : µ 6= µ0 , pokud

X̄ − µ √
n 0
n > zα/2 .


σ

Testy o parametrech normálního rozdělení


Nechť X1 , . . . , Xn je náhodný výběr z N(µ, σ 2 ).
Testujme H0 : µ = µ0 proti alternativě HA : µ 6= µ0 na hladině významnosti α:
Je-li rozptyl σ 2 známý, můžeme zkonstruovat testovou statistiku T = T (X1 , . . . , Xn ) jako
X̄n − µ0 √
T = n.
σ
Hypotézu H0 zamítneme ve prospěch HA , pokud testová statistika leží v kritickém oboru:
Wα = {T : |T | > zα/2 }.
Hypotézu H0 tedy zamítáme, pokud T ∈ Wα , tedy pokud |T | je vysoká a X̄n je daleko od
µ0 . Alternativně, H0 nezamítáme, pokud platí:
!
X̄n − µ0 √
−zα/2 < n < zα/2 .
σ
Úpravou nerovností a osamostatněním µ0 získáme oboustranný konfidenční interval pro µ
o spolehlivosti 1 − α. Oba přístupy jsou zde tedy ekvivalentní.

Testování hypotéz pomocí testových statistik


Přístup založený na konstrukci testové statistiky T a příslušném kritickém oboru testu Wα
lze shrnout následovně:
Průběh testu:
• Zvolíme hladinu významnosti α.
• Napozorujeme realizace náhodného výběru.
• Spočteme testovou statistiku T .
• Nalezneme příslušný kritický obor Wα , založený na odlehlých částech rozdělení testové
statistiky T .
• Zamítneme H0 , pokud T ∈ Wα
X Kritický obor se dá často převést na interval spolehlivosti.

140
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 9.5 Kritické obory a testové statistiky

Testy o parametrech normálního rozdělení


Nechť X1 , . . . , Xn je náhodný výběr z N(µ, σ 2 ).
Testy o střední hodnotě na hladině významnosti α:

• Testová statisika a kritické obory při známém rozptylu σ 2 :

H0 HA testová statistika T kritický obor Wα


µ = µ0 µ 6= µ0 |T | > zα/2
X̄n − µ0 √
µ ≤ µ0 µ > µ0 T = n T > zα
µ ≥ µ0 µ < µ0 σ T < −zα

• Testová statisika a kritické obory při neznámém rozptylu σ 2 :

H0 HA testová statistika T kritický obor Wα


µ = µ0 µ 6= µ0 |T | > tα/2,n−1
X̄n − µ0 √
µ ≤ µ0 µ > µ0 T = n T > tα,n−1
µ ≥ µ0 µ < µ0 sn T < −tα,n−1

Testy o rozptylu na hladině významnosti α:

H0 HA test. statistika T kritický obor Wα


σ 2 = σ02 σ 2 6= σ02 T > χ2α/2,n−1 ∨ T < χ21−α/2,n−1
(n − 1)s2n
σ 2 ≤ σ02 σ 2 > σ02 T = T > χ2α,n−1
σ02
σ 2 ≥ σ02 σ 2 < σ02 T < χ21−α,n−1

Testování pomocí testových statistik – příklad

Příklad 9.3 (– váha kaprů). Na základě dat o vylovených kaprech z minula chceme na hladině
významnosti 5% otestovat pomocí testové statistiky, jestli je střední váha kaprů 4.7 kg, nebo jestli je
významně nižší. Prozkoumáme, zda je vzdálenost testované hodnoty µ0 = 4.7 kg a výběrového průměru
X̄n = 4.565 kg příliš vysoká, než aby mohla platit nulová hypotéza H0 : µ = 4.7 kg. Testujeme hypotézu
o střední hodnotě při neznámém rozptylu, testová statistika tak má tvar

X̄n − µ0 √ 4.565 − 4.7 √


T = n= √ 10 = −2.308.
sn 0.0342

Testujeme proti jednostranné alternativě typu “menší než” na hladině α = 5%, takže zkoumáme,
zda je testová statisika menší než kritická hodnota −tα,n−1 . Zde

T = −2.308 < −1.833 = −t0.05,9 ,

takže na hladině významnosti 5% nulovou hypotézu zamítneme ve prospěch alternativy, že je


skutečná střední váha kaprů významně nižší než 4.7 kg. Na hladině α = 1% bychom ale už nulovou
hypotézu nezamítli, protože

T = −2.308 > −2.821 = −t0.01,9 .


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 141
9 TESTOVÁNÍ HYPOTÉZ BI-PST, ZS 2022/23, Přednáška 1-12

Testování hypotéz – p-hodnota


V literatuře a mnoha statistických programech se vyskytuje pojem p-hodnota.
Nulovou hypotézu nelze na základě naměřených dat zamítnout na každé hladině význam-
nosti α. Minimální hladina významnosti, na které lze hypotézu H0 při dané realizaci náhod-
ného výběru zamítnout, se nazývá p-hodnota. p-hodnota tak záleží na realizaci náhodného
výběru.
Význam p-hodnoty:

• Mnoho statistických programů dává jako výstup testování hypotéz pouze p-hodnotu.

• Je-li p-hodnota menší než naše požadovaná hladina významnosti α, zamítáme H0 .

• Velikost p-hodnoty nám říká, jak silné je zamítnutí H0 , nebo jak slabé je nezamítnutí.

• Čím je p-hodnota menší, tím významnější je zamítnutí H0 .

9.6 Dvouvýběrové a párové problémy


Párový t-test
Pozorujme náhodný výběr párů (X1 , Y1 ), ..., (Xn , Yn ). Veličiny uvnitř párů mohou být
závislé, ale páry navzájem považujeme za nezávislé. Chceme porovnat veličiny tvořící páry.
Tato situace může nastat, když například sledujeme hodnotu určitého ukazatele u stejných
pacientů před a po klinické proceduře. Chceme určit, zda ukazatel zůstal stejný, nebo jestli se
vlivem procedury významně zvýšil či snížil. Předpokládáme, že jsou všechny veličiny normálně
rozdělené s Xi ∼ N(µ1 , σ12 ) a Yi ∼ N(µ2 , σ22 ). Chceme testovat hypotézu H0 : µ1 = µ2 .
Vezmeme-li Zi = Yi − Xi , výsledné veličiny budou mít také normální rozdělení, tentokrát se
střední hodnotou µdiff = µ2 − µ1 . Test shody středních hodnot párových dat tak můžeme
ekvivalentně převést na jednovýběrový test hypotézy o střední hodnotě rozdílů Zi , tedy H0 :
µdiff = 0.

Párový t-test – příklad

Příklad 9.4 (– porovnání výšky otců a synů). Chceme prověřit, zde výška populace roste z ge-
nerace na generaci. Pozorovali jsme pět dvojic otců a jejich synů, nyní dospělých. Naměřili jsme jejich
výšky v centimetrech jako:

výška otce Xi 172 176 180 184 186


výška syna Yi 178 188 177 192 193
rozdíl Zi = Yi − Xi 6 12 -3 8 7

Testujeme, jestli jsou střední hodnoty výšky otců a synů stejné, proti alternativě, že synové jsou
významně vyšší. Volíme α = 5%. Horní jednostranný 95% konfidenční interval pro střední hodnotu
µdiff rozdílů Zi je
   
sZ . 5.52 .
Z̄n − tα,n−1 √ , +∞ = 6 − 2.132 · √ , +∞ = (0.735, +∞).
n 5

Testovaná hodnota µdiff = 0 v intervalu neleží, můžeme tedy shodu zamítnout ve prospěch alternativy,
že synové jsou významně vyšší, než jejich otcové.

142
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 9.6 Dvouvýběrové a párové problémy

Párový t-test – příklad


Příklad 9.4 (– porovnání výšky otců a synů, pokračování). Testovou statistiku, p-hodnotu
a konfidenční interval můžeme v R získat voláním funkce t.test s příslušnými parametry:
> t.test(height_son,height_father,paired=T,alternative="greater")

Paired t-test

data: height_son and height_father


t = 2.4293, df = 4, p-value = 0.03602
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
0.7347268 Inf
sample estimates:
mean of the differences
6
p-hodnota je nižší než α = 5%, takže shodu výšek můžeme na hladině významnosti 5% zamítnout
ve prospěch alternativy. Stejný výsledek nám dá porovnání testové statistiky T = 2.4293 s kritickou
hodnotou t0.05,4 = 2.132.

Dvouvýběrový t-test
Chceme porovnat náhodný výběr X1 , ..., Xn1 se druhým nezávislým výběrem Y1 , ..., Yn2 .
Taková situace může nastat, když například sledujeme hodnotu určitého ukazatele u dvou ne-
závislých skupin pacientů, kde každá skupina podstupuje jiný druh léčby. Chceme zjistit, jestli
je hodnota ukazatele stejná pro obě skupiny, nebo jestli se významně liší. Předpokládejme,
že jsou všechny veličiny nezávislé, normálně rozdělené s Xi ∼ N(µ1 , σ12 ) a Yi ∼ N(µ2 , σ22 ).
Chceme testovat H0 : µ1 = µ2 . Dá se ukázat (viz literatura), že za platnosti H0 má statistika

X̄n1 − Ȳn2
T =
s•
Studentovo t-rozdělení. Výběrová směrodatná odchylka s• a počet stupňů volnosti závisí na
tom, zda mají oba výběry shodný rozptyl (σ12 = σ22 ), nebo ne. Test pak můžeme provést
porovnáním testové statistiky T s příslušnými kritickými hodnotami t-rozdělení.

Dvouvýběrové testy – normální rozdělení


Nechť X1 , . . . , Xn1 je náhodný výběr z N(µ1 , σ12 ) a Y1 , . . . , Yn2 je náhodný výběr z N(µ2 , σ22 ).
Testy o shodě středních hodnot pro σ12 = σ22 :
H0 HA testová statistika T kritický obor Wα
µ1 = µ2 µ1 6= µ2 |T | > tα/2,n1 +n2 −2
X̄n1 − Ȳn2 n1 n2
r
µ1 ≤ µ2 µ1 > µ2 T = T > tα,n1 +n2 −2
µ1 ≥ µ2 µ1 < µ2 s12 n1 + n2 T < −tα,n1 +n2 −2
s
(n1 − 1)s2X + (n2 − 1)s2Y
• Kde s12 =
n1 + n2 − 2

• s2X a s2Y jsou výběrové rozptyly X1 , ..., Xn1 a Y1 , ..., Yn2 ,

• tα,n1 +n2 −2 je kritická hodnota Studentova t-rozdělení s n1 + n2 − 2 stupni volnosti.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 143
9 TESTOVÁNÍ HYPOTÉZ BI-PST, ZS 2022/23, Přednáška 1-12

Dvouvýběrové testy – normální rozdělení


Nechť X1 , . . . , Xn1 je náhodný výběr z N(µ1 , σ12 ) a Y1 , . . . , Yn2 je náhodný výběr z N(µ2 , σ22 ).
Testy o shodě středních hodnot pro σ12 6= σ22 :

H0 HA testová statistika T kritický obor Wα


µ1 = µ2 µ1 6= µ2 |T | > tα/2,nd
X̄n1 − Ȳn2
µ1 ≤ µ2 µ1 > µ2 T = T > tα,nd
µ1 ≥ µ2 µ1 < µ2 sd T < −tα,nd
s
s2X s2
• Kde sd = + Y,
n1 n2

s4d
• nd =  2  2
1 s2X 1 s2Y
n1 −1 n1 + n2 −1 n2

Dvouvýběrový t-test – příklad


Příklad 9.5 (– porovnání výšky mezi zeměmi). Chceme zjistit, jestli je střední výška mužů
v České republice a v Norsku stejná, nebo zda se významně liší. Změřili jsme pět Čechů a šest Norů
a získali jsme jejich výšky v centimetrech:

výška CZE Xi 169 178 179 186 191


výška NOR Yi 175 182 183 189 191 192

Testujeme, zda jsou střední hodnoty výšek mezi výběry shodné, proti alternativě, že se nerovnají, na
hladině významnosti α = 5%. Uvažujme shodný rozptyl výběrů. Testovou statistiku můžeme sestrojit
jako r
X̄n1 − Ȳn2 n1 n2
T = = −1.0545.
s12 n1 + n2
α/2 kritická hodnota t-rozdělení s n1 +n2 −2 stupni volnosti je tα/2,n1 +n2 −2 = t0.025,9 = 2.262. Protože

1.0545 = |T | < tα/2,n1 +n2 −2 = 2.262,


hypotézu shody nezamítáme. Na základě našich dat nelze prokázat významný rozdíl ve střední výšce
mužů mezi oběma zeměmi.

Dvouvýběrový t-test – příklad


Příklad 9.5 (– porovnání výšky mezi zeměmi, pokračování). Testovou statistiku, p-hodnotu
a konfidenční interval můžeme v R získat voláním funkce t.test s příslušnými parametry:
> t.test(height_cze,height_nor,paired=F,
alternative="two.sided",var.equal=T)

Two Sample t-test

data: height_cze and height_nor


t = -1.0545, df = 9, p-value = 0.3191
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-14.887283 5.420617

144
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 9.6 Dvouvýběrové a párové problémy

sample estimates:
mean of x mean of y
180.6000 185.3333
p-hodnota je vyšší než α = 5%, takže shodu výšek na hladině významnosti 5% nelze zamítnout.

Dvouvýběrové testy – normální rozdělení


Nechť X1 , . . . , Xn1 je náhodný výběr z N(µ1 , σ12 ) a Y1 , . . . , Yn2 je náhodný výběr z N(µ2 , σ22 ).
Testy o shodě rozptylů – F-test:
H0 HA testová statistika kritický obor Wα
σ12 = σ22 σ12 6= σ22 T < F1−α/2,n1 −1,n2 −1 ∨ T > Fα/2,n1 −1,n2 −1
s2X
σ12 ≤ σ22 σ12 > σ22 T = T > Fα,n1 −1,n2 −1
s2Y
σ12 ≥ σ22 σ12 < σ22 T < F1−α,n1 −1,n2 −1

• Kde s2X je výběrový rozptyl prvního náhodného výběru a s2Y druhého výběru.

• Fα,n1 −1,n2 −1 je kritická hodnota Fisherova-Snedecorova F-rozdělení s n1 − 1 a n2 − 1


stupni volnosti.

• Důležitá poznámka: F-test je obzvlášť citlivý na splnění předpokladu normality X a Y .


Pokud si nejsme jisti, že data pochází z normálního rozdělení, je potřeba použít jiný
test nebo použít variantu t-testu pro různé rozptyly.

Test shody rozptylů – příklad


Příklad 9.6 (– porovnání výšky mezi zeměmi – shoda rozptylů). Abychom věděli, jakou variantu
dvouvýběrového t-testu máme použít, chceme otestovat, zda mají výšky v obou zemích shodný rozptyl.
To provedeme voláním funkce var.test:
> var.test(height_cze,height_nor)

F test to compare two variances

data: height_cze and height_nor


F = 1.6477, num df = 4, denom df = 5, p-value = 0.5919
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.2230213 15.4294289
sample estimates:
ratio of variances
1.647656
p-hodnota je vyšší než α = 5%, takže shodu rozptylů výšek na hladině významnosti 5% nezamítáme.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 145
10 LINEÁRNÍ REGRESE BI-PST, ZS 2022/23, Přednáška 1-12

10 Lineární regrese
10.1 Kovariance a korelace
Kovariance a korelace
Chceme prozkoumat souvislost mezi dvěma náhodnými veličinami. Někdy můžeme před-
pokládat, že na sobě náhodné veličiny závisí, někdy zase čekáme, že se navzájem neovlivňují.

Příklady 10.1.

• Výška otce a výška syna.

• Tělesná výška a váha.

• Průměrná teplota v regionu a zeměpisná šířka.

• Příjem a délka studia.

• Počet čápů a počet novorozenců ve městě (viz literatura).

Nejprve budeme souvislost veličin modelovat pomocí korelace.

Kovariance a korelace
Kovariance dvou náhodných veličin X a Y je definována následovně:

cov(X, Y ) = E[(X − E X)(Y − E Y )]

a dá se vyjádřit jako
cov(X, Y ) = E[XY ] − E X E Y.
Korelační koeficient je definován jako

cov(X, Y )
ρX,Y = √ √
var X var Y

a udává míru vzájemné lineární závislosti mezi X a Y .

Kovariance a korelace

Věta 10.2. Pro korelační koeficient ρX,Y platí:

i) ρX,Y ∈ [−1, 1].

ii) Když jsou X a Y nezávislé, pak ρX,Y = 0 (veličiny jsou nekorelované).

iii) Když Y = a + bX pro b > 0, pak ρX,Y = 1.

iv) Když Y = a + bX pro b < 0, pak ρX,Y = −1.

Důkaz. Viz přednáška 7.

146
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 10.1 Kovariance a korelace

Korelace – výběr 1000 hodnot

10 Y
ρ=0

X
−4 −3 −2 −1 1 2 3 4

−5

−10

Korelace – výběr 1000 hodnot

10 Y
ρ = 0.7

X
−4 −3 −2 −1 1 2 3 4

−5

−10

Kovariance a korelace – odhad


Na základě náhodného výběru dvojic (X1 , Y1 ), ..., (Xn , Yn ) lze kovarianci odhadnout po-
mocí výběrové kovariance:
n
1 X
sX,Y = (Xi − X̄n )(Yi − Ȳn ).
n − 1 i=1

Korelační koeficient pak můžeme odhadnout pomocí výběrového korelačního koeficientu


jako:
sX,Y
rX,Y = ,
sX sY
q q
kde sX = s2X a sY = s2Y jsou výběrové směrodatné odchylky X a Y .


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 147
10 LINEÁRNÍ REGRESE BI-PST, ZS 2022/23, Přednáška 1-12

Výběrová kovariance a korelace – vlastnosti


Výběrovou kovarianci můžeme přepsat jako
n
1 X
sX,Y = (Xi − X̄n )(Yi − Ȳn )
n − 1 i=1
n
!
1 X
= Xi Yi − nX̄n Ȳn
n − 1 i=1
n
!
n 1X
= Xi Yi − X̄n Ȳn .
n−1 n i=1

Ze zákona velkých čísel pak plyne, že se jedná o konzistentní odhad skutečné kovariance. Dá se
ukázat, že je to také nestranný odhad. Protože jsou výběrové rozptyly konzistentními odhady
skutečných rozptylů, je i výběrový korelační koeficient konzistentním odhadem korelačního
koeficientu.

Odhad korelace – příklad


Příklad 10.3 (– souvislost výšky otců a synů). Chceme odhadnout míru korelace mezi výškami
otců a jejich synů. Změřili jsme výšku pěti dvojic otců a jejich dospělých synů a získali jsme:

výška otce [cm] Xi 172 176 180 184 186


výška syna [cm] Yi 178 183 180 188 190

Z dat jsme spočítali tyto charakteristiky:


n
X n
X
Xi = 898, Yi = 919,
i=1 i=1
n
X n
X
Xi2 = 161412, Yi2 = 169017,
i=1 i=1
n
X
Xi Yi = 165156.
i=1

Odhad korelace – příklad


Příklad 10.3 (– souvislost výšky otců a synů, pokračování). Z naměřených charakteristik spo-
čítáme výběrové průměry, rozptyly a kovarianci:
n n
1X 898 1X 919
X̄n = Xi = = 179.6, Ȳn = Yi = = 183.8,
n i=1 5 n i=1 5

n
!
1 X 1
s2X Xi2 nX̄n2 161412 − 5 · 179.62 = 32.8,

= − =
n−1 i=1
4
n
!
1 X 1
s2Y Yi2 nȲn2 169017 − 5 · 183.82 = 26.2,

= − =
n−1 i=1
4
n
!
1 X 1
sX,Y = Xi Yi − nX̄n Ȳn = (165156 − 5 · 179.6 · 183.8) = 25.9.
n−1 i=1
4

148
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 10.1 Kovariance a korelace

Výběrový korelační koeficient je pak

sX,Y 25.9 .
rX,Y = p 2 2 = √ = 0.883.
sX sY 32.8 · 26.2

Můžeme říct, že mezi výškami otců a jejich synů je silná pozitivní korelace. Výběrový korelační koefi-
cient můžeme v R spočítat pomocí funkce cor(height_father,height_son).

Odhad korelace – příklad


190

+
188

+
186
height_son

184

+
182
180

+
178

172 174 176 178 180 182 184 186

height_father

Testování nulovosti korelace


Chceme být schopni určit, zda je korelace mezi veličinami statisticky významná. K tomu
nám pomůže následující tvrzení:

Věta 10.4. Pozorujeme-li nezávislé a normálně rozdělené dvojice, potom když ρX,Y = 0,
statistika
rX,Y √
T =q n−2
2
1 − rX,Y

má Studentovo t-rozdělení s n − 2 stupni volnosti.

Důkaz. Viz literatura.

Můžeme tedy testovat hypotézu H0 : ρX,Y = 0 a zamítnout ji ve prospěch HA : ρX,Y 6= 0


na hladině významnosti α, pokud |T | > tα/2,n−2 , tedy pokud je normovaný výběrový korelační
koeficient významně daleko od nuly.

Testování nulovosti korelace – příklad


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 149
10 LINEÁRNÍ REGRESE BI-PST, ZS 2022/23, Přednáška 1-12

Příklad 10.4 (– souvislost výšky otců a synů, pokračování). Existuje statisticky významná
souvislost mezi výškami otců a jejich synů? Testujme na hladině významnosti α = 5%. Zís-
káme
rX,Y √ . 0.883 √ .
T =q n−2= √ 3 = 3.267.
2
1 − rX,Y 1 − 0.8832

Příslušná kritická hodnota je tα/2,n−2 = t0.025,3 = 3.182, tedy

3.267 = |T | > t0.025,3 = 3.182.

Na hladině významnosti 5% zamítáme hypotézu, že mezi veličinami je nulová korelace. Mů-


žeme říct, že existuje statisticky významná pozitivní korelace mezi výškami otců a jejich synů.

Testování nulovosti korelace – příklad

Příklad 10.4 (– souvislost výšky otců a synů, pokračování). Nulovost korelace lze v R testovat
pomocí funkce cor.test:
> cor.test(height_father,height_son)

Pearson’s product-moment correlation

data: height_father and height_son


t = 3.267, df = 3, p-value = 0.04688
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.00564631 0.99229297
sample estimates:
cor
0.8835115

p-hodnota je menší než α = 5%, takže hypotézu nekorelovanosti můžeme zamítnout na hladině vý-
znamnosti 5%. Alternativně bychom se mohli rozhodnout pomocí t-statistiky T = 3.267.

10.2 Regresní model


Zajímáme se o závislost náhodné veličiny Y na vysvětlující proměnné x, kterou považujeme
za pevnou.

Příklady 10.5.

• Počet aut na mostě v různou denní dobu.

• Rychlost větru v závislosti na nadmořské výšce.

• Výška člověka v závislosti na věku.

• Váha člověka v závislosti na jeho výšce.

150
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 10.2 Regresní model

Mějme náhodnou veličinu Y = Y (x) závisející lineárně na vysvětlující proměnné x.


Provedeme n nezávislých pozorování Yi = Y (xi ) v bodech x1 , . . . , xn a dostaneme dvojice
(x1 , Y1 ), . . . , (xn , Yn ).

Na základě těchto dvojic chceme analyzovat lineární závislost Y = Y (x).


Pro popis lineární závislosti použijeme lineární regresní model

Yi = α + βxi + εi i = 1, . . . , n.

Předpokládáme, že:

• xi jsou dané hodnoty – ne všechny stejné,

• εi jsou i.i.d. náhodné veličiny s nulovou střední hodnotou (experimentální chyby), často
N(0, σ 2 ),

• α a β jsou neznámé parametry.

Z toho plyne:
E Yi = α + βxi , var Yi = var εi = σ 2 .
Chceme najít odhady a a b parametrů α a β takové, že hodnoty

Ŷi = a + b · xi

budou nejlepšími aproximacemi Yi .

10.2.1 Metoda nejmenších čtverců pro odhady parametrů regresní přímky


Parametry α a β odhadujeme metodou nejmenších čtverců.
Odhady s dobrými vlastnostmi lze vzít jako takové a a b, které minimalizují reziduální
součet čtverců Se
n
X n
X n
X
Se = e2i = 2
(Yi − Ŷi ) = (Yi − (a + bxi ))2 .
i=1 i=1 i=1

e5 e6
Rezidua ei
e4
e3
e1 e2

Odhadnutá regresní přímka a + b · x má tedy nejmenší součet čtverců vertikálních vzdáleností


od naměřených hodnot.

Odhad parametrů regresní přímky

Věta 10.6. Bodové odhady regresních parametrů získané metodou nejmenších čtverců jsou
Pn
i=1 (xi − x̄n )(Yi − Ȳn )
b= Pn 2
a a = Ȳn − b x̄n ,
i=1 (xi − x̄n )


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 151
10 LINEÁRNÍ REGRESE BI-PST, ZS 2022/23, Přednáška 1-12

kde x̄n = n1 ni=1 xi a Ȳn = n1 ni=1 Yi .


P P

Nestranným odhadem rozptylu var Yi = σ 2 je reziduální rozptyl


n
1 X 1
s2 = (Yi − a − b · xi )2 = Se .
n − 2 i=1 n−2

Důkaz. Uvažujme naměřená data y1 , ..., yn : Derivací Se podle a a b najdeme minimum:


∂Se ∂Se
=0 =0
∂a ∂b
n
X
−2 (yi − a − b · xi ) = 0 → a = ȳn − b x̄n
i=1
n
X
−2 (yi − a − b · xi ) xi = 0
i=1

n
X n
X n
X n
X
0= xi yi − ȳn xi − b x2i + b x̄n xi
i=1 i=1 i=1 i=1
Pn Pn
i=1 xi yi − nȳn x̄n i=1 (yi − ȳn )(xi − x̄n )
b= n 2 − nx̄2 = Pn 2
i=1 (xi − x̄n )
P
x
i=1 i n

X Pomocí matice druhých derivací lze ukázat, že se jedná skutečně o minimum.


Důkaz nestrannosti reziduálního rozptylu jako odhadu σ 2 viz literatura.

X Dá se ukázat, že výše zmíněné odhady jsou nejlepší nestranné odhady regresních para-
metrů.
Kdybychom považovali vysvětlující proměnné za náhodné veličiny X1 , ..., Xn , odhad re-
gresního parametru β lze zapsat pomocí odhadů rozptylů a kovariance:
Pn
i=1 (Xi − X̄n )(Yi − Ȳn ) sX,Y sY
b= Pn 2
= 2 = rX,Y ,
i=1 (Xi − X̄n ) sX sX

kde sX,Y je výběrová kovariance a rX,Y výběrový korelační koeficient


n
1 X sX,Y
sX,Y = (Xi − X̄n )(Yi − Ȳn ), rX,Y =
n − 1 i=1 sX sY

a sX a sY jsou odmocniny z výběrových rozptylů


n n
1 X 1 X
s2X = (Xi − X̄n )2 , s2Y = (Yi − Ȳn )2 .
n − 1 i=1 n − 1 i=1

Příklad 10.7 (– závislost výšky synů na výšce jejich otců). Modelujme lineární regresní závislost
výšky synů na výšce jejich otců na základě dat z předchozího příkladu. Naměřili jsme:

výška otce [cm] xi 172 176 180 184 186


výška syna [cm] Yi 178 183 180 188 190

152
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 10.2 Regresní model

Výběrový rozptyl a výběrovou kovarianci jsme spočítali následovně:


n n
1 X 1 X
s2X = (Xi − X̄n )2 = 32.8, sX,Y = (Xi − X̄n )(Yi − Ȳn ) = 25.9.
n−1 n−1
i=1 i=1

Parametry regresní přímky tak můžeme odhadnout jako

sX,Y 25.9 .
b= = = 0.79
s2X 32.8
. 25.9 .
a = Ȳn − b · X̄n = 183.8 − · 179.6 = 41.98
32.8
Za každý centimetr rozdílu ve výšce otců očekáváme průměrný rozdíl 0.79 centimetru ve výšce
jejich synů. Odhady parametrů můžeme v R získat pomocí lm(height_son∼height_father).
190

+
188

+
186
height_son

184

+
182
180

+
178

172 174 176 178 180 182 184 186

height_father

10.2.2 Přesnost regresního modelu


K popisu přesnosti lineárního modelu se používá koeficient determinace R2 :

Se
R2 = 1 − ,
ST

kde Se je reziduální součet čtverců a ST = (n − 1)s2Y :


n
X
ST = (Yi − Ȳn )2 .
i=1

Čím je koeficient determinace R2 blíže jedné, tím přesněji lineární model odpovídá datům.
R2 můžeme interpretovat jako podíl variability v datech, která je vysvětlená lineárním
modelem.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 153
10 LINEÁRNÍ REGRESE BI-PST, ZS 2022/23, Přednáška 1-12

10.2.3 Testování lineární závislosti


Následující vzorce pro testování lineární závislosti a intervaly predikce není třeba znát k úspěš-
nému složení zkoušky. Pro řešení problémů z praxe je dobré vědět, že se lineární závislost
a spolehlivost predikce dají testovat.
Často chceme testovat hypotézu

H0 : β = 0 proti HA : β 6= 0.

To ekvivalentně znamená testovat

H0 : Yi = α + εi proti HA : Yi = α + βxi + εi .

Testování založíme na intervalech spolehlivosti. Dá se ukázat, že pokud mají regresní odchylky


εi normální rozdělení, oboustranný konfidenční interval pro β o spolehlivosti (1−α)% lze najít
jako:  √ √ 
tα/2,n−2 s2 tα/2,n−2 s2
b − q , b + qP ,
P 2 2 2 2
xi − nx̄n xi − nx̄n

kde s2 je reziduální rozptyl a tα/2,n−2 je kritická hodnota Studentova t-rozdělení s n − 2 stupni


volnosti.
Sestavíme interval a zjistíme, zda v něm leží 0. Ekvivalentně můžeme rozhodnout podle
p-hodnoty testu.
Příklad 10.8 (– závislost výšky synů na výšce otců, pokračování). Testujeme, zda výška synů
závisí významně na výšce jejich otců. V R můžeme zobrazit vlastnosti odhadnutého lineárního modelu
pomocí funkce summary(lm()):
> summary(lm(height_son~height_father))

Call:
lm(formula = height_son ~ height_father)

Residuals:
1 2 3 4 5
0.2012 2.0427 -4.1159 0.7256 1.1463

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 41.9817 43.4272 0.967 0.4050
height_father 0.7896 0.2417 3.267 0.0469 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.769 on 3 degrees of freedom


Multiple R-squared: 0.7806, Adjusted R-squared: 0.7075
F-statistic: 10.67 on 1 and 3 DF, p-value: 0.04688

p-hodnota příslušná testu hypotézy H0 : β = 0 je 0.0469, tedy je menší než α = 5%. Na hladině
významnosti 5% tak můžeme zamítnout hypotézu, že výšky synů na výšce jejich otců nezávisí.

154
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák
BI-PST, ZS 2022/23, Přednáška 1-12 10.2 Regresní model

10.2.4 Intervaly predikce


Pro danou hodnotu x můžeme pomocí regresního modelu najít nejpravděpodobnější přísluš-
nou hodnotu Y , které říkáme predikce:

Ŷ = a + b · x.

Můžeme také najít (1 − α)100% interval spolehlivosti predikce, tedy interval, kde se bude
predikovaná hodnota nacházet se zadanou vysokou pravděpodobností:
s
√ 1 (x − x̄n )2
a + b · x ± tα/2,n−2 s2 + Pn 2
n i=1 (xi − x̄n )

Zobrazíme-li regresní přímku a meze intervalu spolehlivosti predikce jako funkci x, získáme
intervaly spolehlivosti kolem regresní přímky.
Region, ve kterém leží celá regresní přímka s pravděpodobností 1 − α, nazýváme pás
spolehlivosti pro regresní přímku. Lze zkonstruovat pomocí Fisherova-Snedecorova
q F-rozdělení
nahrazením tα/2,n−2 v předchozím vztahu kritickou hodnotou 2Fα/2,2,n−2 .

Regresní predikce – příklad


Příklad 10.9 (– závislost výšky synů na výšce otců, pokračování). Chceme odhadnout střední
výšku syna, jehož otec je 175 centimetrů vysoký. Pro dané x = 175 cm chceme predikovat Ŷ :

Ŷ = a + b · x
.
= 41.98 + 0.79 · 175
.
= 180.2 cm.

95% oboustranný interval spolehlivosti pro tuto predikci pak je

(174.9, 185.5).

Příklad 10.10 (– koncentrace kyseliny mléčné). Zjišťovalo se, kolik kyseliny mléčné je ve
100 ml krve u matek (hodnoty xi ) a u jejich novorozenců (hodnoty Yi ) těsně po porodu.
xi 40 64 34 15 57 45
Yi 33 46 23 12 56 40
Předpokládáme lineární závislost mezi koncentrací u matek a koncentrací u jejich novorozenců.
Odhady regresních parametrů získáme jako:
P6
i=1 (xi − x̄n )(Yi − Ȳn )
b= P6 2
= 0.8543,
i=1 (xi − x̄n )
a = Ȳn − b x̄n = −1.3082.

Testujme hypotézu, že koncentrace u matek nijak neovlivňuje koncentraci u jejich novoro-


zenců, H0 : β = 0 proti HA : β 6= 0.
95% interval spolehlivosti pro β je

0∈
/ (0.404, 1.305)
a nulovou hypotézu zamítáme. Závislost je tedy statisticky významná.


c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák 155
10 LINEÁRNÍ REGRESE BI-PST, ZS 2022/23, Přednáška 1-12

Příklad 10.10 (– koncentrace kyseliny mléčné, pokračování). Zobrazme naměřená data,


regresní přímku a pásy spolehlivosti.

60
pás spolehlivosti pro regresnı́ přı́mku

40

20 y=a+b·x

intervaly spolehlivosti kolem regresnı́ přı́mky


0
0 10 20 30 40 50 60 70

156
c 2011–2022 Blažek, Kotecký, Vašata, Hrabáková, Novák

You might also like