Download as pdf or txt
Download as pdf or txt
You are on page 1of 14

Hoofdstuk 5

Bijzondere discrete verdelingen


en enkele van hun toepassingen
Hand-outs van de theorielessen Waarschijnlijkheidsrekening en Statistiek 2020–2021

Prof. dr. ir. Gert de Cooman, Foundations Lab, Universiteit Gent

© 2008–2021 by Gert de Cooman


Vrijgegeven onder Creative Commons Naamsvermelding-NietCommercieel-GeenAfgeleideWerken
4.0 Internationaal-licentie

In dit hoofdstuk nemen we enkele bijzondere en typerende verdelingen van discrete veranderlijken
onder de loupe. We bekijken telkens hun definiërende massafunctie, hun momentenfunctie, verwach-
tingswaarde en variantie.
Deze verdelingen zijn typisch afhankelijk van een of meer parameters, die we identificeren door ze
in de massafunctie achter de conditioneringsstreep te plaatsen.

1 De Bernoulli-verdeling
1.1 Definitie en eigenschappen
5.2
Jacob Bernoulli (1654–1705)
Bernoulli-verdeling [DG:5.2]

5.3
Definitie De Bernoulli-verdeling [DG:5.2]
Het eenvoudigste experiment dat we kunnen beschouwen, heeft maar twee mogelijke uitkomsten, zoals
bijvoorbeeld:
• succes of falen [Eng. success or failure]
• kop of munt [Eng. heads or tails]
• component defect of niet defect in bepaalde periode
• patiënt geneest of geneest niet

1
De volgende definitie is van toepassing op al deze situaties.
Definitie: Bernoulli-verdeling [Eng. Bernoulli distribution]
Een toevallige veranderlijke X die alleen maar de waarden 0 en 1 kan aannemen, en waarvoor

P(X = 1) = p en P(X = 0) = 1 − p

met 0 ≤ p ≤ 1, heeft een Bernoulli-verdeling met parameter p. Voor de massafunctie fX van X geldt
dan, met q = 1 − p

 {
p x = 1 px q1−x x = 0, 1
fX (x) = Be(x|p) := q x = 0 =

 0 elders.
0 elders

1.2 Momenten en momentenfunctie


5.4
Momenten en momentenfunctie De Bernoulli-verdeling [DG:5.2]
Momentenfunctie:
M(t) = pet + q; t ∈R
en dus vinden we:
E(X n ) = p
en in het bijzonder voor de verwachtingswaarde:

E(X) = p

en voor de variantie:
var(X) = E(X 2 ) − E(X)2 = pq.

5.5
Bernoulli-processen De Bernoulli-verdeling [DG:5.2]

Definitie: Bernoulli-proces [Eng. Bernoulli process]


Wanneer spreken we van een Bernoulli-proces?
1. we beschouwen n experimenten [Eng. trials];
2. elke afzonderlijk experiment k heeft een uitkomst Xk met twee mogelijke waarden, die we kunnen
beschouwen als succes (Xk = 1) of als falen (Xk = 0);
3. de waarschijnlijkheid van succes heeft dezelfde waarde p voor alle n experimenten;
4. de uitkomsten Xk zijn onafhankelijk.
Samengevat: Een Bernoulli-proces is een herhaling van n onafhankelijke en identiek verdeelde [Eng. in-
dependent and identically distributed, iid] Bernoulli-steekproeven X1 , X2 , . . . , Xn .

2 De binomiale verdeling
2.1 Definitie en eigenschappen
5.6
Definitie
De binomiale verdeling [DG:5.2]

Definitie: Binomiale verdeling [Eng. binomial distribution]


Beschouw een Bernoulli-proces van n onafhankelijke herhalingen X1 , X2 , . . . , Xn van een Bernoulli-
steekproef met waarschijnlijkheid van succes p. Dan heeft de veranderlijke X = X1 + X2 + · · · + Xn die

2
het aantal successen weergeeft, een binomiale verdeling met parameters n en p, waarvoor de massa-
functie gegeven is door (met q = 1 − p):
( )
 n px qn−x wanneer x = 0, 1, . . . , n
fX (x) = Bn(x|n, p) = x

0 elders.

Bn(·|10, p)
0, 5
p = 1/2

0
0 1 2 3 4 5 6 7 8 9 10

5.7
Andere voorbeelden De binomiale verdeling [DG:5.2]

Bn(·|10, p)

0, 5
p = 1/10

0
0 1 2 3 4 5 6 7 8 9 10

Bn(·|10, p)

0, 5
p = 3/10

0
0 1 2 3 4 5 6 7 8 9 10

5.8

De binomiale verdeling [DG:5.2]

Bn(·|10, p)

0, 5
p = 6/10

0
0 1 2 3 4 5 6 7 8 9 10

3
Bn(·|10, p)

0, 5
p = 8/10

0
0 1 2 3 4 5 6 7 8 9 10

2.2 Momenten en momentenfunctie


5.9
Momenten en momentenfunctie De binomiale verdeling [DG:5.2]
Momentenfunctie:
M(t) = (pet + q)n ; t ∈R
en dus vinden we:
E(X) = M ′ (0) = np en E(X 2 ) = M ′′ (0) = n(n − 1)p2 + np
en in het bijzonder voor de verwachtingswaarde:
E(X) = np
en voor de variantie:
var(X) = E(X 2 ) − E(X)2 = npq.

5.10

De binomiale verdeling [DG:5.2]


Het volgende resultaat kan worden gezien als een veralgemening van de definitie: de som van n onaf-
hankelijke Bernoulli-verdeelde veranderlijken met zelfde parameter p is een binomiaal verdeelde ver-
anderlijke met parameters n en p.
Stelling 5.1: Som van binomiaal verdeelde veranderlijken
Zijn X1 , X2 , . . . , Xm onafhankelijke veranderlijken, waarbij elke Xk binomiaal verdeeld is met parameters
nk en p. Dan is hun som X = X1 + X2 + · · · + Xm ook binomiaal verdeeld met parameters n = n1 + n2 +
· · · + nm en p.
Bewijs. Kijk naar de momentenfunctie (stelling 4.18):
MX (t) = MX1 (t)MX2 (t) · · · MXm (t)
= (pet + q)n1 (pet + q)n2 · · · (pet + q)nm
= (pet + q)n1 +n2 +···+nm ,
en gebruik nu stelling 4.16.

3 De geometrische verdeling
3.1 Definitie en eigenschappen
5.11
Motivering
De geometrische verdeling [DG:5.5]
Beschouw een Bernoulli-proces van een oneindig (onbeperkt) aantal onafhankelijke herhalingen X1 , X2 ,
. . . , Xn , . . . van een Bernoulli-steekproef met waarschijnlijkheid van succes p, met 0 < p < 1.

We zijn geïnteresseerd in het totaal aantal falingen X vóór we een eerste succes bereiken.

Truc om dit te behandelen: bekijk de gebeurtenis An dat n het totaal aantal herhalingen is dat nodig is
om precies 1 succes te behalen, of dus:

4
0 successen in eerste n − 1 herhalingen en n-de herhaling is een succes.

P(An ) = qn−1 p.
Dan is
P(X = x) = P(Ax+1 ) = qx p, x = 0, 1, . . .

5.12
Definitie De geometrische verdeling [DG:5.5]

Definitie: Geometrische verdeling [Eng. geometric distribution]


Beschouw een Bernoulli-proces van onafhankelijke herhalingen X1 , X2 , . . . , Xn , . . . van een Bernoulli-
steekproef met waarschijnlijkheid van succes p, met 0 < p < 1. Dan heeft de veranderlijke X die het
aantal falingen weergeeft vóór het eerste succes, een geometrische verdeling met parameter p, waarvoor
de massafunctie gegeven is door (met q = 1 − p):
{
qx p wanneer x = 0, 1, 2, . . .
fX (x) = Geo(x|p) =
0 elders.

5.13
Voorbeelden De geometrische verdeling [DG:5.5]

Geo(·|p)

0, 5
p = 1/20

0
0 2 4 6 8 10 12 14 16 18 20

Geo(·|p)

0, 5
p = 1/2

0
0 2 4 6 8 10 12 14 16 18 20

5.14
Geheugenloosheid van de geometrische verdeling De geometrische verdeling [DG:5.5]
Een van de kenmerken van de geometrische verdeling, is dat ze geheugenloos is. De volgende stelling
geeft aan wat we daarmee bedoelen.
Stelling 5.2: De geometrische verdeling is geheugenloos [Eng. memoryless]
Zij X een geometrisch verdeelde toevallige veranderlijke. Dan geldt voor alle k, ℓ ∈ N0 :

P(X = k + ℓ|X ≥ k) = P(X = ℓ).

5
Bewijs. Bemerk dat
+∞ +∞ +∞
P(X ≥ k) = ∑ P(X = k + n) = ∑ qk+n p = qk ∑ qn p = qk ,
n=0 n=0 n=0

en dus volgt uit de regel van Bayes dat:

P(X = k + ℓ en X ≥ k) P(X = k + ℓ)
P(X = k + ℓ|X ≥ k) = =
P(X ≥ k) P(X ≥ k)
qk+ℓ p
= = qℓ p = P(X = ℓ).
qk

3.2 Momenten en momentenfunctiefunctie


5.15
Momenten en momentenfunctie De geometrische verdeling [DG:5.5]
Momentenfunctie: ( )
+∞
p 1
M(t) = ∑ qk pekt = 1 − qet
; t < ln
q
k=0

en dus vinden we:


q q q2
E(X) = M ′ (0) = en E(X 2 ) = M ′′ (0) = + 2 2
p p p
en in het bijzonder voor de verwachtingswaarde:
q
E(X) =
p
en voor de variantie:
q
var(X) = E(X 2 ) − E(X)2 = .
p2

5.16
Voorbeeld De geometrische verdeling [DG:5.5]

Voorbeeld: 6 juiste nummers bij de lotto


De waarschijnlijkheid van zes juiste nummers bij de lotto is:
( )−1
45 6·5·4·3·2·1 1
p= = = .
6 45 · 44 · 43 · 42 · 41 · 40 8 145 060

Als je elke week speelt, is de verwachtingswaarde van de tijd dat je moet wachten voor je een eerste
keer zes juiste nummers hebt, gegeven door:
q
= 8 145 059 weken = 156 635, 75 jaar
p

5.17
Is op de lotto spelen irrationeel? (Geen examenstof)
De geometrische verdeling [DG:5.5]
Je zou hieruit kunnen concluderen dat op de lotto spelen irrationeel is. Er wordt wel eens gezegd dat
de lotto een vrijwillig betaalde belasting op domheid is. Deze visie vraagt toch enge nuancering, zoals
blijkt uit het onderstaande artikel:

6
http://nautil.us/issue/4/the-unlikely/why-we-keep-playing-the-lottery

4 De hypergeometrische verdeling
4.1 Definitie en eigenschappen
5.18
Motivering
De hypergeometrische verdeling [DG:5.3]
Beschouw een vaas met A rode en B blauwe ballen.

We nemen n keer op aselecte manier een bal uit de vaas, en plaatsen hem daarna terug.

Als we een rode bal uit de vaas halen als een succes beschouwen, dan kunnen we elke trekking als een
Bernoulli-steekproef beschouwen met parameter (kans op succes)
A
p= ,
A+B
en dan is het aantal rode ballen dat we in n trekkingen uit de vaas halen een binomiaal verdeelde toeval-
lige veranderlijke met parameters n en p.

De binomiale verdeling komt dus naar voren in processen die we kunnen zien als het aselect trekken
van ballen uit een vaas met terugplaatsing.

5.19
Uitwerking
De hypergeometrische verdeling [DG:5.3]
Maar wat als we de ballen niet terugplaatsen?
Belangrijke opmerking
Het trekken van n ballen zonder terugplaatsing is net hetzelfde als de A + B ballen op willekeurige wijze
ordenen in een rij, en dan de n eerste ervan nemen.
Zij Xk = 1 wanneer de k-de bal rood is, en Xk = 0 wanneer hij blauw is. Dan zien we dat:
( )
A+B−1
A−1 A B
P(Xk = 1) = ( ) = =: p en P(Xk = 0) = =: q (1)
A+B A+B A+B
A
en dus
A
E(Xk ) = E(Xk2 ) = =p (2)
A+B
en ook
AB
var(Xk ) = E(Xk2 ) − E(Xk )2 = = pq (3)
(A + B)2
De Xk zijn dus identiek Bernoulli-verdeeld met parameter p.

7
5.20

De hypergeometrische verdeling [DG:5.3]


Op analoge manier vinden we dat met k ̸= ℓ:
( )
A+B−2
A−2 A(A − 1)
P(Xk = 1 en Xℓ = 1) = ( ) =
A+B (A + B)(A + B − 1)
A

en dus
A(A − 1)
E(Xk Xℓ ) = (4)
(A + B)(A + B − 1)
zodat
AB
cov(Xk , Xℓ ) = E(Xk Xℓ ) − E(Xk )E(Xℓ ) = − . (5)
(A + B)2 (A + B − 1)
De veranderlijken Xk en Xℓ zijn negatief gecorreleerd, en dus niet onafhankelijk.

Hun som X = X1 + X2 + · · · + Xn , het aantal rode ballen in n trekkingen zonder terugplaatsing, is dus
niet binomiaal verdeeld!
5.21
Definitie De hypergeometrische verdeling [DG:5.3]
Wat is dan de massafunctie van deze veranderlijke X?
Definitie: hypergeometrische verdeling [Eng. hypergeometric distribution]
 ( )( )
 A B



 x( n −)x max{0, n − B} ≤ x ≤ min{n, A}
fX (x) = Hy(x|A, B, n) := A+B



 n

0 elders
Men zegt: deze veranderlijke heeft de hypergeometrische verdeling met parameters A, B en n.

5.22
Vergelijking met binomiale verdeling
De hypergeometrische verdeling [DG:5.3]

Bn(·|10, 1/2)
Hy(·|10, 10, 10)

0.3

0
0 1 2 3 4 5 6 7 8 9 10

8
4.2 Momenten
5.23
Verwachtingswaarde en variantie De hypergeometrische verdeling [DG:5.3]
Zij X hypergeometrisch verdeeld met parameters A, B en n. Dan vinden we met stelling 4.6 en (2) dat
A
E(X) = E(X1 ) + E(X2 ) + · · · + E(Xn ) = n = np,
A+B
en uit stelling 4.14.2, (3) en (5) dat
n n
var(X) = ∑ var(Xk ) + ∑ cov(Xk , Xℓ )
k=1 k,ℓ=1
k̸=ℓ
AB AB
=n − n(n − 1)
(A + B)2 (A + B)2 (A + B − 1)
AB A + B − n
=n
(A + B)2 A + B − 1
A+B−n
= npq .
A+B−1
Vergelijk trekken met en zonder terugplaatsing: weinig verschil wanneer n veel kleiner is dan A + B,
wel in andere gevallen (zoals n = A + B).

5 De Poisson-verdeling
5.1 Definitie en eigenschappen
5.24
Siméon Denis Poisson (1781–1840)
Poisson-verdeling [DG:5.4]

5.25
Definitie De Poisson-verdeling [DG:5.4]

Definitie: Poisson-verdeling [Eng. Poisson distribution]


Een toevallige veranderlijke X die enkel niet-negatieve gehele waarden kan aannemen, heeft een Poisson-
verdeling met parameter λ > 0 wanneer voor de massafunctie fX van X geldt dat:
 −λ x
e λ
wanneer x = 0, 1, 2, . . .
fX (x) = Ps(x|λ ) :=
 x!
0 elders.

9
5.26
Voorbeelden Poisson-verdeling [DG:5.4]

Ps(·|λ )

0, 5
λ = 1/2

0
0 2 4 6 8 10 12 14 16 18 20

Ps(·|λ )

0, 5
λ =1

0
0 2 4 6 8 10 12 14 16 18 20

5.27

Poisson-verdeling [DG:5.4]

Ps(·|λ )

0, 5
λ =3

0
0 2 4 6 8 10 12 14 16 18 20

Ps(·|λ )

0, 5
λ = 10

0
0 2 4 6 8 10 12 14 16 18 20

5.2 Momenten en momentenfunctie


5.28
Momenten en momentenfunctie De Poisson-verdeling [DG:5.4]
Momentenfunctie:
+∞
λk +∞
(λ et )k
∑ ekt e−λ k! = e−λ ∑ = eλ (e −1) ;
t
M(t) = t ∈R
k=0 k=0 k!

en dus vinden we:

M ′ (t) = eλ (e −1) λ et = λ eλ (e −1)+t


t t

M ′′ (t) = λ eλ (e −1)+t (λ et + 1)
t

10
en in het bijzonder voor de verwachtingswaarde:

E(X) = M ′ (0) = λ

en voor de variantie:

var(X) = E(X 2 ) − E(X)2 = M ′′ (0) − M ′ (0)2 = λ (λ + 1) − λ 2 = λ .

5.29
Eigenschappen De Poisson-verdeling [DG:5.4]

Stelling 5.4 : Poisson-verdeling als limiet van binomiale verdeling


De Poisson-verdeling met parameter λ is de limiet voor n → +∞ van de binomiale verdeling met para-
meters n en pn = λ/n.
Bewijs.
( )
( )n λ t λ n
lim pn e + 1 − pn
t
= lim e +1−
n→+∞ n→+∞ n n
( )
λ (et − 1) n
= lim 1 +
n→+∞ n
= eλ (e −1)
t
(definitie exponentiële)

en gebruik nu stelling 4.16.


Dit kan worden gebruikt om de binomiale verdeling snel te benaderen voor grote n en kleine p.

5.30
Poisson-verdeling als limiet van de binomiale verdeling
De Poisson-verdeling [DG:5.4]

n groot genoeg en p klein genoeg:

Bn(·|20, 1/10)
Ps(·|2)

0, 25

0
0 2 4 6 8 10 12 14 16 18 20

5.31

De Poisson-verdeling [DG:5.4]

n groot genoeg maar p niet klein genoeg:

11
Bn(·|20, 1/2)
Ps(·|10)

0, 25

0
0 2 4 6 8 10 12 14 16 18 20

5.32
Eigenschappen De Poisson-verdeling [DG:5.4]

Stelling 5.5 : Som van Poisson-verdeelde veranderlijken


Zijn X1 , X2 , . . . , Xm onafhankelijke veranderlijken, waarbij elke Xk Poisson-verdeeld is met parameter
λk . Dan is hun som X = X1 + X2 + · · · + Xm ook Poisson-verdeeld met parameter λ = λ1 + λ2 + · · · + λm .
Bewijs. Onmiddellijk uit stellingen 5.1 en 5.4. We kunnen het ook als volgt inzien. Kijk naar de
momentenfunctie (stelling 4.18):

MX (t) = MX1 (t)MX2 (t) · · · MXm (t)


= eλ1 (e −1) eλ2 (e −1) · · · eλm (e −1)
t t t

= e(λ1 +λ2 +···+λm )(e −1) = eλ (e −1) ,


t t

en gebruik nu stelling 4.16.

5.3 Poisson-processen
5.33
Het Poisson-proces
De Poisson-verdeling [DG:5.4]
Stel dat we geinteresseerd zijn in het aantal gebeurtenissen N(t) van een bepaald type dat zich in een
tijdsinterval met lengte t voordoet, bijvoorbeeld:
• aantal radioactieve kernen dat vervalt
• aantal klanten dat een winkel binnenkomt
• aantal datapakketjes dat bij een router aankomt
• aantal telefoongesprekken dat in centrale binnenkomt
• aantal aardbevingen
• ...
Dan vormen, onder bepaalde veronderstellingen, zulke fenomenen een Poisson-proces met tempo λ̇
[Eng. Poisson process with rate λ̇ ], wat wil zeggen dat:
1. N(t) een Poisson-verdeelde veranderlijke is met parameter λ̇ t, voor elke t > 0;
2. het aantal gebeurtenissen in twee disjuncte tijdsintervallen onafhankelijk is.

12
5.34
Veronderstellingen voor een Poisson-proces
De Poisson-verdeling [DG:5.4]
Welke zijn die veronderstellingen?
1. het aantal gebeurtenissen in twee disjuncte tijdsintervallen is onafhankelijk;
2. de waarschijnlijkheid p1 (t) := P(N(t) ≥ 1) dat er tenminste een gebeurtenis is in een interval met
lengte t, is gegeven door λ̇ t + o(t), wat betekent dat:
p1 (t)
= λ̇ ; lim
t→0 t
3. de waarschijnlijkheid p2 (t) := P(N(t) ≥ 2) dat er tenminste twee gebeurtenissen zijn in een inter-
val met lengte t, is gegeven door o(t), wat betekent dat:
p2 (t)
lim = 0.
t→0 t

6 De multinomiale verdeling
6.1 Definitie en eigenschappen
5.35
Motivering
De multinomiale verdeling [DG:5.9] [geen examenstof]
We kijken ter illustratie nog naar een belangrijke meerdimensionale verdeling, die een natuurlijke ver-
algemening is van de binomiale verdeling:
1. we beschouwen n experimenten [Eng. trials];
2. de uitkomst van elk afzonderlijke experiment k heeft m mogelijke waarden, namelijk 1, 2, . . . , m,
en waarde i heeft waarschijnlijkheid pi voor i = 1, 2, . . . , m:
m
pi ≥ 0 en ∑ pi = 1;
i=1
3. de waarschijnlijkheden pi zijn dezelfde voor alle n experimenten;
4. de n experimentuitkomsten zijn onafhankelijk.
We stellen door Xi het aantal experimenten voor waar de uitkomst de waarde i aanneemt.
5.36
Definitie
De multinomiale verdeling [DG:5.9] [geen examenstof]

Definitie: Multinomiale verdeling [Eng. multinomial distribution]


De meerdimensionale veranderlijke (X1 , X2 , . . . , Xm ) heeft dan een multinomiale verdeling met parame-
ters n en (p1 , p2 , . . . , pm ). De gemeenschappelijke massafunctie is gegeven door:

f(X1 ,X2 ,...,Xm ) (x1 , x2 , . . . , xm )


= Mn(x1 , x2 , . . . xm |n, p1 , p2 , . . . , pm )
( )
 n
px1 px2 · · · pxmm wanneer x1 + x2 + · · · + xm = n
:= x1 , x2 , . . . , xm 1 2

0 elders.

5.37
Verband met de binomiale verdeling De multinomiale verdeling [DG:5.9] [geen examenstof]

Stelling 5.6
Beschouw een multinomiaal verdeelde veranderlijke (X1 , X2 , . . . , Xm ) met parameters n en (p1 , p2 , . . . , pm ).
Zij A een deel van {1, 2, . . . , m}, en definieer de veranderlijke Y = ∑i∈A Xi . Dan heeft Y een binomiale
verdeling met parameters n en p = ∑i∈A pi .
Bewijs. Zij Yℓ de toevallige veranderlijke die de waarde 1 aanneemt als de ℓ-de steekproef een waarde
aanneemt in A. Dan zijn de Yℓ onafhankelijke Bernoulli-veranderlijken met parameter p = ∑i∈A pi , en
Y = Y1 +Y2 + · · · +Ym .

13
6.2 Verwachtingswaarden, varianties en covarianties
5.38
Verwachtingswaarden, varianties en covarianties
De multinomiale verdeling [DG:5.9] [geen examenstof]
Uit stelling 5.6 volgt dat Xi binomiaal verdeeld is met parameters n en pi , en dat Xi + X j binomiaal
verdeeld is met parameters n en pi + p j .

Dus vinden we dat


E(Xi ) = npi en var(Xi ) = npi (1 − pi )
terwijl enerzijds
var(Xi + X j ) = n(pi + p j )(1 − pi − p j )
en anderzijds via stelling 4.14.2

var(Xi + X j ) = var(Xi ) + var(X j ) + 2 cov(Xi , X j )


= npi (1 − pi ) + np j (1 − p j ) + 2 cov(Xi , X j )

waaruit we halen dat


1
cov(Xi , X j ) = [var(Xi + X j ) − var(Xi ) − var(X j )] = −npi p j .
2
Dus er is negatieve correlatie. Waarom?

14

You might also like