Professional Documents
Culture Documents
Wen 5
Wen 5
In dit hoofdstuk nemen we enkele bijzondere en typerende verdelingen van discrete veranderlijken
onder de loupe. We bekijken telkens hun definiërende massafunctie, hun momentenfunctie, verwach-
tingswaarde en variantie.
Deze verdelingen zijn typisch afhankelijk van een of meer parameters, die we identificeren door ze
in de massafunctie achter de conditioneringsstreep te plaatsen.
1 De Bernoulli-verdeling
1.1 Definitie en eigenschappen
5.2
Jacob Bernoulli (1654–1705)
Bernoulli-verdeling [DG:5.2]
5.3
Definitie De Bernoulli-verdeling [DG:5.2]
Het eenvoudigste experiment dat we kunnen beschouwen, heeft maar twee mogelijke uitkomsten, zoals
bijvoorbeeld:
• succes of falen [Eng. success or failure]
• kop of munt [Eng. heads or tails]
• component defect of niet defect in bepaalde periode
• patiënt geneest of geneest niet
1
De volgende definitie is van toepassing op al deze situaties.
Definitie: Bernoulli-verdeling [Eng. Bernoulli distribution]
Een toevallige veranderlijke X die alleen maar de waarden 0 en 1 kan aannemen, en waarvoor
P(X = 1) = p en P(X = 0) = 1 − p
met 0 ≤ p ≤ 1, heeft een Bernoulli-verdeling met parameter p. Voor de massafunctie fX van X geldt
dan, met q = 1 − p
{
p x = 1 px q1−x x = 0, 1
fX (x) = Be(x|p) := q x = 0 =
0 elders.
0 elders
E(X) = p
en voor de variantie:
var(X) = E(X 2 ) − E(X)2 = pq.
5.5
Bernoulli-processen De Bernoulli-verdeling [DG:5.2]
2 De binomiale verdeling
2.1 Definitie en eigenschappen
5.6
Definitie
De binomiale verdeling [DG:5.2]
2
het aantal successen weergeeft, een binomiale verdeling met parameters n en p, waarvoor de massa-
functie gegeven is door (met q = 1 − p):
( )
n px qn−x wanneer x = 0, 1, . . . , n
fX (x) = Bn(x|n, p) = x
0 elders.
Bn(·|10, p)
0, 5
p = 1/2
0
0 1 2 3 4 5 6 7 8 9 10
5.7
Andere voorbeelden De binomiale verdeling [DG:5.2]
Bn(·|10, p)
0, 5
p = 1/10
0
0 1 2 3 4 5 6 7 8 9 10
Bn(·|10, p)
0, 5
p = 3/10
0
0 1 2 3 4 5 6 7 8 9 10
5.8
Bn(·|10, p)
0, 5
p = 6/10
0
0 1 2 3 4 5 6 7 8 9 10
3
Bn(·|10, p)
0, 5
p = 8/10
0
0 1 2 3 4 5 6 7 8 9 10
5.10
3 De geometrische verdeling
3.1 Definitie en eigenschappen
5.11
Motivering
De geometrische verdeling [DG:5.5]
Beschouw een Bernoulli-proces van een oneindig (onbeperkt) aantal onafhankelijke herhalingen X1 , X2 ,
. . . , Xn , . . . van een Bernoulli-steekproef met waarschijnlijkheid van succes p, met 0 < p < 1.
We zijn geïnteresseerd in het totaal aantal falingen X vóór we een eerste succes bereiken.
Truc om dit te behandelen: bekijk de gebeurtenis An dat n het totaal aantal herhalingen is dat nodig is
om precies 1 succes te behalen, of dus:
4
0 successen in eerste n − 1 herhalingen en n-de herhaling is een succes.
P(An ) = qn−1 p.
Dan is
P(X = x) = P(Ax+1 ) = qx p, x = 0, 1, . . .
5.12
Definitie De geometrische verdeling [DG:5.5]
5.13
Voorbeelden De geometrische verdeling [DG:5.5]
Geo(·|p)
0, 5
p = 1/20
0
0 2 4 6 8 10 12 14 16 18 20
Geo(·|p)
0, 5
p = 1/2
0
0 2 4 6 8 10 12 14 16 18 20
5.14
Geheugenloosheid van de geometrische verdeling De geometrische verdeling [DG:5.5]
Een van de kenmerken van de geometrische verdeling, is dat ze geheugenloos is. De volgende stelling
geeft aan wat we daarmee bedoelen.
Stelling 5.2: De geometrische verdeling is geheugenloos [Eng. memoryless]
Zij X een geometrisch verdeelde toevallige veranderlijke. Dan geldt voor alle k, ℓ ∈ N0 :
5
Bewijs. Bemerk dat
+∞ +∞ +∞
P(X ≥ k) = ∑ P(X = k + n) = ∑ qk+n p = qk ∑ qn p = qk ,
n=0 n=0 n=0
P(X = k + ℓ en X ≥ k) P(X = k + ℓ)
P(X = k + ℓ|X ≥ k) = =
P(X ≥ k) P(X ≥ k)
qk+ℓ p
= = qℓ p = P(X = ℓ).
qk
5.16
Voorbeeld De geometrische verdeling [DG:5.5]
Als je elke week speelt, is de verwachtingswaarde van de tijd dat je moet wachten voor je een eerste
keer zes juiste nummers hebt, gegeven door:
q
= 8 145 059 weken = 156 635, 75 jaar
p
5.17
Is op de lotto spelen irrationeel? (Geen examenstof)
De geometrische verdeling [DG:5.5]
Je zou hieruit kunnen concluderen dat op de lotto spelen irrationeel is. Er wordt wel eens gezegd dat
de lotto een vrijwillig betaalde belasting op domheid is. Deze visie vraagt toch enge nuancering, zoals
blijkt uit het onderstaande artikel:
6
http://nautil.us/issue/4/the-unlikely/why-we-keep-playing-the-lottery
4 De hypergeometrische verdeling
4.1 Definitie en eigenschappen
5.18
Motivering
De hypergeometrische verdeling [DG:5.3]
Beschouw een vaas met A rode en B blauwe ballen.
We nemen n keer op aselecte manier een bal uit de vaas, en plaatsen hem daarna terug.
Als we een rode bal uit de vaas halen als een succes beschouwen, dan kunnen we elke trekking als een
Bernoulli-steekproef beschouwen met parameter (kans op succes)
A
p= ,
A+B
en dan is het aantal rode ballen dat we in n trekkingen uit de vaas halen een binomiaal verdeelde toeval-
lige veranderlijke met parameters n en p.
De binomiale verdeling komt dus naar voren in processen die we kunnen zien als het aselect trekken
van ballen uit een vaas met terugplaatsing.
5.19
Uitwerking
De hypergeometrische verdeling [DG:5.3]
Maar wat als we de ballen niet terugplaatsen?
Belangrijke opmerking
Het trekken van n ballen zonder terugplaatsing is net hetzelfde als de A + B ballen op willekeurige wijze
ordenen in een rij, en dan de n eerste ervan nemen.
Zij Xk = 1 wanneer de k-de bal rood is, en Xk = 0 wanneer hij blauw is. Dan zien we dat:
( )
A+B−1
A−1 A B
P(Xk = 1) = ( ) = =: p en P(Xk = 0) = =: q (1)
A+B A+B A+B
A
en dus
A
E(Xk ) = E(Xk2 ) = =p (2)
A+B
en ook
AB
var(Xk ) = E(Xk2 ) − E(Xk )2 = = pq (3)
(A + B)2
De Xk zijn dus identiek Bernoulli-verdeeld met parameter p.
7
5.20
en dus
A(A − 1)
E(Xk Xℓ ) = (4)
(A + B)(A + B − 1)
zodat
AB
cov(Xk , Xℓ ) = E(Xk Xℓ ) − E(Xk )E(Xℓ ) = − . (5)
(A + B)2 (A + B − 1)
De veranderlijken Xk en Xℓ zijn negatief gecorreleerd, en dus niet onafhankelijk.
Hun som X = X1 + X2 + · · · + Xn , het aantal rode ballen in n trekkingen zonder terugplaatsing, is dus
niet binomiaal verdeeld!
5.21
Definitie De hypergeometrische verdeling [DG:5.3]
Wat is dan de massafunctie van deze veranderlijke X?
Definitie: hypergeometrische verdeling [Eng. hypergeometric distribution]
( )( )
A B
x( n −)x max{0, n − B} ≤ x ≤ min{n, A}
fX (x) = Hy(x|A, B, n) := A+B
n
0 elders
Men zegt: deze veranderlijke heeft de hypergeometrische verdeling met parameters A, B en n.
5.22
Vergelijking met binomiale verdeling
De hypergeometrische verdeling [DG:5.3]
Bn(·|10, 1/2)
Hy(·|10, 10, 10)
0.3
0
0 1 2 3 4 5 6 7 8 9 10
8
4.2 Momenten
5.23
Verwachtingswaarde en variantie De hypergeometrische verdeling [DG:5.3]
Zij X hypergeometrisch verdeeld met parameters A, B en n. Dan vinden we met stelling 4.6 en (2) dat
A
E(X) = E(X1 ) + E(X2 ) + · · · + E(Xn ) = n = np,
A+B
en uit stelling 4.14.2, (3) en (5) dat
n n
var(X) = ∑ var(Xk ) + ∑ cov(Xk , Xℓ )
k=1 k,ℓ=1
k̸=ℓ
AB AB
=n − n(n − 1)
(A + B)2 (A + B)2 (A + B − 1)
AB A + B − n
=n
(A + B)2 A + B − 1
A+B−n
= npq .
A+B−1
Vergelijk trekken met en zonder terugplaatsing: weinig verschil wanneer n veel kleiner is dan A + B,
wel in andere gevallen (zoals n = A + B).
5 De Poisson-verdeling
5.1 Definitie en eigenschappen
5.24
Siméon Denis Poisson (1781–1840)
Poisson-verdeling [DG:5.4]
5.25
Definitie De Poisson-verdeling [DG:5.4]
9
5.26
Voorbeelden Poisson-verdeling [DG:5.4]
Ps(·|λ )
0, 5
λ = 1/2
0
0 2 4 6 8 10 12 14 16 18 20
Ps(·|λ )
0, 5
λ =1
0
0 2 4 6 8 10 12 14 16 18 20
5.27
Poisson-verdeling [DG:5.4]
Ps(·|λ )
0, 5
λ =3
0
0 2 4 6 8 10 12 14 16 18 20
Ps(·|λ )
0, 5
λ = 10
0
0 2 4 6 8 10 12 14 16 18 20
M ′′ (t) = λ eλ (e −1)+t (λ et + 1)
t
10
en in het bijzonder voor de verwachtingswaarde:
E(X) = M ′ (0) = λ
en voor de variantie:
5.29
Eigenschappen De Poisson-verdeling [DG:5.4]
5.30
Poisson-verdeling als limiet van de binomiale verdeling
De Poisson-verdeling [DG:5.4]
Bn(·|20, 1/10)
Ps(·|2)
0, 25
0
0 2 4 6 8 10 12 14 16 18 20
5.31
De Poisson-verdeling [DG:5.4]
11
Bn(·|20, 1/2)
Ps(·|10)
0, 25
0
0 2 4 6 8 10 12 14 16 18 20
5.32
Eigenschappen De Poisson-verdeling [DG:5.4]
5.3 Poisson-processen
5.33
Het Poisson-proces
De Poisson-verdeling [DG:5.4]
Stel dat we geinteresseerd zijn in het aantal gebeurtenissen N(t) van een bepaald type dat zich in een
tijdsinterval met lengte t voordoet, bijvoorbeeld:
• aantal radioactieve kernen dat vervalt
• aantal klanten dat een winkel binnenkomt
• aantal datapakketjes dat bij een router aankomt
• aantal telefoongesprekken dat in centrale binnenkomt
• aantal aardbevingen
• ...
Dan vormen, onder bepaalde veronderstellingen, zulke fenomenen een Poisson-proces met tempo λ̇
[Eng. Poisson process with rate λ̇ ], wat wil zeggen dat:
1. N(t) een Poisson-verdeelde veranderlijke is met parameter λ̇ t, voor elke t > 0;
2. het aantal gebeurtenissen in twee disjuncte tijdsintervallen onafhankelijk is.
12
5.34
Veronderstellingen voor een Poisson-proces
De Poisson-verdeling [DG:5.4]
Welke zijn die veronderstellingen?
1. het aantal gebeurtenissen in twee disjuncte tijdsintervallen is onafhankelijk;
2. de waarschijnlijkheid p1 (t) := P(N(t) ≥ 1) dat er tenminste een gebeurtenis is in een interval met
lengte t, is gegeven door λ̇ t + o(t), wat betekent dat:
p1 (t)
= λ̇ ; lim
t→0 t
3. de waarschijnlijkheid p2 (t) := P(N(t) ≥ 2) dat er tenminste twee gebeurtenissen zijn in een inter-
val met lengte t, is gegeven door o(t), wat betekent dat:
p2 (t)
lim = 0.
t→0 t
6 De multinomiale verdeling
6.1 Definitie en eigenschappen
5.35
Motivering
De multinomiale verdeling [DG:5.9] [geen examenstof]
We kijken ter illustratie nog naar een belangrijke meerdimensionale verdeling, die een natuurlijke ver-
algemening is van de binomiale verdeling:
1. we beschouwen n experimenten [Eng. trials];
2. de uitkomst van elk afzonderlijke experiment k heeft m mogelijke waarden, namelijk 1, 2, . . . , m,
en waarde i heeft waarschijnlijkheid pi voor i = 1, 2, . . . , m:
m
pi ≥ 0 en ∑ pi = 1;
i=1
3. de waarschijnlijkheden pi zijn dezelfde voor alle n experimenten;
4. de n experimentuitkomsten zijn onafhankelijk.
We stellen door Xi het aantal experimenten voor waar de uitkomst de waarde i aanneemt.
5.36
Definitie
De multinomiale verdeling [DG:5.9] [geen examenstof]
5.37
Verband met de binomiale verdeling De multinomiale verdeling [DG:5.9] [geen examenstof]
Stelling 5.6
Beschouw een multinomiaal verdeelde veranderlijke (X1 , X2 , . . . , Xm ) met parameters n en (p1 , p2 , . . . , pm ).
Zij A een deel van {1, 2, . . . , m}, en definieer de veranderlijke Y = ∑i∈A Xi . Dan heeft Y een binomiale
verdeling met parameters n en p = ∑i∈A pi .
Bewijs. Zij Yℓ de toevallige veranderlijke die de waarde 1 aanneemt als de ℓ-de steekproef een waarde
aanneemt in A. Dan zijn de Yℓ onafhankelijke Bernoulli-veranderlijken met parameter p = ∑i∈A pi , en
Y = Y1 +Y2 + · · · +Ym .
13
6.2 Verwachtingswaarden, varianties en covarianties
5.38
Verwachtingswaarden, varianties en covarianties
De multinomiale verdeling [DG:5.9] [geen examenstof]
Uit stelling 5.6 volgt dat Xi binomiaal verdeeld is met parameters n en pi , en dat Xi + X j binomiaal
verdeeld is met parameters n en pi + p j .
14