Statistiek I I6e2

STATISTIEK & KANSREKENING I
A. van Hoegee en R.J. van Aalst
versie 6.2 (12 april 2011)
Changerecord: versie datum publicatie 5.3 26 april 2010 6 28 mei 2010 6.1 6.2 29 mei 2010 12 april 2011
Veranderingen t.o.v. vorige versie GR instructies toegevoegd H5 Normaalverdeling herschreven en H6 Binomiaalverdeling uitgebreid eea in overeenstemming met de behandelde stof op het hoorcollege 7.4 toegevoegd H1 enkele voorbeelden aangepast, o.a bepaling mediaan
Inhoudsopgave
1 INLEIDING IN DE STATISTIEK ........................................................................................................................ 3 1.1 1.2 1.3 1.4 1.5 1.6 2 2.1 2.2 2.3 2.4 3 3.1 3.2 3.3 3.4 4 4.1 4.2 4.3 4.4 5 5.1 5.2 5.3 5.4 5.5 5.6 5.7 6 DE FREQUENTIETABEL EN HET HISTOGRAM ................................................................................................................. 3 HET GEMIDDELDE .................................................................................................................................................. 4 DE MODUS .......................................................................................................................................................... 6 DE MEDIAAN ........................................................................................................................................................ 7 SPREIDING ........................................................................................................................................................... 8 GEBRUIK GR ...................................................................................................................................................... 10 PERMUTATIES .................................................................................................................................................... 11 VARIATIES ......................................................................................................................................................... 11 COMBINATIES ..................................................................................................................................................... 12 GEBRUIK GR ...................................................................................................................................................... 12 HET BEGRIP KANS ................................................................................................................................................ 13 SOM- EN PRODUCTREGELS .................................................................................................................................... 13 VOORWAARDELIJKE KANS ..................................................................................................................................... 14 KANSEN BIJ TREKKINGEN MET EN ZONDER TERUGLEGGING ........................................................................................... 15 KANSVARIABELEN ................................................................................................................................................ 18 KANSFUNCTIE EN VERDELINGSFUNCTIE .................................................................................................................... 18 VERWACHTINGSWAARDE EN VARIANTIE ................................................................................................................... 20 REKENREGELS ..................................................................................................................................................... 21 INTRODUCTIE NORMALE VERDELING ....................................................................................................................... 23 DE STANDAARDNORMAAL VERDELING ..................................................................................................................... 23 WISKUNDE VAN DE NORMAALVERDELING ................................................................................................................. 24 KANSREKENING MET EEN NORMAALVERDELING ......................................................................................................... 25 BETROUWBAARHEIDSINTERVALLEN ......................................................................................................................... 26 COMBINATIES VAN NORMALE VERDELINGEN .............................................................................................................. 27 DE VERDELING VAN HET GEMIDDELDE VAN EEN STEEKPROEF ......................................................................................... 28
PERMUTATIES, COMBINATIES, VARIATIES .................................................................................................. 11
ELEMENTAIRE KANSREKENING ................................................................................................................... 13
KANSFUNCTIES .......................................................................................................................................... 18
DE NORMALE VERDELING .......................................................................................................................... 23
DE BINOMIALE VERDELING ........................................................................................................................ 30 6.1 BINOMIALE KANSFORMULE ................................................................................................................................... 30 6.2 KANSREKENING MET DE BINOMIALE VERDELING ........................................................................................................ 31 6.3 DE NORMALE BENADERING VAN DE BINOMIALE VERDELING ......................................................................................... 32
DE POISSONVERDELING ............................................................................................................................. 35 7.1 7.2 7.3 7.4 FORMULE VAN DE POISSONVERDELING .................................................................................................................... 35 KANSREKENING MET DE POISSONVERDELING ............................................................................................................ 36 DE NORMALE BENADERING VAN DE POISSONVERDELING ............................................................................................. 37 BINOM NORMAAL; BINOM POISSON; POISSON NORMAAL ............................................................................. 37
8 9 10 11
FORMULEBLAD .......................................................................................................................................... 38 APPENDIX A: TABEL VAN DE STANDAARD NORMAAL VERDELING .............................................................. 41 APPENDIX B: TABEL VAN DE POISSON VERDELING ..................................................................................... 42 APPENDIX C: TABEL VAN DE BINOMIALE VERDELING ................................................................................. 43
1 INLEIDING IN DE STATISTIEK
Statistiek is een wetenschap, die zich bezig houdt met het verzamelen, ordenen, presenteren en analyseren van gegevens; hierbij gaat het dan om resultaten van experimenten of waarnemingen die niet eenduidig zijn; denk hierbij aan het meten van weerstand, treksterkte, maar ook het gewicht van mensen, etc. Net als op vele andere terreinen ook in de techniek van onschatbare waarde. We zullen ons in dit hoofdstuk hoofdzakelijk het ordenen, presenteren en analyseren beschrijven. Op de manier hoe gegevens verzameld worden gaan we hier niet in.
1.1 De frequentietabel en het histogram

Een brei aan meetwaarden geeft geen enkel inzicht; pas als we de meetwaarden rangschikken en ordenen en dit resultaat grafisch weergeven kunnen we allerlei patronen ontdekken. Numerieke ordening. Afhankelijk van het type gegeven vindt deze ordening plaats op volgorde van getallen, alfabetische volgorde, op kleur of iets dergelijks. Om de gegevens in een geordende vorm te presenteren hebben we een flink aantal mogelijkheden: We kunnen de gegevens zonder meer in bijvoorbeeld oplopende volgorde opschrijven. Maar bij grote aantallen meetwaarden is dit nog steeds erg onoverzichtelijk. Als een aantal gegevens vaker dan n keer voorkomt, kunnen we per gegeven ook aangeven met welke frequentie dit gegeven voorkomt. In een dergelijk geval spreken we van een frequentietabel. We onderscheiden een absolute frequentietabel (hierin staan de absolute aantallen van waarneming) en de relatieve frequentietabel (met de percentuele frequenties)
Als voorbeeld geven we hieronder een frequentietabel, waarin het aantal kinderen per gezin wordt weergegeven in een bepaald dorp. Aantal kinderen 0 1 2 3 4 5 6 7 frequentie 20 100 50 21 8 2 0 1
In dit geval krijgen we een redelijk overzichtelijke tabel, waarin we een aardig idee krijgen over het aantal kinderen in een willekeurig gezin. Merk op dat de meetwaarden in dit voorbeeld discreet van aard zijn en niet continu: je hebt 1 kind of 2 kinderen, maar nooit 1,5
Als veel van de gegevens slechts n keer voorkomen, heeft deze methode niet zoveel zin. De tabel wordt dan veel te lang. In een dergelijk geval voegen we een aantal gegevens, dat min of meer dichtbij elkaar liggen samen tot 1 groep (meestal klasse genoemd) en tellen hoeveel van die elementen er dan in dezelfde klasse liggen. Een dergelijke verdeling noemen we dan een klassenindeling.
Als volgend voorbeeld geven we de uitkomst van een lichaamsgewichtbepaling onder in totaal 112 eerstejaars aviation studenten. Je ziet hieronder een absolute frequentietabel , gebaseerd op een klassenindeling. Merk op dat je het hier hebt over een continue variabele, nl. het gewicht: iemand kan 57,3852194 kg wegen en valt dan dus in klasse 2: de klasse van 55-60 kg.
gewicht 50-55 55-60 60-65 65-70 70-75 75-80 80-85 85-90 90-95
Frequentie 7 7 20 22 23 15 11 5 2
Grafische weergave We kunnen de gegevens ook grafisch weergeven. Met Excel kun je vele grafiekjes en staafdiagrammen maken. Een Staafdiagram is de grafische weergave van de frequentieverdeling van data, afkomstig uit een discontinue verdeling, zoals bijvoorbeeld in geval het voorkomen van typen/stijlen/soorten. Maken we een diagram van een continue verdeling, zoals in het voorbeeld hierboven, dan spreken we van een Histogram of kolommendiagram. Een histogram is de tegenhanger van een staafdiagram bij discontinue verdelingen. Overigens zien beide typen diagrammen er hetzelfde uit, alleen de x-as indeling verschilt. Hieronder staat een histogram van de cijferverdeling in het laatste voorbeeld hierboven:
Dit diagram toont kolommen met oppervlakte ter grootte van de (relatieve) frequenties opgericht boven de klassen.
1.2 Het gemiddelde

Heel vaak verzamelen we gegevens om iets te kunnen zeggen over een doorsnee waarde van deze gegevens. En van de meest bekende waarde is het gemiddelde. Helaas bedoelt niet iedereen hetzelfde met het woord gemiddelde. In deze paragraaf behandelen we de drie meest voorkomende vormen van gemiddelde
1.2.1 Het rekenkundig gemiddelde

De meest voorkomende vorm van gemiddelde is het rekenkundige gemiddelde. Het rekenkundig gemiddelde is een waarde, die zodanig gekozen wordt, dat als elk getal uit de gegevensverzameling vervangen wordt door dit rekenkundige gemiddelde, we hetzelfde resultaat krijgen indien we alle getallen bij elkaar optellen of als we het rekenkundig gemiddelde vermenigvuldigen met het aantal elementen in die verzameling. Dit klinkt ingewikkeld. We geven een voorbeeld.Veronderstel: in een verzameling komen 4 getallen voor, namelijk 5, 7, 9 en 11 Als we deze getallen optellen krijgen we: 5 + 7 + 9 + 11 = 32 . Neem nu het getal 8. Indien we 8 vermenigvuldigen met 4 ( het aantal elementen uit de verzameling) dan krijgen we ook 32. In dit geval zeggen we dat het gemiddelde van de getallen 5, 7, 9 en 11 gelijk is aan 8. We kregen dit door 32 te delen door 4. In zijn algemeenheid kunnen we dus zeggen, dat het rekenkundig gemiddelde verkregen wordt door de som van de elementen te delen door het aantal elementen. In formule ziet dat er als volgt uit:
x=
x
i =1
Hierin staat x voor het rekenkundig gemiddelde xi is een willekeurig getal uit de verzameling.
x staat voor de som van alle elementen uit de verzameling.

i i =1
N is het aantal elementen in de verzameling.

Als een aantal getallen vaker dan n keer voorkomt, en er dus een frequentietabel gemaakt kan worden, wordt de formule iets gewijzigd. We krijgen dan:
x=
x
i =1 n i =1
fi
i
Hierin staat x weer voor het rekenkundig gemiddelde. f i staat voor de frequentie waarmee xi voorkomt
n is het aantal verschillende elementen xi in de gehele verzameling.

Dit betekent dus dat:
f
i =1
=N
Het bovenstaande geldt zolang we van elk element precies de waarde weten. Op het moment dat we te maken hebben met een klassenindeling, weten we niet precies meer wat de waarde van elk element afzonderlijk is. In dit geval gaan we ervan uit dat de element homogeen over de klasse verdeeld zijn. We nemen dan het klassemidden (Dit is de gemiddelde waarde van de ondergrens van de klasse en de bovengrens van de klasse) als representant van de klasse en vermenigvuldigen dat met de frequentie. De formule voor het berekenen van het rekenkundig gemiddelde verandert dus niet, alleen staat xi nu voor het klassenmidden.
1.2.2 Het meetkundig gemiddelde

In sommige gevallen krijgen we niet het juiste antwoord bij het toepassen van het rekenkundig gemiddelde. Een voorbeeld hiervan is het berekenen van de gemiddelde rente over een kapitaal. Veronderstel dat we een kapitaal hebben van 10.000,- Over dit kapitaal krijgen we het eerste jaar 2% rente, in het tweede jaar 3%, in het derde jaar 1% en in het vierde jaar 4%. De rente wordt elk jaar over de al betaalde rente uitgekeerd. Als we nu het rekenkundig gemiddelde nemen van de rente (= (1 + 2 + 3 + 4) / 4 = 2,5) en we passen dit rentepercentage 4 jaar achter elkaar toe, zien we dat dit niet exact hetzelfde oplevert. In het eerste geval levert dit op: 11035,50. In het geval van 4 jaar 2,5% krijgen we: 11038,1 Kennelijk zit er een klein foutje in het systeem. De afwijking is echter te groot om het te wijten aan afrondfouten. We passen de formule enigszins aan en krijgen:
x = 4 1,02 *1,03 *1,01 *1,04 = 1,02494

Als we dit percentage 4 jaar uitrekenen krijgen we wel het juiste antwoord. In dit geval bij het gebruik van de hierboven beschreven methode spreken we van het meetkundig gemiddelde. De algemene formule wordt dan:
N
x = N xi
i =1
Hierin is N het aantal elementen in de verzameling.

N
x
i =1
staat voor het product voor alle N elementen uit de verzameling.
1.2.3 Het harmonisch gemiddelde

Het volgende voorbeeld geeft een nog weer iets andere vorm van het berekenen van het gemiddelde. Van werknemer A is bekend, dat hij een bepaald karwei kan afmaken in 4 dagen. Van werknemer B is bekend, dat hij voor hetzelfde karwei 6 dagen nodig heeft. Veronderstel nu, dat het mogelijk is, dat deze 2 werknemers samen aan een karwei beginnen, en dat ze elkaar niet in de weg lopen. Hoeveel tijd zal het voltooien van het karwei dan gemiddeld in beslag nemen? Bij het gebruik van het rekenkundig gemiddelde zouden we uitkomen op 5 werkdagen ( Voor 2 werknemers betekent dit in totaal 2,5 dagen). Als we echter nog wat nauwkeuriger rekenen, vinden we dat werknemer A 1 4 van het karwei in 1 dag doet. Werknemer B doet in 1 dag
1 4
1 6
deel van het karwei.

12 5
3 5 2 Samen doen ze dus op 1 dag + = 12 deel van het karwei. In totaal zijn ze dus + 12 = 12 Het totaal aantal werkdagen komt dan op 4,8. Dit gemiddelde noemen we het harmonisch gemiddelde. 1 6
dag bezig.
In formule: x =
f
i =1
1 xi
1.3 De modus
Als we te maken hebben met een frequentietabel, kunnen we het element opzoeken,dat de hoogste frequentie heeft. In het geval dat er maar n element de grootste frequentie heeft, spreken we van de
modus. Dit is een snelle manier van het bepalen van een doorsnee waarde van de verzameling, maar doorgaans ook niet zo heel erg betrouwbaar. Als de frequenties van een aantal elementen elkaar niet zo heel erg veel ontloopt is het gebruik van de modus niet erg betrouwbaar. Ook bij een klassenverdeling komen we een dergelijk begrip tegen. Nu spreken we echter van een modale klasse. Hierbij treden echter een paar probleempjes op. In eerste instantie moeten we er op letten of de klassen elk dezelfde breedte hebben. Indien dit het geval is, is de klasse met de hoogste frequentie inderdaad de modale klasse. In het geval dat de klassenbreedte varieert, hoeft de klasse met de hoogste frequentie niet noodzakelijk de modale klasse te zijn. We moeten dan de frequentiedichtheid berekenen. Deze frequentie dichtheid kunnen we berekenen, door de frequentie te delen door de lengte van het interval. De modale klasse wordt dan de klasse met de hoogste frequentiedichtheid. Als bij een bepaalde klassenverdeling het zo uitkomt dat er een aantal klassen zijn met ongeveer gelijke frequentie, dan kan het zijn dat we de omvang van de klassen verkeerd gekozen hebben. (De klassen zijn misschien te groot of te klein) Een verandering van de klassenbreedte kan dan leiden tot een beter resultaat.
1.4 De mediaan
Een andere manier om een doorsnee waarde te geven van een verzameling, is het bekijken van de middelste waarde. Hiertoe moeten we de gegevens uit de verzameling eerst ordenen in aflopende of oplopende volgorde. We kunnen dus alleen met een mediaan werken, als de gegevens te ordenen zijn in oplopende of aflopende volgorde. Alleen bij een oneven aantal elementen hebben we een middelste element. Bij een even aantal elementen nemen we voor de mediaan het gemiddelde van de twee elementen, die het dichtst bij het midden liggen. Het bepalen van de mediaan wordt iets lastiger op het moment, dat we met een klassenindeling te maken hebben. Het is dan immers niet duidelijk welke waarde precies de middelste is, omdat we van elke klasse alleen maar weten hoeveel elementen er in zitten. Om toch een redelijke schatting van de mediaan te kunnen maken bepalen we eerst in welke klasse de mediaan ligt. Vervolgens gaan we er van uit, dat de elementen gelijkelijk over de hele klasse zijn verdeeld en onderling op gelijke afstand van elkaar liggen. Op deze manier kunnen we de mediaan uitrekenen. Deze berekening zal dus in veel gevallen een iets andere uitkomst opleveren, dan in het geval, dat we alle waarden exact kennen. Voor de berekening van de mediaan gebruiken we de volgende formule;
x = L+
nl * s m ; In deze formule is: nl + nr
x de mediaan L de ondergrens van de klasse, waarin de mediaan ligt.

nl het aantal elementen links van de mediaan in de klasse, waarin de mediaan ligt nr het aantal elementen rechts van de mediaan in de klasse, waarin de mediaan ligt s m de klassenbreedte van de klasse waarin de mediaan gelegen is.
xi 1 2 3 4 5 6 fi 1 2 3 4 3 2
Voorbeeld1. stel dat we het aantal kinderen per gezin in een buurt met 15 gezinnen inventariseren en stel dat we de frequentietabel hiernaast als uitkomst vinden: Van deze 15 meetwaarden is (in opklimmende volgorde) de achtste de mediaan. De achtste meetwaarde is een 4, en wel de tweede 4 in de klasse van 4 kinderen per gezin. Voeren we deze waarden in in de GR dan lezen we af: x-gem=3,8 en de mediaan = 4 Voorbeeld 2: Maar stel, dat we nu een buurtonderzoek uitvoeren en de leeftijd van alle jonge kinderen onder de 10 jaar inventariseren en dat we nu als uitkomst dezelfde tabel vinden: dwz xi staat nu voor de leeftijd van een kind en fi weer voor het aantal kinderen
dat die leeftijd heeft. Maar nu is de verwerking anders: nu is er sprake van een continue variabele, want als een kind 1 jaar is, dan is hij minimaal 1 en nog geen 2 jaar, bijv 1 jaar, 3 maanden, 5 dagen en 7 uur. Dus moeten we concluderen dat de eerste klasse alle kinderen bevat die ouder zijn dan 1 maar jonger dan 2 etc.
x-min x-max
Voeren we nu weer xi en fi in de GR in, dan lezen we af: x-gem=4,3 en med=4,5; we hebben de calculator immers gezegd dat er in de klasse van 4-5 jarigen vier waarden van 4,5 zijn. In deze situatie heeft de GR echter geen gelijk, omdat bij een continue variabele gaat de bepaling van de mediaan anders verloopt. Die vier waarden van de klasse van 4 tot 5 jaar smeren we gelijkmatig uit over de gehele klassebreedte, dwz de eerste waarde ligt op de 4 en de laatste waarden pinnen we op de vijf. Aldus zien we dat de tweede meetwaarde in deze klasse (die tevens de middelste meetwaarde van de gehele verzameling is) nu op 4,3 ligt, zoals we ook vinden als we de bovenstaande formule voor de mediaan gebruiken.
1 2 3 4 5 6
2 3 4 5 6 7
xi 1,5 2,5 3,5 4,5 5,5 6,5
fi 1 2 3 4 3 2
We moeten de frequentietabel van zonet aanpassen tot de tweede frequentietabel hiernaast. En ook moeten we nu andere waarden voor xi nemen, want xi stelt nu het klassemidden voor: xi voor de klasse van 1 jarigen wordt dus nu niet 1 maar 1,5 etc.
1.5 Spreiding
Met alleen maar de waarde van het gemiddelde of de mediaan of de meest voorkomende meetwaarde hebben we een idee omtrent de centrale ligging van een verzameling, maar hebben we nog geen beeld omtrent de ligging van de verschillende elementen van de verzameling ten opzichte van elkaar. We verkrijgen andere belangrijke informatie over de verzameling indien we weten hoeveel de elementen uit de verzameling afwijken van het gemiddelde. Er is een aantal methodes om deze afwijking uit te rekenen. Elke methode levert een ander resultaat op en het ene resultaat is beter bruikbaar dan het andere. In deze paragraaf zullen we enkele methodes bespreken voor het bepalen van de spreiding van een verzameling.
1.5.1 De Gemiddelde Absolute Afwijking

Bij een verdeling, waar we van ieder element van de verzameling de waarde kennen, kunnen we het rekenkundig gemiddelde uitrekenen en vervolgens voor ieder element uitrekenen wat het verschil is met dat gemiddelde. Als we al deze verschillen optellen, zal de som precies 0 opleveren. Immers het gemiddelde was het getal, dat als vervanger van alle elementen uit de verzameling kon worden beschouwd. Hier kunnen we dus niets mee. Als we echter bij het bepalen van het verschil het eventuele minteken weglaten, krijgen we alleen positieve waardes. Als we deze positieve (absolute) verschillen optellen en daarna delen door het aantal aanwezige elementen in de verzameling krijgen we een waarde voor de gemiddelde absolute afwijking. In formule:
GAA =
f
i =1
* x xi
n i
f
i =1
Hierin is GAA de gemiddelde absolute afwijking.
x het rekenkundig gemiddelde van de verzameling Deze formule kunnen we ook gebruiken in het geval van een klassenverdeling. In dat geval staat xi voor het klassenmidden.
8
In de praktijk wordt GAA niet zo heel vaak gebruikt. Het voordeel is dat het erg simpel uit te rekenen is, het nadeel is, dat we niet erg nauwkeurig een uitspraak kunnen doen over de elementen van de verzameling als we het rekenkundig gemiddelde weten en de GAA .
1.5.2 Het Bereik

Het Bereik (eng: Range R) van een verzameling getallen is gedefinieerd als het grootste getal minus het kleinste getal. In formulevorm: R = xmax x min . Het Bereik wordt wel gebruikt bij het monitoren van productieprocessen, zie Statistiek II (TWi-8)
1.5.3 Variantie en Standaardafwijking

Twee heel belangrijke begrippen in de statistiek zijn de variantie en daarvan afgeleid- de Standaardafwijking. Bij de Variantie nemen we niet het absolute verschil tussen de gemiddelde waarde en de waarde van een element uit de verzameling, maar het kwadraat daarvan. Daar een kwadraat altijd positief of nul is, zal de som van al deze kwadraten ook een positief getal zijn. We noemen deze som de Variantie. Als we vervolgens weer de wortel uit deze som trekken dan krijgen we de standaardafwijking . De definitie van variantie en standaardafwijking in formulevorm wordt dan:
var iantie =
(
i =1 n i =1
f i * x xi
= s tan daardafwij king = var iantie =
f * (x x )
i i i =1
f
i =1
Hierin is : f i de frequentie van xi of de frequentie van de klasse.
xi een willekeurig element uit de verzameling, of het klassenmidden van een klasse.
x het rekenkundig gemiddelde. n het aantal verschillende elementen in de verzameling of het aantal klassen in de verzameling
Het is nu nog lastig om uit te leggen, wat de voordelen zijn van het gebruik van de standaardafwijking ten opzichte van het gebruik van de gemiddelde absolute afwijking. In het hoofdstuk van de normale verdeling bij de kansrekening ( Hoofdstuk 6) komen we hier op terug. Het blijkt dan dat we een uitspraak kunnen doen over het percentage van het aantal elementen dat ligt binnen het interval dat loopt van het gemiddelde minus de standaardafwijking tot het gemiddelde plus de standaardafwijking. ( Dit is ongeveer 67%) Ook zullen we bij de kansrekening te maken krijgen met de variantie. Dit is het kwadraat van de standaardafwijking. Een ander woord voor standaardafwijking is standaarddeviatie.
1.5.4 De kwartiele afwijking

De mediaan geeft de waarde van het middelste element. Dit zegt dus niets over de overige waarden van de elementen uit de verzameling. We bepalen nu de waarde van een element uit de verzameling, dat op een kwart van het interval ligt en de waarde van een element dat op driekwart van het interval ligt. Deze elementen noemen we achtereenvolgens het eerste kwartiel (Q1 ) en het derde kwartiel (Q3 ) De kwartiele afwijking wordt vervolgens gedefinieerd door:
1 2
(Q3 Q1 )
De formules voor het berekenen van Q1 en Q3 lijken erg veel op de berekening van de mediaan.
Q1 = Q3 =
1 4
N f1 f Q1 N f1 f Q3
* sQ1 * sQ3
3 4
1.6 Gebruik GR
Invoer van een frequentietabel TI-83 plus Kies: stat Kies: edit zet de waarden voor Xi in bijv. L1 zet de waarden voor fi in bijv. L2 Kies: stat Kies: calc Kies: 1-varstats Voer in: 1-varstats L1,L2 Casio Kies: stat scherm Zet de waarden van xi in list 1 en de waarden van fi in list 2 Kies: stat scherm Kies: calc (2e tabblad) Zorg dat onder SET(tabblad rechts) je 1varX op List 1 hebt staan en 1varF op List 2 Kies: 1Var
Uitrekenen van gemiddelde en standaarddeviatie
10
2 PERMUTATIES, COMBINATIES, VARIATIES

Bij de kansrekening is de manier waarin acties in een bepaalde volgorde kunnen voorkomen erg belangrijk. In dit hoofdstuk gaan we in op de diverse vormen van in volgorde plaatsen en de daarbij behorende formules.
2.1 Permutaties
Veronderstel we hebben een verzameling van een van te voren bekend aantal allemaal van elkaar verschillende elementen. We kunnen ons dan afvragen op hoeveel manieren we deze elementen kunnen noteren. We beginnen met 1 element. Dit is eenvoudig. We kunnen dit slechts op 1 manier doen. Bekijken we 2 elementen, dan zien we dat er 2 mogelijkheden zijn. Veronderstel dat deze elementen a, b zijn, dan kunnen we schrijven: a b en ba Bij 3 elementen wordt het iets ingewikkelder. Kijken we naar het eerste rijtje, dan kunnen we het derde element er voor zetten, er tussenin en er achter. We krijgen dan dus c a b a c b a b c Ook voor de combinatie b a hebben we 3 mogelijkheden. Bij elkaar dus 2*3=6 mogelijkheden Bij 4 elementen a b c d kunnen we d dus op 4 verschillende plaatsen neerzetten in het rijtje a b c namelijk: abcd abdc adbc dabc Dit geldt voor al de 6 mogelijkheden van een rijtje van 3. In totaal dus 6*4=24 mogelijkheden Eigenlijk 1*2*3*4 mogelijkheden Alle mogelijke rijtjes die we uit een aantal elementen kunnen vormen noemen we de permutaties van die elementen. Het aantal permutaties van bijvoorbeeld 3 elementen is 6 (=1*2*3) We kunnen dit ook schrijven als 3! . Dit spreken we uit als 3 faculteit. Als resultaat krijgen we dus:
1!= 1 2!= 1 * 2 = 2 3!= 1 * 2 * 3 = 6 4!= 1 * 2 * 3 * 4 = 24 5!= 1 * 2 * 3 * 4 * 5 = 120

n
n!= i = 1 * 2 * 3 * ........ * n
i =1
Uit allerlei praktische overwegingen en om formules op het gebied van statistiek meer algemeen te maken is besloten om 0! te definiren als 1. Realiseer je wel dat n! zeer snel groeit. Dat betekent dat op een gewone rekenmachine het maximum meestal 69! is, omdat het grootste getal, dat de rekenmachine aankan 10 100 is. Grafische rekenmachines kunnen meestal iets grotere getallen aan, maar bij ongeveer 150! Houdt het meestal op.
2.2 Variaties
In de vorige paragraaf waren alle elementen verschillend. De vraag is nu wat er verandert als een aantal elementen dezelfde waarde hebben. Bekijk bijvoorbeeld de letters van het woord KAAL. Als de 4 letters verschillend geweest zouden zijn, dan hadden we 4!=24 mogelijkheden gehad. Schrijven we nu alle mogelijkheden op dan krijgen we: AAKL AKAL AKLA KAAL KALA KLAA AALK ALAK ALKA LAAK LAKA LKAA
11
Dit zijn slechts 12 mogelijkheden. We kunnen dit als volgt verklaren: In dit woord komt 2 keer de letter A voor. Tussen deze 2 As kunnen we geen verschil zien. Wanneer we de beide As zouden vervangen door A1 en A2 dan krijgen we wel 24 mogelijkheden Bijvoorbeeld: LA1 A2 K en LA2 A1 K . Zonder de indices staat hier twee keer dezelfde combinatie. Voor elke mogelijkheid verliezen we dus de helft. Elke voorkomende vorm noemen we een variatie. Het aantal variaties dat we kunnen maken van een verzameling met n elementen, waarvan er m hetzelfde zijn is dus:
n! . m!
Komen meerdere elementen in een hogere frequentie voor, deel je steeds door het aantal faculteit. Bekijk bijvoorbeeld het woordje ANANAS. Hierin zitten 3 As en 2 Ns Het aantal variaties wordt dan:
6! 720 = = 60 In dit geval is 6 het totale aantal letters in het woord. 3!*2! 6 * 2
2.3 Combinaties
In het speciale geval, waarin een verzameling bestaat uit 2 verschillende elementen, die elk een paar keer voorkomen, dan spreken we over combinaties. Bijvoorbeeld: We gooien een munt 10 keer op. De mogelijke uitkomsten zijn K(ruis) of M(unt) Een mogelijke uitkomst is 6*K en 4*M. In een volgend hoofdstuk zullen we een formule gaan bedenken over de kans dat deze situatie zich voordoet. Nu bepalen we eerst op hoeveel manieren we 6*K en 4*M kunnen krijgen. In dit geval zal dit zijn: (zie ook de vorige paragraaf):
Dit resultaat had je ook kunnen krijgen, door alle mogelijkheden op te schrijven en dan te tellen hoeveel er zijn. Het is niet aan te raden om dit te doen, omdat 210 erg veel is, en er een grote kans bestaat dat je n vergeet of dubbel telt. Het speciale geval van de combinatie komt zo vaak voor, dat we er een eigen notatie voor bedacht hebben. In boven beschreven situatie zullen we schrijven:
10! 6!*7 * 8 * 9 *10 7 * 8 * 9 *10 = = = 210 6!*4! 6!*1 * 2 * 3 * 4 1* 2 * 3 * 4
10 10! ; We spreken dit uit als 10 over 6. 6 = 6!*4! m m! In het algemeen schrijven we: = n n!*(m n )!
Het aantal is:
2.4 Gebruik GR
berekening 7! TI-83 plus Toets in: 7 Kies: MATH Kies: PRB Kies 4: ! ENTER Toets in: 10 Kies: MATH Kies: PRB Kies 3: NCR Toets in: 6 ENTER Casio Toets in: 7 Kies: OPTN Kies: Prob Kies: x! Toets in 10 Kies: OPTN Kies: Prob Kies: nCr
10 6
12
3 ELEMENTAIRE KANSREKENING
In dit hoofdstuk gaan we in op het begrip kansrekening. Allereerst geven we een definitie van het begrip kansrekening en daarna zullen we enkele regels uit de elementaire kansrekening beschouwen. In hoofdstuk 4 pakken we de kansrekening enigszins formeler aan. In de daarop volgende hoofdstukken komen een paar specifieke kansverdelingen aan de orde. In het laatste hoofdstuk komt het toetsen van uitspraken aan de orde.
3.1 Het begrip kans

Voor het begrip kans zijn meer dan een definitie in omloop, afhankelijk van de benadering van de kanstheorie. De eerste definitie is gebaseerd op practische kansrekening: we voeren hierbij een experiment een heel groot aantal malen uit en turven het aantal keer dat een gewenste uitkomst optreedt. Tenslotte delen we die twee getallen op elkaar om de kans op die gewenste uitkomst af te leiden. Bijvoorbeeld: Bij een eerlijke munt is de kans dat kop boven komt naar verwachting even groot als de kans dat munt boven komt. Als dit zo is, dan komt in 50% van alle keren dat we een eerlijke munt opgooien kop boven en in 50% van de gevallen munt. Als we dit bijvoorbeeld 50 keer doen, zullen we constateren dat we meestal niet exact 25 keer kop en 25 keer munt gooien, maar hoe vaker we de munt opgooien, des te dichter de percentages naar 50% kruipen. Dit laatste verschijnsel noemt de wet van de grote getallen. We concluderen hieruit dat de kans op kop inderdaad 0,5 is. Een tweede , meer theoretische, mogelijkheid om de kans op een bepaalde uitkomst te berekenen, is door het aantal verschillende mogelijkheden, dat tot die bepaalde uitkomst leidt te delen op alle mogelijkhede uitkomsten. We geven weer een voorbeeld: Gooi met twee eerlijke dobbelstenen. Probeer uit te rekenen wat de kans is op bij elkaar 4 ogen. Het aantal goede mogelijkheden is 3, namelijk de eerste dobbelsteen is 1 en de tweede dobbelsteen is 3, beide dobbelstenen geven de waarde 2 of de eerste dobbelsteen is 3 en de tweede is 1. In het totaal zijn er 6*6=36 verschillende mogelijkheden. Dit betekent dat de kans op 4 ogen met 2 dobbelstenen is gelijk aan: P(4) = Ook wordt wel geschreven: P(4) = 8,3%
3 1 = = 0,083 36 12
3.2 Som- en productregels

In de vorige paragraaf hebben we een voorbeeld van een kansberekening gezien, waarin we een enkelvoudige eis stelden aan een bepaalde situatie. Er waren twee dobbelstenen, en de enkelvoudige eis was 4 ogen. Op het moment, dat we de eis iets ingewikkelder maken, wordt de berekening ook gelijk ingewikkelder. Veronderstel dat de eis was: of 4 ogen, of 6 ogen. In deze situatie kijken we hoeveel goede mogelijkheden er zijn om achtereenvolgens 4 of 6 ogen te krijgen. Voor 4 ogen weten we dit al, 3 mogelijkheden, namelijk 1,3 2,2 3,1. Voor 6 ogen zijn dar er 5 namelijk, 1,5 2,4 3,3 4,2 5,1. In het totaal zijn er dus 8 mogelijkheden. De kans wordt dan
P(4 of 6) =
8 2 = = 0,2222 36 9
13
In feite is de kans op 4 ogen of 6 ogen gelijk aan de kans op 4 ogen plus de kans op 6 ogen. Het lijkt er dus op, dat we bij een of situatie de kansen gewoon kunnen optellen. Dit is echter niet helemaal juist. Bekijk het volgende voorbeeld: Gegeven is een spel kaarten met 52 kaarten (13 maal ruiten, 13 maal schoppen, 13 maal klaveren en 13 maal harten) Iemand trekt willekeurig een kaart uit dit spel. Wat is de kans, dat deze kaart een aas of een klaveren kaart is? Als we de goede mogelijkheden tellen, krijgen we klaver aas, klaver heer, klaver vrouw, klaver boer, klaver tien, klaver negen, klaver acht, klaver zeven, klaver zes, klaver vijf, klaver vier, klaver drie, klaver 2, ruiten aas, schoppen aas en harten aas. Als we dit goed tellen komen we uit op 16 mogelijkheden. Dit betekent, dat de kans op een klaver of een aas is gelijk aan: P(klaver of aas) = 16 52 Er zijn 13 klaverkaarten in het spel en 4 azen. Dit betekent P(klaver ) =
13 52
en P(aas) =
4 52
Als we deze twee kansen optellen krijgen we 17 52 . In dit geval kunnen we de kansen niet optellen. Dit wordt veroorzaakt, door het feit, dat klaver aas, zowel meetelt bij de klaveren, als bij de azen. Deze kaart tellen we dubbel, terwijl deze in werkelijkheid slechts een maal voorkomt. In dit geval is de doorsnede van de verzameling van de klaveren met de verzameling van de azen niet leeg. In het geval van de twee dobbelstenen met 4 ogen of 6 ogen is deze doorsnede wel leeg. We krijgen de volgende regel (optelregel); P( A B) = P( A) + P( B) mits A B = en anders :
P( A B) = P( A) + P( B) P( A B)
Veranderen we de eis enigszins, en vragen we nu de kans op klaver aas, dan vragen we eigenlijk naar de kans op klaver en aas. We weten al, dat er maar n kaart in het spel is, dat aan deze eis voldoet. We 1 1 4 1 krijgen dus: P(klaveraas ) = 52 . We weten ook: P(klaver ) = 13 en P(aas) = 52 . = 13 52 = 4 Vermenigvuldigen we deze twee laatste kansen met elkaar, dan krijgen we het resultaat van de eerste 1 1 immers 1 4 * 13 = 52 We krijgen de volgende regel (vermenigvuldigregel): P( A B) = P( A) * P( B) Deze regel geldt zolang de beide kansen onafhankelijk van elkaar zijn, dat wil zeggen, dat de kans op het trekken van een aas niet benvloed wordt door de kans op het trekken van een klaveren kaart.
3.3 Voorwaardelijke kans

Tot nu toe hebben we steeds naar kansen gekeken, die over de gehele verzameling gaan. Soms is het echter zo, dat we al informatie hebben over een deel van de verzameling, zodat de berekening van de kans verandert. Een voorbeeld: We gooien een dobbelsteen en zijn genteresseerd in de uitkomst 6. Zonder verdere informatie, kunnen we er vanuit gaan, dat P( x = 6) = 1 , omdat er 6 verschillende mogelijke uitkomsten 6 zijn met elk een gelijke kans op voorkomen. Als we echter als informatie meegeven, dat op voorhand al vaststaat, dat de uitkomst even is (bijvoorbeeld, omdat er steeds twee zijvlakken zijn met 2 ogen, 4 ogen en 6 ogen. Er geldt nu P( x = 6) = 1 3 Er zijn nu immers nog maar 3 verschillende mogelijke uitkomsten met gelijke kans op voorkomen. Voor dit soort kansen gebruiken we een speciale notatie: P( x = 6 even) . Dit betekent: de kans dat de uitkomst van de worp met een dobbelsteen gelijk is aan 6 onder voorwaarde dat al bekend is, dat de uitkomst even zal zijn.
14
P( A B) P( A) Hieruit kunnen we concluderen: P( A B) = P( A B) * P(B )

In formule kunnen we zeggen: P( B A) = Indien A en B onafhankelijk van elkaar zijn, dan geldt: P A B = P( A) De te trekken conclusie is dan: P(A B) = P(A)* P(B) Deze regel zijn we in een vorige paragraaf al tegengekomen als algemene productregel.
( )
3.4 Kansen bij trekkingen met en zonder teruglegging

Neem een bak met in totaal 50 knikkers. 10 knikkers zijn wit, 15 knikkers zijn zwart en 25 knikkers zijn rood. We kunnen ons nu bijvoorbeeld afvragen, wat de kans is, dat we als we twee knikkers uit deze bak pakken, dat de twee knikkers allebei rood zijn. Daarbij is het van belang om af te srpeken hoe we te werk gaan. Allereerst gaan we er van uit, dat het pakken uit de bak gebeurt op een volstrekt willekeurige manier. Je kunt niet in de bak kijken. Het is niet mogelijk om het verschil tussen de diverse knikkers te voelen. Verder is het van belang, dat we afspreken hoe we de knikkers uit de bak pakken: in principe zijn er twee mogelijkheden. trekking met teruglegging: we pakken 1 knikker, kijken welke kleur de knikker heeft en gooien de knikker weer terug in de bak. Vervolgens hutselen we de knikkers door elkaar en pakken opnieuw een knikker. trekking zonder teruglegging We pakken 1 knikker, kijken welke kleur deze heeft en laten hem naast de bak liggen. Vervolgens trekken we een nieuwe knikker uit de bak.
3.4.1 Trekking met teruglegging

Als eerste bekijken we het systeem met teruglegging. De kans dat de eerste keer een rode knikker 25 getrokken wordt is P(rood ) = 50 =1 2 Aangezien de getrokken knikker weer teruggegooid wordt in de bak en de inhoud van de bak flink door elkaar geschud wordt, is de situatie voor het trekken van de tweede knikker volkomen identiek aan de 25 sitatie bij het trekken van de eerste knikker. De kans is dus wederom P(rood ) = 50 =1 2
1 1 De kans op het trekken van twee rode knikkers wordt dan: P(2 * rood ) = 1 2*2 = 4 Bij de tweede situatie (het trekken zonder teruglegging), is het iets ingewikkelder. 25 Voor het trekken van de eerste knikker maakt het niets uit. P(rood ) = 50 =1 2 Bij de tweede knikker is de situatie veranderd. In de bak zitten nu slechts 49 knikkers, waarvan er 10 wit, 15 zwart en 24 rood zijn. We zijn op zoek naar de kans op het trekken van 2 rode knikkers. Wil de actie succesvol zijn, dan moeten we er vanuit gaan, dat de eerste trekking een rode bal opgeleverd heeft. Dit is dus een voorbeeld van een voorwaardelijke kans uit de vorige paragraaf. De kans dat de tweede knikker rood is wordt: P(rood ) = 24 49 24 In deze situatie wordt de kans op twee rode knikkers: P(2 * rood ) = 1 2 * 49 = 12 49
Stel nu dat we niet de kans op twee rode knikkers hadden willen uitrekenen, maar de kans op een witte knikker en een zwarte knikker.
15
De volgorde waarin we de knikkers trekken is kennelijk niet van belang, want er is geen eis gesteld aan de volgorde. Zowel eerst een witte knikker en dan zwarte knikker is goed, als eerst een zwarte knikker en dan een witte. In de situatie waarin we de getrokken knikker weer terug leggen, zijn beide kansen gelijk. 15 150 3 Immers, de kans op eerst een witte knikker en daarna een zwarte knikker is: P( wz ) = 10 50 * 50 = 2500 = 50
10 De kans op eerst een zwarte en daarna een witte knikker is: P( zw) = 15 50 * 50 = De kans op een witte en een zwarte knikker in willekeurige volgorde is: 150 2500
3 50
P(1wit en1zwart ) = P(wz ) + P( zw) =
3 50
3 + 50 =
3 25
Veronderstel, dat we het probleem nog wat groter maken, door te vragen naar de kans op 3 witte en 5 zwarte knikkers. Zouden we de knikkers na trekking weer teruggegooid hebben in de bak, dan moet er ook vermenigvuldigd worden met het aantal mogelijkheden, waarop we 3 witte en 5 zwarte knikkers kunnen ordenen, alleen de kans per trekking van 8 knikkers veranderd. Deze kans wordt: P(wwwzzzzz) =
10 3 50
* 15 50 = 0,000019
8 3
Als de volgorde er niet toe doet, dan krijgen we P(3 * w + 5 * z ) = * P( wwwzzzzz ) = 0,00109 .
k nk Algemeen geldt voor een trekking met teruglegging: P(k ) = * p * (1 p) . Deze formule staat
ook wel bekend als de kansfunctie voor de Binomiaal verdeling en komt in H6 verder aan bod.
n k
3.4.2 Trekking zonder teruglegging: Hypergeometrische trekking

We gaan weer even terug naar het probleem van trekking van 2 knikkers en de kans op 1 witte en 1 zwarte. In de situatie, waarin we de getrokken knikker niet terugleggen geldt het volgende:
15 150 3 P( wz ) = 10 50 * 49 = 2450 = 49 10 150 3 P( zw) = 15 50 * 49 = 2450 = 49
Ook hier zien we weer, dat beide kansen gelijk zijn. In eerste instantie lijkt dit toeval, omdat de breuken, die met elkaar vermenigvuldigd worden van elkaar verschillen, maar bij nadere analyse blijkt, dat het product in de teller uit dezelfde factoren bestaat. De noemers zijn zelfs identiek. 3 6 Hier zal dan ook gelden: P(1wit en 1zwart ) = P( wz ) + P( zw) = 2 * 49 = 49 De factor 2 , waarmee in beide gevallen wordt vermenigvuldigd, staat voor het aantal mogelijkheden, dat bestaat om een witte knikker en een zwarte knikker te ordenen. Veronderstel, dat we het probleem nog wat groter maken, door te vragen naar de kans op 3 witte en 5 zwarte knikkers. Veronderstel, dat we dit doen zonder teruglegging. In zon geval kiezen we een correcte combinatie. Bijvoorbeeld wit,wit,wit,zwart,zwart,zwart,zwart,zwart. Vervolgens vermenigvuldigen we deze kans met het aantal mogelijkheden, die we kennen om 3 witte en 5 zwarte knikkers te ordenen. In het vorige hoofdstuk hebben we gezien, dat dit aantal te verkrijgen is door de formule n = =
8! 6 * 7 *8 = = 56 3!*5! 1 * 2 * 3 8 10 9 8 15 14 13 12 11 P(3 * w en 5 * z ) = 3 * 50 * 49 * 48 * 47 * 46 * 45 * 44 * 43 = 0,00067
8 3
Deze methode van berekening noemen we bottom-up.
16
Je kunt de kans bij trekking zonder teruglegging ook Top down berekenen. Als je wil berekenen wat de kans is op 3 witte en 5 zwarte, dan gebruik je de volgende definitie voor kans: P(3w5z)=(aantal verschillende manieren waarop ik 3 witte en 5 zwarte kan trekken) / (totaal aantal manieren waarop ik 8 knikkers kan trekken) . Bedenk: het aantal manieren waarop ik 3 witte uit die in totaal 10 witte kan
10 15 ; het aantal manieren waarop ik 5 zwarte uit die in totaal 15 zwarte kan trekken is 5 ; 3 50 en tenslotte het aantal manieren waarop ik 8 knikkers uit de bak van 50 kan trekken is 8 ; Dus geldt: 10 15 3 * 5 = 0,00067 : gelukkig, de kans dat ik 3 witte en 5 zwarte uit die 50 trek is dan: P(3w,5 z ) = 50 8
trekken is er komt hetzelfde uit
17
4 KANSFUNCTIES
In het vorige hoofdstuk hebben we op een intutieve manier aan kansrekening gedaan. Om er iets meer structuur in aan te brengen gaan we van af nu met zogenoemde kansvariabelen en kansfuncties werken. In dit hoofdstuk wordt uitgelegd wat er onder een kansvariabele en een kansfunctie wordt verstaan en wat voor soort kansvariabelen we tegen kunnen komen
4.1 Kansvariabelen
In het vorige hoofdstuk hebben we kennisgemaakt met het begrip kans. Om goed aan kansente kunnen rekenen, moeten we werken met variabelen, die goed te kwantificeren zijn. Dus bijvoorbeeld het aantal autos dat een kruising passeert, of het gemiddeld aantal autos dat het kruispunt per uur passeert. Als we bijvoorbeeld de merken registreren, die de kruising passeren, kunnen we wel spreken over het aantal merken, dat in 1 uur de kruising passeert, of het gemiddeld aantal autos per merk, maar niet het gemiddelde merk. We zullen nu een kansvariabele als volgt definiren. Een kansvariabele is een functie, die aan de uitkomst van een kansexperiment een reel getal toevoegt. Een kansvariabele noemen we officieel ook wel een stochastische variabele genoemd, of kortweg een stochast. We onderscheiden twee types kansvariabelen: discrete kansvariabelen continue kansvariabelen Bij discrete variabelen hebben we te maken met uitkomsten, die van elkaar te onderscheiden zijn. Als voorbeeld kunnen we denken aan het aantal kinderen in een gezin. (Dit zijn er altijd 0, 1, 2, 3 enz en nooit 1,5 of 1,3) of het aantal ogen dat met een dobbelsteen geworpen kan worden. Heel vaak geven we discrete kansvariabelen aan met k en de uitkomst van de kansvariabele met k Als we dus schrijven: P(k = k ) dan bedoelen we de kans, dat de uitkomst van kansvariabele k gelijk is aan k . Bij een dobbelsteen zouden we bijvoorbeeld kunnen uitrekenen: P(k = 3). Dit is dus de kans, dat bij een dobbelsteen met 1 worp 3 ogen worden geworpen. Bij continue kansvariabelen, is er geen ruimte tussen twee opeenvolgende gebeurtenissen. Als voorbeeld van een continue kansvariabele geldt bijvoorbeeld de tijd die verstrijkt tussen twee elkaar opvolgende gebeurtenissen. In feite kan dit elk willekeurig getal zijn. Bij continue kansvariabelen hebben we ook altijd te maken met oneindig veel variabelen, terwijl dat bij discrete kansvariabelen niet perse noodzakelijk is. Bij het aantal ogen, dat je met 1 dobbelsteen kan gooien, hebben we maar te maken met 6 kansvariabelen (maximaal). Veelal geven we continue kansvariabelen aan met x
4.2 Kansfunctie en verdelingsfunctie

In deze paragraaf houden we ons bezig met het beschrijven van een kansvariabele. Zowel bij discrete variabelen k als bij continue variabelen x hebben we een uitkomstenverzameling, die bestaat uit rele getallen. Bij de getallen uit deze verzameling behoren kansen. Deze kansen voldoen
18
uiteraard aan de kansregels. De beschrijving van deze kansen noemen we de kansfunctie f (k ) bij een discrete kansvariabele en de kansdichtheidsfunctie f (x ) bij een continue kansvariabele.
4.2.1 kansfunctie met discrete kansvariabelen Bij een discrete variabele k kan de kansfunctie f (k ) worden beschouwd als een rijtje kansen, die uit het
experiment verkregen zijn. Als voorbeeld nemen we de kansfunctie bij het tegelijk werpen van twee dobbelstenen: De mogelijke uitkomsten zijn 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 We berekenen achtereenvolgens: 1 1 (Dit is de kans dat beide dobbelstenen een 1 opleveren. f (2) = P(k = 2) = 1 6 6 = 36
2 1 f (3) = P(k = 3) = 36 = 18 3 1 f (4) = P(k = 4) = 36 = 12 4 f (5) = P(k = 5) = 36 =1 9 5 f (6) = P(k = 6) = 36 6 f (7) = P(k = 7 ) = 36 =1 6 5 f (8) = P(k = 8) = 36 4 f (9) = P(k = 9) = 36 =1 9 3 1 f (10) = P(k = 10) = 36 = 12 2 1 f (11) = P(k = 11) = 36 = 18 1 f (12) = P(k = 12 ) = 36
Een kansfunctie moet aan twee eisen voldoen. - De functiewaarde is voor iedere k positief of 0. - De som van alle functiewaarden moet samen 1 zijn. Bij controle blijkt dat deze lijst met functiewaarden aan beide eisen voldoet.
4.2.2 Kansdichtheidsfunctie met continue kansvariabelen.

Bij continue kansvariabele kunnen we niet langer de functiewaarde in een bepaald punt geven. Hier zal per definitie immers altijd 0 uitkomen. Wel kunnen we de kansfunctie geven voor een bepaald interval. Als je bijvoorbeeld een groot aantal zakken met aardappels hebben, waarvan we weten, dat het gewicht per zak kan variren en het gemiddelde gewicht 20 kg is, dan kunnen we wel aangeven wat de kans is dat het gewicht van een willekeurige zak ligt tussen 19,81 en 19,83. Voor deze kans zal gelden:
19,83
P(19,81 < x < 19,83) =
19,81
f ( x)dx
Voor f ( x) moet dan weer wel gelden: - f ( x) 0 voor elke x
f ( x)dx = 1
19
4.2.3 Kansverdelingsfunctie
Een begrip dat direct in verband te brengen is met de kansfunctie, is de verdelingsfunctie F ( k ) . Onder bepaalde omstandigheden kan het nuttig zijn om te rekenen met cumulatieve kansen. We bekijken dan niet de kansen f (k ) van diverse losse punten, maar we werken met F (k ) = P(k k ). De functie F ( k ) geeft de kans aan dat de variabele k een waarde aanneemt kleiner of gelijk aan een bepaalde grenswaarde k . Voor F ( k ) gelden de volgende eigenschappen: - F ( k ) is niet dalend - F (k ) = 0 voor k < min(k ) -
F (k ) = 1 voor k > max k )

F (k ) =
min( k )
P(k = k )
Indien f ( x) een continue verdeling is, geldt voor de laatste bewering:

x
F ( x) =
f ( x)dx
4.3 Verwachtingswaarde en variantie

Zoals we in hoofdstuk 1 gezien hebben, kunnen we van een verzameling de gemiddelde waarde uitrekenen. De betekenis van het gemiddelde was, dat als we elk element uit de verzameling zouden vervangen door de gemiddelde waarde, de uitkomst van de som van alle elementen gelijk zou zijn aan het aantal elementen maal de gemiddelde waarde. Als we nu de kans op een bepaalde gebeurtenis opvatten als een gestandaardiseerde frequentie, waarmee deze gebeurtenis optreedt, kunnen we ook hiervan de gemiddelde waarde berekenen. Deze gemiddelde waarde geven we in de kansrekening aan met de verwachting of de verwachtingswaarde. Deze wordt meestal aangegeven met E(k ) of Indien we met een discrete kansverdeling te maken hebben geldt: E = =
alle k
k * P(k = k )
alle k
P(k = k )
alle k
Omdat we in het begin van dit hoofdstuk al geconcludeerd hebben, dat ook schrijven als: E = =
P(k = k ) = 1 kunnen we dit
alle k
k * P(k = k )
Voorbeeld: Bereken de verwachting van het gooien met een dobbelsteen. In feite wordt hier dus gevraagd naar de gemiddelde uitkomst bij het gooien van een dobbelsteen. We gaan ervan uit dat de kans op 1, 2, 3, 4, 5 of 6 even groot is. In dit geval betekent dit:
P(x = 1) = P(x = 2) = P(x = 3) = P(x = 4)P(x = 5) = P(x = 6) = 1 6 1 1 1 1 1 21 1 We krijgen: = 1 * 1 + * 2 + * 3 + * 4 + * 5 + * 6 = = 3 6 6 6 6 6 6 6 2
20
Bij een continue kansverdeling wordt het sommatieteken vervangen door een integraalteken. We krijgen
dan: =
xP(x )dx
Hier geldt ook weer:
P(x )dx
P(x )dx = 1
De formule wordt dan:
xP (x )dx
Bij het bepalen van het gemiddelde hebben we ook gekeken of we iets kunnen zeggen over een maat om te kunnen constateren hoeveel een willekeurige uitkomst afwijkt van het gemiddelde. Een standaardmaat was daar de standaardafwijking. Ook bij de kansrekening gebruiken we de standaardafwijking . Ook komt vaak het begrip variantie voor. Var(x ) = 2 . Voor de formule van de standaardafwijking gebruiken we een formule, die analoog is aan de formule in de statistiek. Voor een discrete verdeling krijgen we voor de variantie:
Var(k ) = 2 =
alle k
P(k = k )* (k )
alle k
en voor de standaardafwijking: =
P(k = k )* (k )
Voor de continue verdeling geldt: Var(x ) =
P(x )* (x ) dx

en =
P(x )dx
P(x )* (x ) dx
4.4 Rekenregels
In de praktijk komt het vaak voor, dat een bepaalde kansvariabele wordt omgebouwd naar een andere kansvariabele: stel dat bij een bepaald bedrijf gegeven is, dat het gemiddelde bruto maandsalaris gelijk is aan 2000,- Door een salarismaatregel krijgt iedere werknemer 5% meer salaris. Wat zal nu het gemiddelde bruto maandsalaris worden? Veronderstel, dat de diverse salarissen weergegeven worden door xi en de frequentie, waarin deze salarissen voorkomen gelijk is aan f i . In dit geval geldt dat het gemiddelde x =
alle i
fx
i alle i
De nieuwe salarissen worden allemaal 5% hoger. Dat wil zeggen 1.05 * xi . Voor het gemiddelde zal dan gelden: x nieuw =
alle i
1,05 * x
alle i
* fi = 1,05 *
alle i
* fi = 1,05 * x
i
alle i
In het algemeen zal gelden, dat als we elk element uit een verzameling met vermenigvuldigen, wordt ook het gemiddelde met wordt vermenigvuldigd.
21
Kijken we nu naar de variantie, dan geldt: Var (x ) =
alle i
(x x )
i alle i
* fi
.
f
2
De formule voor de variantie na vermenigvuldiging met wordt dan:
Var( x ) =
alle i
( * x * x )
i alle i
* fi =
2 * x xi * f i
alle i alle i
fi
fi
= 2Var(x )
We krijgen dus als regel: Als we elk element uit een verzameling met vermenigvuldigen, wordt de variantie met 2 vermenigvuldigd. Voor de standaardafwijking geldt dat dit de wortel uit de variantie is. In dit geval betekent dit dat de standaardafwijking met vermenigvuldigd wordt. Het maakt dus niet uit of positief of negatief is. In beide gevallen neemt de standaardafwijking met een factor toe. Op dezelfde manier kunnen we aantonen, dat als we bij ieder element uit de verzameling een getal optellen, dan zal ook het gemiddelde met toenemen. Als we nu echter naar de variantie kijken, zullen we zien, dat het verschil tussen het nieuwe gemiddelde en de nieuwe elementen niet verandert, immers beide nemen met dezelfde waarde toe. Er zal dus gelden: Var(x + ) = Var(x) Voor de standaardafwijking geldt hetzelfde. Deze zal dus ook niet veranderen, als bij elk element uit de verzameling een zelfde getal wordt opgeteld. Op vrijwel identieke manier kunnen we afleiden, dat als we twee verschillende verzamelingen hebben, de ene met een verwachtingswaarde 1 en de andere met een verwachtingswaarde 2 , dat de totale verwachtingswaarde wordt
1 + 2 . Voor de variantie geldt dan: Var(x) + Var( y ) = Var(x + y )
Overigens geldt ook: Var(x y ) = Var(x) + Var( y ) We geven tot slot nog een samenvatting van bovenstaande regels:
E( k ) = E(k ) E(k + ) = E(k ) +
Var( k ) = 2Var(k )
k = k
Var(k + ) = Var(k )
E(k 1 + k 2 ) = E(k 1 ) + E(k 2 ) Var(k 1 + k 2 ) = Var(k 1 ) + Var(k 2 ) k1 +k 2 = k21 + k22 E(k 1 k 2 ) = E(k 1 ) E(k 2 ) Var(k 1 k 2 ) = Var(k 1 ) + Var(k 2 ) k1 k 2 = k21 + k22
NB: Tel NOOIT de sigmas bij elkaar op, de varianties mogen WEL bij elkaar worden opgeteld!!!
22
5 DE NORMALE VERDELING
In het vorige hoofdstuk is de kansdichtheidsfunctie en de kansfunctie besproken. In de hoofdstukken 5, 6 en 7 komen de drie belangrijkste kans(dichtheids)functies aan bos In dit hoofdstuk wordt een continue kansfunctie besproken, namelijk de normale verdeling. In de twee volgende hoofdstukken worden twee discrete kansfuncties besproken: de binomiale verdeling en de Poissonverdeling.
5.1 Introductie Normale Verdeling

Als ik een inventarisatie zou maken van het gewicht van alle -mannelijke- eerstejaars studenten in Nederland en ik zou deze gewichten uitzetten in een frequentietabel en ik zou de aantallen met elkaar verbinden door een vloeiende lijn dan zou ik een figuur krijgen die er uitziet als in onderstaande figuur:
Maar het bijzondere is dat we een dergelijke klok-vorm ook tegenkomen als we de lengte van studenten, of de gewichten van appels uit een bepaalde boomgaard, of de lengte van voeten van een bepaalde leeftijdscategorie inventariseren en grafisch uitzetten. Overal om ons heen duikt een dergelijke frequentiegrafiek op en hieraan dankt deze verdeling dan ook zijn naam Normale Verdeling of Normaalverdeling. Blijkbaar zit achter iedere Normale verdeling eenzelfde kansdichtheidsverdeling verscholen, maar daarovcer meer in de volgende paragraaf. Eerst noemen we nog even de drie aspecten op waardoor elke Normaalverdeling wordt gekenmerkt: de symmetrische klokvorm, en dat is wat het een Normaalverdeling maakt, de ligging van het midden, de waarde ook die de hoogste kans heeft. We duiden die aan met verwachtingswaarde E of , de halve breedte op halve hoogte, die we aanduiden met standaarddeviatie . Een willekeurige Normaalverdeling wordt aangeduid als N(, var) of ook wel N(, 2).
5.2 de Standaardnormaal verdeling

Als we nu een willekeurige Normaalverdeling bezien, bijvoorbeeld die van de gewichten, en we trekken van alle gemeten gewichtswaarden het gemiddelde gewicht () af, dan krijgen we een verdeling die rond de 0 slingert. Als we verder de x-as herschalen door de x-waarden te delen door de waarde van , dan
23
blijken we een kansdichtheidsfunctie te krijgen die bij een waarde van 4 is uitgedoofd (0 is geworden). En als we dit proces bij alle andere normaalverdelingen herhalen, blijken alle normaalverdelingen na deze transformatie over elkaar heen te vallen, mits we ze ook nog even allemaal in verticale richting normeren. Alle willekeurige normaalverdelingen zijn dus via de transformatie z =
dezelfde kansdichtheidsfunctie: de Standaard Normaal verdeling, een Normaalverdeling met =0 en =1. Deze functie wordt beschreven door de formule: f ( z ) =
0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 - -4 -3 -2 -1 0 1 2 3 4
te reduceren tot een en
1 2
1 z2 2
en ziet er als in onderstaande figuur:
5.3 wiskunde van de Normaalverdeling

De formule van de normale verdeling wordt gegeven door: ; Hierin is de standaardafwijking en het gemiddelde. e 2 Om aan te tonen, dat f ( x) een echte kansverdelingis, moeten we aantonen, dat f ( x) > 0 voor alle x . Dit is eenvoudig want een exponentiele functie is altijd overal positief.
f ( x) =
x 1 2
Verder moet gelden:
achterwege laten. Om nu uit te rekenen wat de kans is dat x tussen x1 en x2 ligt, kunnen we de volgende integraal opschrijven:
x2 x2
f ( x)dx = 1. Dit is een stuk lastiger om te bewijzen. We zullen het bewijs hier
2
P( x1 < x < x 2) =
x1
f ( x)dx =
x1
1 2
x 1 2
dx
maar gelukkig hebben we de GR of desnoods tabellen om deze integraal uit te rekenen.
24
5.4 Kansrekening met een normaalverdeling

5.4.1 De normale verdeling berekenen met de GR
Vb1. De GR heeft de beschikking over een aantakl voorgeprogrammeerde kans(dichtheids)functies. Stel je hebt een verdeling met een gemiddelde van 273 en een standaarddeviatie van 35 en je wil uitrekenen wat in deze verdeling de kans is op producten tussen de 270 en 280. Vb2. Stel dat je wil weten beneden welke grens er nog maar 5% van de producten is
berekening Vb1: P(270<x<280) TI-83 plus Kies: [second] VARS (=DISTR) Kies: 2: NORMALCDF Voer in: NORMALCDF( og, bg, , ) NORMALCDF(270,280,273,35)=0,1134 Casio Kies: Stat scherm Kies: DIST (5e tabblad) Kies: NORM (1e tabblad) Kies: Ncd Voer in: lower: 270 upper: 280 : 35 : 273 Kies: Stat scherm Kies: DIST (5e tabblad) Kies: NORM (1e tabblad) Kies: InvN Voer in: area: 0.05 : 35 : 273
Vb2: P(x<?)=0.05
Kies: [second] VARS (=DISTR) Kies: 3: INVNORM Voer in: INVNORM( p, , ) INVNORM( 0.05,273,35)=215.43
5.4.2 De tabel van de normale verdeling.

Toen er nog geen rekenmachines waren met voorgeprogrammeerde kansfuncties, zoals de GR van vandaag, werd kansberekening gedaan aan de hand van tabellen. Voor de volledigheid leggen we dat maar even hier uit, de tabellen zijn voor de volledigheid als Annex bijgevoegd. Zoals we in de vorige paragraaf zagen, stuiten we bij de normale verdeling op een bepaalde interaal, die lastig is uit te rekenen. Gebleken is, dat deze integraal wel uit te rekenen is langs numerieke weg. De uitkomst van deze integraal kunnen we dan via een tabel weergeven. Het probleem hierbij is echter dat we te maken hebben met steeds andere waarden voor het gemiddelde en de standaardafwijking. Als we echter in de formule van de integraal de x vervangen door een variabele z , die gedefinierd wordt door
z=
integraal. De uitkomsten van deze integraal kunnen we in een tabel weergeven, die slechts 1 bladzijde in beslag neemt. (Zie Appendix A, op blz. 25 ). Als we naar de grafiek van de normale verdeling kijken, zien we, dat deze symmetrisch is ten opzichte van de gemiddelde waarde. Dit betekent, dat we in een tabel alleen maar de waarde hoeven op te geven voor de waarden groter dan de gemiddelde waarde. Voor de variabele z hoeven we dus alleen maar een tabel te maken voorzover deze waarde groter is dan of gelijk aan 0. Verder blijkt uit de tabel, dat de overschrijdingswaarde van de kans bij z > 4,0 zeer dicht bij 0 ligt. We hebben een tabel nodig waarin z loopt van 0 tot 4,0. In Appendix A vindt je een tabel, waarin z loopt van 0 tot 3,99. In de eerste kolom vindt je de waarde van z in 1 decimaal. In de rest van de kolommen staat de kans, die gegeven wordt door P 0 < x < z , waarin z de waarde is, die in de eerste kolom staat, gevolgd door een tweede decimaal, die boven al de overige kolommen staat. Dus als z = 1,23 , dan kijken we in een rij, waarin in de eerste kolom staat 1,2 en kijken vervolgens naar de waarde in dezelfde rij, maar dan in de kolom waar helemaal bovenaan staat 3. De waarde, die we aflezen is de kans, dat de uitkomst van z ligt tussen 0 en 1,23. We geven een voorbeeld. In een koelhuis staan een groot aantal kisten gevuld met appels. Het gemiddelde gewicht van een kist met appels is 20 kg met een standaardafwijking van 0,2 kg. Gevraagd wordt om de kans te bepalen, dat een willekeurige kist, die we uit het koelhuis pakken een gewicht heeft van meer dan 20,3 kg.
, dan blijkt dat we alle problemen terug kunnen brengen naar een gestandaardiseerde
25
Eerst gaan we z berekenen. In dit voorbeeld is de grenswaarde x gelijk aan 20,3 kg. dit geval 20 kg en is de standaardafwijking, hier is gelijk aan 0,2 kg.
is het gemiddelde, in
z=
20,3 20 = 1,5 0,2
In de tabel van de normale verdeling zoeken we in de linker kolom de waarde 1,5. In de kolom ernaast, vinden we op dezelfde regel de waarde voor 0< z < 1,50. Deze waarde is: 0,4332. De kans, dat z > 1,50 is in dit geval: 0,5000 0,4332 = 0,0668 Veronderstel, dat we de kans willen bepalen om een kist appels te pakken, die een gewicht heeft tussen 19,9 en 20,2 kg, dan moeten we het volgende berekenen. Allereerst berekenen we de waarde van Voor
z . Voor x = 19,9 krijgen we: z =
19,9 20 = 0,5 0,2
20,2 20 =1 0,2 We moeten dus bepalen, wat de kans is dat 0,5 < z < 1
x = 20,2 krijgen we: z =
Hiertoe verdelen we het interval in twee stukken, namelijk 0,5 < z < 0 en 0 < z < 1 Voor het tweede gedeelte kunnen we de kans rechtstreeks uit de tabel aflezen. We vinden: P 0 < z < 1 = 0,3413. De tabel voorziet echter niet in negatieve waarden van z . We hebben echter al eerder opgemerkt, dat de grafiek van de normale verdeling symmetrisch is. Dit betekent dat P 0,5 < z < 0 = P 0 < z < 0,5 . De kans in het rechterlid van de vergelijking
kunnen we weer rechtstreeks uit de tabel van de normale verdeling aflezen. Deze kans is Hieruit volgt, dat
0,5328
0,1915 P( 0,5 < z < 1) = P( 0,5 < z < 0) + P(0 < z < 1) = 0,3413 + 0,1915 =
5.5 Betrouwbaarheidsintervallen
Bij Normaalverdelingen is het handig gebruik te maken van zgn. betrouwbaarheidsintervallen, oftewel intervallen waarbinnen een bepaald percentage van de verzameling voorkomende waarden zich bevindt. Zo ligt 95% van alle waarden van een Normaalverdeling N(, 2) tussen -1,96* en +1,96*.
We spreken dan ook wel van een 95% betrouwbaarheidsinterval: -1,96* < x < +1,96*. Je kan het ook zo begrijpen: de uitspraak alle waarden liggen tussen -1,96* en +1,96* is slechts in 95% van alle gevallen waar en is dus voor 95% betrouwbaar. Dat getal 1,96 vinden we als volgt: als ik met mn GR ( mbv de inversenormaal functie) voor de Standaardnormaalfunctie wil berekenen beneden welke z-waarde ik nog maar 2,5% kans vind, dan krijg ik z= -1,96 als uitkomst. En als ik wil weten boven welke z waarde nog maar 2,5% kans ligt, dan vindt ik z= +1,96. Pakken we vervolgens de transformatie formule z = krijgen we 1,96 =
en vullen we voor z in 1,96 dan
De meeste betrouwbaarheidsintervallen zijn: 90%: -1, 456* < x < +1,645* 95%: -1,960* < x < +1,960* 99%: -2,575* < x < +2,575*
oftewel: 1,96 = x en dus vinden we:
1,96 = x
26
5.6 combinaties van normale verdelingen

Een belangrijke stelling in de statistiek van Normaalverdelingen is de volgende: Elke willekeurige combinatie van Normaalverdeelde variabelen is zelf ook weer Normaalverdeeld. Deze stelling maakt het o.a. mogelijk om een kansberekening te doen voor bijvoorbeeld het gewicht van een aantal passagiers samen, als ik de verdeling van het gewicht van de individuele passagier weet. Maar vele andere nuttige toepassingen bestaan hiervan. We noemen enkele voorbeelden. voorbeeld 1: het gewicht van 4 passagiers samen Stel dat we weten dat de lichaamsgewichten x van volwassen passagiers Normaal verdeeld zijn, met = 75 kg en = 12. We schrijven dan: x N (75;144) ofx N (75;12 2 )
Bereken nu de kans dat 4 passagiers samen meer weken dan 250 kg. We hebben nu niet variabele x, waar het om gaat, maar we hebben een nieuwe variabele x1 + x2 + x3 + x 4; waarbij xn N (75;144) . Om te kunnen rekenen moeten we eerst van deze nieuwe variabele de verwachtingswaarde en de variantie uitrekenen. Mbv de rekenregels uit het vorige hoofdstuk vinden we: E ( x1 + x 2 + x3 + x 4) = E ( x1) + E ( x 2) + E ( x3) + E ( x 4) = 300 en: var( x1 + x2 + x3 + x4) = var( x1) + var( x2) + var( x3) + var( x4) = 576 en dus:
sigma ( x1 + x 2 + x3 + x 4) = 576 = 24
Nu kunnen we berekenen met de GR: P(x1+x2+c3+x4>250)=normalcdf(250, 10000, 300, 24)=.....
Voorbeeld 2: het Passingsprobleem

We bekijken het volgende probleem: Op een bouwplaats staan 2 kisten, waarvan de ene gevuld is met moeren, waarvan de opening een wijdte heeft van 11 mm met een standaardafwijking van 0,5 mm. In de andere kist zitten bouten, met een steeldikte van 10,9 mm en een standaardafwijking van 0,3 mm. Een werknemer pakt uit de beide kisten een bout en een moer. Wat is de kans, dat deze bout en moer passend zijn? (Hierbij veronderstellen we dat een bout en een moer passend zijn, als de steeldikte van de bout 0,1mm of minder kleiner is dan de wijdte van de opening van de moer. ) Dit probleem lijkt op het eerste gezicht een lastig probleem, omdat het lijkt, dat deze kans erg afhankelijk is van de bout of de moer, die we als eerste pakken. Als we dit probleem echter iets nauwkeuriger bekijken, kunnen we iets zeggen over het gemiddelde verschil van de wijdte van de opening van de moer en de steeldikte van de bout. Ook kunnen we iets zeggen over de standaardafwijking van dit verschil. Laten we eerst eens kijken naar het gemiddelde verschil. Voor de wijdte van de opening van de moer geldt: moer = 11,0 Voor de gemiddelde steeldikte geldt: bout = 10,9 De verwachte waarde voor het verschil zal zijn: Voor de standaardafwijking geldt: moer
= moer bout = 11 10,9 = 0,1 = 0,5 en bout = 0,3

2 2 moer + bout
In het vorige hoofdstuk hebben we al gezien, dat zal gelden: verschil =
Pas op! Ook al kijken we hier naar het verschil van twee verzamelingen, voor de standaardafwijking geldt dat de twee kwadraten moeten worden opgeteld. We krijgen dus:
verschil = 0,52 + 0,32 = 0,34 = 0,583
27
berekening P(0.0<v<0.1)
TI-83 plus Kies: [second] VARS (=DISTR) Kies: 2: NORMALCDF Voer in: NORMALCDF( og, bg, , ) NORMALCDF(0.0, 0.1, 0.1, 0,583)= =0,0681
Casio Kies: Stat scherm Kies: DIST (5e tabblad) Kies: NORM (1e tabblad) Kies: Ncd Voer in: lower: 0.0 upper: 0.1 : 0.583 : 0.1
Conclusie: De kans op een passende bout en moer is dus slechts 6,81%
5.7 de verdeling van het gemiddelde van een steekproef

Stel dat we alle eerstejaars van nederland een tentamen statistiek laten doen. We weten dan zeker dat de cijfers uiteen zullen lopen van 1 tot 10. Maar nu gaan we al die eerste willekeurig bij elkaar zetten in klassen van zeg- 20 studenten. En van al die klassen van 20 studenten bereken we het gemiddelde cijfer dat de studenten van een klas voor hun tentamen statistiek hebben gehaald. Zouden de klassegemiddelden ook uiteen lopen van 1 tot 10? Ik denk het niet: want er is nooit een klas waarbij toevallig- alle 20 studenten een 1 hebben gehaald, net zomin als er een klas zal zijn waarbij alle studenten weer heel toevallig- een 10 hebben gescoord. Nee, je gevoel zegt je dat die klassegemiddelden zullen varieren tussen de 3,5 en de 7,5. Je gevoel is juist en dat kun je ook eenvoudig bewijzen: bedenk: x n =
x
i =1
Een gemiddelde is niets anders dan een combinatie van afzonderlijke variabelen x. Dus als voor de waarden van x geldt dat ze normaal verdeeld zijn, dan geldt dus ook dat de gemiddelden normaal verdeeld
2 moeten zijn. Maw: als x N ( ; x ) dan geldt: x N ( x ; x ) Maar de verwachtingswaarde van het gemiddelde is natuurlijk dezelfde als de verwachtingswaarde van alle waarden x apart. En voor de variantie van het gemiddelde geldt:
n xi x var(xi ) 1 n 1 ; en dus geldt: x = !!! var( x n ) = var i =1 = 2 var xi = 2 n var(xi ) = n n n n i =1 n Dit bepaalt het verschil in de verdeling van de individuele waarden en die van de gemiddelden:
x
De zwarte grafiek geeft de ligging van de individuele waarden x weer en de blauwe lijn die van de gemiddelden x n van een steekproef van n individuele waarden. 28
5.7.1 betrouwbaarheidsintervallen voor het gemiddelde van een steekproef

Als het gemiddelde x n ook normaalverdeeld is, dan kunnen we natuurlijk ook betrouwbaarheidsintervallen geven voor de ligging van het gemiddelde van een steekproef van n waarden. Het 90% betrouwbaarheidsinterval voor x n is gegeven door:
1,645 x < x < + 1,645 x oftewel: 1,645 x < x < + 1,645 x

n n
Het 95% betrouwbaarheidsinterval voor x n is gegeven door:
1,960 x < x < + 1,960 x oftewel: 1,960 x < x < + 1,960 x

n n
En het 99% betrouwbaarheidsinterval voor x n is gegeven door:
2,575 x < x < + 2,575 x oftewel: 2,575 x < x < + 2,575 x

n n
29
6 DE BINOMIALE VERDELING
In het vorige hoofdstuk hebben we kennis gemaakt met een continue verdeling. In dit hoofdstuk en het
volgende hoofdstuk bekijken we discrete verdelingen. In dit hoofdstuk bekijken we een eindige discrete verdeling. In het volgende een onbegrensde discrete verdeling.
6.1 Binomiale kansformule

De binomiale verdeling is een verdeling waarbij maar twee mogelijke uitkomsten mogelijk zijn. Als voorbeelden noemen we de uitkomsten van een multiple choice test. (Antwoorden zijn goed of fout.), het gooien van een munt (Kop of munt), het schieten met pijl en boog (roos of niet) en het gooien met een dobbelsteen (je gooit een zes, of je gooit geen zes). Het is bovendien een trekking waarbij de kans op succes een vaste waarde heeft. Eigenlijk is een ander woord voor een binomiale kansverdeling ook wel de verdeling voor een trekking met teruglegging (zie hoofdstuk 3) We geven nog een paar voorbeelden. Voorbeeld 1. Tossen met een munt Iemand gooit een eerlijke munt 5 maal op. Bereken de kans, dat in deze serie 4 maal kop en eenmaal munt voorkomt. Oplossing: De kans op kop is 0,5 en de kans op munt is ook 0,5.
1 1 De kans op achtereenvolgens kop,kop,kop,kop en munt is: P(kkkkm) = 1 2 * 2 = 32 Daar we bij deze opgave niet gezegd hebben, dat 4 maal kop en eenmaal munt perse in deze volgorde moet optreden, is elke combinatie van 4 maal kop en eenmaal munt correct. In Hfst 2 hebben we gezien, dat het aantal mogelijkheden om 4 maal kop en eenmaal munt in willekeurige volgorde te gooien gelijk is 4
aan:
5 5! 1 = 1!*4! = 5 5 1
4 5 32
1 1 In dit geval krijgen we dus: P(4 * kop ) = * 2 * 2 =
Voorbeeld 2 Iemand moet voor een test 6 multiple choice vragen beantwoorden. Er zijn 4 keuzes per vraag. De testkandidaat heeft geen flauw idee welk antwoord correct is en kies dus blind. Wat is nu de kans, dat hij op deze manier 4 vragen goed beantwoord. Oplossing: In dit geval is de kans op succes per vraag 0,25 en de kans op fout 0,75. Het aantal mogelijke volgordes van 4 goede vragen in een reeks van 6 is gelijk aan:
6 6! 4!*5 * 6 2 = 2!*4! = 2 * 4! = 15 6 1 4 3 2 In dit geval krijgen we: P(4 goed ) = 2 * 4 * 4 =
135 4096
= 0,0330
Voorbeeld 3 Zelfde voorbeeld als bij voorbeeld 2, maar nu met de vraag: Wat is de kans, dat er ten minste 4 vragen goed beantwoord worden. Oplossing: P(goed antwoord 4) = P(4 goed ) + P(5 goed ) + P(6 goed ) =
30
6 1 4 3 2 6 1 5 3 6 1 6 2 * 4 * 4 + 1 * 4 * 4 + 0 * 4 = 0,0376
Voorbeeld 4 Zelfde voorbeeld als bij voorbeeld 2, maar nu met de vraag: Wat is de kans, dat er ten minste 2 vragen goed beantwoord worden. Oplossing: In feite kunnen we hetzelfde antwoord geven als in het vorige voorbeeld. We krijgen dan: Dit wordt wel erg veel werk. Slimmer is om te bedenken, dat ten minste 2 goede antwoorden het tegengestelde is van hoogstens 1 goed antwoord. Dit betekent:
P(goed antwoord 2) = P(2 goed ) + P(3 goed ) + P(4 goed ) + P(5 goed ) + P(6 goed ) P(goed antwoord 2) = 1 P(goed antwoord 1) = 1 P(0 goed ) P(1 goed ) = 6 3 6 6 1 3 5 1 0 * 4 1 * 4 * 4 = 0,4661
Algemeen kunnen we dus het volgende stellen: Voer ik een trekking n maal uit, waarbij de kans op succes gelijk is aan p, dan geeft de volgende formule de kans weer op k maal succes bij n trekkingen:
n k nk P(k ) = k * p * (1 p) Aan de basis van een binomiale verdeling ligt een experiment waarbij de kans op een bepaalde uitkomst gegeven wordt door een vast getal p. Jacob Bernoulli (1654 1705), een van de vele prominente wiskundigen uit de Bernoulli familie, is degene die zon experiment voor het eerst wiskundig heeft beschreven in zijn boek Ars Conjectandi (vertaald met: de Kunst van het Gissen)
6.2 Kansrekening met de Binomiale verdeling

6.2.1 Binomiale verdeling met de GR
berekening P(k2)=1 - P(k1) TI-83 plus Kies: [second] VARS (=DISTR) Kies: A: BINOMCDF Voer in: BINOMCDF(n, p, kmax) = BINOMCDF(6, 0.25, 1)=0,534 Bereken 1-0,534=0,466 Casio Kies: Stat scherm Kies: DIST (5e tabblad) Kies: BINM (5e tabblad) Kies: Bcd Kies: Var (2e tabblad) Voer in: data: x: 1 Numtrial: 6 p: 0.25 Kies: Stat scherm Kies: DIST (5e tabblad) Kies: BINM (5e tabblad) Kies: Bpd Kies: Var (2e tabblad) Voer in: Data x: 4 Numtrial: 6 p: 0.25
P(k=4)
Kies: [second] VARS (=DISTR) Kies: 0: BINOMPDF Voer in: BINOMPDF(6, 0.25, 4)=0,0330
31
6.2.2 Tabel van de binomiale verdeling

Toen er nog geen geavenceerde rekenmachines waren maakte men gebruik van tabellen. Voor de volledigheid hebben we in Annex C tabellen van de binomiale verdeling opgenomen. in Appendix C een tabel, waarin n loopt van 2 tot en met 10. Verder vinden we waarden voor n=12, 15 en 20. Verder is de tabel gemaakt voor p (=kans op succes) van 0,05 tot 0,50. Het is niet nodig om ook een tabel voor p (=kans op succes) te maken van 0,55 tot 0,95, omdat we dan ook kunnen kijken naar q (= kans op falen). Als p loopt van 0,55 tot o,95 dan loopt q van 0,5 tot 0,45. ( Immers p + q = 1) Boven de tabel staat, dat de uitkomst cumulatief is. Dat betekent, dat steeds aangegeven wordt de kans op hoogstens k maal succes bij n acties. We kijken nogmaals naar de voorbeelden uit de vorige paragraaf en we beginnen met voorbeeld 4. Daarin vermeldden we al, dat het handiger was om eerst de kans op hoogstens 1 goed antwoord uit te rekenen. In dit geval is de kans op succes gelijk aan 0,25. We pakken de tabel uit Appendix C erbij. Het ging om 6 vragen. Dit betekent dat n=6. Het aantal goed beantwoorde vragen was hoogstens 1. In dit geval is k dus gelijk aan 1. In de tabel zoeken we nu de rij op, waarvoor geldt: n=6 en k=1. Vervolgens gaan we naar links, naar de kolom waarboven staat p = 0,25 . We vinden in de tabel: 0,5339. We kunnen dus de conclusie trekken: P goed antwoord 1 = 0,5339 Als oplossing van het probleem van voorbeeld 4 vinden we dan: De oplossing voor voorbeeld 3 loopt op identieke wijze. We kunnen de tabel echter ook gebruiken voor het oplossen van de voorbeelden 1 en 2. Als we naar voorbeeld 2 kijken, wordt er gevraagd om te bepalen wat de kans is op 4 goed beantwoorde vragen. Uit de tabel kunnen we alleen maar afleiden, wat de kans is op hoogstens 4 goed beantwoorde vragen en de kans op hoogstens 3 goed beantwoorde vragen. Als we deze twee kansen echter van elkaar aftrekken, krijgen we precies de kans op 4 goed beantwoorde vragen. We krijgen:
P(goed antwoord 2) = 1 P(goed antwoord 1) = 1 0,5339 = 0,4661
P(4 goed ) = P(Goed antwoord 4) P(goed antwoord 3) = 0,9954 0,9624 = 0,0330
6.2.3 Grenzen aan het rekenen met de binomiaalformule

Er zijn twee situaties waarbij de standaard hulpmiddelen je in de steek (kunnen) laten en waarbij je dus naar andere middelen moet grijpen om een binomiaal probleem op te lossen: 1. Je hebt te maken met een binomiaal probleem met kleine kans p (p<0,05) : in dit geval pas je de Poissonverdeling toe (H7) 2. De GR kan je opgave niet uitrekenen of de tabel is niet toereikend voor jouw situatie: in dit geval pas je de Normale benadering van de Binomiaal verdeling toe (6.3)
6.3 De Normale benadering van de Binomiale verdeling

Stel dat je met je GR wil berekenen wat de kans is op k maal een kop bij, zeg 100 maal gooien met een eerlijke munt, waarbij je k laat lopen van 0 tot 100. En stel dat je al die waarden zou uitzetten in een grafiek. Je krijgt dan onderstaande grafiek te zien: We merken direct enkele belangrijke zaken op: De vorm is precies die van een normale verdeling De verwachtingswaarde ligt bij 50, zijnde het product van n en p We zien dus dat onder bepaalde voorwaarden de kansverdeling van het aantal malen succes zich gedraagt als een normaalverdeling. We spreken dan ook van: de Normale benadering van een binomiaalverdeling.
32
This approximation, known as de MoivreLaplace theorem, is a huge time-saver (exact calculations with large n are very onerous); historically, it was the first use of the normal distribution, introduced in Abraham de Moivre's book The Doctrine of Chances in 1738.
0.09 0.08
0.07 0.06 0.05 0.04

0.03 0.02 0.01 0 0 10 20 30 40 50 60 70 80 90 100 Series1
Zou je n nu langzaam minder laten worden, dan zul je zien dat op een gegeven moment de grafiek scheef begint te trekken. Als vuistregel geldt dat deze benadering goed opgaat als: n= 25 of hoger, n np > 5 n n(1-p) > 5 Om te kunnen rekenen met een normaalbenadering moeten we nog wel de formules hebben voor het gemiddelde en de variantie. Zonder afleiding of bewijs geven we de volgende formules: De verwachting = N * p ; de variantie var = N * p * q en standaardafwijking In deze twee formules geldt: N = aantal elementen in de verzameling. p = kans op succes. q = 1 p kans op falen.
= N * p*q
MAAR!!! Er is n belangrijke truc bij het toepassen van deze benadering en dat is de keuze van de juiste grenswaarde: Een binomiaalverdeling is een discontinue kansverdeling: ik kan 23 maal kop gooien of 24 maal, maar niet 23,5. Maar in de Normale benadering ga ik nu over naar een continue verdeling. Als ik bijvoorbeeld de kans wil uitrekenen op 24 maal kop of meer, dan valt 24 in mijn uit te rekenen kansgebied maar 23 erbuiten. In de normale benadering kies ik dan voor 23,5! LET OP: Als je deze truc met de grenswaarde niet goed toepast wordt het antwoord fout gerekend! Voorbeeld 1 We tossen een eerlijke munt 100 keer. Wat is de kans, dat we meer dan 60 keer kop gooien. Oplossing:
33
Bij een eerlijke munt is de kans op kop gelijk aan de kans op munt. Dit betekent dat p = 0,5 en q = 0,5 Verder geldt dat N = 100 . Daar 100 veel groter is dan 30 passen we in plaats van de binomiale verdeling de normale verdeling toe. In dit geval geldt: = N * p = 100 * 0,5 = 50
= N * p * q = 100 * 0,5 * 0,5 = 25 = 5

We moeten uitrekenen de kans op meer dan 60 maal kop, dus 60 doet niet mee maar 61 wel, we kiezen dus nu als grenswaarde voor de normale benadering 60,5. Rekenen we met de binomiaalverdeling, dan vinden we met de GR:
berekening Binomiaal:*) P(k>60)=1 - P(k60) TI-83 plus Kies: [second] VARS (=DISTR) Kies: A: BINOMCDF Voer in: BINOMCDF(100, 0.5, 60)=0,9824 Bereken 1-0,9824=0,0176 Casio Kies: Stat scherm Kies: DIST (5e tabblad) Kies: BINM (5e tabblad) Kies: Bcd Kies: Var (2e tabblad) Voer in: Data x: 60; Numtrial: 100; p: 0.5 Bereken 1-0,9824=0,0176 Kies: Stat scherm Kies: DIST (5e tabblad) Kies: NORM (1e tabblad) Kies: Ncd Voer in: lower: 60.5; upper: 1000; : 5; : 50
Normale benadering: P(k>60)
Kies: [second] VARS (=DISTR) Kies: 2: NORMALCDF Voer in: NORMALCDF(60.5, 1000, 50, 5)=0,0179 **)
6.3.1 Betrouwbaarheidsintervallen met de Normale benadering van de Binomiale verdeling

We weten dat het 95% betrouwbaarheidsinterval van een normale verdeling gegeven wordt door:
95%: -1,960* < x < +1,960*
Vullen we nu de waarde voor en hierin in, dan kunnen we het 95% betrouwbaarheidsinterval in de normale benadering van de binomiale verdeling ook schrijven als: n p 1,96 n p (1 p) < k < n p + 1,96 n p (1 p)
k door f dan krijgen we voor n het 95% betrouwbaarheidsinterval voor de fractie f van een steekproef met omvang n: p (1 p) p (1 p) p 1,96 < f < p + 1,96 n n
En als we deze hele vergelijking delen door n, en vervangen we
34
7 DE POISSONVERDELING
In het vorige hoofdstuk hebben we kennis gemaakt met een discrete verdeling. Ook in dit hoofdstuk bekijken we een discrete verdeling: de Poissonverdeling of ook wel aangeduid met de term NegatiefExponentile verdeling. Deze verdeling mag in twee omstandigheden toegepast worden: . Er is niet zozeer sprake van een binomiale trekking met een bepaalde kans, maar wel van een verwacht aantal gebeurtenissen. Voorbeelden zijn: Het aantal vliegtuigen, dat in een uur landt op een bepaald vliegveld. Het aantal autos, dat op een bepaalde dag een zeker kruispunt passeert. Het aantal wachtenden in een rij, het aantal paketten met gevaarlijke stoffen dat per dag in een magazijn binnenkomt, of ook het aantal weeffouten in een lap stof per meter. In al deze voorbeelden is n onbekend en p ook onbekend, maar n*p is het verwachte aantal vliegtuigen, autos, pakjes met gevaarlijke stoffen etc. In de genoemde voorbeelden, gaat het dus heel vaak over een aantal gebeurtenissen per tijdseenheid, maar het kan dus ook om een gebeurtenis per andere eenheid gaan, zoals in het laatste voorbeeld per lengte geweven stof Er is wl sprake van een binomiale verdeling, maar de kans op een gebeurtenis is te klein en het aantal experimenten te groot (n) om de kans met behulp van de Binomiaalformule naukeurig te kunnen uitrekenen.
7.1 Formule van de Poissonverdeling

De Poissonverdeling is een verbijzondering van de Binomiaalverdeling voor kleine p en grote n. Voeren we een experiment, met kans p op succes n maal uit, dan wordt de kans op k maal succes gegeven door:
n! n! m m 1 m m = P(k ) = 1 = 1 k !(n k ) ! n n k ! n (n k ) ! k m k n 1 n n m k m n(n 1)(n 2)......(n k + 1) ) m k = 1 e m als n k k ! n k! m n k 1 n m hierin hebben we ingevuld voor p: p = ; m = p n n k e De Poissonverdeling wordt als volgt gedefinieerd: P(k = k ) = ; = pn k! Hierin is k het aantal dat beschouwd wordt en het verwachte aantal per tijdseenheid.
k nk k n
De Poissonverdeling als benadering van de binomiaalverdeling gaat het beste op als n>50 en n*p <5
De Poissonverdeling is genoemd naar Simon Poisson die deze kansverdeling ontdekte en samen met zijn statistische theorie in 1838 publiceerde in zijn werk Recherches sur la probabilit des jugements en matires criminelles et matire civile. 35
Voorbeeld 1 Het aantal schepen dat per dag de haven van Amsterdam binnenloopt is 5 per dag. Bereken de kans, dat er op een bepaalde dag geen enkel schip deze haven binnenloopt. Oplossing: Volgens de formule geldt: P(k = 0) =
Voorbeeld 2 De gemiddelde tijd, die verstrijkt tussen de aankomst van twee verschillende klanten in een wachtrij is 3 minuten. Bereken de kans, dat in een bepaald kwartier er minder dan 4 klanten binnen komen. Oplossing: Dat de tijd, die gemiddeld verstrijkt tussen de aankomst van twee klanten gelijk is aan 3 minuten, betekent dat er gemiddeld 5 klanten per kwartier arriveren. In dit geval betekent dat = 5
5 0 5 * e = 0,0067 0!
P(k < 4) = P(k = 0) + P(k = 1) + P(k = 2) + P(k = 3) 50 e 5 51 e 5 5 2 e 5 53 e 5 Dit betekent: P(k < 4) = + + + = 0! 1! 2! 3! 0,0067 + 0,0337 + 0,0842 + 0,1404 = 0,2650
7.2 Kansrekening met de Poissonverdeling

7.2.1 Poissonverdeling met de GR
Berekening (vb2) P(k<4)= P(k3) TI-83 plus Kies: [second] VARS (=DISTR) Kies: C: POISSONCDF Voer in: POISSONCDF (, kmax) = POISSONCDF (5, 3) = 0,2650 Kies: [second] VARS (=DISTR) Kies: B: POISSONPDF Voer in: POISSONPDF (5,3)=0,1404 Casio Kies: Stat scherm Kies: DIST (5e tabblad) Kies: POISN (6e tabblad) Kies: Pcd Kies: Var (2e tabblad) Voer in: Data x: 3; : 5 Kies: Stat scherm Kies: DIST (5e tabblad) Kies: POISN (6e tabblad) Kies: Ppd Kies: Var (2e tabblad) Voer in: Data x: 3; : 5
P(k=3)
7.2.2 Tabel van de Poissonverdeling

Zowel in het eerste als in het tweede voorbeeld zien we, dat de kans niet of nauwelijks uit te rekenen is zonder rekenmachine. In het tweede voorbeeld is het zelfs met een rekenmachine tamelijk veel werk. Daarom is ook van de Poissonverdeling een tabel gemaakt. In dit dictaat vind je een tabel voor de Poissonverdeling in Appendix B. De tabel werkt vrij simpel. In de kop staan een aantal waarden van gegeven. De waarde van k loopt tot 19. Veronderstel dat we voorbeeld 1 uit de vorige paragraaf hadden willen oplossen met de tabel. We hadden daar = 5 en k=0. In de tabel kijken we op de regel k = 0 en in de kolom met kop = 5 en vinden dan: P(k = 0) = 0,0067 Daar de tabel geen cumulatieve waarden geeft, zoeken we bij voorbeeld 2 de waarden voor achtereenvolgens k = 0, k = 1, k = 2 en k = 3 op en tellen deze resultaten op. Ook dan krijgen we weer precies hetzelfde antwoord. Door afrondfouten, zou het laatste cijfer 1 kleiner of groter kunnen zijn.
36
7.3 De normale benadering van de Poissonverdeling

<< dit onderwerp hoort niet bij de tentamenstof voor TWi-4>>
Bij de binomiale verdeling zagen we dat de tabel op een gegeven moment te kort schoot. Ook bij de Poisson verdeling is dit het geval. In dit dictaat loopt de waarde van niet verder dan 8,0. Zoals ook bij de binomiale verdeling het geval is, kunnen we de Poisson verdeling opvatten als een normale verdeling, als voldoende groot is. We gaan er in dit geval vanuit, dat als > 8 dit inderdaad het geval is. Voor de normale verdeling hebben we de verwachting en de standaardafwijking nodig. In het geval van de Poissonverdeling is al bekend, zoals in voorbeeld 1 van paragraaf 7.1, of eenvoudig te berekenen, zoals in voorbeeld 2 van paragraaf 7.1. Voor geven we zonder bewijs, dat geldt: 2 = . Dit betekent: = Verder moeten we op dezelfde manier als bij de binomiale verdeling rekening houden met de integercorrectie. We geven een voorbeeld: Veronderstel, dat er op Schiphol gemiddeld 3 vliegtuigen landen per 2 minuten. Bereken de kans, dat er in 1 uur meer dan 95 vliegtuigen landen. Oplossing: In dit geval geldt dat de verwachting van het aantal gelande vliegtuigen in 1 uur gelijk is aan
3 * 30 = 90
= 90 en = 90 = 9,49 De grenswaarde 95 wordt door integercorrectie 95,5. Met de GR berekenen we: P(x > 95) = normalcdf(95.5, 1000, 90, 9.49)=0.1357
Dit betekent: Met de tabel wordt dit: P( x > 95) = P z >
95,5 90 = P(z > 1,1) = 0,5 0,3643 = 0,1357 5
7.4 Binom Normaal; Binom Poisson; Poisson Normaal

<< dit onderwerp hoort niet bij de tentamenstof voor TWi-4>>
Hier vatten we alle regels samen over het benaderen van de ene verdeling met een andere: 1. Binomiaal vraagstuk, maar p (of 1-p)<0,05? Y: Ga verder bij 3: behandelen als Poissonvraagstuk met =n*p (let op de grenzen voor voor toepassing van Poissonformules!!) N: ga verder bij 2 2. Binomiaal vraagstuk, maar n> 25 n np > 5 (of n(1-p) > 5)? Y: Dan benaderen als een Normaalverdeling, met =n*p; var=n*p*(1-p) N: bereken als Binomiaal vraagstuk 3. Poisson vraagstuk, maar >10? Y: Dan benaderen als een Normaalverdeling met = ; var= N: bereken als Poissonvraagstuk
37
8 Formuleblad
8.1 Definitie: gemiddelde, variantie en standaardafwijking, mediaan
N
Verzameling meetwaarden: gemiddelde:
x =
x
i =1
N
i
; variantie: var =
(x x )
i i =1
n
frequentietabel:
gemiddelde x =
x
i =1 n i =1
fi
;
i
variantie= var =
f * (x x )
i i i =1
f
i =1
standaardafwijking of standaarddeviatie:
= variantie
de Mediaan x van een klasse-indeling is te bepalen via de formule: x = L +
nl * s m , met: nl + nr
L is de ondergrens van de klasse, waarin de mediaan ligt. nl is het aantal elementen links van de mediaan in de klasse, waarin de mediaan ligt nr is het aantal elementen rechts van de mediaan in de klasse, waarin de mediaan ligt s m is de klassenbreedte van de klasse waarin de mediaan gelegen is.
8.2 Definitie: kans, kansfunctie, verwachtingswaarde, variantie en standaardafwijking

kans = aantal gewenste uitkomsten gedeeld door totaal aantal uitgevoerde experimenten kans = totaal aantal van alle mogelijke, verschillende gewenste uitkomsten, gedeeld door het totaal aantal van alle mogelijke, verschillende uitkomsten. discrete kansfunctie P(k): verwachtingswaarde: E(k) = =
alle k
continue kansfunctie P(x):
k * P(k = k )
alle k
P(k = k )
2 i i
E(x)= =
xP (x )dx
P(x )dx
2
variantie:
Var (x ) =
alle i
(x x ) * f
alle i
`
i
Var(x ) =
P(x )* (x ) dx
P(x )dx
standaardafwijking of standaarddeviatie:
= variantie
38
8.3 rekenregels verwachtingswaarde, variantie en standaardafwijking E( k ) = E(k ); Var( k ) = 2Var(k ) ; k = k E(k + ) = E(k ) + ; Var(k + ) = Var(k )
E(k 1 + k 2 ) = E(k 1 ) + E(k 2 ); Var(k 1 + k 2 ) = Var(k 1 ) + Var(k 2 ); k1 +k 2 = k21 + k22 E(k 1 k 2 ) = E(k 1 ) E(k 2 ); Var(k 1 k 2 ) = Var(k 1 ) + Var(k 2 ); k1 k 2 = k21 + k22
voor totalen van N onafhankelijk van elkaar tot stand gekomen uitkomsten geldt: E x = N * E ( x) ; Var( x) = N *Var( x) ; ( x) = N * ( x)
voor gemiddelden van N onafhankelijk van elkaar tot stand gekomen uitkomsten geldt:
E(x ) = E( x) ;
Var( x ) = Var ( i =1 ) = N
N * Var( x) Var ( x) = N2 N
(x) =
( x)
N
8.4 variaties, rangschikkingen

n onderling verschillende voorwerpen kunnen op n! verschillende manieren gerangschikt worden. n voorwerpen, waarvan er m tot de ene soort en n-m tot de andere soort behoren, kunnen op n n! = verschillende manieren gerangschikt worden. m m!*(n m)!
8.5 hypergeometrische trekking (trekking zonder teruglegging):

Bij n voorwerpen in totaal, waarvan k succes betekenen, geldt voor de kans p op m succes uit l trekkingen: k n k m * l m p(m succes bij l trekkingen) = n l
8.6 Normale verdeling

Normale verdeling wordt aangeduid door N ( , var) of N(, 2), standaardnormaalverdeling is de kansfunctie achter elke normaalverdeling; standaardnormaalverdeling: N (0,1) Als x behoort tot de Normaalverdeling N ( , var) en z de variabekle is van de x standaardnormaalverdeling N (0,1) , dan geldt: z = ; oftewel: x = + z *
8.6.1 combinaties van normale verdelingen

een combinaltie van variabelen die elk afzonderlijk behoren tot een normale verdeling vormen samen weer een normale verdeling.
39
8.6.2 betrouwbaarheidsintervallen van een normale verdeling

voor een normale verdeling geldt: 90% van de waarden ligt tussen -1,645* en 95% van de waarden ligt tussen -1,96 * en 99% van de waarden ligt tussen -2,575* en +1,645* +1,96 * +2,575*
8.7 Binomiale verdeling (trekking met vaste kans op succes, dus met teruglegging)
Bij n onafhankelijke trekkingen, met elk afzonderlijk kans p op succes, dan geldt: n k nk de kans op k maal succes uit n trekkingen: P(k uit n) = k * p * (1 p)
8.7.1 normale benadering van een Binomiale verdeling

een binomiale verdeling mag onder bepaalde omstandigheden benaderd worden door een normale verdeling, waarbij voor de normale benadering geldt dat de verwachtingswaarde = N * p ; en de variantie var = N * p * q ; = N * p * q ; In deze formules geldt: N = aantal elementen in de verzameling. p = kans op succes. q = 1-p = kans op falen. Deze benadering mag alleen worden toegepast als de variantie minimaal 10 is
8.7.2 betrouwbaarheidsintervallen van de normale benadering van een binomiale verdeling

voor een normale benadering van een binomiale verdeling geldt dus: 90% van de waarden ligt tussen N * p 1,645 * N * p * q en N * p + 1,645 * N * p * q 95% van de waarden ligt tussen N * p 1,96 * N * p * q 99% van de waarden ligt tussen N * p 2,575 * N * p * q en en
N * p + 1,96 * N * p * q N * p + 2,575 * N * p * q
8.8 Poissonverdeling
indien p heel klein en n heel groot is kan de binomiale verdeling worden benaderd door de k e poisson formule: P(k = k ) = k! hierbij is zowel de verwachtingswaarde als ook de variantie.
40
9 Appendix A: tabel van de Standaard Normaal verdeling

OPPERVLAKTE ONDER DE GRAFIEK VAN DE STANDARD NORMALE VERDELING VAN 0 TOT z
z | 0 1 2 3 4 5 6 7 8 9 -----+--------------------------------------------------------------------------------------------------------0.0 | .0000 .0040 .0080 .0120 .0160 .0190 .0239 .0279 .0319 .0359 0.1 | .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0754 0.2 | .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141 0.3 | .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517 0.4 | .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879 | 0.5 | .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224 0.6 | .2258 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2518 .2549 0.7 | .2580 .2612 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852 0.8 | .2881 .2910 .2939 .2967 .2996 .3023 .3051 .3078 .3106 .3133 0.9 | .3159 .3186 .3212 .3288 .3264 .3289 .3315 .3340 .3565 .3389 | 1.0 | .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621 1.1 | .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830 1.2 | .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015 1.3 | .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177 1.4 | .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319 1.5 | .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441 1.6 | .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545 1.7 | .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633 1.8 | .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4706 1.9 | .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767 | 2.0 | .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817 2.1 | .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857 2.2 | .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890 2.3 | .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916 2.4 | .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936 | 2.5 | .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .4952 2.6 | .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964 2.7 | .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974 2.8 | .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .4981 2.9 | .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986 | 3.0 | .4987 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4990 .4990 3.1 | .4990 .4991 .4991 .4991 .4992 .4992 .4992 .4992 .4993 .4993 3.2 | .4993 .4993 .4994 .4994 .4994 .4994 .4994 .4995 .4995 .4995 3.3 | .4995 .4995 .4995 .4996 .4996 .4996 .4996 .4996 .4996 .4997 3.4 | .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4998 | 3.5 | .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998 3.6 | .4998 .4998 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 3.7 | .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 3.8 | .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 3.9 | .5000 .5000 .5000 .5000 .5000 .5000 .5000 .5000 .5000 .5000
41
10 APPENDIX B: Tabel van de Poisson verdeling

-----------------------------------------------------------------------------------------------------------------------------------------------
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.5 2.0 3.0 4.0 5.0 6.0 7.0 8.0 k ----------------------------------------------------------------------------------------------------------------------------------------------0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 9048 8187 7408 6703 6065 5488 4966 4493 4066 3679 2231 1353 0498 0183 0067 0025 0009 0003 0905 1637 2222 2681 3033 3293 3476 3595 3659 3679 3347 2707 1494 0733 0337 0149 0064 0027 0045 .0164 0333 0536 0758 0988 1217 1438 1647 1839 2510 2707 2240 1465 0842 0446 0223 0107 0002 0011 0033 0072 0126 0198 0284 0383 0494 0613 1255 1804 2240 1954 1404 0892 0521 0286 0000 0001 0003 0007 0016 0030 0050 0077 0111 0153 0471 0902 1680 1954 1755 1339 0912 0573 0000 0000 0000 0001 0002 0004 0007 0012 0020 0031 0141 0361 1008 1563 1755 1606 1277 0916 0000 0000 0000 0000 0000 0000 0001 0002 0003 0005 0035 0120 0504 1042 1462 1606 1490 1221 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0008 0034 0216 0595 1044 1377 1490 1396 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0009 0081 0298 0653 1033 1304 1396 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0027 0132 0363 0688 1014 1241 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0008 0053 0181 0413 0710 0993 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0019 0082 0225 0452 0722 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0006 0034 0113 0263 0481 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0013 0052 0142 0296 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0005 0022 0071 0169 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0009 0033 0090 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0003 0014 0045 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0006 0021 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0009 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0007
42
11 APPENDIX C: Tabel van de Binomiale Verdeling

n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 -------------------------------------------------------------------------------------------------------------------------------------2 2 3 3 3 4 4 4 4 5 5 5 5 5 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 0 1 0 1 2 0 1 2 3 0 1 2 3 4 0 1 2 3 4 5 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8 0,9025 0,9975 0,8574 0,9928 0,9999 0,8145 0,9860 0,9995 1,0000 0,7738 0,9774 0,9988 1,0000 1,0000 0,7351 0,9672 0,9978 0,9999 1,0000 1,0000 0,6983 0,9556 0,9962 0,9998 1,0000 1,0000 1,0000 0,6634 0,9428 0,9942 0,9996 1,0000 1,0000 1,0000 1,0000 0,6302 0,9288 0,9916 0,9994 1,0000 1,0000 1,0000 1,0000 1,0000 0,8100 0,9900 0,7290 0,9720 0,9990 0,6561 0,9477 0,9963 0,9999 0,5905 0,9185 0,9914 0,9995 1,0000 0,5314 0,8857 0,9842 0,9987 0,9999 1,0000 0,4783 0,8503 0,9743 0,9973 0,9998 1,0000 1,0000 0,4305 0,8131 0,9619 0,9950 0,9996 1,0000 1,0000 1,0000 0,3874 0,7748 0,9470 0,9917 0,9991 0,9999 1,0000 1,0000 1,0000 0,7225 0,6400 0,5625 0,9775 0,9600 0,9375 0,6141 0,5120 0,4219 0,9392 0,8960 0,8338 0,9966 0,9920 0,9844 0,5220 0,4096 0,3164 0,8905 0,8192 0,7383 0,9880 0,9728 0,9492 0,9995 0,9984 0,9961 0,4437 0,3277 0,2373 0,8352 0,7373 0,6328 0,9734 0,9421 0,8965 0,9978 0,9933 0,9844 0,9999 0,9997 0,9990 0,3771 0,2621 0,1780 0,7765 0,6554 0,5339 0,9527 0,9011 0,8306 0,9941 0,9830 0,9624 0,9996 0,9984 0,9954 1,0000 0,9999 0,9998 0,3206 0,2097 0,1335 0,7166 0,5767 0,4449 0,9262 0,8250 0,7564 0,9879 0,9667 0,9294 0,9988 0,9953 0,9871 0,9999 0,9996 0,9987 1,0000 1,0000 0,9999 0,2725 0,1678 0,1001 0,6572 0,5033 0,3671 0,8948 0,7969 0,6785 0,9786 0,9437 0,8862 0,9971 0,9896 0,9727 0,9998 0,9988 0,9958 1,0000 0,9999 0,9996 1,0000 1,0000 1,0000 0,2316 0,1342 0,0751 0,5995 0,4362 0,3003 0,8591 0,733820,6007 0,9661 0,9144 0,8343 0,9944 0,9804 0,9511 0,9994 0,9969 0,9900 1,0000 0,9997 0,9987 1,0000 1,0000 0,9999 1,0000 1,0000 1,0000 0,4900 0,9100 0,3430 0,7840 0,9730 0,2401 0,6517 0,9163 0,9919 0,1681 0,5282 0,8369 0,9692 0,9976 0,1176 0,4202 0,7443 0,9295 0,9891 0,9993 0,0824 0,3294 0,6471 0,8740 0,9712 0,9962 0,9998 0,0567 0,2553 0,5518 0,8059 0,9420 0,9887 0,9987 0,9999 0,0404 0,1960 0,4628 0,7297 0,9012 0,9747 0,9957 0,9996 1,0000 0,4225 0,8775 0,2746 0,7182 0,9571 0,1785 0,5630 0,8735 0,9850 0,1160 0,4284 0,7648 0,9460 0,9947 0,0754 0,3191 0,6471 0,8826 0,9777 0,9982 0,0490 0,2338 0,5323 0,8002 0,9444 0,9910 0,9994 0,0319 0,1691 0,4278 0,7064 0,8939 0,9747 0,9964 0,9998 0,0207 0,1211 0,3373 0,6089 0,8283 0,9464 0,9888 0,9986 0,9999 0,3600 0,8400 0,2160 0,6480 0,9360 0,1296 0,4752 0,8208 0,9744 0,0778 0,3370 0,6826 0,9130 0,9898 0,0647 0,2333 0,5443 0,8208 0,9590 0,9959 0,0280 0,1586 0,4199 0,7102 0,9037 0,9812 0,9984 0,0168 0,1064 0,3154 0,5941 0,8263 0,9502 0,9915 0,9993 0,0101 0,0705 0,2318 0,4826 0,7334 0,9006 0,9750 0,9962 0,9997 0,3025 0,7975 0,1664 0,5748 0,9089 0,0915 0,3910 0,7585 0,9590 0,0503 0,2562 0,5931 0,8688 0,9815 0,0277 0,1636 0,4415 0,7447 0,9308 0,9917 0,0152 0,1024 0,3164 0,6083 0,8471 0,9643 0,9963 0,0084 0,0632 0,2201 0,4770 0,7396 0,9115 0,9819 0,9983 0,0046 0,0385 0,1495 0,3614 0,6214 0,8342 0,9502 0,9909 0,9992 0,2500 0,7500 0,1250 0,5000 0,8750 0,0625 0,3125 0,6875 0,9375 0,0312 0,1875 0,5000 0,8125 0,9688 0,0156 0,1094 0,3438 0,6562 0,8906 0,9844 0,0078 0,0625 0,2266 0,5000 0,7734 0,9375 0,9922 0,0039 0,0352 0,1445 0,3633 0,6367 0,8555 0,9648 0,9961 0,0020 0,0195 0,0898 0,2539 0,5000 0,7461 0,9102 0,9805 0,9980
43
Tabel van de Binomiale Verdeling vervolg

n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 -------------------------------------------------------------------------------------------------------------------------------------10 0 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0025 0,0010 10 1 0,9139 0,7361 0,5443 0,3758 0,2440 0,1493 0,0860 0,0464 0,0232 0,0107 10 2 0,9885 0,9298 0,8202 0,6778 0,5256 0,3828 0,2616 0,1673 0,0996 0,0547 10 3 0,9990 0,9872 0,9500 0,8791 0,7759 0,6496 0,5138 0,3823 0,2660 0,1719 10 4 0,9999 0,9984 0,9901 0,9672 0,9219 0,8497 0,7515 0,6331 0,5044 0,3770 10 5 1,0000 0,9999 0,9986 0,9936 0,9803 0,9527 0,9051 0,8338 0,7384 0,6230 10 6 1,0000 1,0000 0,9999 0,9991 0,9965 0,9894 0,9740 0,9452 0,8980 0,8281 10 7 1,0000 1,0000 1,0000 0,9999 0,9996 0,9984 0,9952 0,9877 0,9726 0,9453 10 8 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995 0,9983 0,9955 0,9893 10 9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9990 12 0 0,5404 0,2824 0,1422 0,0687 0,0317 0,0138 0,0057 0,0022 0,0008 0,0002 12 1 0,8816 0,6590 0,4435 0,2749 0,1584 0,0850 0,0424 0,0196 0,0083 0,0032 12 2 0,9804 0,8891 0,7358 0,5583 0,3907 0,2528 0,1513 0,0834 0,0421 0,0193 12 3 0,9978 0,9744 0,9078 0,7946 0,6488 0,4925 0,3467 0,2253 0,1345 0,0730 12 4 0,9998 0,9957 0,9761 0,9274 0,8424 0,7237 0,5833 0,4382 0,3044 0,1938 12 5 1,0000 0,9995 0,9954 0,9806 0,9456 0,8822 0,7873 0,6652 0,5269 0,3872 12 6 1,0000 0,9999 0,9993 0,9961 0,9857 0,9614 0,9154 0,8418 0,7393 0,6128 12 7 1,0000 1,0000 0,9999 0,9994 0,9972 0,9905 0,9745 0,9427 0,8883 0,8062 12 8 1,0000 1,0000 1,0000 0,9999 0,9996 0,9983 0,9944 0,9847 0,9644 0,9270 12 9 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998 0,9992 0,9972 0,9921 0,9807 12 10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9989 0,9968 12 11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 15 0 0,4633 0,2059 0,0874 0,0352 0,0134 0,0047 0,0016 0,0005 0,0001 0,0000 15 1 0,8290 0,5490 0,3186 0,1671 0,0802 0,0353 0,0142 0,0052 0,0017 0,0005 15 2 0,9638 0,8159 0,6042 0,3980 0,2361 0,1268 0,0617 0,0271 0,0107 0,0037 15 3 0,9945 0,9444 0,8227 0,6482 0,4613 0,2969 0,1727 0,0905 0,0424 0,0176 15 4 0,9994 0,9873 0,9383 0,8358 0,6865 0,5155 0,3519 0,2173 0,1204 0,0592 15 5 0,9999 0,9978 0,9832 0,9389 0,8516 0,7216 0,5643 0,4032 0,2608 0,1509 15 6 1,0000 0,9997 0,9964 0,9819 0,9434 0,8689 0,7548 0,6098 0,4522 0,3036 15 7 1,0000 1,0000 0,9996 0,9958 0,9827 0,9500 0,8868 0,7869 0,6535 0,5000 15 8 1,0000 1,0000 0,9999 0,9992 0,9958 0,9848 0,9578 0,9050 0,8182 0,6964 15 9 1,0000 1,0000 1,0000 0,9999 0,9992 0,9963 0,9876 0,9662 0,9231 0,8491 15 10 1,0000 1,0000 1,0000 1,0000 0,9999 0,9993 0,9972 0,9907 0,9745 0,9408 15 11 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995 0,9981 0,9937 0,9824 15 12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9989 0,9963 15 13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995 15 14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 20 0 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002 0,0000 0,0000 0,0000 20 1 0,7358 0,3917 0,1756 0,0692 0,0243 0,0076 0,0021 0,0005 0,0001 0,0000 20 2 0,9245 0,6769 0,4049 0,2061 0,0913 0,0355 0,0121 0,0036 0,0009 0,0002 20 3 0,9841 0,8670 0,6477 0,4114 0,2252 0,1071 0,0444 0,0160 0,0049 0,0013 20 4 0,9974 0,9568 0,8298 0,6296 0,4148 0,2375 0,1182 0,0510 0,0189 0,0059 20 5 0,9997 0,9887 0,9327 0,8042 0,6172 0,4164 0,2454 0,1256 0,0553 0,0207 20 6 1,0000 0,9976 0,9781 0,9133 0,7858 0,6080 0,4166 0,2500 0,1299 0,0577 20 7 1,0000 0,9996 0,9941 0,9679 0,8982 0,7723 0,6010 0,4159 0,2520 0,1316 20 8 1,0000 0,9999 0,9987 0,9900 0,9591 0,8867 0,7624 0,5956 0,4143 0,2517 20 9 1,0000 1,0000 0,9998 0,9974 0,9861 0,9520 0,8782 0,7553 0,5914 0,4119 20 10 1,0000 1,0000 1,0000 0,9994 0,9961 0,9829 0,9468 0,8725 0,7507 0,5881 20 11 1,0000 1,0000 1,0000 0,9999 0,9991 0,9949 0,9804 0,9435 0,8692 0,7483 20 12 1,0000 1,0000 1,0000 1,0000 0,9998 0,9987 0,9940 0,9790 0,9420 0,8684 20 13 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9985 0,9935 0,9786 0,9423 20 14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9984 0,9936 0,9793 20 15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9985 0,9941 20 16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9987 20 17 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998 20 18 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 20 19 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
44

Statistiek I I6e2

Uploaded by

Copyright:

Available Formats

You might also like

Statistiek I I6e2

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Statistiek I I6e2

Uploaded by

Copyright:

Available Formats

STATISTIEK & KANSREKENING I

A. van Hoegee en R.J. van Aalst

versie 6.2 (12 april 2011)

PERMUTATIES, COMBINATIES, VARIATIES .................................................................................................. 11

ELEMENTAIRE KANSREKENING ................................................................................................................... 13

DE NORMALE VERDELING .......................................................................................................................... 23

1.1 De frequentietabel en het histogram

1.2 Het gemiddelde

1.2.1 Het rekenkundig gemiddelde

x staat voor de som van alle elementen uit de verzameling.

N is het aantal elementen in de verzameling.

n is het aantal verschillende elementen xi in de gehele verzameling.

1.2.2 Het meetkundig gemiddelde

x = 4 1,02 *1,03 *1,01 *1,04 = 1,02494

Hierin is N het aantal elementen in de verzameling.

staat voor het product voor alle N elementen uit de verzameling.

1.2.3 Het harmonisch gemiddelde

deel van het karwei.

nl * s m ; In deze formule is: nl + nr

x de mediaan L de ondergrens van de klasse, waarin de mediaan ligt.

xi 1,5 2,5 3,5 4,5 5,5 6,5

1.5.1 De Gemiddelde Absolute Afwijking

Hierin is GAA de gemiddelde absolute afwijking.

1.5.2 Het Bereik

1.5.3 Variantie en Standaardafwijking

= s tan daardafwij king = var iantie =

Hierin is : f i de frequentie van xi of de frequentie van de klasse.

1.5.4 De kwartiele afwijking

Uitrekenen van gemiddelde en standaarddeviatie

2 PERMUTATIES, COMBINATIES, VARIATIES

1!= 1 2!= 1 * 2 = 2 3!= 1 * 2 * 3 = 6 4!= 1 * 2 * 3 * 4 = 24 5!= 1 * 2 * 3 * 4 * 5 = 120

10! 6!*7 * 8 * 9 *10 7 * 8 * 9 *10 = = = 210 6!*4! 6!*1 * 2 * 3 * 4 1* 2 * 3 * 4

3.1 Het begrip kans

3.2 Som- en productregels

3.3 Voorwaardelijke kans

P( A B) P( A) Hieruit kunnen we concluderen: P( A B) = P( A B) * P(B )

3.4 Kansen bij trekkingen met en zonder teruglegging

3.4.1 Trekking met teruglegging

P(1wit en1zwart ) = P(wz ) + P( zw) =

3.4.2 Trekking zonder teruglegging: Hypergeometrische trekking

8! 6 * 7 *8 = = 56 3!*5! 1 * 2 * 3 8 10 9 8 15 14 13 12 11 P(3 * w en 5 * z ) = 3 * 50 * 49 * 48 * 47 * 46 * 45 * 44 * 43 = 0,00067

Deze methode van berekening noemen we bottom-up.

4.2 Kansfunctie en verdelingsfunctie

4.2.2 Kansdichtheidsfunctie met continue kansvariabelen.

P(19,81 < x < 19,83) =

Voor f ( x) moet dan weer wel gelden: - f ( x) 0 voor elke x

F (k ) = 1 voor k > max k )

Indien f ( x) een continue verdeling is, geldt voor de laatste bewering:

4.3 Verwachtingswaarde en variantie

P(k = k ) = 1 kunnen we dit

P(x = 1) = P(x = 2) = P(x = 3) = P(x = 4)P(x = 5) = P(x = 6) = 1 6 1 1 1 1 1 21 1 We krijgen: = 1 * 1 + * 2 + * 3 + * 4 + * 5 + * 6 = = 3 6 6 6 6 6 6 6 2

Hier geldt ook weer:

De formule wordt dan:

Voor de continue verdeling geldt: Var(x ) =

Kijken we nu naar de variantie, dan geldt: Var (x ) =

De formule voor de variantie na vermenigvuldiging met wordt dan:

1 + 2 . Voor de variantie geldt dan: Var(x) + Var( y ) = Var(x + y )

E( k ) = E(k ) E(k + ) = E(k ) +

x = 4 1,02 1,03 1,01 *1,04 = 1,02494

10! 6!7 8 * 9 10 7 8 * 9 10 = = = 210 6!4! 6!1 2 * 3 * 4 1* 2 * 3 * 4

8! 6 * 7 8 = = 56 3!5! 1 * 2 * 3 8 10 9 8 15 14 13 12 11 P(3 * w en 5 * z ) = 3 * 50 * 49 * 48 * 47 * 46 * 45 * 44 * 43 = 0,00067

6 6! 4!5 6 2 = 2!4! = 2 4! = 15 6 1 4 3 2 In dit geval krijgen we: P(4 goed ) = 2 * 4 * 4 =