Download as pdf or txt
Download as pdf or txt
You are on page 1of 17

Statistical Estimination & Testing

Hoofdstuk 1 Omgeving en risico’s


§1.2 Materiële fout
De accountant controleert de jaarrekening op fouten.
- Niet alleen fout geldbedrag, maar ook:
 Maatschappelijk niet-aanvaardbare grondslagen voor waardering.
 Onduidelijke omschrijving.
 Foute rubricering.
- Twee soorten fouten  Opzettelijk en onopzettelijk.

Oorzaken onopzettelijke fouten:


- Onzorgvuldige bedrijfsvoering.
- Slecht werkende interne controle.
- De accountant controleert niet alles.

Jaarrekening wordt door gebruikers geanalyseerd op basis van ratio’s.


𝑅𝑒𝑠𝑢𝑙𝑡𝑎𝑎𝑡
- Voorbeeld: 𝑊𝑖𝑛𝑠𝑡𝑚𝑎𝑟𝑔𝑒𝑟𝑎𝑡𝑖𝑜 =
𝑂𝑚𝑧𝑒𝑡

De getrouwheid van deze cijfers wordt pas aangetast als de fout boven een bepaalde grens gaat.
- Deze grens  Materialiteit of jaarrekeningtolerantie.
- Een fout boven deze grens  Materiële fout of een fout van materieel belang.

Twee definities van een materiële fout:


- NIVRA-geschrift 25: ‘De onaanvaardbaar te achten kwaliteit of afwijking van de populatie
moet worden afgeleid uit het kleinste bedrag dat voor het beeld van de jaarrekening van
betekenis moet worden geacht. Met andere woorden: op het bedrag van de kleinste fout
waarbij een belangstellende met recht en reden zou kunnen stellen dat de jaarrekening geen
betrouwbaar beeld meer geeft.’.
- Standaar 320, NBA 2010: ‘Informatie is materieel indien het weglaten of het onjuist
weergeven daarvan de economische beslissingen die gebruikers op basis van de jaarrekening
nemen, zou kunnen beïnvloeden.’.

Controletolerantie  (Maximaal) geldbedrag  Monetary Precision.


- Omrekenen naar percentage van totale massa  Toelaatbaar foutpercentage.
- Belangrijk foutpercentage (Pbelangrijk)  Hierboven te veel risico.
𝑀𝑃 𝑀𝑜𝑛𝑒𝑡𝑎𝑟𝑦 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛
- Formule 1a: 𝑃𝑏𝑒𝑙𝑎𝑛𝑔𝑟𝑖𝑗𝑘 = 𝑀 = 𝑀𝑎𝑠𝑠𝑎

1
§1.3 Risico’s
Accountants-
controlerisico

Inherent Interne-
Ontdekkingsrisico
controlerisico controlerisico

Cijferanalyserisico Steekproefrisico Uitvoeringsrisico

Accountantscontrolerisico (ACR)  De kans dat een onjuiste accountantsverklaring wordt afgegeven


bij een jaarrekening waarin onjuistheden of omissies van materieel belang voorkomen.
- Zelfs zonder steekproeven hier nog kans op door:
 Te optimistisch over werking interne controle.
 Verslapping waakzaamheid.
 Te optimistische schatting van allerlei factoren.

Axiomatisch voorbehoud  Beperkingen bij controle:


- Kwalitatief:
 Accountant is niet op alle terreinen deskundig.
 Accountant is niet altijd en overal aanwezig.
 Er kunnen (on)bewust feiten buiten de administratie worden gehouden.
- Kwantitatief:
 Verwerven van volledige zekerheid gaat gepaard met hele hoge kosten, daarom vaak
steekproef.

Inherent risico (IR)  De kans dat er in een jaarrekening onjuistheden of omissies van materieel
belang voorkomen, afgezien van de invloed van interne controle.
- Kan worden berekend aan de hand van vragenlijst.
- Toch vaak IR van 100% aangehouden.

Interne-controlerisisco (ICR)  De kans dat onjuistheden of omissies van materieel belang niet tijdig
worden voorkomen of ontdekt en hersteld door het stelsel van maatregelen van administratieve
organisatie en interne controle.
- Laag ICR bij:
 Goede controletechnische functiescheidingen.
 Dwingende verbanden in goederen- en geldbeweging.
 Goed functionerend budgetsysteem.
 Permanente interne analyse van cijfers.
- ICR kan worden ingeschat door  Proceduretest en lijncontroles.

Cijferanalyserisico (CAR)  De kans dat onjuistheden of omissies van materieel belang niet door
cijferanalyse worden ontdekt.
- Cijferanalyse  Cijferbeoordeling, totaal- en verbandscontroles en controle met budgetten
en normen.

2
- Laag CAR bij:
 Goede verbandscontroles.
 Harde normen.
 Goede mogelijkheden om afwijkingen van de norm te analyseren.
 Mogelijkheden tot afstemming met andere externe of al gecontroleerde gegevens.

Steekproefrisico (SR)  De kans dat de conclusie van de accountant op basis van de steekproef
verschilt van de conclusie die zou zijn bereikt, indien de gehele populatie zou zijn gecontroleerd.
- Enigste risico dat betrouwbaar kan worden gemeten.

Uitvoeringsrisico  De kans dat de accountant door onvolkomenheden in het werkprogramma of


door verkeerde interpretatie van informatie een foute conclusie trekt.
- Dit risico is verwaarloosbaar klein door:
 Goede kwaliteitsbeheersingsprocedures door de accountant, met voldoende aandacht
aan deskundig en ervaren personeel, voldoende supervisie, goede dossiervorming en
goede planning.

Twee belangrijke risicoanalysemodellen:


- Audit Risk Model (ARM), of ook wel: Audit Assurance Model (AAM).
- Bayesian Risk Assessment Model (BRAM).

Verschil tussen ARM en BRAM:


- Bij ARM wordt er een reductie toegekend aan de steekproefgrootte op basis van een hoger
toegelaten steekproefrisico.
- Bij BRAM wordt de reductie bewerkstelligd op basis van voorinformatie over een hogere
tolerantie.

Audit Risk Model  Ontwikkeld in de VS, door:


- Toenemende aansprakelijkheid  Behoefte aan terugdringen invloed ‘professional
judgement’.
- Toenemende concurrentie  Neerwaartse druk op omvang controlewerkzaamheden.

Het ARM is gebaseerd op de volgende formule:


𝐴𝐶𝑅 = 𝐼𝑅 × 𝐼𝐶𝑅 × 𝐶𝐴𝑅 × 𝑆𝑅, dus:
𝐴𝐶𝑅
𝑆𝑅 =
𝐼𝑅 × 𝐼𝐶𝑅 × 𝐶𝐴𝑅

Door goede inschatting van de risico’s  Optimale controlemix voor accountant.

Voordelen ARM:
- Als denkmodel heeft dit een duidelijke structuur waardoor de kwaliteitsbeheersing zal
verbeteren.

Nadelen ARM:
- Moeilijke inschatting van de risico’s, met name het inherente risico dat dynamisch van aard
kan zijn, dat wil zeggen afhankelijk van tijd en omstandigheden.
- Niet valideerbaar, dat wil zeggen niet achteraf controleerbaar.

3
Hoofdstuk 2 De steekproef voor de accountantscontrole
§2.2.5 De steekproefmethode
Twee soorten steekproeven:
- Postensteekproeven en waarde-eenhedensteekproeven.

Postensteekproeven  Voor een uitspraak over posten.


Waarde-eenhedensteekproeven  Geven een conclusie over de afwijking in de gecontroleerde
populatie in euro’s.

§2.3 Selectiemethoden
A-selecte steekproef (statistisch)  Random selecteren  Eisen:
- De verzameling steekproeven kan worden gedefinieerd.
- De kans op het verkrijgen van iedere mogelijke steekpoef is bekend.
- Procedure geeft aan alles een selectiekans die groter is dan 0.
- Selectie door willekeurigheidsmechanisme waarbij iedere steekproef precies zijn kans krijgt.

Guldenrangnummermethode  Alle waarde-eenheden in de populatie krijgen een rangnummer en


hieruit worden aselect het benodigd aantal rangnummer geselecteerd (ook bij posten).
- Nadelen:
 Komt niet voor in commerciële software.
 Niet gegarandeerd grote posten geselecteerd.
 Foute post kan meerdere malen worden geselecteerd.
- Voordelen:
 Eenvoudige methode.
 Selectie is random.
 Kan met ieder gewenst aantal worden uitgebreid.

4
Systematische selectie  Selectie met vast interval (posten en waarde-eenheden).
- Interval is zo groot dat er precies genoeg dingen geselecteerd worden.
- Voordelen:
 Eenvoudig en snel uit te voeren.
 Alle posten die groter zijn dan het berekende interval worden geselecteerd.
 Deze posten zijn individueel significant  Selectiekans van 100%.
- Nadelen:
 Een patroon in de populatie kan samenvallen met het vaste interval.
 Lastig uit te breiden.

Cell sampling  Hetzelfde interval als systematische selectie. Populatie wordt onderverdeeld in
aantal intervallen met vaste breedte (cellen) en in elke cel wordt aselect een waarde-eenheid
gekozen (alleen waarde-eenheden niet bij posten).
- Voordelen:
 Efficiënte evaluatiemethode.
 Meer verschillende selecties mogelijk.
- Nadelen:
 Niet alle posten ter grootte van één interval hebben een 100% selectiekans.
 Eén post kan in 2 aangrenzende cellen liggen, waardoor één foute post tot twee fouten
in de steekproef kan leiden.

Zeefmethode  Iedere post wordt op een ‘zeef’ gelegd met variabele zeefopening, posten groter
dan de zeefopening blijven liggen en worden geselecteerd.
𝑀 𝑀𝑎𝑠𝑠𝑎
- Maximale zeefopening: 𝑁 = 𝑆𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓𝑔𝑟𝑜𝑜𝑡𝑡𝑒
- Voordeel  Aselectheid van de trekking.
- Nadeel  Steekproefomvang is variabel.

Methode Aselectheid Grote posten Uitbreiding


Guldenrangnummers Optimaal Geen automatische Zonder problemen
selectiekans
Vast interval Mogelijk samenloop Alles > interval Guldenrangnummers
met patroon in
populatie
Cell sampling Optimaal Alles > 2x interval Guldenrangnummers
Zeefmethode Optimaal Alles > maximale Zonder problemen
zeefopening

§2.6 Kansverdelingen
Discrete kansverdelingen  Een beperkt aantal mogelijkheden (waar of niet waar).
- Populatie N met fractie π successen.
- Steekproef n met k successen.
Continue kansverdelingen  Oneindig veel mogelijkheden.
- Populatie N met gemiddelde µ en standaarddeviatie σ.
- Steekproef n met gemiddelde 𝑥̅ en standaarddeviatie s.

Complementregel:
- 𝑃(𝒌 > 𝑘) = 1 − 𝑃(𝒌 ≤ 𝑘) of 𝑃(𝒌 > 𝑘) = 1 − 𝑃(𝒌 ≤ 𝑘 − 1)
- VB: 𝑃(𝒌 > 3) = 1 − 𝑃(𝒌 ≤ 3) 𝑜𝑓 𝑃(𝒌 > 5) = 1 − 𝑃(𝒌 ≤ 4)

𝑎!
Combinatie  Het aantal manieren om b uit a te trekken: (𝑎𝑏) = 𝑏!(𝑎−𝑏)!
(in RM a-nCr-b)

5
Discrete kansverdelingen
Hypergeometrische verdeling  Steekproef zonder teruglegging  Kansfunctie die rekening kan
houden met de afhankelijkheid tussen diverse trekkingen.
(𝐾 𝑁−𝐾
𝑘 )( 𝑛−𝑘 )
𝑃(𝒌 = 𝑘) =
(𝑁
𝑛)
In grafische rekenmachine: Menu  Statistics  DIST  F6  HYPRGEO  Hpd
X = k = aantal successen in steekproef.
n = n = steekproef grootte.
M = K = aantal successen in populatie.
N = N = grootte populatie.

Kansvariabele  Het aantal fouten.


𝐾
- Gemiddeld aantal fouten = Verwachtingswaarde  𝜇 = 𝑛 × 𝑁
=𝑛 × 𝜋
𝑁−𝑛
- Standaardafwijking  𝜎 = √𝑛𝜋(1 − 𝜋) × √
𝑁−1

Binomiale verdeling  Steekproef met teruglegging  Elke trekking is onafhankelijk aan


voorgaande.
𝐾
- Kans op fout is altijd hetzelfde, namelijk: 𝜋 =
𝑁
- Kansfunctie: 𝑃(𝒌 = 𝑘) = (𝑛𝑘)𝜋 𝑘 (1 − 𝜋)𝑛−𝑘
- Verwachtingswaarde: 𝜇 = 𝑛𝜋
- Standaardafwijking: 𝜎 = √𝑛𝜋(1 − 𝜋)

In grafische rekenmachine: Menu  Statistics  DIST  BINOMIAL  Bpd


X = k = Aantal fouten in steekproef
Numtrial = n = Grootte van steekproef
P = π = K/N = fouten in populatie/grootte van populatie

Poissonverdeling  Veel toegepast in accountantscontrole vanwege eenvoudige omgang.


𝜇𝑘
- Kansfunctie: 𝑃(𝒌 = 𝑘) = 𝑒 −𝜇
𝑘!
- Verwachtingswaarde: 𝜇 = 𝑛𝜋
- Standaardafwijking: 𝜎 = √𝜇

In grafische rekenmachine: Menu  Statistics  DIST  F6  POISSON  Ppd


X = k = Aantal fouten in steekproef
λ = µ = Verwachtingswaarde

Continue kansverdelingen
Student t-verdeling  Symmetrische kansdichtheidsfunctie waarvan de verwachtingswaarde gelijk
is aan nul en de spreiding afhankelijk is van het aantal waarnemingen in de sp  Bij een lage n.
- Voor steekproef met 10 uitkeringen  T-verdeling met n-1 = 9 vrijheidsgraden.
- Vrijheidsgraden = df (degrees of freedom).
𝑥̅ − 𝜇
- Omrekening naar t-waarde: 𝑡 = 𝑠⁄ 𝑛

2 ∑(𝑥𝑖 −𝑥̅ )2
- 𝑠 =
𝑛−1
- Als standaarddeviatie van steekproef bekend is.

6
Normale verdeling  Bij toenemende steekproefgrootte zelfde uitkomsten als student t-verdeling
 Bij hoge n.
- Geen vrijheidsgraden.
1 𝑥− 𝜇 2
1
- Functie: 𝑓(𝑥) = 𝜎 √2𝜋
𝑒 −2( 𝜎
)
(σ en µ gegeven)
- π = echt pi, dus 3,14
1 2
1
- Standaard normale verdeling: ∅(𝑥) = × 𝑒 −2(𝑥)
√2𝜋
𝑥−𝜇 𝑥̅ −𝜇
- 𝑧= 𝜎
= 𝜎
⁄ 𝑛

- Als de standaarddeviatie van het totaal bekend is.

Chi-kwadraat (x2)-verdeling  Als de steekproef getrokken is uit een normaal verdeelde populatie,
dan heeft deze grootheid een Chi-kwadraatverdeling.

In RM: Statistics  DIST  CHI  InvC.


Area = Kans.
Df = Vrijheidsgraden.

F-verdeling  Om te toetsen of twee steekproeven dezelfde variaties hebben.

§2.7 Benaderingen

𝑁−𝑛
De factor √ 𝑁−1 wordt eindigheidscorrectie genoemd.

7
Hoofdstuk 3 Schatten van gemiddelde
§3.1 Inleiding
Centrale Limietstelling  Des te groter de steekproef, des te meer de verdeling van het
steekproefgemiddelde op een normale verdeling gaat lijken.
- In boek grenswaarde 100  Alle steekproeven boven 100 automatisch normaal verdeeld.

§3.2 Schatten van een gemiddelde bij steekproeven uit normaal verdeelde populaties
Puntschatting  Geeft een indicatie waar het werkelijke populatiegemiddelde kan liggen.
- ‘beste schatting’  De meest voor de hand liggende waarde van het werkelijke.

Schattingsinterval  Waarde rondom het steekproefgemiddelde waarbinnen de populatiewaarde


wordt verwacht  Betrouwbaarheidsinterval.
- Tweezijdig schattingsinterval  Als het populatiegemiddelde zowel lager als hoger kan
uitvallen.
- Eenzijdig schattingsinterval  Als het populatiegemiddelde alleen lager of hoger kan
uitvallen.
- Onnauwkeurigheid  De helft van het schattingsinterval  E.
𝑠
 𝐸 = 𝑡1⁄ 𝛼 × 𝑛 of 𝐸 = (𝜇𝑈 − 𝜇𝐿 )/2
2 √

Betrouwbaarheid  Groot, als het schattingsinterval heel breed wordt gekozen.


- Bij 100% een veel te breed interval.
- In formule: 1 - α
Onbetrouwbaarheid  De kans dat het schattingsinterval niet het populatiegemiddelde omvat.
- 𝛼 =1−𝐸
- Ook wel: overschrijdingskans.

Standaardfout (‘standard error’)  Standaardafwijking in steekproef.

Boven-/ondergrens van schattingsinterval:


- Als populatiestandaardafwijking (σ) niet bekend is  Gebruik van s.
- Als populatiestandaardafwijking (σ) bekend is  Gebruik van σ ipv s en z ipv t.

Ondergrens  Afr. Naar beneden.


Bovengrens  Afr. Naar boven.
Df  Naar beneden.

𝑥̅ = Steekproefgemiddelde.
S = Steekproefstandaardafwijking.
n = Steekproefgrootte.
σ = Populatiestandaardafwijking.
N = Populatiegrootte.
µ = Populatiegemiddelde.
t = Waarde t-verdeling (Overschrijdingskans = α/2 en df = n – 1)
z = Waarde z-verdeling.

8
§3.3 Andere schattingsintervallen voor het gemiddelde
Bij een grote steekproef van n > 100:

X = Steekproefgemiddelde.
S = Steekproefstandaardafwijking.
n = Steekproefgrootte.
σ = Populatiestandaardafwijking.
t = Waarde t-verdeling (Overschrijdingskans = α/2 en df = n – 1)
z = Waarde z-verdeling

Als de steekproef meer dan 10% van de populatie omvat  Toevoeging eindigheidscorrectie.
𝒔 𝑠 𝑁−𝑛 𝑛
-  × √ 𝑁−1  Als 𝑁 ≥ 0,1
√𝒏 √𝑛

Van gemiddeld naar totaal:


- 𝑥̅  N × 𝑥̅
𝒔 𝑠
- 𝒏
 𝑛 × 𝑁
√ √

9
§3.4 Bepaling van de steekproefgrootte
𝑠
Nauwkeurigheidseis: 𝑡 × ≤𝐸
√𝑛
𝑡 2 ×𝑠2
Hieruit volgt  Minimale steekproefgrootte: 𝑛 ≥ 𝐸2
(Bij grote populatie)

Minimale steekproefgrootte neemt toe als:


- Kleinere onnauwkeurigheid van de schatting.
- Grotere spreiding in de gegevens.
- Grotere betrouwbaarheid.

Probleem als s niet bekend is  Oplossing:


- Op basis van ervaring schatting.
- Kleine steekproef om standaardafwijking te schatten.

Na indicatieve steekproef  Aanvullende steekproef  Om op je minimale steekproefgrootte te


komen.

Methode van Stein  Als n > 30


- Bij uitbreidend steekproef.
𝑛 ×𝑋 +𝑛 ×𝑋
- 𝑋̅𝑡𝑜𝑡 = 1 𝑛1 + 𝑛2 2
1 2
𝑠1
- 𝜇𝑈/𝐿 = 𝑥̅𝑡𝑜𝑡 ± 𝑡1 × 𝑛
(met Df = n1 – 1)
√ 𝑡𝑜𝑡

Hoofdstuk 4 Schatten van een percentage


§4.1 Schatten van een percentage met de hypergeometrische verdeling
Het steekproefresultaat wordt steeds onwaarschijnlijker als het percentage in de populatie
toeneemt.

§4.2 Benaderingen
p = percentage fouten in steekproef = k/n.
π = percentage fouten in populatie = K/N.

Als het gaat om steekproef zelf  Gewoon k/n.


Als het gaat om totale populatie  N x k/n.

Gaat om discrete verdeling.


𝑛
- Als 𝑁 ≥ 0,1  Hypergeometrische verdeling.
𝑛
- Als 𝑁 < 0,1  Binomiale verdeling.

Binomiale verdeling  Tabel 13.8.


𝑘 𝑘+1
𝑃𝑜𝑛𝑑𝑒𝑟 = 𝑃𝑏𝑜𝑣𝑒𝑛 =
𝑘 + (𝑛 − 𝑘 + 1) × 𝐹 𝑛−𝑘
𝑘+1+ 𝐹
𝑉1 = 2𝑛 − 2𝑘 + 2
𝑉2 = 2𝑘 𝑉1 = 2𝑘 + 2
𝑉2 = 2𝑛 − 2𝑘

10
Als wel binomiaal verdeeld (n/N < 0,1), maar:
- F-waarde niet in tabel (α ontbreekt).
- En n ≥ 20.
- En p < 0,1.

Poissonbenadering  Tabel 13.5.


𝑎1
𝑃𝑜𝑛𝑑𝑒𝑟 =
𝑛
𝑎2
𝑃𝑏𝑜𝑣𝑒𝑛 =
𝑛

Hoofdstuk 5 Toetsen op een gemiddelde


§5.2 Toetsingsprocedure
Stappen bij toetsing:
1. Bepaal nulhypothese H0 en de alternatieve hypothese H1.
2. Bepaal toetsingsgrootheid op basis van steekproef.
3. Bepaal kritieke gebied en kijk of waarde van toetsingsgrootheid daarin valt.
4. Conclusie + Betrouwbaarheid.

H0  Verwerpen.
H1  Aantonen.
µ0  Populatiegemiddelde die we gaan toetsen.

§5.3 Risico’s
α-risico  Kans dat je H0 onterecht verwerpt.
- Betrouwbaarheid  1 – α.
Β-risico  Kans dat je H0 onterecht niet verwerpt.
- Betrouwbaarheid  1 – β.

Wat moet je µ < µ0 µ > µ0 µ ≠ µ0


aantonen:
Soort toetsing: 1-zijdig linkse toetsing
1-zijdig rechtse 2-zijdige toetsing
toetsing
Hypothesen: H0: µ ≥ µ0 H0: µ ≤ µ0 H0: µ = µ0
H1: µ < µ0 H1: µ > µ0 H1: µ ≠ µ0
Omschrijving populatieparameter: µ is het gemiddelde van … in de populatie bestaande uit …

Toetsen met kritieke grens en kritiek gebied


Grenzen met t-verdeling (of z-verdeling).

H1 – hypothese: µ < µ0 µ > µ0 µ ≠ µ0


Kritieke grens of 𝑠 𝑠 𝑠
𝐺𝐿 = 𝜇0 − 𝑡𝛼 × 𝐺𝑅 = 𝜇0 + 𝑡𝛼 × 𝐺𝐿 = 𝜇0 − 𝑡𝛼⁄2 ×
grenzen: √𝑛 √𝑛 √𝑛
En
𝑠
𝐺𝑅 = 𝜇0 + 𝑡𝛼⁄2 ×
√𝑛
Kritiek gebied: X ≤ GL X ≥ GR X ≤ GL en X ≥ GR

11
Opschrijvingsmethode:
1. Hypothesen: H0: µ ≥ = ≤ µ0
H1: µ < ≠ > µ0
µ is het gemiddelde van …
2. Toetsingsgrootheid: 𝑥̅ = …
3. Kritieke grens: GL = … en/of GR = …
Kritiek gebied: X ≤ GL en/of X ≥ GR
4. Conclusie: - Toetsingsgrootheid ligt wel/niet in het kritieke gebied.
- H0 wel/niet verwerpen.
- Er is wel/niet aangetoond dat µ significant afwijkt.
- Het α/β – risico is relevant.

Toetsen op basis van schattingsinterval


Opschrijvingsmethode:
1. Hypothesen: H0: µ ≥ = ≤ µ0
H1: µ < ≠ > µ0
µ is het gemiddelde van …
2. Toetsingsgrootheid: 𝑥̅ = …
3. Schatting: µL = … en/of µR = …
Interval: [-ꚙ;µL] [µR;µL] [µR;ꚙ]
4. Conclusie: - Grenswaarde ligt niet/wel in het schattingsinterval.
- H0 wel/niet verwerpen.
- Er is wel/niet aangetoond dat µ significant afwijkt.
- Het α/β – risico is relevant.

Toetsen op basis van significatie/p-waarde


Opschrijvingsmethode:
1. Hypothesen: H0: µ ≥ ≤ µ0
H1: µ < > µ0
µ is het gemiddelde van …
2. Toetsingsgrootheid: p-waarde.
3. Onderschrijdingskans: 𝑃 = 𝑃(𝑡 ≤ −𝑡𝑥̅ )
Overschrijdingskans: 𝑃 = 𝑃(𝑡 ≥ 𝑡𝑥̅ )
𝑥̅ − 𝜇0
𝑡𝑥̅ =
𝑠/√𝑛
4. Conclusie: - De p-waarde is lager/hoger dan α.
- H0 wel/niet verwerpen.
- Er is wel/niet aangetoond dat µ significant afwijkt.
- Het α/β – risico is relevant.

Toetsen op basis van de t-waarde


Opschrijvingsmethode:
1. Hypothesen: H0: µ ≥ ≤ µ0 en H1: µ < > µ0
µ is het gemiddelde van …
2. Toetsingsgrootheid: 𝑡𝑥̅ -waarde.
𝑥̅ −𝜇
3. De t-waarde behorende bij de kritieke grens 𝑡𝛼 : 𝑡𝑥̅ = 𝑠/ 𝑛0

4. Conclusie: - 𝑡𝑥̅ ≥ 𝑡𝛼 / 𝑡𝑥̅ < 𝑡𝛼
- H0 wel/niet verwerpen.
- Er is wel/niet aangetoond dat µ significant afwijkt.
- Het α/β – risico is relevant.

12
Steekproef > H0 verworpen H0 niet verworpen
˅ Werkelijk
H0 – waar Foute beslissing Juiste beslissing
Fout vd 1e soort Betrouwbaarheid
α 1-α
H1 – waar Juiste beslissing Foute beslissing
Onderscheidingsvermogen Fout vd 2e soort
1-β β

Linkse toetsing:
𝑔𝐿 − 𝜇1 𝑔𝐿 − 𝜇1
𝛽 = 𝑃(𝑥̅ > 𝑔𝐿 |𝜇 = 𝜇1 ) = 𝑃 (𝑧 > ) = 1 − 𝑃(𝑧 ≤ )
𝜎/√𝑛 𝜎/√𝑛

Rechtse toetsing :
𝑔𝑅 − 𝜇1
𝛽 = 𝑃(𝑥̅ < 𝑔𝑅 |𝜇 = 𝜇1 ) = 𝑃 (𝑧 < )
𝜎/√𝑛

Als voorgeschreven wordt wat 𝛼 moet zijn en wat bij gegeven 𝜇1 de 𝛽 moet zijn, kan de
tweestaptoets van Stein toegepast worden:
(𝑡𝛼 +𝑡𝛽 )2
1. Bereken de benodigde steekproefomvang: ntot = (𝜇 2 𝑠12 .
1 −𝜇0 )
Neem 𝑑𝑓 en 𝑠 uit de vorige steekproef (omvang daarvan moet minstens 15 zijn). De
benodigde steekproefomvang moet minstens 30 zijn.
𝑥̅ −𝜇
2. Toetsen met toetsingsgrootheid 𝑡 = |𝜇𝑡𝑜𝑡−𝜇 0| (𝑡𝛼 + 𝑡𝛽 ) en kritieke grens 𝑡𝛼 , allemaal met 𝑑𝑓
1 0
uit de vorige steekproef.
Bij 2-zijdige toetsing: 𝑡𝛼 in voorgaande formules vervangen door 𝑡𝛼/2 .

Hoofdstuk 6 Toetsen op een percentage: gehele fouten


§6.2 Steekproefgrootte en §6.3 Conclusies
Stappenplan:
1. Bepaal nulhypothese H0 en de alternatieve hypothese H1.
2. Bepaal toetsingsgrootheid op basis van steekproef.
3. Bepaal kritieke gebied en kijk of waarde van toetsingsgrootheid daarin valt.
4. Conclusie + Betrouwbaarheid.

n = steekproefgrootte, k = fouten in steekproef, π = fractie fouten in steekproef = k/n

𝜋 < 𝑝0 𝜋 ≠ 𝑝0 𝜋 > 𝑝0
𝐻0 : 𝜋 ≥ 𝑝0 𝐻0 : 𝜋 = 𝑝0 𝐻0 : 𝜋 ≤ 𝑝0
𝐻1 : 𝜋 < 𝑝0 𝐻1 : 𝜋 ≠ 𝑝0 𝐻1 : 𝜋 > 𝑝0
𝑘𝑘𝑟−𝐿 = 𝑘 𝑘𝑘𝑟−𝐿 en 𝑘𝑘𝑟−𝑅 𝑘𝑘𝑟−𝑅
𝑃(𝑘 ≤ 𝑘) ≤ 𝛼 Gebruik 𝛼/2 𝑃(𝑘 ≥ 𝑘) ≤ 𝛼, dus:
𝑃(𝑘 ≤ 𝑘 − 1) ≥ (1 − 𝛼)
𝑘 ≤ 𝑘𝑘𝑟−𝐿 𝑘 ≤ 𝑘𝑘𝑟−𝐿 en 𝑘 ≥ 𝑘𝑘𝑟−𝑅 𝑘 ≥ 𝑘𝑘𝑟−𝑅

We zoeken naar kritieke grens : Kkr, waarvoor geldt:


- P(k in het kritieke gebied) > 1 – α, of:
- P(k niet in het kritieke gebied) ≤ α

13
Gebruik van de binomiale verdeling of de cumulatieve binomiale verdeling (tabel 13.1).

De toetsingsgrootheid = k.

Herhaling binomiale verdeling


Het aantal fouten 𝑘 in de steekproef van grootte 𝑛
- 𝑘 is binomiaal verdeeld: 𝑘~𝐵𝐼𝑁(𝑛 = ⋯ , 𝜋 = ⋯ )
- 𝑃[𝒌 = 𝑘] = (𝑛𝑘)𝜋 𝑘 (1 − 𝜋)𝑛−𝑘

Toetsen d.m.v. het kritieke gebied


Opschrijvingsmethode:
1. Hypothesen: 𝐻0 : 𝜋 ≥=≤ 𝑝0
𝐻1 : 𝜋 <≠> 𝑝0
𝜋 is de fractie … in de populatie bestaande uit …
2. Toetsingsgrootheid: 𝑘 (aantal fouten in de steekproef)
3. Kritieke grens: P(𝑘 ≤ 𝑘𝑘𝑟−𝐿 ) ≤ 𝛼 en/of P(𝑘 ≤ 𝑘 − 1) ≥ (1 − 𝛼)
Kritieke gebied: k ≤ 𝑘𝑘𝑟−𝐿 en/of k ≥ 𝑘𝑘𝑟−𝑅
4. Conclusie: De toetsingsgrootheid ligt niet/wel in het kritieke gebied.
H0 wordt niet/wel verworpen.
Er is niet/wel aangetoond dat 𝜋 significant afwijkt.
Het β/α-risico is relevant.

De steekproefgrootte als je de kritieke grens al weet:


- 𝑘𝑘𝑟 = 0
log(𝛼)
- 𝑛 ≥ log(1−𝑝 )
0
- 𝑘𝑘𝑟 ≥ 0
𝑎 [𝑘 ]
- 𝑛 ≥ 12𝑝 𝑘𝑟
0

§6.4 Toetsen met een schattingsinterval


Opschrijvingsmethode:
1. Hypothesen: 𝐻0 : 𝜋 ≥=≤ 𝑝0
𝐻1 : 𝜋 <≠> 𝑝0
𝜋 is de fractie … in de populatie bestaande uit …
2. Toetsingsgrootheid: 𝑘 (aantal fouten in de steekproef)
𝑘+1 𝑘
3. Schatting: 𝑝𝑏𝑜𝑣𝑒𝑛 = 𝑛−𝑘 en/of 𝑝𝑜𝑛𝑑𝑒𝑟 = 𝑘+(𝑛−𝑘+1)𝐹
𝑘+1+ 𝛼/2
𝐹𝛼/2

𝑣1 = 2𝑘 + 2 𝑣1 = 2𝑛 − 2𝑘 + 2
𝑣2 = 2𝑛 − 2𝑘 𝑣2 = 2𝑘
Interval: [0; 𝑝𝑏𝑜𝑣𝑒𝑛 ] [𝑝𝑜𝑛𝑑𝑒𝑟 ; 𝑝𝑏𝑜𝑣𝑒𝑛 ] [𝑝𝑜𝑛𝑑𝑒𝑟 ; 1]
4. Conclusie: De grenswaarde 𝑝0 ligt wel/niet in het schattingsinterval.
H0 wordt niet/wel verworpen.
Er is niet/wel aangetoond dat 𝜋 significant afwijkt.
Het β/α-risico is relevant.

14
Poisson benadering  Als je de binomiale verdeling mag gebruiken (n/𝑁 < 0,1),
• maar de F-waarde staat niet in de tabel (𝛼 ontbreekt)
• en 𝑛 ≥ 20
• en 𝑝 < 0,10
Gebruiken we de poisson benadering:
𝑎 𝑎
𝑝𝑏𝑜𝑣𝑒𝑛 = 𝑛2 en 𝑝𝑜𝑛𝑑𝑒𝑟 = 𝑛1

β-risico  De kans dat je 𝐻0 onterecht niet verwerpt.


- Oftewel de kans dat 𝑘 onterecht niet in het kritieke gebied ligt.
Onderscheidingsvermogen  1 − 𝛽.
- De kans dat 𝑘 wel in het kritieke gebied ligt en je 𝐻0 wel verwerpt.

Hoofdstuk 7 Toetsen op een percentage: gedeeltelijke fouten


§7.2 Berekening van de maximale fout
Stringer Bounds  Sommeert de basisonnauwkeurigheid met de meest waarschijnlijke fout en de
onnauwkeurigheidsgroei.

De maximale fout kan worden onderverdeeld in 3 deelfouten:


- BP (Basisonnauwkeurigheid)  In tabel 13.5 (Poisson) bij k = 0.
- MLE (Meest waarschijnlijke fout)  p in steekproef naar π in populatie.
 Foutfractie = (B-W)/B.
- PGW (Onnauwkeurigheidsgroei)  Tabel 13.6 PGW.

Maximale fout: 𝑀𝐹 = 𝑃𝐵 + 𝑀𝐿𝐸 + ∑ 𝑃𝐺𝑊 (𝑀𝐹 = 𝑎2).


Vergelijk deze met pbelangrijk.

§7.3 Analyse
Uitbreiden steekproef:
2𝑛
∆𝑛 = 𝜔 (1 + √1 − )−𝑛
3𝜔
3 𝑎2 (=𝑀𝐹)
- 𝜔 = 4𝑝
𝑏𝑒𝑙𝑎𝑛𝑔𝑟𝑖𝑗𝑘

§7.4 PPS-schatter
PPS-schatter
- Alleen bij waarde-eenhedensteekproeven.
- Minstens 30 fouten in de steekproef.

Stappenplan:
𝑒
1. Bereken voor elke post in de steekproef de tainting: 𝑡𝑖 = 𝑏𝑖 .
𝑖
Waarbij: ti: Tainting van artikel i.
ei: Fout van artikel i.
bi: Boekwaarde van artikel i.
∑𝑡
2. Bereken de gemiddelde tainting: 𝑡̅ = 𝑛 𝑖.

15
∑(𝑡𝑖2 ) ∑(𝑡𝑖 )2
3. Bereken de standaardafwijking: 𝑠𝑡 = √ − .
𝑛−1 𝑛(𝑛−1)
̂𝑃𝑃𝑆 ± 𝑡𝛼 × 𝑠𝑃𝑃𝑆
4. Bereken het schattingsinterval: 𝑊
2
𝐵
Waarbij: ̂𝑃𝑃𝑆 = 𝐵(1 − 𝑡̅) en 𝑠𝑃𝑃𝑆 = 𝑠𝑡
𝑊 .
√𝑛

Als de onnauwkeurigheid van het verkregen interval niet voldoet:


𝑡 2 ×𝑠𝑡2 ×𝐵
- Bereken nieuwe steekproefomvang: 𝑛𝑡𝑜𝑡 ≥
𝐸2
- Steekproef uitbreiden met 𝑛2 = 𝑛𝑡𝑜𝑡 − 𝑛1 .
̅ ̅
- ̅ = 𝑛1 𝑡1 +𝑛2 𝑡2.
Nieuwe gemiddelde tainting: 𝑡𝑡𝑜𝑡 𝑛𝑡𝑜𝑡
𝑠𝑡1
- ̅ )𝐵 ± 𝑡𝛼/2 [𝑑𝑓 = 𝑛1 − 1] ×
Nieuwe intervalgrenzen: 𝜇𝑃𝑃𝑆𝑈/𝐿 = (1 − 𝑡𝑡𝑜𝑡 𝐵
√𝑛𝑡𝑜𝑡

Hoofdstuk 11 De aanpassingstoets
§11.1 Chi-kwadraat-aanpassingstoets
Opschrijvingsmethode:
1. Hypothesen: 𝐻0: 𝑝1/π1=…, 𝑝2/π2=…,…
𝐻1: minstens één van de 𝑝’s verschilt
(𝑂𝑖 −𝐸𝑖 )2
2. Toetsingsgrootheid: 𝜒 2 = ∑𝑘𝑖=1 𝐸𝑖
3. Kritieke grens: 𝑔[𝑑𝑓]=𝑔[𝑘−1] (Tabel 13.7)
Kritieke gebied: 𝜒 2 ≥ 𝑔𝛼 [𝑑𝑓]
4. Conclusie: De toetsingsgrootheid ligt niet/wel in het kritieke gebied.
H0 wordt niet/wel verworpen.
Er is niet/wel aangetoond dat één van de 𝑝’s verschilt van H0.
Het β/α-risico is relevant.

Voorwaarden voor Chi-kwadraattoets:


- 𝑛 ≥ 20.
- Onafhankelijke waarnemingen.
- De kans dat een waarneming in een bepaalde cel valt is constant.
- Voorwaarde van Cochran: 𝑛 × 𝑝𝑖 ≥ 5 oftewel 𝐸𝑖 ≥ 5.

§11.2 Benford’s Law


𝑖+1
Benford’s law  𝑃(𝑖) = log ( 𝑖 ).
- met 𝑃(𝑖) de kans dat het eerste cijfer van een getal gelijk is aan 𝑖 met 𝑖 = 1,2,3, … ,9.

Voorwaarden voor Benford’s law:


- Natuurlijke getallen, d.w.z.:
 Geen ingebouwde maximumwaarde of minimumwaarde.
 Geen toegekende getallen (artikelnummers, bankrekeningnummers,…).
 Geen menselijke beïnvloeding van de getallen (winkelprijzen met combi’s 95 en 99).
- Minstens 1000 getallen.
- Geen getallen onder de 10.
- Getallen van minstens 4 cijfers.

16
§11.3 Toepassingen van de aanpassingstoets
De Chi-kwadraat-aanpassingstoets op de (discrete) uniforme verdeling:
- 𝑃𝑖 kan ook berekend worden voor het tweede cijfer, het derde cijfer, etc. van een getal.
- Uit Benford’s law volgt dat voor het derde cijfer van een getal (in mindere mate voor het
tweede cijfer) de kansen gelijkmatig verdeeld zijn.
- Als elk (geheel) cijfer even vaak voorkomt  (discrete) uniforme verdeling.

Opschrijvingsmethode:
1. Hypothesen: 𝐻0 : 𝑝1 = 𝑝2 = 𝑝3 = ⋯ = 𝑝9 = 0,10
𝐻1 : minstens één van de 𝑝’s verschilt
(𝑂𝑖 −𝐸𝑖 )2
2. Toetsingsgrootheid: 𝜒 2 = ∑𝑘𝑖=1 𝐸𝑖
3. Kritieke grens: 𝑔𝛼 [𝑑𝑓] = 𝑔𝛼 [𝑘 − 1] (Tabel 13.7)
Kritieke gebied: 𝜒 2 ≥ 𝑔𝛼 [𝑑𝑓]
4. Conclusie: De toetsingsgrootheid ligt niet/wel in het kritieke gebied.
H0 wordt niet/wel verworpen.
Er is niet/wel aangetoond dat één van de 𝑝’s verschilt van 𝐻0 .
Het β/α-risico is relevant.

17

You might also like