Download as pdf or txt
Download as pdf or txt
You are on page 1of 34

formuleboekje

Inhoudstafel

FORMULES UIT HOOFDSTUK 1 (BESCHRIJVENDE TECHNIEKEN EN PARAMETERVRIJE KENGETALLEN)4

0. INLEIDENDE BEGRIPPEN 4

ONDERWERP VAN STATISTIEK 4


DE MEETNIVEAUS 4

1. BESCHRIJVEN VAN EEN STEEKPROEF MET EEN FREQUENTIETABEL 5

NOTATIE AFSPRAKEN: 5
OPSTELLEN VAN EEN FREQUENTIETABEL MET ÉÉN DIMENSIE (= ÉÉN KOLOM) 5
INDELEN IN KLASSEN 5
OPSTELLEN VAN EEN FREQUENTIETABEL MET MEERDERE DIMENSIES: KRUISTABEL 5

2. BESCHRIJVEN VAN EEN STEEKPROEF MET GRAFIEKEN 6

3. BESCHRIJVEN VAN EEN STEEKPROEF MET PARAMETERVRIJE KENGETALLEN 7

CENTRALE TENDENS 7
1) MODUS 7
2) MEDIAAN 7
SPREIDINGSTENDENS 8
1) RANGE 8
2) PERCENTIEL 8
3) IQR 8
EEN TOEPASSING: KWARTIELEN EN ‘OUTLIERS’ 8

FORMULES UIT HOOFDSTUK 2 (BESCHRIJVENDE TECHNIEKEN EN PARAMETRISCHE KENGETALLEN) 9

1. BESCHRIJVEN VAN EEN STEEKPROEF MET PARAMETRISCHE KENGETALLEN 9

CENTRALE TENDENS 9
HET (REKENKUNDIG) GEMIDDELDE 9
EEN GEWOGEN GEMIDDELDE 9
HET HARMONISCH GEMIDDELDE 9
SPREIDINGSTENDENS 9
DE STANDAARDAFWIJKING 9
COMBINATIE VAN CENTRALE EN SPREIDINGSTENDENS: VC 10
STANDARD ERROR OF THE MEAN 10
FREQUENTIEVERDELING EN KENGETALLEN 10

2. BESCHRIJVEN VAN EEN POPULATIE: DE NORMALE VERDELING (GAUSSCURVE) 11

3. BESCHRIJVEN VAN EEN STEEKPROEF MET ‘GROEPEN’ HERHAALDE METINGEN 12

 VVV – meetvariatie
pagina: 1/29
formuleboekje

SAMENVATTING VAN EEN TABEL MET GROEPEN HERHAALDE METINGEN 12


ONDERLINGE VERGELIJKING INTRA ↔ INTER INDIVIDUELE VARIATIECOËFFICIËNTEN 13

4. PROPAGATIE VAN DE STANDAARDAFWIJKINGEN 13

FORMULES UIT HOOFDSTUK 3 (NORMALE VERDELING EN VERDELING STEEKPROEFGEMIDDELDE) 14

1. PLAATS VAN EEN INDIVIDUELE METING BINNEN EEN POPULATIE: DE NORMALE EN DE


STANDAARDNORMALE VERDELINGEN 14

DEFINITIE: Z-WAARDE 14
DEFINITIE: P-WAARDE 14
NOTATIE Z-WAARDE EN P-WAARDE 14
REFERENTIEWAARDEN EN CUTOFF OPSTELLEN 15

2. VERDELING VAN EEN STEEKPROEFGEMIDDELDE (CENTRALE LIMIETSTELLING) 16

3. BETROUWBAARHEIDSINTERVAL VOOR µ EN T-VERDELING 16

FORMULES VOOR EEN 95% B.I. VOOR µ BIJ EEN STEEKPROEF (GROOTTE N) UIT EEN NORMAAL VERDEELDE POPULATIE
16
GEBRUIK B.I. IN HET LABORATORIUM 17

FORMULES UIT HOOFDSTUK 4 (JUISTHEID EN PRECISIE) 18

1. VALIDATIE - ALGEMEEN 18

2. VALIDATIE MET ‘GROEPEN’ HERHAALDE METINGEN 18

3. JUISTHEID 18

AANTONEN VAN JUISTHEID DOOR GEBRUIK VAN GECERTIFICEERD REFERENTIEMATERIAAL CRM 18


AANTONEN VAN JUISTHEID DOOR VERGELIJKING MET REFERENTIEMETHODE 18

4. PRECISIE 19

⇒ INVULLING 1: HERHAALBAARHEID (REPEATABILITY) 19


⇒ INVULLING 2: INTERMEDIAIRE PRECISIE (INTERMEDIATE PRECISION) 19

5. DETECTIE CAPABILITEIT 20

6. NORMALE VERDELING EN OUTLIERS – DIXON 20

7. NORMALE VERDELING EN OUTLIERS – GRUBB’S 21

 VVV – meetvariatie
pagina: 2/29
formuleboekje

FORMULES UIT HOOFDSTUK 5 (ENKELVOUDIGE LINEAIRE REGRESSIE) 22

1. LINEAIRE CORRELATIE (PEARSON) 22

VOORWAARDE VOOR LINEAIRE CORRELATIEBEREKENINGEN 22

2. (ENKELVOUDIGE) LINEAIRE REGRESSIE – KLEINSTE KWADRATENMETHODE 23

DEFINITIE: DE STATISTISCH ‘BEST PASSENDE’ RECHTE DOOR DE OPGEGEVEN PUNTEN 23


DEFINITIE: STANDAARDFOUT SE VAN DE GEVONDEN RECHTE 24
VOORWAARDEN VOOR REGRESSIEBEREKENINGEN HERSCHREVEN NAAR RESIDU’S OF ERRORS 24
RESIDUELE PLOT 24

3. (ENKELVOUDIGE) LINEAIRE REGRESSIE – BETROUWBAARHEIDSINTERVAL VOOR α EN β 25

4. (ENKELVOUDIGE) LINEAIRE REGRESSIE – LIJNSCHATTING (EXCEL) 25

5. (ENKELVOUDIGE) LINEAIRE REGRESSIE – Y-WAARDEN VOORSPELLEN 26

6. (ENKELVOUDIGE) LINEAIRE REGRESSIE – X-WAARDEN TERUGREKENEN 27

FORMULES UIT HOOFDSTUK 6 (METHODEVERGELIJKING) 28

1. METHODEVERGELIJKING MET ENKELVOUDIGE LINEAIRE REGRESSIE 28

2. METHODEVERGELIJKING MET BIAS- EN RATIOPLOTS 29

 VVV – meetvariatie
pagina: 3/29
formuleboekje

formules uit hoofdstuk 1 (beschrijvende technieken en parametervrije kengetallen)

0. INLEIDENDE BEGRIPPEN
Onderwerp van statistiek
⇒ toevalsveranderlijken (kansvariabelen of random variables)
Een toevalsveranderlijke is een kenmerk van een populatie.
Van een toevalsveranderlijke ken je de verzameling van alle mogelijke waarden die deze
veranderlijke kan aannemen → de uitkomstenruimte S (Sample space).
De uitkomstenruimte is → eindig → discrete kansvariabele
→ oneindig → continue kansvariabele

De elementen van deze uitkomstenruimte zijn


→ numeriek: ‘variabele’ eigenschap van de populatie → drie meetniveaus
→ niet numeriek: attributief (eigenschap) kenmerk van de populatie → twee meetniveaus

Soorten steekproeven
→ toevallig of a-select:
selectie uit een populatie is toevallig als ieder individu evenveel kans heeft om gekozen te
worden; meestal gebeuren deze selecties met toevalsgetallen.
→ systematisch:
de selectie gebeurt volgens een vast patroon (bvb. iedere 100ste bezoeker van een
tentoonstelling)
→ representatief of gestratificeerd:
je vindt een zelfde proportie van deelgroepen van de populatie terug in de steekproef

De meetniveaus
discrete toevalsvariabelen
1) nominaal meetniveau
de waarden dienen alleen om een onderscheid tussen verschillende categorieën te maken en
hebben geen ‘numerieke’ betekenis.

2) ordinaal meetniveau
de categorieën krijgen niet meer een willekeurige waarde maar de schaal geeft een rangorde
weer. Een hogere waarde op deze schaal geeft aan dat de eigenschap belangrijker of groter of
… is. De toegekende waarde is echter geen weergave van een ‘orde van grootte’.

continue toevalsvariabelen
3) interval
Een intervalschaal geeft niet alleen een rangorde weer maar ook de verschillen (intervallen)
tussen de mogelijke uitkomsten heeft een betekenis. Deze schaal heeft echter een willekeurig
gekozen nulpunt en daarom hebben verhoudingen (ratio’s) van uitkomsten geen betekenis.

4) ratio
Een ratioschaal heeft alle eigenschappen van een intervalschaal en heeft bovendien een
natuurlijk nulpunt. Zo hebben zowel verschillen tussen twee uitkomsten als verhoudingen
van twee uitkomsten een reële betekenis.

 VVV – meetvariatie
pagina: 4/29
formuleboekje

1. BESCHRIJVEN VAN EEN STEEKPROEF MET EEN FREQUENTIETABEL

Notatie afspraken:
n = aantal elementen steekproef
N = aantal elementen populatie
i = een volgnummer (plaats van x binnen de uitkomstenruimte) ⇒ te gebruiken als index
Range = maximum – minimum
Opstellen van een frequentietabel met één dimensie (= één kolom)
De steekproef wordt geklasseerd volgens één variabele.

Kolom 1 en kolom 2 van de frequentietabel


Kolom 1 is de kolom met het volgnummer i .
Kolom 2 is de kolom met de mogelijke uitkomsten → invulling afhankelijk van de
uitkomstenruimte (en dus van het gekozen meetniveau).

indelen in klassen
⇒ keuze klassengrenzen
zuiver wiskundige benadering
* deel Range door ‘gewenste aantal klassen’ (meestal ± 10 );
* kies een ‘mooi’ getal in de buurt van deze uitkomst als mogelijke breedte
(w als notatie voor klassenbreedte)
* de ondergrens van het laagste interval is dan: min - breedte/2
logische benadering
* rangschikt de steekproef in stijgende volgorde
* schrijf een ‘waarde die op een schaalverdeling hoort’ onder de kleinste en boven de
grootste waarde
* verdeel dan deze schaalverdeling in minimaal 6 en maximaal 10 intervallen
⇒ notatie intervallen:
* als half-open interval: [ondergrens,bovengrens[ (in vb [2000,3500[)
* kleinste getal-grootste getal van een klasse (in vb 2000-3499)

De andere kolommen van een frequentietabel


definitie: frequentie fi = f(xi)
= aantal keer dat xi voorkomt binnen de steekproef
= aantal elementen van de steekproef dat in klasse i zit
( fi is een natuurlijk getal ! )

fi
definitie: relatieve frequentie Fi =
n
= proportie van de steekproef dat behoort tot klasse i

definitie: cumulatieve frequentie of c.fi


c.f1 = f1
c.fi = c.fi-1 + fi voor i = 2,3,...

definitie: cumulatieve relatieve frequentie of c.Fi


c.F1 = F1
c.Fi = c.Fi-1 + Fi voor i = 2,3,...
Opstellen van een frequentietabel met meerdere dimensies: kruistabel

 VVV – meetvariatie
pagina: 5/29
formuleboekje

De steekproef wordt geklasseerd volgens twee variabelen (kolom- en rijtitels) en bevat alleen
frequenties.

2. BESCHRIJVEN VAN EEN STEEKPROEF MET GRAFIEKEN

• Taartdiagram (Pie-chart):
dit diagram vergelijkt de aangeduide getallen (fi) procentueel met elkaar (fi wordt omgezet
naar Fi) en is alleen zinvol bij nominale en ordinale (indien weinig categorieën) variabelen.

• Blokkendiagram (of staafdiagram): fi in functie van xi

• Stem-and-Leaf plot: een ‘numerieke grafiek’


Gebruikt bij numerieke metingen waarbij elke waarneming xi bestaat uit tenminste 2 cijfers.
Dit cijfer wordt gesplitst in een ‘stem’ (de eerste cijfers) en een ‘leaf’ (de resterende cijfers:
deze moeten voor alle getallen evenveel cijfers bevatten). In de eerste kolom van de tabel
plaats je de ‘stem’ en in de tweede kolom de ‘leaf’.

• Histogram: is een blokkendiagram van fi (of Fi) in functie van xi bij interval of ratio.
Meestal wordt er aan het histogram nog een frequentiepolygoon of -verdeling
toegevoegd.

• Frequentiepolygoon: is een lijndiagram (punten verbonden door lijn) van Fi in


functie van xi.

• Cumulatief frequentiepolygoon of percentielendiagram: is een lijndiagram van c.Fi


in functie van xi.

• Frequentieverdeling: is een spreidingsdiagram (vloeiende lijn) van Fi in functie van


xi. Meer over frequentieverdelingen volgt in hoofdstuk 2&3. Hierna volgt de
verdeling van steekproef 2.

Eigenschap 1: de oppervlakte onder deze kromme is altijd gelijk aan 1

Eigenschap 2: teken de ophaallijn voor een bepaalde x-waarde; de oppervlakte onder de


curve, links van deze ophaallijn is dan gelijk aan c.F (= de kans op een waarde
kleiner of gelijk aan de gekozen x).

• Cumulatieve frequentieverdeling of percentielendiagram: is een spreidingsdiagram


van c.Fi in functie van xi.

• polygonen gebruik je voor de lage meetniveaus en verdelingen voor de hoge


meetniveaus

 VVV – meetvariatie
pagina: 6/29
formuleboekje

• Boxplot:

3. BESCHRIJVEN VAN EEN STEEKPROEF MET PARAMETERVRIJE KENGETALLEN

⇒ Men onderscheidt twee types kengetallen naar uitdrukking:


- maat voor de centrale tendens
- maat voor de spreidingstendens

centrale tendens
1) modus
is de xi die hoort bij de grootste fi-waarde m.a.w. deze xi komt het meeste
voor in de steekproef
→ x-waarde van het maximum van het histogram

modus bij intervallen: klassenmidden van de klasse met grootste


of anders gebruiken van begrip ‘modale klasse’

2) mediaan
is die waarde uit de steekproef waarvoor 50% van de steekproef een kleinere (of gelijke)
waarde heeft en 50% een grotere

berekening vanuit de datamatrix:


rangschik alle elementen van de steekproef in stijgende volgorde

→ n oneven →Me = middelste getal van deze rangschikking


→ n even →Me = gemiddelde van de twee middelste getallen van deze rangschikking

⇒ samengevat: Me = getal met positie (n+1)⋅0,5 in de rangschikking

 VVV – meetvariatie
pagina: 7/29
formuleboekje

spreidingstendens

1) Range
= max - min

2) Percentiel
→ het percentiel PX (0 ≤ X ≤ 100) = de uitkomst waarvoor c.Fi gelijk is aan 0,X
bvb. P10 of het 10de percentiel van een steekproef, is deze waarde waarvoor 10% van de
uitkomsten ≤ zijn en (100-10)% = 90% van de getallen ≥ zijn, voor deze x-waarde is de
oppervlakte in de linkerstaart onder de frequentieverdeling = 0,10

→ berekening via bepaling van de (rang-)‘orde’


PX heeft de orde in de stijgend gerangschikte gegevens = (n + 1)*0,X

Percentielen met aparte naam:


→ P50 = de mediaan of het 50ste percentiel → positie (n+1)⋅0,50
→ P25 = het eerste kwartiel Q1 of het 25ste percentiel → positie (n+1)⋅0,25
→ P75 = het derde kwartiel Q3 is het 75ste percentiel → positie (n+1)⋅0,75

3) IQR
⇒ InterQuartile Range = IQR = P75 – P25
= Q3 - Q1

Een toepassing: kwartielen en ‘outliers’


Definitie: uitzondering, outlier of uitbijter is een waarde van de steekproef die het gevolg is
van een volledig foute meting. Deze waarde ligt ver uit de buurt van de andere
getallen en beïnvloedt zo de statistische berekeningen in negatieve zin. In de
statistiek veronderstelt men dat je, als gevolg van toevallige invloeden, maximaal
5% mag (dus niet moet) maken. Metingen die het gevolg zijn van zo’n meetfout,
mag je dan weglaten.

→ Mogelijke uitbijters zijn dus de kleinste waarde(n) en/of de grootste


waarde(n) van de geordende steekproef.

Wanneer mag je schrappen ?


bereken: Q1 – 1,5 * IQR ≈ P2,5
bereken: Q3 + 1,5 * IQR ≈ P97,5
elk getal van de steekproef dat buiten deze grenzen valt, is een ‘outlier’.

 VVV – meetvariatie
pagina: 8/29
formuleboekje

formules uit hoofdstuk 2 (beschrijvende technieken en parametrische kengetallen)

1. BESCHRIJVEN VAN EEN STEEKPROEF MET PARAMETRISCHE KENGETALLEN

⇒ Men onderscheidt twee types kengetallen naar uitdrukking:


- maat voor de centrale tendens
- maat voor de spreidingstendens
⇒ Men onderscheidt twee types kengetallen naar benaming:
- statistieken: getallen berekend op basis van een steekproef (Latijnse letters)
- parameters: getallen berekend op basis van de volledige populatie (Griekse letters)
⇒ Men onderscheidt twee types frequentieverdelingen:
- parametervrij: van de frequentieverdeling is de wiskundige uitdrukking niet gekend
- parametrisch: van de frequentieverdeling is de wiskundige uitdrukking wel gekend.

centrale tendens

het (rekenkundig) gemiddelde


n

∑x
i =1
i
voor een steekproef = x =
n
N

∑x i
voor de volledige populatie = µ = i =1
N

een gewogen gemiddelde


= ∑ wi ⋅ xi
hierin staat wi voor wegingscoëfficiënten, er geldt bovendien ∑w i =1

het harmonisch gemiddelde


xharm. volgt uit
1 1 n 1
= ⋅∑
xharm. n i =1 x i

spreidingstendens
de standaardafwijking

∑ (x i − x )2
voor een steekproef = SD of s = i =1
→ toets rekenmachine σn-1
n −1

 VVV – meetvariatie
pagina: 9/29
formuleboekje

∑ (x i − µ)2
voor de populatie = σ = i =1
→ toets rekenmachine σn
N

en spreidingstendens wordt soms uitgedrukt door de variantie (s2 of σ2).

combinatie van centrale en spreidingstendens: VC


uitgedrukt door de relatieve standaardafwijking (RSD) of variatiecoëfficiënt (VC% of CV%)
SD
RSD =
x
SD
VC% = × 100%
x

Standard Error of the Mean


(SE of soms SEM)

SD
→ formule SE =
n

De echte waarde van µ ligt dan


met 95% zekerheid tussen de waarden x - 2⋅SE en x + 2⋅SE
met 99,8% zekerheid tussen de waarden x - 3⋅SE en x + 3⋅SE

Frequentieverdeling en kengetallen
De vorm van de frequentieverdeling (en dus ook het mogelijk wiskundig verband tussen xi en
Fi) legt vast welke kengetallen zinvol zijn. Zo is een curve met meerdere maxima een geval
van parametervrije kenmerken: een gemiddelde waarde en standaardafwijking hebben hier
weinig betekenis. Meestal geldt volgende redenering
→ bij een symmetrische frequentieverdeling kiest men voor gemiddelde ( = mediaan) en
standaardafwijking als kengetallen; bij een scheve (niet-symmetrisch) kiest men meestal
voor Me en de kwartielen als kengetallen

 VVV – meetvariatie
pagina: 10/29
formuleboekje

2. BESCHRIJVEN VAN EEN POPULATIE: DE NORMALE VERDELING (GAUSSCURVE)

→ notatie: f(x) voor de normale verdeling (dit is de frequentieverdeling)


F(x) voor cumulatieve normale verdeling(dit is de cumulatieve freq.verdeling)

( x −µ )2
1 −
→ formule: f(x) = e 2σ2
(hierin π = 3,14…)
2π ⋅σ

→ de grafieken:
normale verdeling
f(x)

0,0350
0,0300
0,0250
0,0200
0,0150
0,0100
0,0050
0,0000
0 10 20 30 40 50 60 70 80 90 100 110

cumulatieve normale verdeling


F(x)

00 001

00 001

00 001

00 000

00 000

00 000
0 10 20 30 40 50 60 70 80 90 100 110

→ twee parameters of kengetallen: µ (populatiegemiddelde) en


σ (populatiestandaardafwijking)
→ een veel gebruikte verkorte notatie voor dit functievoorschrift: N(µ;σ2)
+∞
→ ∫ f ( x ).dx =1 ⇒ de oppervlakte onder de kansfunctie = 1 ⇒⇒ combinatie µ en σ bepaalt
−∞
de vorm van de ‘piek’

→ er geldt (zie ook cumulatieve normale verdeling):


99,8% van de populatie ligt tussen µ ± 3⋅σ
95% van de populatie ligt tussen µ ± 2·σ
70% van de populatie ligt tussen µ ± 1⋅σ

 VVV – meetvariatie
pagina: 11/29
formuleboekje

3. BESCHRIJVEN VAN EEN STEEKPROEF MET ‘GROEPEN’ HERHAALDE METINGEN


⇒ SPREIDING INTRA EN INTER

Samenvatting van een tabel met groepen herhaalde metingen


Het totale gemiddelde (‘grand mean’ – ‘ANOVA mean’) x van de tabel is het gemiddelde
van alle n meetresultaten

∑ ∑ 𝑥𝑥𝑖𝑖𝑖𝑖
𝑥𝑥̿ = (i = rijaanduiding en j = kolomaanduiding)
𝑛𝑛

Bij gelijke groepsgrootte is dit gelijk aan het gemiddelde van de k groepsgemiddelden
∑𝒌𝒌𝒋𝒋=𝟏𝟏 𝒙𝒙�𝒋𝒋
�=
𝒙𝒙 𝒌𝒌

Bij ongelijke groepsgrootte is dit gelijk aan het gewogen gemiddelde (‘weighed mean’) x w
van de k groepen. De wegingscoëfficiënten worden bepaald door de respectieve
groepsgroottes ni.
∑𝒌𝒌𝒋𝒋=𝟏𝟏 𝒏𝒏𝒋𝒋 ∙𝒙𝒙�𝒋𝒋 𝑛𝑛𝑗𝑗
����
𝒙𝒙 𝒘𝒘 = - dit betekent dat 𝑤𝑤𝑗𝑗 =
𝒏𝒏 𝑛𝑛

Het globale gemiddelde (‘overall mean’) x van de tabel is het gemiddelde van de
k groepsgemiddelden

∑𝒌𝒌𝒋𝒋=𝟏𝟏 𝒙𝒙�𝒋𝒋
�=
𝒙𝒙 𝒌𝒌

De totale SD bestaat uit twee componenten


→ spreiding tussen de groepen SDb (between) of SDinter

→ spreiding binnen de groepen SDw (within) of SDintra

Formules (ni = grootte van groep i en k = aantal groepen):

∑ ((n )
k

k i − 1) ⋅ s i2
1
SDw = ⋅ ∑ si2 (bij gelijke groepsgrootte) en anders SDw = i=1

k i =1 k

∑ (n
i=1
i − 1)

( )
k
1
⋅ ∑ xi − x = SD tussen de groepsgemiddelden
2
SDb =
k − 1 i =1

De totale SD = SD 2w + SD b2 .
w staat voor within groups of binnen de groepen of intra-groep
b staat voor between groups of tussen de groepen of inter-groep

 VVV – meetvariatie
pagina: 12/29
formuleboekje

(k − 1) ⋅ SD b2 + (n − k ) ⋅ SD 2w
De gemiddelde of ‘pooled’ SD =
n −1

k = aantal groepen en n = totaal aantal getallen (alle groepen)

SDb2 − SDw2
ICC (intra class correlatiecoëfficiënt) of rI =
SDb2 + SDw2

onderlinge vergelijking intra ↔ inter individuele variatiecoëfficiënten

de‘individuality index’ of I-index (afkorting II) of Ratio


VC I % VCintra
I-index = of =
VC G % VCinter

SDI
Hierin staat VCI% = 100 ⋅ voor de intra-individuele VC%, x voor ‘grand mean’
x
SD G
en VCG% = 100 ⋅ voor de inter-individuele VC%, x voor ‘overall mean’.
x

4. PROPAGATIE VAN DE STANDAARDAFWIJKINGEN

staat voor:
- als je een lineaire combinatie (sommen en verschillen) maakt van metingen van
verschillende parameters xi of x i (en elke meting heeft een eigen standaardafwijking
si) dan is de totale standaardafwijking voor deze lineaire combinatie gegeven door
s12 + s 22 + s 32 + s 24 + .....

- als je een product of quotiënt maakt van metingen van verschillende parameters xi of
x i (en elke meting heeft een eigen standaardafwijking si) dan is de totale relatieve
standaardafwijking voor deze berekening gegeven door
RSD12 + RSD 22 + RSD 32 + RSD 24 + .....

 VVV – meetvariatie
pagina: 13/29
formuleboekje

formules uit hoofdstuk 3 (normale verdeling en verdeling steekproefgemiddelde)

1. PLAATS VAN EEN INDIVIDUELE METING BINNEN EEN POPULATIE: DE NORMALE EN DE


STANDAARDNORMALE VERDELINGEN

standaardnormale verdeling (z-waarde)


Uitspraken doen over de plaats van een individuele uitkomst binnen een normale verdeling
kan via transformatie van de gegevens naar de standaardnormale verdeling (z-waarde).

Definitie: z-waarde
x−µ
van een mogelijke uitkomst x in N(µ;σ²) =
σ
z2
1 −
deze z-waarde volgt de ‘standaardnormale verdeling’ f ( x ) = e 2
of N(0;1)

Je kan dan klasseren ‘over de populatiegrenzen heen’ op basis van deze z-waarden en met
volgende tabel:

categorie percentiel z-waarde status


I 0,0 – 5,0 z < -1,645 extreem laag …..
II 5,0 – 15,0 -1,645 < z < -1,036 onder gemiddelde …..
III 15,0 – 85,0 -1,036 < z < +1,036 gemiddeld …..
IV 85,0 – 95,0 +1,036 < z < +1,645 boven gemiddelde …..
V 95,0 – 100;0 +1,645 < z extreem hoog …..
….. is bvb gewicht, vetgehalte

Definitie: p-waarde

p-waarde van x = de kans op een nog ‘extremer’ resultaat dan deze x


= de kans op een nog extremere z-waarde dan deze berekend voor x
= de oppervlakte onder N(0;1) in linkerstaart als z<0
in rechterstaart als z>0

Notatie z-waarde en p-waarde

de p-waarde wordt als index aan de z-waarde toegevoegd.

Zo staat z 0,10L voor de éénzijdige z-waarde die hoort bij een p-waarde van 10% in de
1

linkerstaart, z 0,10R voor de z-waarde die hoort bij een p-waarde van 10% in de rechterstaart en
1

z 0,10R voor de z-waarde (rechterstaart) die hoort bij een p-waarde van 10% verdeeld over beide
2

staarten (dwz 90% van de populatie wordt ingesloten).

 VVV – meetvariatie
pagina: 14/29
formuleboekje

referentiewaarden en cutoff opstellen

Men vertrekt van een voldoende grote steekproef (500 – 1000) en men berekent dan als
referentie-interval de grenswaarden die horen bij de p-waarden van 0,05 (tweezijdig).

formules: µ ± z αR ⋅ σ = µ ± 1,96 ⋅ σ ≈ µ ± 2 ⋅ σ ≈ x ± 2 ⋅ SD
2

Het interval µ ± z αR ⋅ σ = µ ± 3,089 ⋅ σ ≈ µ ± 3 ⋅ σ ≈ x ± 3 ⋅ SD sluit 99,8% van de populatie


2

in en is het limietinterval.

voor één enkele grenswaarde in alle formules wordt z αR vervangen door z αR


2 1

Voor verdelingsvrije (als de frequentieverdeling van de grote steekproef niet op normale


verdeling wijst) referentiewaarden neemt men de waarden van Q(0,025) en Q(0,975)
(resp. Q(0,05) of Q(0,95)).

Standaardnormale verdeling en percentielen en kwartielen

P25 heeft een z-waarde = -0,67


P50 heeft een z-waarde = 0,00
P75 heeft een z-waarde = +0,67

⇒ IQR = 1,34 voor N(0;1) en IQR = 1,34σ voor N(µ;σ2)

P2,5 of Q(0,025) = -1,96 en P97,5 of Q(0,975) = +1,96


⇒ 95% van de populatie ligt binnen een gebied van ±1,96σ rond µ

P0,1 of Q(0,0010) = -3,00 en P99,9 of Q(0,9990) = +3,00


⇒ 99,8% van de populatie ligt binnen een gebied van ±3,00σ rond µ

 VVV – meetvariatie
pagina: 15/29
formuleboekje

2. VERDELING VAN EEN STEEKPROEFGEMIDDELDE (CENTRALE LIMIETSTELLING)


De centrale limietstelling stelt dat de statistiek x , berekend voor één bepaalde steekproef
met grootte n uit N(µ;σ²), behoort tot een normale verdeling N( µ x ; σ2x ): de ‘verdeling van het
steekproefgemiddelde’

De centrale limietstelling stelt ook dat voor n groter dan 30, x behoort tot een bijna normale
verdeling N( µ x ; σ2x ) of de oorspronkelijke populatie normaal is of niet

De centrale limietstelling stelt bovendien ook dat:


µx = µ
σ
σx =
n

x − µx x − µ
⇒ Gevolg: z-waarde van x in N( µ x ; σ2x ) = =
σx σ
n

σ
⇒ Gebruikte notatie: SE i.p.v. σ x ⇒ SE =
n

3. BETROUWBAARHEIDSINTERVAL VOOR µ EN T-VERDELING

betrouwbaarheidsinterval (afkorting b.i.)


Dit is het interval (berekend met de statistieken van de steekproef) waarbinnen met …%
zekerheid de echte waarde van de parameter ligt.
Meestal neemt een 95% betrouwbaarheidsinterval (dwz de ‘onzekerheid’ α = 0,05).

formules voor een 95% b.i. voor µ bij een steekproef (grootte n) uit een normaal
verdeelde populatie
Een steekproef (grootte n) uit N(µ;σ²) levert x en s op.

De formules voor een (1-α)% bi voor µ zijn


s
⇒ de ondergrens = x − t αR ;df ⋅
2
n
s
⇒ de bovengrens = x + t αR ;df ⋅
2
n

Merk op: het betrouwbaarheidsinterval voor µ ligt symmetrisch rond x

De t-verdeling hangt af van de grootte van de steekproef n.


Men noemt dan n-1 het aantal vrijheidsgraden van deze t-verdeling
⇒ notatie: df = n-1 (degrees of freedom)

⇒ notatie waarde tabel: t αR ;df


2

 VVV – meetvariatie
pagina: 16/29
formuleboekje

gebruik b.i. in het laboratorium


Als je in het laboratorium een reeks herhaalde metingen uitvoert en met het gemiddelde x
verdere berekeningen uitvoert dan neemt men de grenzen van het 95%
betrouwbaarheidsinterval voor µ als absolute fout A.F. op deze gemiddelde waarde.

s
A.F.x = t 0,05R ;df ⋅
2
n

b.i. en minimale steekproefomvang


s
Je kan de term ± t αR ;df ⋅ interpreteren als de ‘fout’ op x om µ te benaderen. Als je deze
2
n
term vooraf aan een bepaalde waarde gelijkstelt, kan je hieruit een waarde voor n berekenen:
dit is de minimale steekproefgrootte nodig om de vooropgestelde ‘afwijking’ niet te
overschrijden. In de praktijk gebeuren deze berekeningen met computerprogramma’s.

een belangrijk verschil: betrouwbaarheidsinterval b.i. ↔ referentieinterval r.i.


- een betrouwbaarheidsinterval geeft grenzen waarbinnen µ (het gemiddelde van de
populatie) met 95% zekerheid ligt
- een referentieinterval geeft (voor gegeven µ en σ) de grenzen waartussen 95% van de
populatie ligt

 VVV – meetvariatie
pagina: 17/29
formuleboekje

formules uit hoofdstuk 4 (juistheid en precisie)

1. VALIDATIE - ALGEMEEN

• validatie van een methode is het aantonen dat de methode geschikt is voor de
beoogde toepassing; dat wil zeggen voldoet aan de eisen die er met betrekking tot de
toepassing aan gesteld worden.

2. VALIDATIE MET ‘GROEPEN’ HERHAALDE METINGEN

Voor de meeste methoden beperkt validatie zich tot een studie van juistheid (trueness) en
precisie (precision).

3. JUISTHEID
de opgegeven steekproefgrootte n* is altijd een richtwaarde en geen absoluut gegeven.
*de reeks is een kleine steekproef met herhaalde** metingen .

** soms gebruikt men metingen verkregen onder verschillende omstandigheden


→ short term trueness ↔ long term trueness.

AANTONEN VAN JUISTHEID DOOR GEBRUIK VAN GECERTIFICEERD REFERENTIEMATERIAAL


CRM

nodig materiaal: een (gecertificeerde) controle


de waarden van de controles variëren tussen 80% van de laagst verwachte uitkomst en 120%
van de hoogste verwachte uitkomst (juistheid controleren over ganse meetbereik)

uit te voeren metingen: 6 herhaalde* metingen op de controle

de statistiek:
1) ofwel 95% b.i. voor µ
x
2) ofwel berekening van ‘Juistheid%’ of ‘Recovery%’ = × 100
µ
x−µ
3) ofwel berekening van %verschil (%difference) = × 100
µ

AANTONEN VAN JUISTHEID DOOR VERGELIJKING MET REFERENTIEMETHODE


zie hoofdstuk 6 van deze cursus.

 VVV – meetvariatie
pagina: 18/29
formuleboekje

4. PRECISIE

⇒ invulling 1: HERHAALBAARHEID (REPEATABILITY)

symbool: r

uit te voeren metingen: n herhaalde metingen

de statistiek: bereken SDr of VCr% als maat voor de onderlinge spreiding van de bepalingen

SDr
formule: VCr% = ⋅ 100
x

⇒ invulling 2: INTERMEDIAIRE PRECISIE (INTERMEDIATE PRECISION)

symbool: R

uit te voeren metingen: n herhaalde metingen per staal per identieke omstandigheid

Je moet nu rekening houden met twee ‘variatiebronnen’ (oorzaken van mogelijke spreiding
binnen de meetresultaten):

→ tussen de groepen (between): SDbetween


→ binnen de groepen (within): SDwithin

de statistiek:

sR
VCR% = ⋅ 100
x

met 𝑠𝑠𝑅𝑅 = �𝑠𝑠𝑤𝑤2 + 𝑠𝑠𝑏𝑏2

Men spreekt van reproduceerbaarheid als de metingen gegroepeerd worden volgens de


plaats (het labeffect).

 VVV – meetvariatie
pagina: 19/29
formuleboekje

5. DETECTIE CAPABILITEIT

• Blanco – Blank is een monster dat de te bepalen component niet bevat of waarvan de
concentratie ver onder de werkbare range valt.
• Blancolimiet – Limit of Blank (LoB) van een methode is het hoogste meetresultaat
dat men redelijker wijs kan verwachten voor een blancostaal. Redelijker wijs betekent
hier met kans op misclassificatie 0,05.

de statistische achtergrond:
(minstens) 20 verschillende blanco stalen meten
→ éénzijdig 95% betrouwbaarheidsinterval voor het gemiddelde blanco-signaal opstellen

LoB =

= (als de aflezingen gecorrigeerd worden met de blanco)

6. NORMALE VERDELING EN OUTLIERS – DIXON

Vraag: bevat een gegevensreeks (normaal verdeelde veranderlijke) ‘outliers’ (95%


betrouwbaarheid)?

Oplossing:
Rangschik de reeks in stijgende volgorde:

verdachte waarde - volgende/vorige waarde


Bereken de Q-waarde: Q =
Range

Dit getal moet je vergelijken met een zo genaamde ‘kritieke waarde’ (grenswaarde) uit
volgende tabel:

steekproefgrootte kritieke waarde voor Q (95% betr.)


3 0,941
4 0,765
5 0,642
6 0,560
7 0,507
8 0,554
9 0,512
10 0,477

als Q-berekend > Q-tabel ⇒ waarde is een uitzondering


als Q-berekend ≤ Q-tabel ⇒ waarde is geen uitzondering

 VVV – meetvariatie
pagina: 20/29
formuleboekje

7. NORMALE VERDELING EN OUTLIERS – GRUBB’S

gegeven: een geordende steekproef uit een normaal verdeelde populatie


bereken: x en s

x 1 of n − x
voor de uiterste waarde(n) x1 en/of xn: G1 of n =
s

zoek de kritieke waarden op in volgende tabel:


steekproefgrootte grens voor 95% betr. grens voor 99% betr.
3 1,155 1,155
4 1,481 1,496
5 1,715 1,754
6 1,887 1,973
7 2,020 2,139
8 2,126 2,274
9 2,215 2,387
10 2,290 2,482
11 2,355 2,564
12 2,412 2,636
13 2,462 2,699
14 2,507 2,755
15 2,549 2,809
16 2,585 2,852
17 2,620 2,894
18 2,651 2,932
19 2,681 2,968
20 2,709 3,001

als G1 of n > grenswaarde van 99% betrouwbaarheid


⇒ waarde is een uitzondering; x1 en/of xn mag geschrapt worden
als G1 of n > grenswaarde van 95% betrouwbaarheid
⇒ waarde is een ‘straggler’ (= bijna outlier); x1 en/of xn mag niet geschrapt worden
(getal wordt wel in de reeks aangegeven met*)
als G1 of n ≤ grenswaarde van 95% betrouwbaarheid
⇒ waarde is geen uitzondering

 VVV – meetvariatie
pagina: 21/29
formuleboekje

formules uit hoofdstuk 5 (enkelvoudige lineaire regressie)

1. LINEAIRE CORRELATIE (PEARSON)


lineaire correlatie ↔ correlatiecoëfficiënt van Pearson
dit is een statistische techniek waarmee men kan nagaan of er tussen twee gegevensreeksen
een (significant) lineair verband (beide parameters zijn dan verbonden door een vergelijking
van de eerste graad) bestaat.
als correlatiecoëfficiënt ± +1 ⇔ er bestaat een positief (stijgende rechte) lineair verband
als correlatiecoëfficiënt ± -1 ⇔ er bestaat een negatief (dalende rechte) lineair verband
als correlatiecoëfficiënt ± 0 ⇔ er bestaat geen lineair verband

symbool: rP

voorwaarde voor lineaire correlatieberekeningen


xi is een gecontroleerd, dus exact gekend getal (bevat geen meetfout)
yi is een, bij bepaalde xi, gemeten getal en dus een kansvariabele
⇒ voor elke xi varieert yi volgens een normale verdeling met variantie σ² (waarde σ is
onafhankelijk van xi) rond zijn ‘echte’ waarde

berekening:
n
→ bereken: SS xx = ∑ ( x i − x ) 2
i=1

n
SS yy = ∑ ( y i − y ) 2
i=1

n
SS xy = ∑ ( x i − x ) ⋅ ( y i − y )
i=1

in de formules staat SS voor kwadratensom (Sum of Squares).


SS xy
→ formule: rP =
SS xx ⋅ SS yy

conclusie
→ grenswaarde: tabel Pearson (formuleboekje)
in de 1ste kolom zoek je n
voor de vraag naar correlatie (dwz stijgend of dalend) neem je de kolom onder α2 = 5% (3de
kolom)
voor de vraag naar stijgend lineair verband neem je de kolom onder α1R = 5% (2de kolom)
voor de vraag naar dalend lineair verband neem je de kolom onder α1R = 5% (2de kolom)
→ besluit: als berekende |rp| > waarde uit deze tabel dan is de lineaire correlatie aangetoond
→ Berekening in de praktijk: Excelfunctie CORRELATIE(y-waarden;x-waarden)

 VVV – meetvariatie
pagina: 22/29
formuleboekje

2. (ENKELVOUDIGE) LINEAIRE REGRESSIE – KLEINSTE KWADRATENMETHODE

Begrip: we zoeken de vergelijking van de best passende rechte door een reeks puntenkoppels.

Merk op: in statistiek staat a voor de constante van de rechte


staat b voor de richtingscoëfficiënt van de rechte

Voorwaarden voor de berekeningen van de best passende rechte


- er is zinvolle correlatie aangetoond (Pearson): in de praktijk komt dit meestal neer op een
visuele controle van de scatterplot

- xi is een gecontroleerd, dus exact gekend getal (bevat geen meetfout)


yi is een, bij bepaalde xi, gemeten getal en dus een kansvariabele
⇒ voor elke xi varieert yi volgens een normale verdeling met variantie σ² rond zijn
‘echte’ waarde

notaties: α en β voor de parameters en a en b voor de statistieken (steekproef)


n = aantal puntenkoppels
df = n - 2 = aantal vrijheidsgraden van een rechte
yi de y-waarde van een gegeven punt (xi,yi)
ŷ i de verwachte waarde (expected value) = a + b ⋅ x i

definitie: residu of error van een gegeven punt (xi,yi) e i = y i − ŷ i (bevat teken!)

definitie: de statistisch ‘best passende’ rechte door de opgegeven punten


de best passende rechte zoek je met de methode van de kleinste kwadraten.

de rechte y = a + b ⋅ x is ‘best passend’ voor gevonden waarden voor a en b


n n
⇔ de som van de kwadraten ∑ (y i − ŷ i ) = ∑ e i2 wordt minimaal voor deze a en b.
2

i=1 i=1

De oplossing van het kleinste kwadratenprobleem (een extremumvraagstuk: via partiële


afgeleiden):
SS xy
→ de richtingscoëfficiënt b = (eenheid b = eenheid y-as/eenheid x-as)
SS xx

→ de constante a = y − b ⋅ x (eenheid a = eenheid y-as)

gevolg: de best passende rechte gaat altijd door ( x , y )


( x , y ) is het gemeenschappelijke punt van y = a + b⋅x en y = α + β⋅x

 VVV – meetvariatie
pagina: 23/29
formuleboekje

definitie: standaardfout SE van de gevonden rechte

het kleinste kwadraat (te berekenen met de a en b van de best passende rechte) wordt afgekort
n
als SSE ⇒ SSE = ∑ (y − ŷ i )
2
i
i=1

SSE ∑ (y i − ŷ i ) 2
→ formule standaardfout: SE = = i=1
(SE heeft de eenheid van de y-as)
n−2 n−2

SE
→ formule standaardafwijking: SD = (SD heeft eenheid x-as)
b

SD SE
→ VC = 100 ⋅ = 100 ⋅ (VC in %)
x b⋅x

voorwaarden voor regressieberekeningen herschreven naar residu’s of errors


- de residu’s ei zijn onafhankelijke van elkaar
- deze ei volgen een normale verdeling N(0; SE²)
SE = Standard Error of standaardfout = ‘standaardafwijking’ van de rechte
(sommige boeken gebruiken hier σ als notatie)
SE² = de variantie van yi ronde de kleinste kwadratenlijn voor bepaalde xi
d.w.z. yi volgt N(α + β·xi; SE²)

residuele plot
is de scatterplot van de residu’s y − ŷ in functie van de referentiewaarde x (of van de
verwachte waarde ŷ ). Zie ook hoofdstuk 6 van deze cursus.

residuele plot en ‘outliers’ bij de gegevens punten:


Vertrek van de grafiek van de (xi of y i , ei) - koppels en trek rond de nullijn ± 2 SE-lijnen
(95% betrouwbaarheid) of ± 3 SE-lijnen (99% betrouwbaarheid): alle puntenkoppels die
buiten de zo ontstane band vallen, zijn uitbijters. Laat deze weg en voer alle
regressieberekeningen opnieuw uit.

 VVV – meetvariatie
pagina: 24/29
formuleboekje

3. (ENKELVOUDIGE) LINEAIRE REGRESSIE – BETROUWBAARHEIDSINTERVAL VOOR α EN β


gevolg van SE ⇒ SE(b) en SE(a) of de standaardfouten op b en a

SE 2 SSE
de formules: SE(b) = =
n
(n − 2) ⋅ SS xx
∑ (x
i=1
i − x)2

  n
  SSE ⋅ ∑ x i2
 1 x2  ⋅ SE² =
SE(a) = + i=1
n n  n(n − 2) ⋅ SS xx



i=1
(x i − x)2 

Met deze formules kan je betrouwbaarheidsintervallen (definite zie hoofdstuk 4 – methoden


en onderzoek) opstellen voor α eb richtingscoëfficiënt β.

[
een 95% b.i. voor β: b − t 0,05R ;df ⋅ SE(b),b + t 0,05R ;df ⋅ SE(b)
2 2
]
[
een 95% b.i. voor α: a − t 0,05R ;df ⋅ SE(a), a + t 0,05R ;df ⋅ SE(a)
2 2
]
Er geldt:
bevat het 95% b.i. voor α het getal nul ⇒ de rechte gaat door de oorsprong
bevat het 95% b.i. voor β het getal nul ⇒ horizontale rechte

4. (ENKELVOUDIGE) LINEAIRE REGRESSIE – LIJNSCHATTING (EXCEL)


de functie LIJNSCHATTING van excel geeft (indien juist uitgevoerd) volgende informatie
over het kleinste kwadraten probleem:
de output is een (5x2) blok
b a
SE(b) SE(a)
r² SE
F df
SSreg SSRes

uitvoeren van deze functie (dit gaat niet via het menu invoegen functie):
- sleep de muis over een (5x2) blok
- tik in: =LIJNSCH(blok y-waarden;blok x-waarden;WAAR;WAAR)
- druk de toetsen Ctrl en shift samen in en gebruik (toetsen ingedrukt houden) dan enter
- de 10 getallen verschijnen in de aangeduide cellen

 VVV – meetvariatie
pagina: 25/29
formuleboekje

5. (ENKELVOUDIGE) LINEAIRE REGRESSIE – Y-WAARDEN VOORSPELLEN


→ Gegeven: een waarde voor x, genoteerd x0

→ bereken de te verwachten y-waarde voor de gegeven x-waarde:


ŷ = a + b⋅x0 (schatting via de gevonden oplossing y = a + b⋅x)

→ De standaardfout op deze ŷ wordt genoteerd als SE( ŷ ) en heeft als formule:


 
 
(x − x)2
SE( ŷ ) = 1 + + n 0  ⋅ SE 2
1
 n 
→ prediction


∑i=1
(x i − x)2 

→ Het 95% b.i. voor de echte y is dan: [ ŷ - t 0,05R ;df ⋅ SE( ŷ ) , ŷ + t 0,05R ;df ⋅ SE( ŷ ) ]
2 2

Opmerking: als de gegeven x0 behoort tot de gegevensreeks (dit zijn de xi-waarden van de n
puntenkoppels) wordt de formule iets eenvoudiger:
 
 
(x − x)2
SE( ŷ ) =  + n 0  ⋅ SE 2
1
n 
→ confidence



i=1
(x i − x)2 

(mean prediction)

Regressie, confidence en prediction op grafiek

Linear Regression with


A
1200,00 95,00% Mean Prediction Interval and
golfl = 615,00 + 9,70 * conc 95,00% Individual Prediction Interval
R-Square = 1,00
1100,00 A

A
1000,00
golfl

A
900,00

800,00 A

A
700,00

10,00 20,00 30,00 40,00 50,00 60,00

conc

 VVV – meetvariatie
pagina: 26/29
formuleboekje

6. (ENKELVOUDIGE) LINEAIRE REGRESSIE – X-WAARDEN TERUGREKENEN


→ Gegeven: een waarde voor y, genoteerd y0

y0 − a
→ bereken de voor x te verwachten waarde (terugrekenen): x̂ =
b
(schatting via de gevonden oplossing y=a+ b⋅x)

→ De standaardfout op deze x̂ wordt genoteerd als SE( x̂ ) en heeft als formule:

 
 
2
SE  1 1 (y 0 − y)2 
SE( x̂ ) = ⋅ + +
b2  m n n 
 b 2 ∑ (x i − x)2 
 i=1 

hierin staat m voor het aantal keer dat je de onbekende meet en


y0 voor het gemiddelde van deze m bepalingen

→ Het 95% b.i. voor de echte x is dan: [ x̂ - t 0,05R ;df ⋅ SE( x̂ ) , x̂ + t 0,05R ;df ⋅ SE( x̂ ) ]
2 2

extrapoleren ↔ interpoleren:
de term ( y 0 − y ) 2 legt vast dat interpoleren (y0 van de onbekende ligt tussen de gemeten y-
waarden van de standaarden en dus in de buurt van y ) een kleinere fout op de onbekende
concentratie oplevert dan extrapoleren (↔ keuze standaarden)

 VVV – meetvariatie
pagina: 27/29
formuleboekje

formules uit hoofdstuk 6 (methodevergelijking)

1. METHODEVERGELIJKING MET ENKELVOUDIGE LINEAIRE REGRESSIE


Voorwaarde: twee kwantitatieve methoden en de voorwaarden van regressierekenen.

Dit betekent: herhaalde bepalingen volgen een normale verdeling


de x-waarden zijn ± constante waarden
elk staal of individu levert een puntenkoppel op

Een afspraak: voor elk getallenkoppel neem je


- als x-waarde: het resultaat bekomen met de referentiemethode (meestal het toestel dat
men wil vervangen, een goed gekende vragenlijst, resultaten van een bloedanalyse,…)
- als y-waarde: het resultaat bekomen met de ‘nieuwe’ of de ‘niet rechtstreekse’ (bvb.
Fe-opname berekend op basis van een FFQ) methode

De statistiek definieert twee types afwijkingen of fouten tussen de beide methodes: constante
fouten en proportionele fouten.

- constante afwijking of ‘bias’


- proportionele afwijking

concrete uitvoering:
nodig materiaal: n verschillende stalen of personen (liefst n ≥ 30, dit is dikwijls niet haalbaar)

uit te voeren metingen: de groep van n stalen wordt met beide methoden bepaald

de statistiek: voert dan enkelvoudige lineaire regressie (zie hoofdstuk 5) uit op de


getallenkoppels.

Grafische analyse van de regressieberekening:

1) de scatterplot of het spreidingsdiagram (met op de grafiek ook de 1ste bissectrice): de


resultaten van de nieuwe methode y in functie van de referentiemethode x

2) de residuele plot: residu y − ŷ in functie van de referentiewaarde x (of van de

verwachte waarde ŷ )

Een bedenking
- De uitleg in de tekst veronderstelt dat de resultaten van beide methoden
‘vergelijkbare’ getallen zijn (zelfde orde van grootte, zelfde referentiewaarden). Je
kan deze methode ook gebruiken om resultaten voor eenzelfde parameter maar met
twee toestellen die ‘niet-vergelijkbare’ waarden opleveren te vergelijken: gebruik de
z-waarden in de plaats van de meetresultaten!

 VVV – meetvariatie
pagina: 28/29
formuleboekje

2. METHODEVERGELIJKING MET BIAS- EN RATIOPLOTS


Voorwaarde: twee kwantitatieve methoden.

Een afspraak: voor elk getallenkoppel neem je


- als x-waarde: het resultaat bekomen met de referentiemethode (meestal het toestel dat
men wil vervangen, een goed gekende vragenlijst, resultaten van een bloedanalyse,…)
- als y-waarde: het resultaat bekomen met de ‘nieuwe’ of de ‘niet rechtstreekse’ (bvb.
Fe-opname berekend op basis van een FFQ) methode

De plots:

3) de biasplot (bias betekent afwijking): het verschil y − x in functie van x (de


referentiemethode)

Opmerking: soms gebruikt men procentuele bias in de plaats van bias; de formule
y−x
%bias = ⋅ 100
x

y
4) de ratioplot: de verhouding in functie van x (de referentiemethode)
x

5) de Bland en Altman-plot: het paarverschil in functie van het paargemiddelde

 VVV – meetvariatie
pagina: 29/29
tabellen'statistiek

Inhoudsopgave-tabellen

tabel pagina
standaardnormale'verdeling -132
grenzen'voor'betrouwbaarheidsinterval 3
Pearson 4

VVV','opleiding'BL'en'CH
tabellen'statistiek

tabel 'standaardnormale verdeling' (cumulatieve relatieve frequentie in functie van gegeven z-waarde)

z-waarde 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0,01 0,00
-3,2 0,0005 0,0005 0,0005 0,0006 0,0006 0,0006 0,0006 0,0006 0,0007 0,0007
-3,1 0,0007 0,0007 0,0008 0,0008 0,0008 0,0008 0,0009 0,0009 0,0009 0,0010
-3,0 0,0010 0,0010 0,0011 0,0011 0,0011 0,0012 0,0012 0,0013 0,0013 0,0013
-2,9 0,0014 0,0014 0,0015 0,0015 0,0016 0,0016 0,0017 0,0018 0,0018 0,0019
-2,8 0,0019 0,0020 0,0021 0,0021 0,0022 0,0023 0,0023 0,0024 0,0025 0,0026
-2,7 0,0026 0,0027 0,0028 0,0029 0,0030 0,0031 0,0032 0,0033 0,0034 0,0035
-2,6 0,0036 0,0037 0,0038 0,0039 0,0040 0,0041 0,0043 0,0044 0,0045 0,0047
-2,5 0,0048 0,0049 0,0051 0,0052 0,0054 0,0055 0,0057 0,0059 0,0060 0,0062
-2,4 0,0064 0,0066 0,0068 0,0069 0,0071 0,0073 0,0075 0,0078 0,0080 0,0082
-2,3 0,0084 0,0087 0,0089 0,0091 0,0094 0,0096 0,0099 0,0102 0,0104 0,0107
-2,2 0,0110 0,0113 0,0116 0,0119 0,0122 0,0125 0,0129 0,0132 0,0136 0,0139
-2,1 0,0143 0,0146 0,0150 0,0154 0,0158 0,0162 0,0166 0,0170 0,0174 0,0179
-2,0 0,0183 0,0188 0,0192 0,0197 0,0202 0,0207 0,0212 0,0217 0,0222 0,0228
-1,9 0,0233 0,0239 0,0244 0,0250 0,0256 0,0262 0,0268 0,0274 0,0281 0,0287
-1,8 0,0294 0,0301 0,0307 0,0314 0,0322 0,0329 0,0336 0,0344 0,0351 0,0359
-1,7 0,0367 0,0375 0,0384 0,0392 0,0401 0,0409 0,0418 0,0427 0,0436 0,0446
-1,6 0,0455 0,0465 0,0475 0,0485 0,0495 0,0505 0,0516 0,0526 0,0537 0,0548
-1,5 0,0559 0,0571 0,0582 0,0594 0,0606 0,0618 0,0630 0,0643 0,0655 0,0668
-1,4 0,0681 0,0694 0,0708 0,0721 0,0735 0,0749 0,0764 0,0778 0,0793 0,0808
-1,3 0,0823 0,0838 0,0853 0,0869 0,0885 0,0901 0,0918 0,0934 0,0951 0,0968
-1,2 0,0985 0,1003 0,1020 0,1038 0,1056 0,1075 0,1093 0,1112 0,1131 0,1151
-1,1 0,1170 0,1190 0,1210 0,1230 0,1251 0,1271 0,1292 0,1314 0,1335 0,1357
-1,0 0,1379 0,1401 0,1423 0,1446 0,1469 0,1492 0,1515 0,1539 0,1562 0,1587
-0,9 0,1611 0,1635 0,1660 0,1685 0,1711 0,1736 0,1762 0,1788 0,1814 0,1841
-0,8 0,1867 0,1894 0,1922 0,1949 0,1977 0,2005 0,2033 0,2061 0,2090 0,2119
-0,7 0,2148 0,2177 0,2206 0,2236 0,2266 0,2296 0,2327 0,2358 0,2389 0,2420
-0,6 0,2451 0,2483 0,2514 0,2546 0,2578 0,2611 0,2643 0,2676 0,2709 0,2743
-0,5 0,2776 0,2810 0,2843 0,2877 0,2912 0,2946 0,2981 0,3015 0,3050 0,3085
-0,4 0,3121 0,3156 0,3192 0,3228 0,3264 0,3300 0,3336 0,3372 0,3409 0,3446
-0,3 0,3483 0,3520 0,3557 0,3594 0,3632 0,3669 0,3707 0,3745 0,3783 0,3821
-0,2 0,3859 0,3897 0,3936 0,3974 0,4013 0,4052 0,4090 0,4129 0,4168 0,4207
-0,1 0,4247 0,4286 0,4325 0,4364 0,4404 0,4443 0,4483 0,4522 0,4562 0,4602
-0,0 0,4641 0,4681 0,4721 0,4761 0,4801 0,4840 0,4880 0,4920 0,4960 0,5000

VVV','opleiding'BL'en'CH pagina'2
tabellen'statistiek

tabel 'standaardnormale verdeling' (cumulatieve relatieve frequentie in functie van gegeven z-waarde)

z-waarde 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995

VVV','opleiding'BL'en'CH pagina'3
tabellen'statistiek

VVV','opleiding'BL'en'CH pagina'3
tabellen'statistiek

VVV','opleiding'BL'en'CH pagina'4

You might also like