Professional Documents
Culture Documents
College 4 - Oneway ANOVA & Multipele Vergelijkingen
College 4 - Oneway ANOVA & Multipele Vergelijkingen
LITERATUUR
Om een variantieanalyse uit te voeren, onderzoek je eerst de gegevens. Er hoeft slechts bij benadering aan de
modelvoorwaarden te worden voldaan om geldige resultaten te verkrijgen. Boxplots naast elkaar geven een
overzicht van de gegevens. Met normale kwantielplots en histogrammen (voor elke groep afzonderlijk of voor
de residuen) kun je uitschieters of extreme afwijkingen van de normaliteit detecteren.
Naast Normaliteit gaat het ANOVA-model uit van gelijke populatiestandaarddeviaties. Bereken de verhouding
tussen de grootste en de kleinste standaarddeviatie van de steekproef. Als deze verhouding kleiner is dan 2 en
de normaliteitsvoorwaarde redelijk is, kan ANOVA worden uitgevoerd.
ANOVA is gebaseerd op het opsplitsen van de totale variatie die in de gegevens wordt waargenomen in twee
delen variatie tussen groepen en variatie binnen groepen. Als de variatie tussen groepen groot is in
verhouding tot de variatie binnen groepen, hebben we bewijs tegen de nulhypothese.
De ANOVA F-test deelt de robuustheid van de t-test met twee steekproeven. Het is relatief ongevoelig voor
matige niet-normaliteit en ongelijke varianties, vooral als de steekproefomvang vergelijkbaar is.
1
§12.2 COMPARING THE MEANS
De ANOVA F-test zegt niet welke groepsgemiddelden verschillen. Het is daarom gebruikelijk om vergelijkingen
tussen de middelen toe te voegen aan eenrichtings-ANOVA.
Specifieke vragen die vóór het onderzoek van de gegevens zijn geformuleerd, kunnen als contrasten worden
uitgedrukt. Tests en betrouwbaarheidsintervallen voor contrasten geven antwoord op deze vragen.
Als er geen specifieke vragen worden geformuleerd voordat de gegevens worden onderzocht en de
nulhypothese van gelijkheid van populatiegemiddelden wordt verworpen, worden meervoudige
vergelijkingsprocedures gebruikt om de statistische significantie van de verschillen tussen paren gemiddelden
te beoordelen.
De minst significante verschillen (lsd)-methode controleert de waarschijnlijkheid van een valse afwijzing voor
elke vergelijking. De Bonferroni-methode controleert de algehele waarschijnlijkheid van enkele valse
afwijzingen bij alle vergelijkingen.
COLLEGE
INHOUD COLLEGE
Het concept;
Het ANOVA-model;
Toetsingsschema;
Multipele vergelijkingen.
VORIGE COLLEGES
De t-toets
o Wanneer?
o Welke?
o Hoe?
VISUALISATIE
1. Plot de gemiddelden;
2. Plot een benadering van de ruwe scores.
ANOVA-MODEL
INTRODUCTIE
2
Analysis Of Variance, variantieanalyse.
DE F-VERDELING
Als de populatiegemiddelden gelijk zijn, hoe groot zal F dan ongeveer zijn?
Als de variatie binnen en tussen de groepen wordt veroorzaakt door vergelijkbare dingen dan zal het aan
elkaar gelijk zijn, en je deelt dat door elkaar, kom je uit op 1. Daar hoort een grote p-waarde bij, niet
significant;
De F-verdeling is afhankelijk van twee vrijheidsgraden en wordt altijd eenzijdig getoetst.
DATA = FIT (variantie tussen de groepen) + RESIDUALS (variantie binnen de groepen) SST(sum of square of
total, de gekwadrateerde afstand totaal, alle variantie) = SSG (variantie tussen de groepen) + SSE (de variantie
binnen de groepen)
SSG = de som van de verschillen2 tussen de groepsgemiddelden en het overall gemiddelde voor alle scores;
SSE = de som van de verschillen2 tussen score en de respectievelijke groepsgemiddelden voor alle scores
(ook wel Residuals, de som van alle gekwadrateerde verschillen);
SST = de som van de verschillen2 van de scores t.o.v. van het overall gemiddelde voor alle scores (ook wel
Data, variantie van de drie groepsgemiddelde en de overal groepsgemiddelde);
3
o R2 = SSG/SST (coëfficiënt of determination = verklaarde
variantie, welk deel van de variantie wordt verklaard door
jouw model en welk deel niet);
Hoeveel variantie kan ik verklaren? Je krijgt
door deze formule een percentage, van
hoeveel procent variantie wordt verklaard
door jouw ANOVA-model;
Als je drie groepen hebt, tel je telkens drie
dingen bij elkaar op. Je telt op: het aantal
personen (Ni);
De bovenste is between en de onderste is within.
TOETSINGSSCHEMA: VOORBEELD
HET TOETSINGSSCHEMA
1. Onderzoeksvraag (+ situatieschets);
2. Hypothesen (één- of tweezijdig);
3. Toetskeuze (assumpties?) + significantieniveau α;
4. Berekening toetsstatistiek;
5. Aflezen p-waarde (tabel);
6. Beslissing (vergelijk p met α);
7. Inhoudelijke conclusie.
HET ONDERZOEK
DE ONDERZOEKSVRAAG
HYPOTHESEN
H0 = de gemiddelden op sociale vaardigheid van alle groepen kinderen (rakkers, welpen en explorers) in de
populatie zijn gelijk: μr= μw= μe
4
Ha = Niet alle gemiddelden op sociale vaardigheid van de groepen kinderen (rakkers, welpen en explorers)
in de populatie zijn gelijk (je geeft niet aan om welke groep het specifiek gaat, en daarom kan je hem ook
niet in een formele mutatie zetten);
o De vraag is meerzijdig, maar je toets is eenzijdig (dus nooit je p met twee vermenigvuldigen).
TOETSKEUZE
Voor nu we vergelijken meer dan twee gemiddelden op een numerieke variabele = ANOVA;
o Assumpties en alternatieve toets komen in college 6;
o Alpha 5%.
BEREKENING TOETSSTATISTIEK
5
Volgens tabel p-waarde ligt tussen de 0.010 en 0.025 in. R2? Dit is significant. Want dit is kleiner dan
0.05.
CONCLUSIE
MULTIPELE VERGELIJKINGEN
HET BASISIDEE
BEREKENING T
Toetsingsgrootheid voor het toetsen van het gemiddelde verschil tussen groepen 1 en 2
DE LSD-PROCEDURE
6
BONFERRONI PROCEDURE
Nadeel lsd-procedure
o Vergroot de kans op significante effecten die door toeval veroorzaakt worden. Er was geen
verschil, maar jouw lsd-procedure geeft aan van wel.
‘Oplossing’
o Bonferroni methode = Houdt de overall kans op een foute
verwerping onder alle vergelijkingen gelijk aan 5%;
o N.B. Alpha delen door het aantal toetsen wat je doet, of p-
waarde vermenigvuldigen met 3. De kans kan niet hoger zijn
dan 1.
KRITIEK OP VOORBEELD