SV Statistiek

1 Achtergronden van statistiek
Wat is statistiek?
• Alle vaardigheden die nodig zijn om beter te kunnen analyseren, interpreteren en
presenteren
• Maakt het mogelijk om onderzoek bij een kleine groep mensen (= steekproef) uit te voeren
en toch iets te concluderen over alle mensen waarover we iets willen weten (=populatie)
2 soorten
• BESCHRIJVENDE STATISTIEK
= Analyseren en beschrijven van de steekproef
• INDUCTIEVE STATISTIEK
= Veralgemenen naar de populatie (dmv schattingen) en vergelijken met ander of eerder
onderzoek
Vakjargon
• Onderzoekseenheid: elk subject of object waarover je iets wil weten
(=onderzoekselement/onderzoeksobject)
– Populatie: alle
– Steekproef: selectie
– Respondent: persoon
– Case/record: 1
Vakjargon (2)
• Onderzoekseigenschappen: eigenschappen van onderzoekseenheden
= variabelen
» Onafhankelijke variabele
» Afhankelijke variabele
Verschil onafhankelijke en afhankelijke variabele

 Bv1: omdat ik een vrouw ben, naai ik vooral jurken
o Onafhankelijk: vrouw
o Afhankelijk: jurk, hangt af van uw geslacht
 Bv2: het hebben van een parking bij een winkel en tevredenheid
o Onafhankelijk: parking hebben of niet
o Afhankelijk: tevredenheid hangt af van parking
! Spreken over samenhang, niet oorzaak
Representativiteit
Om veralgemening naar de populatie mogelijk te maken, moet de steekproef
1. Voldoende groot zijn
2. Toevallig getrokken zijn
 Iedereen moet evenveel kans hebben te worden geënquêteerd
3. Qua eigenschappen van de onderzoekseenheden dezelfde samenstelling hebben als de
populatie
 Zeer veel aandacht aan geven!
 Veralgemening naar populatie mogelijk maken
1 Aan de slag met steekproefgegevens = beschrijvende statistiek
1.1 Tabellen en grafieken
Tabellen
• Zeer belangrijk in rapportage
• Frequentietabel en kruistabel
• Frequentietabel:
Frequentietabel in rapport:
Kruistabel
• Frequentietabel voor delen van de steekproef
• Nagaan of er een verband is tussen de onafhankelijke en de afhankelijke variabele
– bv: geven vrouwen meer geld uit dan mannen
• Interpretatie minder eenvoudig dan het lijkt
Basisgrafieken kruistabel
Grafieken
• Verhoogt de leesbaarheid van het rapport
• Geeft belangrijke indruk over het hele rapport
• In SPSS of Excel
• 2 meest voorkomende:
– Taartpunt
– Staafdiagrammen
Taartpunt
• Samen 100%
• 1 variabele
• Info uit frequentietabel
Staafdiagram
• Kan informatie uit frequentietabel of kruistabel bevatten
• Percentage toevoegen aan staven!
1.2 Meetniveaus
 Nominaal en ordinaal: categorisch
o Speciaal soort categorisch = dichotoom
 Metrisch : continu
Nominaal
 geen rangorde, geen gemiddelde kunnen berekenen
 bv: ja-nee vragen
1.3 Tendensmaten
 Centrummaten: wat treffen we het meest aan?
o Gemiddelde
o Mediaan
o Modus
 Spreidingsmaten: in hoeverre lopen de waarnemingen uiteen?
o Range
o Variantie
o Standaarddeviatie
o Percentielscores: individuele score tov groep
Rekenkundig gemiddelde
• steekproef:
• populatie:
• Vb: scores op tevredenheidsschaal: 1,3,3,6,7

Gemiddelde =
! Enkel bij data van metrisch niveau
Mediaan
• Middelste waarneming, 50% hoger en 50% lager
• Indien even (en dus 2 middelste): gemiddelde van deze 2
Mediaan?
• Vb: scores op tevredenheidsschaal: 1,2,3,5,6,7
Mediaan?
! Enkel bij data vanaf ordinaal niveau
Modus
• Waarneming die het meest voorkomt
Modus?
• Vb:
Modus?
Output SPSS
Modus, mediaan en gemiddelde
Spreidingsmaten: range
• Hoogste – laagste waarneming
• Vaak niet zo betrouwbaar: uitschieters (outliers): ‘wegknippen’ grootste uitschieters
• Range bij homogene en heterogene scores
Variantie en standaarddeviatie
• Vaak gebruikt
• Geeft aan of waarnemingen op elkaar lijken (homogeniteit) of van elkaar verschillen
(heterogeniteit)
• Variantie = gekwadrateerde gemiddelde afstand tov gemiddelde:
– Groot: veel scores ver van gemiddelde
– Klein: veel scores dichtbij gemiddelde
• Standaarddeviatie = wortel uit variantie
Waarom kwadrateren?
Formules
Praktisch
1) bereken het gemiddelde van de scores
2) trek van alle waarden dit gemiddelde af3) kwadrateer de uitkomsten
4) bereken het gemiddelde van deze kwadraten
==> variantie
5) neem hiervan de wortel
==> standaarddeviatie
Voorbeeld
 Scores op test: 1,4,7,5,10,3,12 (n=7; N=20)

 In het voorbeeld: 7 personen doen tentamen
 ! Niet realistisch, in de meeste gevallen gaat het niet om de populatie die men onderzoekt,
mar om een steekproef. We gaan dus op zoek naar s, niet naar sigma. Verder zien we hoe we
sigma kunnen schatten.
Percentielscores
• Vergelijken van de score van een individu met de overige scores
• Hoeveel procent van de scores ligt lager dan de score vh individu? = percentielscore van zijn
score
• Te berekenen in SPSS (kijk naar cumulatieve percentages)
Kwartielen en decielen
• Kwartiel = verdeling van alle scores in 4 delen
– 1ste deel = 25% laagste scores
– 4de deel = 25% hoogste scores
• Decielen = verdeling van alle scores in 10 delen
– 1ste deel = 10% laagste scores
– 10de deel = 10% hoogste scores
2 Inductieve statistiek
Kansbegrip
• We kunnen enkel schattingen maken over populatiewaarden
• Hooguit aangeven met welke waarschijnlijkheid, met welke kans, steekproefresultaten zullen
overeenstemmen met die van de populatie
Frequentie- en waarschijnlijkheidsverdeling
• Frequentieverdeling: concrete verdeling van gegevens uit feitelijk waargenomen
onderzoeksmateriaal
• Waarschijnlijkheidsverdeling: verdeling van gegevens binnen populatie, geschat vanuit de
frequentieverdeling van de steekproef
Frequentieverdeling
Waarschijnlijkheidsverdeling
Normaalverdeling
 Gemiddelde modus en mediaan hebben ongeveer zelfde waarde
 1 modus
 Klokmodel
Verschillende vormen
• Wat als gemiddelde verhoogt/verlaagt?

• Wat als standaarddeviatie verhoogt/verlaagt?
Vaste geometrische verhoudingen
Standaardnormaalverdeling
= Z-verdeling
Puntschatting
• 1 cijfer
• In voorgaande stelling:
– x = 1500 Euro
– µ = 1500 Euro
• Wat indien andere steekproef?
• Niet zo nauwkeurig
Opmerkingen
• Minstens even belangrijk:
– Representativiteit steekproef (samenstelling, toeval)
– Goede vragenlijst
– Correcte afname vragenlijst
• Omvang populatie niet belangrijk (tenzij kleine populatie)
Eenmaal boven de 400 à 500 respondenten blijft antwoordpatroon stabiel
Intervalschatting
• Tussen welke waarden ligt mijn parameter met een grote waarschijnlijkheid?
• In voorgaande stelling:
– x = 1500 Euro
– 95%(1420< π <1580)
= het gemiddelde inkomen in de populatie ligt tussen 1420 Euro en 1580 Euro, uitgaande van 95%
kans dat deze uitspraak waar is
= betrouwbaarheidsinterval
Betrouwbaarheidsinterval
• Formule 95%-betrouwbaarheidsinterval van het gemiddelde in de populatie:
• 1,96 is z-waarde overeenkomstig met 95% betrouwbaarheid
• Bij 90% wordt dit 1,65; bij 99% wordt dit 2,58
Grootte steekproef
• Hoe groter, hoe nauwkeuriger schatting
• Kostprijs per onderzoekseenheid: duur!
• Hoe bepalen hoe groot steekproef moet zijn?
Grootte steekproef - Nauwkeurige schatting
Steekproefgrootte
• Vertrekken vanuit zelfde formule
• Andersom te werk gaan
• Bij metrische data:
• Betrouwbaarheid die opdrachtgever wenst (z)

• Maximale breedte interval dat opdrachtgever wenst
• Vermoeden van de standaarddeviatie in de populatie (σ)
 n enige onbekende, kunnen we berekenen
Steekproefgrootte berekenen
• Steekproefcalculators op het internet :
• http://www.steekproefcalculator.com/steekproefcalculator.htm

SV Statistiek

Uploaded by

Copyright:

Available Formats

You might also like

SV Statistiek

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

SV Statistiek

Uploaded by

Copyright:

Available Formats

1 Achtergronden van statistiek

Verschil onafhankelijke en afhankelijke variabele

! Spreken over samenhang, niet oorzaak

• Vb: scores op tevredenheidsschaal: 1,3,3,6,7

! Enkel bij data van metrisch niveau

! Enkel bij data vanaf ordinaal niveau

Modus, mediaan en gemiddelde

• Te berekenen in SPSS (kijk naar cumulatieve percentages)

• Wat als gemiddelde verhoogt/verlaagt?

Vaste geometrische verhoudingen

• 1,96 is z-waarde overeenkomstig met 95% betrouwbaarheid

Grootte steekproef - Nauwkeurige schatting

• Betrouwbaarheid die opdrachtgever wenst (z)

You might also like