5V Wis A PO Statistiek 2023-2024

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 6

PO 5VWisA503 - Statistiek met de computer

SUCCES!!!
Deadline: 15 maart 2024

Maak deze opdracht in tweetallen. Gebruik Excel om de opgaven te maken. Geef


jullie antwoorden en uitleg van jullie werkwijze in Excel in het tabblad ‘antwoorden’.
Maak tussendoor back-ups van jullie bestand (bijvoorbeeld door ze aan jezelf te
mailen) om te voorkomen dat jullie werk kwijtraken.
De opdracht lever op (of voor) 15 maart 2024 in als Excel-bestand(en) bij jullie
docent via de ELO. Vergeet niet om jullie namen in de bestandsnaam te zetten.
Het benodigde Excel-bestand vinden jullie bij de opdracht op de ELO.

In deze opdracht ga je de gegevens uit de twee databestanden onderzoeken. Daarbij


probeer je conclusies te trekken uit de data. Uiteraard licht je jouw antwoorden waar
mogelijk toe met een geschikte (grafische) representatie. Zorg er tevens voor dat
jouw figuren voorzien zijn van assen-labels, een titel en een duidelijke opmaak.
Instructies over het gebruik van Excel kun je via G&R-instructievideo’s bekijken.
Daarnaast kun je ook toelichting vinden in H2 en H7.
Geef de antwoorden in het tabblad ‘antwoorden’. Het is ook toegestaan om voor
iedere (deel)opgave een nieuw tabblad te maken in Excel. Zorg er in beide gevallen
voor dat jouw antwoorden goed vindbaar en duidelijk leesbaar zijn en dat je één
excelbestand inlevert en verder niets.

1
Open als eerste het Excel-bestand ‘Dataset Leerlingen’.

Opgave 1: Cijfers
In deze dataset zie je gegevens van leerlingen van vier verschillende scholen
inclusief hun gemiddelde cijfers voor wiskunde, Nederlands, Engels en natuurkunde.

I. Bereken het gemiddelde cijfer voor wiskunde A op de havo. (2p)

Nu ga je de gemiddelde resultaten voor Nederlands en Wiskunde bekijken. Als


eerste maak je een boxplot (in Excel heet dit ‘Box en whisker’). Merk op dat de
grafiek in Excel een kwartslag gedraaid is t.o.v. wat je gewend bent in G&R (zie deel
2 hoofdstuk 5).

II. Bepaal de kwartielafstand voor zowel het gemiddelde cijfer voor Nederlands als
voor het gemiddelde voor Wiskunde met behulp van de boxplot. Controleer dit
met een berekening zonder boxplot. (4p)

Nu ga je bepalen of er een (statistisch) verband bestaat tussen de cijfers voor


Nederlands en Wiskunde.

III. Leg uit waarom jouw eerder gemaakte boxplot niet hiervoor geschikt is. (3p)

IV. Maak een puntenwolk en beredeneer of er wel of geen verband bestaat tussen
de cijfers voor Nederlands en Wiskunde. (4p)

2
Open het Excel-bestand: “Dataset Schoolverlaters”. Een korte beschrijving van de
data vind je aan het einde van dit document. Je mag ervan uitgaan dat deze dataset
een representatieve steekproef is van alle recent gediplomeerden in het voortgezet
onderwijs in Nederland. Uiteraard licht je jouw antwoorden waar mogelijk toe met een
geschikte (grafische) representatie.

Opgave 2: Steekproef trekken


Op basis van haar registraties beschikt DUO over een lijst met alle gediplomeerden
van het voortgezet onderwijs per schooljaar. Uit deze lijst kan een aselecte en
representatieve steekproef worden getrokken van alle gediplomeerden van het
voortgezet onderwijs van een bepaald schooljaar.

V. Leg uit hoe er een aselecte en representatieve steekproef kan worden


getrokken uit deze lijst. Leg dus niet (alleen) uit wat dat is, maar beschrijf hoe je
dit daadwerkelijk kunt doen met dit excelbestand, eventueel met een voorbeeld.
(4p)

Een voorbeeld van een andere manier van het trekken van een steekproef is via de
scholen van het voortgezet onderwijs aan gediplomeerden te vragen of zij mee willen
doen aan het onderzoek.

VI. Leg uit hoe deze laatste werkwijze een steekproef kan opleveren, die niet
aselect en niet representatief is. (4p)

Opgave 3: Oordeel over keuzemogelijkheden gevolgde VO-


opleiding
In de enquête is gevraagd naar het oordeel over de gevolgde VO-opleiding met
betrekking tot keuzemogelijkheden. Het antwoord kon gegeven worden op een
schaal van 1 tot en met 7 waarbij 1 betekende veel te weinig en 7 veel te veel. Er
mochten alleen geheeltallige antwoorden gegeven worden.
Niet alle deelnemers aan het onderzoek hebben dit onderdeel beantwoord. De cellen
met een * worden niet meegenomen in de berekeningen. Controleer dat het aantal
records gelijk is aan 3465.
Strikt genomen is de variabele “oordeel keuzemogelijkheden” discreet en ordinaal.
Je kunt verschillende diagrammen maken van deze variabele, bijvoorbeeld een
cirkeldiagram, een staafdiagram en een lijndiagram (frequentiepolygoon).

3
VII. Welk van deze drie diagrammen past het beste bij het discrete en ordinale
karakter van de variabele? Licht jouw antwoord toe en maak het diagram. (4p)

Maak in één assenstelsel de relatieve cumulatieve frequentiepolygonen van de


variabele “oordeel keuzemogelijkheden” apart voor degenen die een vmbo-diploma
behaalden en degenen die een havo- of vwo-diploma behaalden. Dit kun je doen
door eerst een draaitabel te maken van de variabelen ‘Oordeel keuzemogelijkheden’
en ‘Schoolniveau’. Door met de rechtermuisknop te klikken in de draaitabel kun je
‘Waarden weergeven als’ en kiezen voor ‘% voorlopig totaal in…’, zodat je hierna
een relatieve cumulatieve frequentiepolygonen kunt maken.

VIII. Onderzoek of je op basis van deze polygonen kunt concluderen of één van
beide groepen een positiever oordeel heeft over de keuzemogelijkheden. Licht
jouw antwoord toe. (4p)

Om een uitspraak te doen over de grootte van het verschil tussen degenen met een
vmbo-diploma en degenen met een havo- of vwo-diploma voor wat betreft hun
oordeel over de keuzemogelijkheden in hun vo-opleiding kan gebruik gemaakt

worden van het maximale cumulatieve percentage verschil ( ) en


onderstaande vuistregels:

 als , dan zeggen we “het verschil is groot”;

 als , dan zeggen we “het verschil is middelmatig”;

 als , dan zeggen we “het verschil is gering”.


Voor uitleg over het maximale cumulatieve percentage verschil kun je deze video
bekijken.

IX. Onderzoek of het verschil tussen degenen met een vmbo-diploma en degenen
met een havo- of vwo-diploma voor wat betreft hun oordeel over de
keuzemogelijkheden gering, middelmatig of groot is. (3p)

Opgave 4: Opleidingsniveau ouders en kind


In de enquête is aan de gediplomeerden gevraagd wat het niveau is van de hoogst
behaalde opleiding van hun moeder en van hun vader.

X. Bereken het deel van de moeders dat een hoger niveau dan vmbo heeft
voltooid. (3p)

4
Iemand beweert dat er een positieve samenhang bestaat tussen het
opleidingsniveau van de vader en het opleidingsniveau van de moeder.
XI. Onderzoek of deze bewering door de steekproef wordt ondersteund. Licht jouw
werkwijze toe. (6p)

Het is denkbaar dat er een samenhang bestaat tussen het opleidingsniveau van de
moeder en het niveau van het behaalde diploma in het voortgezet onderwijs door het
kind.

XII. Onderzoek deze samenhang en onderbouw jouw bevindingen met tabellen,


grafieken en/of berekeningen. (6p)

Hierboven ging het twee keer om de samenhang tussen variabelen.

XIII. Bij welke van de twee samenhangen (de samenhang tussen opleidingsniveau
vader en opleidingsniveau moeder en de samenhang tussen opleidingsniveau
moeder en niveau diploma kind) is er sprake van een causale relatie1?
a) Bij geen van beide
b) Alleen bij de eerste
c) Alleen bij de tweede
d) Bij allebei
Licht jouw antwoord toe. (3p)

1
bij een causaal of oorzakelijk verband tussen twee variabelen dient er een statistisch verband tussen
de twee grootheden te zijn waarbij verandering van de ene grootheid zorgt voor verandering van de
andere grootheid.

5
Beschrijving variabelen
Naam variabele Betekenis Mogelijke waarde(n) en betekenis
vragenlijstnummer twee soorten vragenlijsten 1=vmbo; 2=havo of vwo
geslacht geslacht van de deelnemer 1=man; 2=vrouw
Schaal van 1 tot en met 7 met alleen de
oordeel over de keuzemogelijkheden die men binnen het
oordeel keuzemogelijkheden geheeltallige waarden waarbij 1=veel te
vmbo of binnen havo / vwo had
weinig en 7=veel te veel
Schaal van 1 tot en met 7 met alleen de
oordeel over de moeilijkheidsgraad van de gevolgde vmbo-
oordeel moeilijkheidsgraad geheeltallige waarden waarbij 1=veel te
of havo / vwo opleiding die men heeft gevolgd
makkelijk en 7= veel te moeilijk
aantal arbeidsuren per week het aantal uren dat er per week betaald werk wordt verricht spreekt voor zich
het bruto inkomen in euro dat per maand met betaald werk spreekt voor zich
bruto maandinkomen in euro
wordt verdiend
leeftijd in jaren op het moment van het invullen van de vragenlijst spreekt voor zich
1=havo; 2=MBO BOL; 3=MBO BBL;
gaan doen na vmbo wat ben je gaan doen na het behalen van je vmbo diploma?
4=geen opleiding, gaan werken; 5=overig
1=basisonderwijs; 2=lager
opleidingsniveau moeder hoogst behaalde opleiding moeder beroepsonderwijs, vmbo / mavo; 3=havo,
vwo; 4=MBO; 5=HBO, universitair
1=basisonderwijs; 2=lager
opleidingsniveau vader hoogst behaalde opleiding vader beroepsopnderwijs, vmbo / mavo; 3=havo,
vwo; 4=MBO; 5=HBO, universitair
oordeel over de aansluiting tussen de gevolgde vmbo- of 1=slecht; 2=matig; 3=redelijk; 4=goed
oordeel aansluiting
havo / vwo opleiding en de gekozen vervolgopleiding
vervolgopleiding nog steeds 1=ja; 2=nee, diploma behaald; 3=nee, ik
volg je de gekozen vervolgopleiding nog steeds?
volgen ben gestopt

You might also like