Data Analyse

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 4

DATA-ANALYSE

TIMEN DOBBELS & NOAH TANGHE


Onze Data
Eerst zullen we het even hebben over de data die we verzameld hebben. Ik heb een grote passie
voor schoenen, dus koos ik voor dit project om iets te doen met schoenen. Omdat ik toch wel een
aantal schoenen heb staan thuis dacht ik dat het een goed idee was om een dataset te maken
waarin te zien is wanneer ik welke schoen aandoe en weer uitdoe. Omdat Timen ook veel weet
over schoenen, en het een goed idee vond, kozen we om mijn dataset te gebruiken om er een
analyse van te maken.

Manier van bijhouden


Iedere keer dat ik een schoen aandeed stuurde ik via
Microsoft Forms een melding die door gebruik van
Microsoft automate automatisch in de dataset
belandde. De dataset hiernaast toont het totale aan
data die ik heb kunnen ophalen. Je ziet dat niet elke
schoen dagelijks gedragen is geweest. Dit klopt en
heeft geen e ect op de uitwerking van de analyse. (In
= tijdstip van schoenen aandoen, out = tijdstip van
schoenen uitdoen). Ook deelden we de schoenen op
in 3 klasse’s : classic als alledaagse schoen om mee
naar school te gaan. Comfy om thuis aan te doen of
op informele momenten en als laatst basketschoenen,
dit spreekt voor zich. Ik heb 4 training per week dus daarom heb ik 2 paar basketschoenen.

Omdat we graag willen bijhouden hoelang en hoeveel we verschillende schoenen aandoen,


moeten we deze tabel wel nog wat aanpassen. Door een simpele formule te gebruiken krijgen we
een tabel waarin we zien hoelang we elke schoen per
dag aandoen. Als er een 0 staat betekent het dus dat
die schoen die bepaalde dag niet is gedragen
geweest ( Let op dat de data is weergegeven in aantal
uur : 4,8 is dus 4 uur en 50 minuten.) Ook willen we
graag later een correlatie maken met het weer en
vooral de regen. Hiervoor hebben we een dataset
geïmporteerd van het weer van afgelopen maanden.
Dit deden we via visual crossing, we hadden maar 1
kolom van een grote dataset nodig dus konden we
deze via een simpele formule uit die tabel halen en
toevoegen .
ff
Univariate analyse
We beginnen met een paar simpele dingen, we kunnen door de data in
Knime te laten lezen weten hoeveel we elke dag de schoenen gemiddeld
aandoen. Ook kunnen we hier zien wat het minimum is en het maximum,
alsook de mediaan van de data. Ik heb de gemiddelden van elke schoen
ook nog eens in een histogram geplaatst om visueel duidelijk te maken wat
de verhoudingen zijn. We zien hier bijvoorbeeld
dat we dat ik gemiddeld 3,47 uur mijn Air
Forces 1 draag per dag. Ik heb op 1 dag de
schoenen 14 uur aangehad, het maximum dus.
We zien dat ik mijn Crocs gemiddeld 0,25 uur
en dus 15 min per dag aandoe, dit wil niet
zeggen dat ik ze elke dag 15 minuten aandoe.

Dit is zeer bruikbare data, maar naar ons gevoel had deze data te veel
invloed door alle dagen waarop geen paar schoenen aandeden, daarom
beslisten we om door het gebruik van een row lter de nullen weg te laten.
Zo kunnen we van elke schoen een analyse maken op basis van de
dagen die we ze e ectief hebben aangedaan. Dit deden we dan ook,
hieronder vind je van elke schoen een kleine analyse. In deze analyse maken
we gebruik van de statistics, een boxplot en een histogram.

AIR FORCE 1

New Balance

Dunk Paisley

YZY Slides

YZY foam runners


ff
fi
Crocs

Jordan 11

Paul George 5

Bivariate analyse
Nu kunnen we verschillende aspecten samen gaan inspecteren en kijken of er een correlatie
bestaat. Hiervoor hebben we de weerdata gedownload die ik eerder had vermeld. We zullen zien
of er een correlatie bestaat tussen de classic schoenen en het aantal neerslag die die dag viel.

Door een scatter plot te verbinden met de row lter


van Air Forces en dan in te stellen dat we kijken
naar de verhouding tussen het aantal uur dat ik
mijn Air Forces droeg en het aantal regen die er die
dag is gevallen. Door deze gra ek op te stellen
zien we dat er een kleine trendlijn ontstaat waar de
punten relatief dicht bij liggen. Om deze informatie
te checken sluiten we ook een lineair correlatie aan
om te kijken wat de correlatie is tussen de 2. We
kunnen a ezen dat er een positieve correlatie is
van 0,28. Dit is redelijk zwak, maar wel groot
genoeg om te zeggen dat er toch een soort van
verband is tussen de 2. Als we logisch nadenken
kan dit ook kloppen, mijn Air Forces zijn mijn
goedkoopste paar classic schoenen, het is dus van sprekend dat als het hard regent ik deze
langer aandoe en minder mijn duurdere schoenen draag.
fl
fi
fi
Als test zullen we ook van de
andere 2 classic schoenen kijken
of er een correlatie bestaat tussen
hoelang ik ze aandoe en hoeveel het regent. Ik doe dit alleen maar voor de classic schoenen
omdat de regen alleen invloed heeft op deze schoenen, ik zal geen andere schoenen thuis of naar
de basket aandoen omdat het harder of niet regent. Als we kijken naar de correlatie met de New
Balances zien we dat het dicht bij de 0 ligt, dit betekent dat er bijna geen verband is tussen de 2.
Maar als we kijken naar de correlatie tussen de Dunk Paisleys en de regen zien we een negatieve
correlatie van iets meer dan -0,5. Dit is relatief gezien een sterk verband tussen die 2, maar dit kan
ook zeker kloppen. Mijn dunks zijn de schoenen die ik het recents heb gekocht en redelijk duur
waren, deze zal ik dus niet aandoen
als er hevige regen is.

Voor wat is deze data bruikbaar?


Deze data kun je voor meer gebruiken dan je denkt, met de univariate analyse kunnen we
bijvoorbeeld zien hoeveel uur we een schoen gemiddeld dragen per dag. Omdat we ook de
aankoopdatum weten van elke schoen kunnen we berekenen hoeveel uur we de schoen al in
totaal hebben aangedaan. We weten ook de aankoopprijs van elke schoen, hiermee kunnen we
berekenen hoeveel deze schoen heeft gekost per uur dat we hem hebben gedragen. Zo kunnen
we de schoenen vergelijken en kijken welke relatief het duurst zijn. Want een hemd van 100 euro
die je 200 keer aandoet is relatief gezien goedkoper dan een van 10 euro die je na de eerste keer
dragen nooit meer aandoet. Zo
kunnen we dus tot een conclusie
komen welke schoen een goede
aankoop was en welke niet. (Let
op deze data is pas vanaf 7
december 2022 en kan dus van
sommige schoenen die ik al langer
heb een fout beeld vormen. )

CREDITS
Knime

Timen Bobbels / Noah Tanghe


Lansen Puttemans

You might also like