Skip to ContentSkip to Navigation
Maatschappij/bedrijven Scholierenacademie Scholieren Profielwerkstuk

Statistiek

Data verwerken en interpreteren

Als je data hebt verzameld voor je PWS, bijvoorbeeld als je een enquête hebt afgenomen, moet je de getallen en waardes die hieruit zijn gekomen kunnen interpreteren. Dit doe je o.a. door deze getallen te verwerken in verschillende concepten, zoals gemiddeldes, de mediaan en de modus. Bij wiskunde heb je hier vast al mee leren werken. Hieronder volgt een korte samenvatting van deze concepten en hun toepasbaarheid, met daaronder extra informatie over belangrijke zaken om rekening mee te houden als je met statistiek aan de gang gaat.

Gemiddelde

Een gemiddelde reken je uit om alle waardes die je hebt gekregen te vatten in één getal. Een gemiddelde reken je uit door de som van de observaties te delen door het totaal aantal observaties. Een observatie is de waarde van één persoon uit jouw steekproef, dus bijvoorbeeld de leeftijd van één persoon.

Bij een steekproef heb je van 5 mensen de leeftijd gevraagd, en de leeftijden zijn 12, 13, 14, 15, en 16. Het gemiddelde bereken je door deze waarden bij elkaar op te tellen en te delen door het aantal observaties, in dit geval 5. 12+13+14+15+16 = 73. Om nu het gemiddelde uit te rekenen deel je 73 door 5. 73/5 = 14,6. De gemiddelde leeftijd in jouw steekproef is dus 14,6 jaar.

 Mediaan

De mediaan is het middelste getal van jouw data. In het geval van het vorige voorbeeld is de mediaan de middelste leeftijd die je kan vinden. Om deze te bepalen kan je twee methodes gebruiken. De eerste methode is om alle leeftijden op volgorde te zetten: dus, 12-13-14-15-16. Hierna haal je hier het middelde getal uit, wat dus 14 is. 14 is dan de mediaan van jouw steekproef.

Bij grotere steekproeven, of steekproeven met een even aantal, is het lastig om op de bovenstaande manier de mediaan te vinden. Dan gebruik je de volgende formule: (n+1)/2. N is hierbij de grootte van de steekproef, in dit geval is dat dus 5, want de steekproef bestaat uit 5 mensen. Voor dit voorbeeld is het ook nodig om de getallen op volgorde te zetten. Een voorbeeld om de mediaan uit te rekenen: (5+1) / 2 = 3. Je zoekt dan het derde getal in de reeks, in geval weer 14. Als je een even getal van observaties hebt, zal uit deze formule een kommagetal komen (bijvoorbeeld 3,5). Zoek dan het getal wanneer je afrondt naar boven, dus het 4e getal.

Modus

De modus is het getal dat het vaakst voorkomt in jouw steekproef. In het bovenstaande voorbeeld is er geen modus, want alle getallen komen één keer voor. Als de getallenreeks van leeftijden uit jouw steekproef er uit zou zien als dit: 14-14-15-16-17, is 14 de modus, want dit getal komt het vaakst voor in de reeks.

Uitbijters

Een uitbijter is een waarde uit jouw steekproef die veel lager of hoger is dan de rest, waardoor deze opvalt. In de bovenstaande reeks met leeftijden, zit er geen uitbijter. 12-13-14-15-16 zitten allemaal dicht bij elkaar; er is geen getal dat opvalt omdat deze heel laag of hoog is.

Stel je nu voor dat dit jouw reeks met leeftijden van de steekproef is: 14-14-15-16-17-41. 41 is in dit geval erg opvallend, aangezien dit getal veel hoger is dan de rest. Het is belangrijk om bij de data die je verkrijgt in jouw PWS te letten op uitbijters, want deze kunnen invloed hebben op de conclusies die jij trekt uit de data. Als je bijvoorbeeld een gemiddelde uitrekent met een uitbijter erin, valt deze veel hoger of lager uit dan zonder uitbijter. Dit gemiddelde is dan mogelijk ook niet meer representatief zijn voor de hele steekproef, omdat er eigenlijk maar één observatie is die het gemiddelde erg omhooghaalt.

Een voorbeeld hiervan is dat het gemiddelde van de bovenstaande reeks leeftijden zonder uitbijter (dus 41) 15,2 is. Met uitbijter, dus inclusief 41, is dit gemiddelde 19,5. De uitbijter heeft dus een grote invloed op het gemiddelde, waardoor het gemiddelde met een uitbijter een vertekend beeld kan geven van jouw steekproef. Wat goed is om te onthouden wanneer jij een uitbijter vindt in jouw data is:

  1. De uitbijter heeft mogelijk een grote invloed op statistieken (zoals het gemiddelde)

  2. De uitbijter is mogelijk een fout (iemand heeft hier misschien een raar of verkeerd antwoord neergezet)

  3. De uitbijter is een bijzonder geval (misschien vind jij door deze uitbijter wel een uitzondering of een bijzonder geval in jouw steekproef)

Ga bij het vinden van een uitbijter dan ook het bovenstaande lijstje af, om jouw resultaten zo betrouwbaar mogelijk te maken. Op de modus en mediaan heeft een uitbijter geen grote invloed. Het is daarom ook belangrijk deze te laten zien in jouw resultaten, omdat dit de interpretatie en representativiteit van jouw data nog beter en duidelijker maakt. Geef ook altijd aan wanneer en waar je een uitbijter tegen bent gekomen.

 

Laatst gewijzigd:15 februari 2024 13:39