spreidingsmaten
wiskunde-interactief.be
Hoe lang duurt een dag in Alaska?
Barrow ligt boven de poolcirkel.
Drie zomermaanden lang gaat de zon niet onder. In december en januari blijft het
24u donker.
Sitka ligt even noordelijk als Kopenhagen.
Het kent lange zomerdagen en korte winterdagen.
Maar dit grote verschil tussen beide steden blijkt totaal niet uit gemiddelde en
mediaan.
Daarom voeren we naast centrummaten ook spreidingsmaten in.
Liggen alle waarden dicht bij een centrumwaarde, of liggen ze juist sterk
gespreid?
Variatiebreedte
Hoe ver je het groene punt versleept,
het rekenkundig gemiddelde verandert niet.
De mate waarop waarden uit elkaar liggen, noemen we
spreiding.
We zoeken daarom naast centrummaten ook spreidingsmaten.
Een voor de hand liggende vraag is: "Hoeveel verschilt het grootste getal van
het kleinste?"
De variatiebreedte is het verschil
tussen de grootste en de kleinste waarde.
|
Kwartielen en interkwartielafstand
De variatiebreedte zegt enkel iets over de grootste en de kleinste
waarde, ook al is die uitzonderlijk.
Bij de kwartielen kijken we naar de middelste helft van de waarden.
Het eerste kwartiel Q1 is het (n+1)/2e getal. Een
vierde van alle waarden is kleiner dan Q1.
Het derde kwartiel Q3 is het 3.(n+1)/2e getal. Een vierde van alle
waarden is groter dan Q3.
De interkwartielafstand = Q3 - Q1.
De helft van alle waarden ligt tussen Q1 en Q3.
De interkwartielafstand geeft de spreiding van de middelste helft van alle
waarden.
|
Gemiddelde afwijking t.o.v. het gemiddelde
Wil je een maat die rekening houdt met alle
waarden, dan zou je de gemiddelde verandering kunnen berekenen.
We tellen gewoon alle afwijkingen t.o.v. het gemiddelde op en delen door
het aantal waarden.
Dit is echter niet zo'n goed idee...
De negatieve en de positieve afwijkingen t.o.v. het gemiddelde heffen
elkaar op.
De gemiddelde afwijking t.o.v. het gemiddelde is steeds gelijk aan 0.
Variantie en standaardafwijking
Wilen we toch met elke maat rekening houden, dan
moeten we alle afwijkingen positief maken.
Dit kan door steeds het kwadraat te nemen van elke afwijking.
Gaan de waarden over gewichten of lichaamslengten, dan wordt de
variantie uitgedrukt in kg2 of cm2.
Zo'n resultaat kan je natuurlijk niet interpreteren.
Om terug in de eenheid van de waarden te komen, nemen we terug de
vierkantswortel van de variantie.
De variantie is de som van de
gekwadrateerde afwijking t.o.v. het gemiddelde, gedeeld door het
gemiddelde.
De standaardafwijking is de vierkantswortel uit de variantie.
|
De standaardafwijking zal je op het eerste zicht niet veel wijzer maken,
maar toch is het een veelgebruikte maat
voor de spreiding van een groep waarden t.o.v. het gemiddelde.
Zo zijn intelligentietesten genormeerd met een gemiddelde van 100 en een
standaardafwijking van 15.
Bij gelijkaardige klokvormige frequentieverdelingen kan je berekenen
hoeveel % van de waarden zich tussen
welke grenzen bevinden.
Bij een klokvormige ('normale') verdeling
van de waarden ligt
68,27 % van de waarden binnen een afstand van 1 standaardafwijking van het
gemiddelde.
95,45 % van de waarden binnen een afstand van 2
standaardafwijkingen van het gemiddelde.
|