Data spreiding

Seth · Bericht door **Seth** » 03 apr 2013, 14:24

Aan de hand van mijn data heb ik twee boxplotten gemaakt om de data te vergelijken.
Nu komt er naar voren dat de spreiding in 1 boxplot groter is dan in de andere.
De gemiddelde van beide boxplotten is overigens wel nagenoeg gelijk.
Wat wilt dit zeggen over mijn data en hoe moet ik dit interpreteren?

Bericht door **arie** » 04 apr 2013, 11:07

Een boxplot beschrijft je dataset (= gegevensverzameling).
Je ziet hierdoor in jouw geval dat:
- in dataset 1 alle gegevens dicht bij het gemiddelde liggen
- in dataset 2 het gemiddelde gelijk is aan dataset 1, maar de spreiding groter is.
Dit is een prima beschrijving.

Een verklaring (waarom dit zo is) kan je niet uit de boxplot afleiden.
Een verklaring moet je zelf zien te vinden (en aan te tonen) uit de kennis van de objecten waar je onderzoek betrekking op heeft.
Ook de consequenties hangen af van wat je precies onderzocht en gemeten hebt.

Voorbeeld:
Als dataset 1 gaat over de lichaamsafmetingen van personen in stad 1, en
als dataset 2 gaat over de lichaamsafmetingen van personen in stad 2,
dan zal je een kledingzaak in stad 1 adviseren vooral gemiddelde kledingmaten op voorraad te hebben, en een kledingzaak in stad 2 naast de gemiddelde maten ook relatief veel extra kleine en extra grote maten.
Een verklaring waarom de lichaamsmaten in stad 2 veel meer gespreid zijn kunnen we echter niet uit de boxplot afleiden.

Seth · Bericht door **Seth** » 04 apr 2013, 13:53

Arie bedankt voor de informatie wat betreft de Mann Withney U test en de data spreiding.

Wiskundeforum

Data spreiding

Data spreiding

Re: Data spreiding

Re: Data spreiding