Data spreiding

Continue & discrete verdelingen, toevalsveranderlijken, betrouwbaarheidsintervallen, correlaties.
Plaats reactie
Seth
Nieuw lid
Nieuw lid
Berichten: 6
Lid geworden op: 26 mar 2013, 08:52

Data spreiding

Bericht door Seth » 03 apr 2013, 14:24

Aan de hand van mijn data heb ik twee boxplotten gemaakt om de data te vergelijken.
Nu komt er naar voren dat de spreiding in 1 boxplot groter is dan in de andere.
De gemiddelde van beide boxplotten is overigens wel nagenoeg gelijk.
Wat wilt dit zeggen over mijn data en hoe moet ik dit interpreteren?

arie
Moderator
Moderator
Berichten: 3570
Lid geworden op: 09 mei 2008, 09:19

Re: Data spreiding

Bericht door arie » 04 apr 2013, 11:07

Een boxplot beschrijft je dataset (= gegevensverzameling).
Je ziet hierdoor in jouw geval dat:
- in dataset 1 alle gegevens dicht bij het gemiddelde liggen
- in dataset 2 het gemiddelde gelijk is aan dataset 1, maar de spreiding groter is.
Dit is een prima beschrijving.

Een verklaring (waarom dit zo is) kan je niet uit de boxplot afleiden.
Een verklaring moet je zelf zien te vinden (en aan te tonen) uit de kennis van de objecten waar je onderzoek betrekking op heeft.
Ook de consequenties hangen af van wat je precies onderzocht en gemeten hebt.

Voorbeeld:
Als dataset 1 gaat over de lichaamsafmetingen van personen in stad 1, en
als dataset 2 gaat over de lichaamsafmetingen van personen in stad 2,
dan zal je een kledingzaak in stad 1 adviseren vooral gemiddelde kledingmaten op voorraad te hebben, en een kledingzaak in stad 2 naast de gemiddelde maten ook relatief veel extra kleine en extra grote maten.
Een verklaring waarom de lichaamsmaten in stad 2 veel meer gespreid zijn kunnen we echter niet uit de boxplot afleiden.

Seth
Nieuw lid
Nieuw lid
Berichten: 6
Lid geworden op: 26 mar 2013, 08:52

Re: Data spreiding

Bericht door Seth » 04 apr 2013, 13:53

Arie bedankt voor de informatie wat betreft de Mann Withney U test en de data spreiding.

Plaats reactie