Standaarddeviatie

Continue & discrete verdelingen, toevalsveranderlijken, betrouwbaarheidsintervallen, correlaties.
Plaats reactie
Ocmer
Nieuw lid
Nieuw lid
Berichten: 3
Lid geworden op: 29 jun 2006, 15:40
Locatie: Amsterdam

Standaarddeviatie

Bericht door Ocmer » 23 jan 2008, 14:53

Hallo,

Ik wil graag de SD van verschillende reeksen cijfers berekenen maar nu ben ik tegen een probleempje aan gelopen waarbij hulp erg welkom is. Overal waar ik kijk wordt de SD beschreven als de gemiddelde afwijking van het gemiddelde. Mijn vraag is: waarom moet het kwadraat worden genomen van de afwijkingen en moet vervolgens hier de wortel uit worden getrokken?

De uitleg die ik hier over vind is dat de afwijkingen ook negatief kunnen zijn. Door deze te kwadrateren, en door de wortel hieruit te trekken los je dit op. Maar er moet ook een ander reden zijn, want:

Reeks Afw. Kwdr.
2 2 4 2
5 -1 1 1
1 3 9 3
6 -2 4 2
7 -3 9 3
Gem. 4.20 5.4 2.200000
2.323790008

Stel je haalt gewoon de min weg voor de verschillen en neemt het gemiddelde, dan krijg je 2.2. Als je de gangbare formule gebruikt met als gemiddelde van de kwadraten 5.4, en wortelt dat, dan krijg je 2.32379..de SD. Bij langere reeksen kan dit verschil groter zijn. Ik kan me voorstellen dat de uitersten worden uitvergroot in het resultaat met het kwadraat, maar waarom is dat statistisch beter dan gewoon negatieve getallen in positieve om te zetten?

Bvd,
Remco
Ik zou opzich wel willen, maarja...ik heb geen zin...

tjeerd
Vast lid
Vast lid
Berichten: 42
Lid geworden op: 16 jul 2008, 08:49

Re: Standaarddeviatie

Bericht door tjeerd » 30 aug 2008, 21:28

maar waarom is dat statistisch beter dan gewoon negatieve getallen in positieve om te zetten?
Dat het statistisch beter zou zijn kun je in het algemeen niet stellen.
Er zijn situaties waarbij het beter is de absolute waarden van de afwijkingen t.o.v. het rekenkundig gemiddelde te gebruiken.

In het algemeen is het zo. Je hebt een dataset en daar wil je iets van weten of vergelijken met een andere dataset. Je heb je eigenschappen nodig, net zoals je eigenschappen van een persoon noemt als je hem wilt beschrijven. "Jan is een aardige vent met peentjeshaar, blauwe ogen en 1,87 m lang".
In de statistiek is het zo dat wanneer je mag aannemen dat een dataset uit een bepaalde theoretische verdeling stamt, je de bijbehorende eigenschappen gebruikt. Verder is het dan gemakkelijk rekenen, toetsen en betrouwbaarheidsintervallen bepalen.
vaak is het zo dat je uitkomt op de normale verdeling (al dan niet na transformatie van de gegevens) en dan heb je als eigenschappen het rekenkundig gemiddlde en de standaarddeviatie.
Helder?

Plaats reactie