Standaarddeviatie bepalen bij gewogen gemiddelde
Geplaatst: 14 jul 2021, 20:52
Goedenavond,
Ik twijfel over de correcte wijze om de standaard deviatie te bepalen.
Mijn dataset bestaat uit prijsplannen waarbij elk vliegtuig een prijs per stoel kent en een capaciteit uitgedrukt in het aantal stoelen.
Nu heb ik ervoor gekozen om een gewogen gemiddelde prijs te berekenen, door elke voorkomende prijs te wegen met het aantal vliegtuigstoelen waar die prijs betrekking op heeft.
Vervolgens wil ik graag de standaarddeviatie als spreidingsmaat bepalen om de lezer naast een representatief gemiddelde ook een bruikbare indruk te geven van de spreiding.
Het lijkt mij voor de hand liggen om de wegingsfactor die voor het gewogen gemiddelde is gebruikt ook mee te nemen in het bepalen van de standaarddeviatie. Is dit ook zo, of zijn er (statistische) argumenten om er toch voor te kiezen de standaarddeviatie van de voorkomende prijzen te berekenen ongeacht het aantal stoelen waar de prijs betrekking op heeft?
En mijn tweede vraag is -ervan uitgaande dat de wegingsfactor inderdaad van belang is- hoe ik de standaarddeviatie kan berekenen als ik de wegingsfactor mee wil nemen? Moet ik dan de afstand van elke voorkomende prijs tot de gewogen gemiddelde prijs kwadrateren en dan vermenigvuldigen met de wegingsfactor en uiteindelijk alles delen door de som van de wegingsfactoren? En dan de wortel nemen uiteraard.
Ik twijfel over de correcte wijze om de standaard deviatie te bepalen.
Mijn dataset bestaat uit prijsplannen waarbij elk vliegtuig een prijs per stoel kent en een capaciteit uitgedrukt in het aantal stoelen.
Nu heb ik ervoor gekozen om een gewogen gemiddelde prijs te berekenen, door elke voorkomende prijs te wegen met het aantal vliegtuigstoelen waar die prijs betrekking op heeft.
Vervolgens wil ik graag de standaarddeviatie als spreidingsmaat bepalen om de lezer naast een representatief gemiddelde ook een bruikbare indruk te geven van de spreiding.
Het lijkt mij voor de hand liggen om de wegingsfactor die voor het gewogen gemiddelde is gebruikt ook mee te nemen in het bepalen van de standaarddeviatie. Is dit ook zo, of zijn er (statistische) argumenten om er toch voor te kiezen de standaarddeviatie van de voorkomende prijzen te berekenen ongeacht het aantal stoelen waar de prijs betrekking op heeft?
En mijn tweede vraag is -ervan uitgaande dat de wegingsfactor inderdaad van belang is- hoe ik de standaarddeviatie kan berekenen als ik de wegingsfactor mee wil nemen? Moet ik dan de afstand van elke voorkomende prijs tot de gewogen gemiddelde prijs kwadrateren en dan vermenigvuldigen met de wegingsfactor en uiteindelijk alles delen door de som van de wegingsfactoren? En dan de wortel nemen uiteraard.