Ik loop momenteel stage bij een bedrijf en ik onderzoek de tijd die nodig is om vrachtwagens te beladen. Ik heb de gegevens van 2015 opgevraagd en dit zijn 21.295 vrachten op jaarbasis.
Nu verschilt de laadtijd van 5 minuten tot soms wel meer dan 4 uur.
Nu vroeg ik me af welke centrummaat ik moet gebruiken om een goed beeld te geven van de normale laadtijd van een vrachtwagen.
Zou ik dan het gemiddelde pakken = 25 minuten
Of zou ik dan de mediaan pakken = 17 minuten
Ik zou voor het gemiddelde kunnen gaan omdat er meer dan 20.000 waarden beschikbaar zijn, maar de mediaan is dan weer minder gevoelig voor de uitschieters die ik hierboven benoemde.
Het gaat mij dus ook eigenlijk om de onderbouwing bij de keuze die ik maak, want ik wil kunnen ondebouwen waarom ik welke centrummaat heb gekozen.
Vraagje, help mij met mijn stage! :D
Re: Vraagje, help mij met mijn stage! :D
Het lijkt mij een arbitraire keuze. Als je aangeeft wat je nadien gaat doen met de waarden, kunnen we misschien het ene of het andere argumenteren.
Re: Vraagje, help mij met mijn stage! :D
Met behulp van de waarden wil ik een schatting maken van hoeveel vrachtwagens er per uur of per dag beladen kunnen worden, om ze te kijken of een verhoging van het aantal vrachtwagens opgevangen kan worden met hetzelfde aantal werknemers. Met een gemiddelde van 25 minuten is het natuurlijk krapper dan wanneer je de mediaan van 17 minuten pakt. Daarom wil ik graag weten welke van de twee het best hiervoor is.wnvl schreef:Het lijkt mij een arbitraire keuze. Als je aangeeft wat je nadien gaat doen met de waarden, kunnen we misschien het ene of het andere argumenteren.
Re: Vraagje, help mij met mijn stage! :D
Ga je werken met Poisson processen om alles te modelleren?
Dan zou ik lambda gelijk stellen aan het gemiddelde.
Dan zou ik lambda gelijk stellen aan het gemiddelde.