Hallo,
Wie kan mij helpen met het volgende probleem:
Ik heb een jaar lang meetgegevens van afgevoerd afval. Nu ben ik voordat ik met deze gegevens aan de slag ben gegaan eerst gaan kijken naar het meetsysteem. Na één week meten blijkt dat er regelmatig verschillen zitten tussen het werkelijk afgevoerde afval en het geregistreerde afval, door bijvoorbeeld telfouten, typefouten, etc. Omdat deze fouten waarschijnlijk ook in de jaargegevens zitten wil ik op basis van de controle week gegevens een uitspraak doen over de jaardata.
Bijvoorbeeld: op basis van één week metingen zie ik een gemiddelde afwijking van 25% met een standaarddeviatie van....., dit maakt dus de jaargetallen onbruikbaar, aangezien we een nauwkeurigheid van 10% nastreven....
Meetvoorbeeld:
Werkelijk afval = 10, geregistreerd is 10, verschil = 0
Werkelijk afval = 10, geregistreerd is 11, verschil = -1
Werkelijk afval = 11, geregistreerd is 10, verschil = 1
Werkelijk afval = 10, geregistreerd is 8, verschil = 2
Werkelijk afval = 8, geregistreerd is 10, verschil = -2
etc. komen veel voor.
Maar de volgende komen ook voor:
Werkelijk afval = 73, geregistreerd is 68, verschil = 5
Werkelijk afval = 31, geregistreerd is 11, verschil = 20
Werkelijk afval = 105, geregistreerd is 10, verschil = 95
etc.
Hoe grote steekproef moet ik nu nemen om betrouwbaar iets te zeggen over de gemiddelde afwijking en de standaarddeviatie? en moet deze afwijking dan normaal verdeeld zijn?
Steekproefgrootte voor validatie afvalgegevens?
Re: Steekproefgrootte voor validatie afvalgegevens?
Hallo fvromans,
Met een steekproef vanaf grootte 40 is nauwkeurig genoeg een gemiddelde en een standaarddeviatie te vinden. Mag natuurlijk groter.
Kom je zo verder?
Met een steekproef vanaf grootte 40 is nauwkeurig genoeg een gemiddelde en een standaarddeviatie te vinden. Mag natuurlijk groter.
Kom je zo verder?
Stap 1 van het oplossen van een probleem is te erkennen dat je een probleem hebt.
(Raffiek Torreman)
(Raffiek Torreman)
Re: Steekproefgrootte voor validatie afvalgegevens?
Bedankt, maar hoe bereken je die 40?
en Zelf denk ik echter dat dat ruim onvoldoende is. Ik kom namelijk om de zo veel tijd enorme uitschieters tegen. De meeste afwijkingen zijn 0, 1, 2 en 3, maar af en toe ook een van 80 bijvoorbeeld, daarom krijg ik ook geen normale verdeling.....
Kun je hier iets over zeggen?
en Zelf denk ik echter dat dat ruim onvoldoende is. Ik kom namelijk om de zo veel tijd enorme uitschieters tegen. De meeste afwijkingen zijn 0, 1, 2 en 3, maar af en toe ook een van 80 bijvoorbeeld, daarom krijg ik ook geen normale verdeling.....
Kun je hier iets over zeggen?
Re: Steekproefgrootte voor validatie afvalgegevens?
Ik weet niet hoe je die 40 berekent, dat leerde ik bij statistiek, dat je dan zeker was.
Wat is om de zoveel tijd? De meeste afwijkingen zijn 0, 1, 2 en 3. dat zou je ook terugzien in de Gauss-curve. Uitschieters van 80 worden niet uitgesloten, die kans bestaat nog, en zou je tegen kunnen komen.
Heb je geprobeerd met een steekproef een gemiddelde en een standaardafwijking te berekenen?
Wat is om de zoveel tijd? De meeste afwijkingen zijn 0, 1, 2 en 3. dat zou je ook terugzien in de Gauss-curve. Uitschieters van 80 worden niet uitgesloten, die kans bestaat nog, en zou je tegen kunnen komen.
Heb je geprobeerd met een steekproef een gemiddelde en een standaardafwijking te berekenen?
Stap 1 van het oplossen van een probleem is te erkennen dat je een probleem hebt.
(Raffiek Torreman)
(Raffiek Torreman)
Re: Steekproefgrootte voor validatie afvalgegevens?
Ja ik heb het gemiddelde en de standaard deviatie berekend.
Maar ik weet dat er dusdanige uitschieters zijn die niet in de normale verdeling vallen. Als ik de gegevens check op normaliteit blijken ze dus ook niet normaal verdeeld.
Ik weet dat bijvoorbeeld 5 weken geleden een enorme typefout in de gegevens terecht is gekomen, die bijvoorbeeld een afwijking van 500 heeft veroorzaakt. Dit zie ik dus in mijn steekproef niet terug.
Dus hoe groot moet de steekproef zijn als je iets wilt zeggen over een onbekende verdeling met onbekende uitschieters?
Maar ik weet dat er dusdanige uitschieters zijn die niet in de normale verdeling vallen. Als ik de gegevens check op normaliteit blijken ze dus ook niet normaal verdeeld.
Ik weet dat bijvoorbeeld 5 weken geleden een enorme typefout in de gegevens terecht is gekomen, die bijvoorbeeld een afwijking van 500 heeft veroorzaakt. Dit zie ik dus in mijn steekproef niet terug.
Dus hoe groot moet de steekproef zijn als je iets wilt zeggen over een onbekende verdeling met onbekende uitschieters?
Re: Steekproefgrootte voor validatie afvalgegevens?
Ik denk dat het met de variabele "menselijke fout" moeilijk wordt een normale verdeling te maken. Welke standaardafwijking en gemiddelde heb je gevonden? Hoe groot is de kans met die waarden een fout van 500 te vinden? Klopt die kans met de werkelijkheid (1/aantal ingevoerde data)?
Stap 1 van het oplossen van een probleem is te erkennen dat je een probleem hebt.
(Raffiek Torreman)
(Raffiek Torreman)