Steekproefgrootte voor validatie afvalgegevens?

Continue & discrete verdelingen, toevalsveranderlijken, betrouwbaarheidsintervallen, correlaties.
Plaats reactie
fvromans
Nieuw lid
Nieuw lid
Berichten: 3
Lid geworden op: 30 jul 2010, 06:07

Steekproefgrootte voor validatie afvalgegevens?

Bericht door fvromans » 30 jul 2010, 07:38

Hallo,

Wie kan mij helpen met het volgende probleem:

Ik heb een jaar lang meetgegevens van afgevoerd afval. Nu ben ik voordat ik met deze gegevens aan de slag ben gegaan eerst gaan kijken naar het meetsysteem. Na één week meten blijkt dat er regelmatig verschillen zitten tussen het werkelijk afgevoerde afval en het geregistreerde afval, door bijvoorbeeld telfouten, typefouten, etc. Omdat deze fouten waarschijnlijk ook in de jaargegevens zitten wil ik op basis van de controle week gegevens een uitspraak doen over de jaardata.

Bijvoorbeeld: op basis van één week metingen zie ik een gemiddelde afwijking van 25% met een standaarddeviatie van....., dit maakt dus de jaargetallen onbruikbaar, aangezien we een nauwkeurigheid van 10% nastreven....

Meetvoorbeeld:
Werkelijk afval = 10, geregistreerd is 10, verschil = 0
Werkelijk afval = 10, geregistreerd is 11, verschil = -1
Werkelijk afval = 11, geregistreerd is 10, verschil = 1
Werkelijk afval = 10, geregistreerd is 8, verschil = 2
Werkelijk afval = 8, geregistreerd is 10, verschil = -2
etc. komen veel voor.

Maar de volgende komen ook voor:
Werkelijk afval = 73, geregistreerd is 68, verschil = 5
Werkelijk afval = 31, geregistreerd is 11, verschil = 20
Werkelijk afval = 105, geregistreerd is 10, verschil = 95
etc.

Hoe grote steekproef moet ik nu nemen om betrouwbaar iets te zeggen over de gemiddelde afwijking en de standaarddeviatie? en moet deze afwijking dan normaal verdeeld zijn?

David
Moderator
Moderator
Berichten: 4927
Lid geworden op: 14 mei 2009, 16:22

Re: Steekproefgrootte voor validatie afvalgegevens?

Bericht door David » 31 jul 2010, 21:27

Hallo fvromans,

Met een steekproef vanaf grootte 40 is nauwkeurig genoeg een gemiddelde en een standaarddeviatie te vinden. Mag natuurlijk groter.

Kom je zo verder?
Stap 1 van het oplossen van een probleem is te erkennen dat je een probleem hebt.
(Raffiek Torreman)

fvromans
Nieuw lid
Nieuw lid
Berichten: 3
Lid geworden op: 30 jul 2010, 06:07

Re: Steekproefgrootte voor validatie afvalgegevens?

Bericht door fvromans » 01 aug 2010, 07:28

Bedankt, maar hoe bereken je die 40?

en Zelf denk ik echter dat dat ruim onvoldoende is. Ik kom namelijk om de zo veel tijd enorme uitschieters tegen. De meeste afwijkingen zijn 0, 1, 2 en 3, maar af en toe ook een van 80 bijvoorbeeld, daarom krijg ik ook geen normale verdeling.....

Kun je hier iets over zeggen?

David
Moderator
Moderator
Berichten: 4927
Lid geworden op: 14 mei 2009, 16:22

Re: Steekproefgrootte voor validatie afvalgegevens?

Bericht door David » 01 aug 2010, 11:46

Ik weet niet hoe je die 40 berekent, dat leerde ik bij statistiek, dat je dan zeker was.

Wat is om de zoveel tijd? De meeste afwijkingen zijn 0, 1, 2 en 3. dat zou je ook terugzien in de Gauss-curve. Uitschieters van 80 worden niet uitgesloten, die kans bestaat nog, en zou je tegen kunnen komen.

Heb je geprobeerd met een steekproef een gemiddelde en een standaardafwijking te berekenen?
Stap 1 van het oplossen van een probleem is te erkennen dat je een probleem hebt.
(Raffiek Torreman)

fvromans
Nieuw lid
Nieuw lid
Berichten: 3
Lid geworden op: 30 jul 2010, 06:07

Re: Steekproefgrootte voor validatie afvalgegevens?

Bericht door fvromans » 02 aug 2010, 10:34

Ja ik heb het gemiddelde en de standaard deviatie berekend.

Maar ik weet dat er dusdanige uitschieters zijn die niet in de normale verdeling vallen. Als ik de gegevens check op normaliteit blijken ze dus ook niet normaal verdeeld.

Ik weet dat bijvoorbeeld 5 weken geleden een enorme typefout in de gegevens terecht is gekomen, die bijvoorbeeld een afwijking van 500 heeft veroorzaakt. Dit zie ik dus in mijn steekproef niet terug.

Dus hoe groot moet de steekproef zijn als je iets wilt zeggen over een onbekende verdeling met onbekende uitschieters?

David
Moderator
Moderator
Berichten: 4927
Lid geworden op: 14 mei 2009, 16:22

Re: Steekproefgrootte voor validatie afvalgegevens?

Bericht door David » 02 aug 2010, 11:18

Ik denk dat het met de variabele "menselijke fout" moeilijk wordt een normale verdeling te maken. Welke standaardafwijking en gemiddelde heb je gevonden? Hoe groot is de kans met die waarden een fout van 500 te vinden? Klopt die kans met de werkelijkheid (1/aantal ingevoerde data)?
Stap 1 van het oplossen van een probleem is te erkennen dat je een probleem hebt.
(Raffiek Torreman)

Plaats reactie