Prangende vraag mbt omvang steekproef.

Continue & discrete verdelingen, toevalsveranderlijken, betrouwbaarheidsintervallen, correlaties.
Plaats reactie
Hugo88
Nieuw lid
Nieuw lid
Berichten: 3
Lid geworden op: 04 apr 2014, 08:46

Prangende vraag mbt omvang steekproef.

Bericht door Hugo88 » 04 apr 2014, 08:48

Beste statistici,

Ik heb een vraag waarop ik geen antwoord kan vinden in mijn statistiek boeken of op internet. Deze vraag luidt:

Hoe groot moet je steekproef zijn om een (enigszins acceptabel) representatief beeld van de samenstelling van je hele populatie te krijgen in de volgende situatie:

In een grote kist met appels zitten 1000 appels, deze zijn rot of niet rot.

Vraag 1:
-Hoeveel appels moet ik trekken; 1 per keer, blind, zonder terugleggen, en compleet random om een (enigszins acceptabel) representatief beeld te krijgen van de verhouding rotte/niet rotte appels?

Vraag 2:
-Stel ik trek random, zonder terugleggen, 5 appels, hoeveel (%) zekerheid geeft mij de samenstelling van deze steekproef over de samenstelling van de hele kist met duizend appels?

Hoe bereken je dit en eventueel, wat is de naam van deze methode?

Alvast bedankt voor jullie reactie, ik kijk uit naar jullie berekening!

Hugo.

arie
Moderator
Moderator
Berichten: 3911
Lid geworden op: 09 mei 2008, 09:19

Re: Prangende vraag mbt omvang steekproef.

Bericht door arie » 04 apr 2014, 14:16


Hugo88
Nieuw lid
Nieuw lid
Berichten: 3
Lid geworden op: 04 apr 2014, 08:46

Re: Prangende vraag mbt omvang steekproef.

Bericht door Hugo88 » 04 apr 2014, 14:33

Hallo Arie, ik vrees van niet. Toch bedankt voor je reactie! Iemand anders?

Gebruikersavatar
wnvl
Vergevorderde
Vergevorderde
Berichten: 1490
Lid geworden op: 05 okt 2011, 16:30

Re: Prangende vraag mbt omvang steekproef.

Bericht door wnvl » 05 apr 2014, 13:21

Bovenstaande link van Arie is wel relevant.

Probleem is dat je vraag niet zo goed geformuleerd is.
Formuleer je vraag eens in termen van een betrouwbaarheidsinterval.

http://nl.wikipedia.org/wiki/Betrouwbaarheidsinterval

en koppel daaraan een percentage van bvb 95%.

Ook het begrip significantie kan evt. relevant zijn voor je vraagstelling.
Als je de vraag nauwkeuriger formuleert zullen er zeker antwoorden komen, maar "hoeveel (%) zekerheid geeft mij de samenstelling van deze steekproef over de samenstelling van de hele kist met duizend appels" is echt ongelukkig geformuleerd.

Hugo88
Nieuw lid
Nieuw lid
Berichten: 3
Lid geworden op: 04 apr 2014, 08:46

Re: Prangende vraag mbt omvang steekproef.

Bericht door Hugo88 » 05 apr 2014, 21:25

Beste wnvl, bedankt voor je reactie. Laat ik het anders formuleren, ik ben een absolute leek op het gebied van statistiek, maar ik zit wel een probleem dat raakt aan statistiek. Ik kan het probleem dus niet formuleren in termen van betrouwbaarheidsintervallen of significantieniveau's, omdat ik domweg geen idee heb wat die termen exact inhouden. Ik kan deze begrippen natuurlijk wel Wikipedia-en, maar dan weet ik nog steeds niet zeker wat ik aan het doen ben. Ik ben een fruitteler die wil weten hoeveel appels ik moet controleren om de samenstelling van een kist met duizend appels te weten. Ik accepteer 20% rotte appels en mijn steekproef moet mij 90% zekerheid geven over de juiste verhouding appels in de kist. Op dit moment controleren wij 5 appels per kist. Hoeveel appels moet ik controleren om die 90% zekerheid (over de verhouding rot/niet rot in de kist) te krijgen? En hoeveel % zekerheid over de verhouding heb ik wanneer ik 5 appels controleer? Meer informatie kan ik jullie niet geven. Mochten jullie nog meer informatie nodig hebben, dan geef ik graag antwoord, maar bedenk daarbij dat ik absoluut geen verdere kennis van statistiek heb. Nogmaals, alvast hartelijk dank voor jullie antwoord!

Gebruikersavatar
wnvl
Vergevorderde
Vergevorderde
Berichten: 1490
Lid geworden op: 05 okt 2011, 16:30

Re: Prangende vraag mbt omvang steekproef.

Bericht door wnvl » 05 apr 2014, 22:49

Laat ons beginnen met de eerste vraag.

Ik heb een kist met 1000 appels. Hoeveel appels moet ik uit de kist nemen zonder terugleggen om met een betrouwbaarheid van 95% te kunnen stellen dat minder dan 20% van de appels rot is.

Probleem is dat dit eigenlijk nog afhankelijk is van de a-priori kans verdeling van het percentage rotte appels.
Dit betekent dat we de verdelingsfunctie over de tijd heen van het percentage rotte appels in een kist moeten kennen. Evt. kunnen we wel uitgaan van een a prior uniforme verdeling.

Ik kom er later op terug, of als iemand anders ze wil oplossen intussen...

arno
Vergevorderde
Vergevorderde
Berichten: 1923
Lid geworden op: 25 dec 2008, 16:28
Locatie: Beek en Donk, Noord-Brabant

Re: Prangende vraag mbt omvang steekproef.

Bericht door arno » 06 apr 2014, 17:41

wnvl schreef:Ik heb een kist met 1000 appels. Hoeveel appels moet ik uit de kist nemen zonder terugleggen om met een betrouwbaarheid van 95% te kunnen stellen dat minder dan 20% van de appels rot is.
Ik heb dit straks proberen op te lossen door een binomiale linkseenzijdige toets, maar toen kwam ik op een negatieve waarde uit. We weten in ieder geval dat n = 1000 en dat we de binomiale verdeling mogen benaderen met een normale verdeling met gemiddelde 1000∙p en standaardafwijking . Verder weten we op grond van een betrouwbaarheid van 95%
dat z = -1,645, dus , dus , dus . Links en rechts kwadrateren geeft: 1.082.410p-1.082.410p² = 40.000.000p²,
dus 4108241p² = 108241p, dus . Laten we er dus van uitgaan dat p = 0,026. We willen nu het aantal appels vinden om te constateren dat minder dan 2,6% van de appels rot is. Vanwege een betrouwbaarheid van 95% geldt
dat α = 0,05. We zoeken nu het kritieke gebied waarbij gegeven is dat . We benaderen deze kans met een normale verdeling met gemiddelde 1000∙0,026 = 26 en standaardafwijking . We vinden dan dat . Als we dus minimaal 0 en maximaal 20 appels uit de kist halen die rot zijn mogen we in dat geval constateren dat minder dan 2,6% van de appels rot is.
"Mathematics is a gigantic intellectual construction, very difficult, if not impossible, to view in its entirety." Armand Borel

Gebruikersavatar
wnvl
Vergevorderde
Vergevorderde
Berichten: 1490
Lid geworden op: 05 okt 2011, 16:30

Re: Prangende vraag mbt omvang steekproef.

Bericht door wnvl » 07 apr 2014, 14:50

Arno,

Ik veronderstel dat

p=kans op rotte appel in jou redenering

Moet het niet zijn



in jou redenering?

Maar ook mits deze correctie, begrijp ik je redenering niet goed eigenlijk.
Als je eerst bovenstaand correctie al dan niet bevestigt denk ik verder over je redenering.

Het probleem is in elk geval veel moeilijker dan ik initieel dacht.

Gebruikersavatar
wnvl
Vergevorderde
Vergevorderde
Berichten: 1490
Lid geworden op: 05 okt 2011, 16:30

Re: Prangende vraag mbt omvang steekproef.

Bericht door wnvl » 07 apr 2014, 17:32

Ik moet het nog aandachtiger bekijken, maar ik denk dat je een beta binomiaalverdeling kan gebruiken om de verdelingsfunctie voor te stellen van de kans p op een rotte appel als je a rotte appels hebt in je steekproef en b niet rotte appals.


pdf(p|a,b)=B(a,b)

http://en.wikipedia.org/wiki/Beta-binomial_distribution

arno
Vergevorderde
Vergevorderde
Berichten: 1923
Lid geworden op: 25 dec 2008, 16:28
Locatie: Beek en Donk, Noord-Brabant

Re: Prangende vraag mbt omvang steekproef.

Bericht door arno » 07 apr 2014, 17:51

wnvl schreef:Arno,

Ik veronderstel dat

p=kans op rotte appel in jou redenering

Moet het niet zijn



in jou redenering?
Die 200 zou dan het aantal rotte appels moeten zijn als je uitgaat van jouw vraagstelling, maar dan zou p = 0,2 moeten zijn, en als ik dan met behulp van een continuïteitscorrectie het gebied bij een linkszijdige toets probeer te bepalen kom ik voor het aantal appels op een negatieve waarde uit, vandaar dat ik geprobeerd heb om een waarde voor p te vinden die wel positieve waarden geeft. Laat dit verder echter maar zitten.
"Mathematics is a gigantic intellectual construction, very difficult, if not impossible, to view in its entirety." Armand Borel

Gebruikersavatar
wnvl
Vergevorderde
Vergevorderde
Berichten: 1490
Lid geworden op: 05 okt 2011, 16:30

Re: Prangende vraag mbt omvang steekproef.

Bericht door wnvl » 07 apr 2014, 20:26

De waarde van p berekenen, gaat niet lukken. Wat wel kan is een kansverdeling berekenen voor p. Dit wordt de a posteriori pdf genoemd.
Ideeën daarachter zijn gebaseerd op de Bayesiaanse statistiek.

http://en.wikipedia.org/wiki/Bayesian_inference

Ik denk dat we komen tot een pdf die een Beta functie is (te verifieren).

http://en.wikipedia.org/wiki/Beta_function

Voor elke willekeurige combinatie van a getrokken appels met b rotte appels kunnen we zo'n pdf berekenen.
Voor zo'n pdf kunnen we berekenen wat de kans de kans verdeling is van van het aantal rotte appels op 1000 appels.

Op zich is het probleem dan nog niet opgelost, maar probleem is dat de vraag eigenlijk niet helemaal duidelijk is.

Als je 20 appels hebt en er is geen enkele rot dan kan je met 95% zekerheid zeggen dat er geen 20% rot is. Als je 20 appels hebt en er zijn er 4 rot, dan kan je geen voorspelling doen met 95% zekerheid. Het komt erop neer dat de a-priori probabiliteiten vastgelegd moeten worden in de vraagstelling zoals eerder gesteld.

Plaats reactie