Betrouwbaarheidsinterval bij grote steekproef

Continue & discrete verdelingen, toevalsveranderlijken, betrouwbaarheidsintervallen, correlaties.
Plaats reactie
mickeym
Nieuw lid
Nieuw lid
Berichten: 2
Lid geworden op: 13 apr 2020, 11:02

Betrouwbaarheidsinterval bij grote steekproef

Bericht door mickeym » 28 aug 2021, 12:57

Stel we hebben een spel kaarten zonder jokers en we onderzoeken het kenmerk: "de kaart is rood", oftewel alle harten en ruiten kaarten. We weten dat de populatieproportie hiervan 26/52 = 0,5 exact is. Maar neem nu aan dat we een steekproef nemen met steekproefomvang n = 52. Dan is standaardafwijking sd = wortel ( p * (1-p) / n) = wortel (0,5*0,5/52) = 0,069, oftewel 2 sd= 0,139 en het 95% betrouwbaarheidsinterval van de populatieproportie is [ 0,361 ; 0,639]. Dat is een heel brede betrouwbaarheidsinterval, terwijl we weten dat de populatieproportie exact gelijk is aan 0,5. Een vergelijkbare redenatie kun je opzetten met n=51, die heeft een steekproefproportie van 25/51 = 0,490 of 26/51 = 0,510, terwijl het 95% betrouwbaarheidsinterval weer heel breed is. De formule van sd = wortel ( p * (1-p) / n) is hier dus niet heel bruikbaar om het 95% betrouwbaarheidsinterval mee op te stellen. Hoe moet ik deze situatie interpreteren? De formule voor het betrouwbaarheidsinterval lijkt hier niet erg bruikbaar, want ik zou een klein (nauwkeurig) betrouwbaarheidsinterval verwachten als ik 51 van de 52 kaarten trek in een steekproef.

Of stel dat ik de steekproefomvang wil bepalen als ik een 95% betrouwbaarheidsinterval van [0,48 ; 0,52] wil bereiken, oftewel sd=0,01. Dan krijg je 0,01 = wortel (0,5*0,5 / n), oftewel n = 2500, dus ik moet 2500 kaarten trekken om dit betrouwbaarheidsinterval te bereiken, terwijl de populatie maar 52 kaarten kent. Intuitief zou ik verwachten dat bijvoorbeeld n=51 ook al ruim voldoende zou zijn, omdat de steekproefproportie dan 0,490 of 0,510 zal zijn.

wnvl1
Nieuw lid
Nieuw lid
Berichten: 1
Lid geworden op: 17 feb 2019, 02:46

Re: Betrouwbaarheidsinterval bij grote steekproef

Bericht door wnvl1 » 29 aug 2021, 00:23

Als je een kaart getrokken hebt wordt ze dan teruggelegd en kan ze daarna teruggetrokken worden?
Als het antwoord nee is, dan is je formule fout. Je formule "sd = wortel ( p * (1-p) / n)" is alleen maar geldig bij terugleggen.
Je redenering verderop is echter gebaseerd op niet-terugleggen.

arie
Moderator
Moderator
Berichten: 3645
Lid geworden op: 09 mei 2008, 09:19

Re: Betrouwbaarheidsinterval bij grote steekproef

Bericht door arie » 29 aug 2021, 19:36

Meer precies:
Je betrouwbaarheidsinterval is geldig als p constant blijft.
Dat is zo:
[1] bij een steekproef met teruglegging,
maar ook bij
[2] een relatief kleine steekproef (bijvoorbeeld een steekproef enkele 10-tallen uit een populatie van enkele 10000-tallen of meer)
In dit laatste geval zal p niet relevant veranderen,.

mickeym
Nieuw lid
Nieuw lid
Berichten: 2
Lid geworden op: 13 apr 2020, 11:02

Re: Betrouwbaarheidsinterval bij grote steekproef

Bericht door mickeym » 31 aug 2021, 14:34

Ok bedankt allebei! Duidelijk.

Plaats reactie