Steekproef Italie

Continue & discrete verdelingen, toevalsveranderlijken, betrouwbaarheidsintervallen, correlaties.
Plaats reactie
Gebruikersavatar
wnvl
Vergevorderde
Vergevorderde
Berichten: 1490
Lid geworden op: 05 okt 2011, 16:30

Steekproef Italie

Bericht door wnvl » 28 feb 2013, 03:15

Opgepikt op een ander forum, maar ik geraak er niet uit wat de beste methode is om dit op te lossen.

In Italië wordt een steekproef gedaan met 60000 families willekeurig gekozen uit de in totaal 25000000 families in het land. In Italie zijn er 8094 gemeentes. Het aantal inwoners van elke gemeente is gekend.

Wat is het verwacht aantal verschillende gemeentes waaruit die 60000 families zullen komen?

Ik ben ook geïnteresseerd in benaderingen.

Ik zie in elk geval een zekere link met het coupon collector's probleem, de variant waar bij de verschillende coupon's een verschillende kans hebben om voor te komen.

Gebruikersavatar
wnvl
Vergevorderde
Vergevorderde
Berichten: 1490
Lid geworden op: 05 okt 2011, 16:30

Re: Steekproef Italie

Bericht door wnvl » 28 feb 2013, 22:17

Ik heb hier een antwoord gekregen.

http://math.stackexchange.com/questions ... 181#317181

Eigenlijk niet zo moeilijk :shock:

arie
Moderator
Moderator
Berichten: 3911
Lid geworden op: 09 mei 2008, 09:19

Re: Steekproef Italie

Bericht door arie » 01 mar 2013, 21:45

Een steekproef uit een populatie neem je meestal zonder terugleggen.
Je link geeft de oplossing voor het probleem met terugleggen.

Voor grote getallen zal je het verschil kunnen verwaarlozen, voor kleine getallen is het verschil wel merkbaar:
in het voorbeeld in je link:
met 5 balkleuren met resp. 2, 3, 4, 5 en 6 exemplaren, in totaal dus 20 exemplaren, waaruit er 5 getrokken worden, zijn zonder terugleggen 15504 combinaties mogelijk.
Ik kom dan uit op E(N) = 3.44369.

Leuk vraagstuk.

Gebruikersavatar
wnvl
Vergevorderde
Vergevorderde
Berichten: 1490
Lid geworden op: 05 okt 2011, 16:30

Re: Steekproef Italie

Bericht door wnvl » 02 mar 2013, 14:12

Klopt, zonder terugleggen zal het verwacht aantal altijd een beetje groter zijn. Al zal bij een steekproef over heel Italie het verschil pas veel cijfers achter de komma zichtbaar zijn.

Ik had de vraag bewust met terugleggen gepost omdat ik zelf richting coupon collector probleem aan het denken was en ik vermoedde dat de versie met terugleggen meer kans maakte om opgelost te kunnen worden. Uiteindelijk is het meer een variant op de verjaardagsparadox en zijn beide versies met en zonder terugleggen relatief eenvoudig op te lossen.

Plaats reactie