Unieke Bestandsnaam

Continue & discrete verdelingen, toevalsveranderlijken, betrouwbaarheidsintervallen, correlaties.
Plaats reactie
Gebruikersavatar
meneer van Hoesel
Vergevorderde
Vergevorderde
Berichten: 395
Lid geworden op: 20 apr 2010, 14:43
Locatie: Zwolle

Unieke Bestandsnaam

Bericht door meneer van Hoesel » 31 mei 2010, 12:28

Voor een een of ander website wil ik bestanden die worden geplaats een unieke naam krijgen, dus ik aan het werk om een random-generator te maken. Bestands namen krijgen 6 karakters [A-Z][A-Z,0-9]x5, of te wel de eerste is een letter, daarna 5x een letter of cijfer en dus ongeveer 1,6 miljard mogelijkheden.

Ik had nu een test omgeving gemaakt met daarin 130 bestanden en ik kijk zo naar mijn lijstje en zie

...
IELA09
J5AS91
J5ASIQ
J5DF9J
...

en dacht toen bij mijzelf dat deze redelijk unieke kans met 4 dezelfde begin karakters mogelijk helemaal niet zo uniek is.

probleem 1:
hoe groot is de kans dat op een serie van 130 namen de eerste 4 karakters het zelfde zijn

probleem 2:
hoe groot is de kans dat op 13.000 bestanden er twee met identieke naam (6 karakters het zelfde) voor zouden kunnen komen (dat mag namenlijk niet, want dan zou je een bestand overschrijven)


hoewel dus die kansen relatief klein zijn was ik toch enigzins verbaasd dat het mij overkwam; met andere woorden: "als is de kans nog zo klein, wees er op voorbereid dat het toch kan gebeuren"


NB. natuurlijk gaat het mij niet om de computer oplossing, dat is gewoon een kwestie van 8 karakters nemen, en vervolgens toch maar even testen of de naam niet toevallig al bestaat en als dat zo is, even een nieuwe genereren

David
Moderator
Moderator
Berichten: 4927
Lid geworden op: 14 mei 2009, 16:22

Re: Unieke Bestandsnaam

Bericht door David » 31 mei 2010, 12:43

Hallo meneer van Hoesel,

Kort om u op weg te helpen:
probleem 1)
Het eerste teken is een letter, de volgende 3 een cijfer of een letter.
Er zijn 26 mogelijkheden voor het eerste teken, en 36 mogelijkheden voor elk van de volgende 3 tekens.
Kunt u iets met deze gegevens? Snapt u dat er bij de tweede 36 tekens zijn?

probleem 2)
Hoe groot is de kans dat 2 namen exact overeenkomen? Kunt u daarbij de complementregel gebruiken?
Stap 1 van het oplossen van een probleem is te erkennen dat je een probleem hebt.
(Raffiek Torreman)

Gebruikersavatar
op=op
Vergevorderde
Vergevorderde
Berichten: 1087
Lid geworden op: 23 apr 2010, 18:11

Re: Unieke Bestandsnaam

Bericht door op=op » 31 mei 2010, 13:03

meneer van Hoesel schreef: hoewel dus die kansen relatief klein zijn was ik toch enigzins verbaasd dat het mij overkwam; met andere woorden: "als is de kans nog zo klein, wees er op voorbereid dat het toch kan gebeuren"
Nee die kansen zijn niet klein maar groot.
Als je gevraagd wordt 100 willekeurige getallen op te schrijven tussen 100 en 999, dan is je rijtje getallen waarschijnlijk verre van willekeurig.
Het bijzondere van willekeurige (=random) getallen is, dat ze patronen laten zien.
Welke patronen is vooraf nooit duidelijk. Het kan zijn zoals in jouw geval dat er 5 achter elkaar met de zelfde letter beginnen, of dat er een woord in zit met allemaal dezelfde letters, of dat er Nederlandse woorden tussen zitten of dat er 5 woorden in zitten bestaande uit 1 letter en de rest cijfers of ... of ... of ... (het aantal patroon variaties is zeer groot).
In al deze gevallen zou jij ons hier diezelfde waarschuwing gegeven hebben.

Gebruikersavatar
meneer van Hoesel
Vergevorderde
Vergevorderde
Berichten: 395
Lid geworden op: 20 apr 2010, 14:43
Locatie: Zwolle

Re: Unieke Bestandsnaam

Bericht door meneer van Hoesel » 31 mei 2010, 13:05

probleem 1:


mogelijk verschillende 4-karakter combinaties

probleem 2:


mogelijk verschillende 6-karakter combinaties

David
Moderator
Moderator
Berichten: 4927
Lid geworden op: 14 mei 2009, 16:22

Re: Unieke Bestandsnaam

Bericht door David » 31 mei 2010, 19:36

probleem 2:
Stel, er is één code gekozen.
Er zijn 1.572.120.575 mogelijkheden voor dat de tweede code niet overeenkomt, een code dat die code wel overeenkomt. (Is dat een duidelijke zin?) Kunt u nu met \frac{\mathrm{"succes"}}{\mathrm{totaal}} uitrekenen hoe groot de kans (ongeveer) is dat 2 codes overeenkomen?

probleem 1.
Die vind ik lastig. Ik zou dit proberen:
Voor het 2e t/m het 4e teken is de kans op een letter en dus op een cijfer. Dan is het kijken: hoeveel mogelijkheden zijn er om 3 verschillende cijfers en/of letters te vinden, hoeveel voor 2 dezelfde cijfersen/of letters en dus een verschillende, en hoeveel voor 3 dezelfde cijfers en/of letters.

Komt u zo verder, of was u dat al?
Stap 1 van het oplossen van een probleem is te erkennen dat je een probleem hebt.
(Raffiek Torreman)

Plaats reactie