- Een nucleotide kan een A, T, C of G zijn
- Een sequentie bestaat uit een combinatie van 19 van deze nucleotides
- Een genoom is in feite een hele lange sequentie
Ik heb een genoom van 130 miljoen nucleotides van een willekeurige samenstelling.
Een willekeurige sequentie van 19 nucleotides lang, bijvoorbeeld ATCGCTTGAGTGCGATGCG, hoe vaak kan ik verwachten deze terug te vinden op het totale genoom als ik 3 positities fout mag hebben? Oftwel:
Als dit ergens op het genoom staat:
ATCGCTTGAGTGCGATGCG
Dan wordt bijvoorbeeld AGCGCATGAGTGCGCTGCG ook beschouwd als 'gevonden'.
In ieder geval weet ik dat van een willekeurige sequentie van 19 nucleotides, er 26.163 variaties zijn als 3 posities anders mogen zijn.
Iemand het antwoord?