GMDP TP IV (30.05.06)
Calcul de la taille de l'espèce Homo neanderthalensis
Une étude parue dans Nature le 30 mars 2000 révèle qu'une
séquence d'un Néanderthalien du Caucase daté d'environ 29'000 ans diffère
pour l'ADN mitochondrial de 3.48% de la séquence de l'Homme de Néanderthal. Si
l'on admet que les 2 individus étaient contemporains, que le taux de mutation
de l'ADNmt est de 7% par million d'année de divergence et que le temps de
génération des Néanderthaliens est de 20 ans, quelle est la taille de
l'espèce Homo neanderthalensis?
Effet des expansions démographiques
- Utilisez l'applet TreeToy
sur
http://www.xmission.com/~wooding/TreeToy/
pour visualiser l'effet des expansions démographiques sur la forme
des généalogie et sur la diversité moléculaire.
Utilisez les paramètres suivants:
- Sample size: 10 (taille de l'échantillon)
- Theta0: 1 (paramètre q avant
l'expansion)
- Growth Factor: 1000.0 (Ampleur de l'expansion instantanée, q
après expansion = 1'000)
- Tau: 15 (Temps de l'expansion exprimé en unités de mutation
t=2ut)
- Observez la forme des généalogies. Quelle est la différence
principale avec celles tirées d'une population stationnaire ?
- Observez la distribution mismatch. Quelle est sa valeur moyenne
? Pourquoi ?
- Modifiez le "Growth factor" à 100. Que
constatez-vous en ce qu concerne les généalogies et la distribution
mismatch ?
- Modifiez le "Growth factor" à 1'000 et "Theta0"
à 10. Mêmes questions. Comparez les généalogies à celles générées
pour une population stationnaire avec un "Theta0" à 10.
Simulation de séquences d'ADN dans une population stationnaire avec le
logiciel SIMCOAL
- Simulation de 100 échantillons de 20 séquences d'ADNmt de 300 pb de long
avec le logiciel SIMCOAL
- Téléchargez le programme SIMCOAL se trouvant sur la page
http://cmpg.unibe.ch/software/simcoal/, et installez le programme
simcoal.exe sur votre ordinateur dans le répertoire de votre choix.
- Téléchargez le fichier dna_sta.par
qui est le fichier de configuration spécifiant les paramètres des
simulations à effectuer.
- Mettez le dans le répertoire ou se trouve le programme simcoal.exe.
- Consultez le contenu du fichier avec un éditeur de texte (p. ex.
notepad). Vous verrez que ce fichier va vous permettre de simuler des
échantillons
- de 20 séquences d'ADN de 300 pb
- tirés d'une population de N=5000 individus haploides
- où le taux de mutation u par séquence est de 0.0005
- Calculez rapidement (de tête) le nombre moyen de différences par
paire attendu entre les séquences
- Lancez l'application simcoal.exe, entrez le nom du fichier
contenant les paramètres de la simulation (dna_sta), faites
faire 100 simulations
- Lancez Arlequin pour analyser les fichier simulés
- Dans Arlequn, chargez le fichier dna_sta.arb qui contient la
liste de tous les fichiers générés par simcoal à partir du fichier
d'entrée dna_sta.par
- Configurez les calculs à faire effectuer par Arlequin dans l'onglet
Settings. Après avoir sélectionné la ligne General settings
dans le panneau de gauche, cliquez sur le bouton Infer from
distance matrix dans le panneau de droite. Ceci oblige Arlequin à vérifier que 2
séquences ayant des noms différents soient bien différentes, de manière à calculer le nombre d'allèles dans l'échantillon.
Dans le panneau de gauche, sélectionnez la ligne Molecular diversity
indices, et cochez les cases Standard diversity indices
et Molecular diversity, ainsi que toutes les cases permettant de
calculer le paramère Theta de la population dont vous connaissez la valeur attendue.
- Estimation du paramètre q par le nombre
d'allèles selon la formule (Ewens 1972)
où n est la taille de l'échantillon et k le nombre
d'allèle attendu.
- Estimation du paramètre q par le nombre de
sites polymorphes S
- Estimation du paramètre q par le nombre moyen
de différence par paire p
E(p) = q
- Estimation du paramètre q par
l'homozygotie attendue
.
Dans l'onglet Batch file, cochez la case Theta
values
Lancez les cacluls en appuyant sur le bouton Start.
Vous pouvez consulter le résumé des résultats des analyses des
100 fichiers avec Excel. Lancer Excel et droppez le fichier theta.sum
généré par Arlequin. Vous verrez les estimations des valeurs de q par
les 4 méthodes décrites plus haut pour chaque simulation. Calculez la
moyenne des estimations et comparez les à la valeur attendue que vous
avez calculé.
- Visualisation des arbres de coalescence avec le logiciel TreeView que vous
pouvez télécharger sur
http://taxonomy.zoology.gla.ac.uk/rod/treeview.html .
- Après l'avoir installée, lancez l'application Treeview.
- Glissez-collez les fichiers avec l'extension *.trees générés par
simcoal.exe, et observez les généalogies simulées.