GMDP TP IV (30.05.06)


Calcul de la taille de l'espèce Homo neanderthalensis

Une étude parue dans Nature le 30 mars 2000 révèle qu'une séquence d'un Néanderthalien du Caucase daté d'environ 29'000 ans diffère pour l'ADN mitochondrial de 3.48% de la séquence de l'Homme de Néanderthal. Si l'on admet que les 2 individus étaient contemporains, que le taux de mutation de l'ADNmt est de 7% par million d'année de divergence et que le temps de génération des Néanderthaliens est de 20 ans, quelle est la taille de l'espèce Homo neanderthalensis?

Effet des expansions démographiques

  1. Utilisez l'applet TreeToy sur  http://www.xmission.com/~wooding/TreeToy/
    pour visualiser l'effet des expansions démographiques sur la forme des généalogie et sur la diversité moléculaire. 

    Utilisez les paramètres suivants:

  1. Observez la forme des généalogies. Quelle est la différence principale avec celles tirées d'une population stationnaire ?
  2. Observez la distribution mismatch. Quelle est sa valeur moyenne ? Pourquoi ?
  3. Modifiez le "Growth factor" à 100. Que constatez-vous en ce qu concerne les généalogies et la distribution mismatch ?
  4. Modifiez le "Growth factor" à 1'000 et "Theta0" à 10. Mêmes questions. Comparez les généalogies à celles générées pour une population stationnaire avec un "Theta0" à 10.

Simulation de séquences d'ADN dans une population stationnaire avec le logiciel SIMCOAL

  1. Simulation de 100 échantillons de 20 séquences d'ADNmt de 300 pb de long avec le logiciel SIMCOAL
    1. Téléchargez le programme SIMCOAL se trouvant sur la page http://cmpg.unibe.ch/software/simcoal/, et installez le programme simcoal.exe sur votre ordinateur dans le répertoire de votre choix.
    2. Téléchargez le fichier dna_sta.par qui est le fichier de configuration spécifiant les paramètres des simulations à effectuer.
    3. Mettez le dans le répertoire ou se trouve le programme simcoal.exe.
    4. Consultez le contenu du fichier avec un éditeur de texte (p. ex. notepad). Vous verrez que ce fichier va vous permettre de simuler des échantillons
      • de 20 séquences d'ADN de 300 pb
      • tirés d'une population de N=5000 individus haploides
      • où le taux de mutation u par séquence est de 0.0005
    5. Calculez rapidement (de tête) le nombre moyen de différences par paire attendu entre les séquences
    6. Lancez l'application simcoal.exe, entrez le nom du fichier contenant les paramètres de la simulation (dna_sta), faites faire 100 simulations
    7. Lancez Arlequin pour analyser les fichier simulés
    8. Dans Arlequn, chargez le fichier dna_sta.arb qui contient la liste de tous les fichiers générés par simcoal à partir du fichier d'entrée dna_sta.par
    9. Configurez les calculs à faire effectuer par Arlequin dans l'onglet Settings. Après avoir sélectionné la ligne General settings dans le panneau de gauche, cliquez sur le bouton  Infer from distance matrix dans le panneau de droite. Ceci oblige Arlequin à vérifier que 2 séquences ayant des noms différents soient bien différentes, de manière à calculer le nombre d'allèles dans l'échantillon. Dans le panneau de gauche, sélectionnez la ligne Molecular diversity indices, et  cochez les cases Standard diversity indices et Molecular diversity, ainsi que toutes les cases permettant de calculer le paramère Theta de la population dont vous connaissez la valeur attendue.
      • Estimation du paramètre q par le nombre d'allèles selon la formule (Ewens 1972)

      n est la taille de l'échantillon et k le nombre d'allèle attendu.

      • Estimation du paramètre q par le nombre de sites polymorphes S


      • Estimation du paramètre q par le nombre moyen de différence par paire p

       E(p) = q

      • Estimation du paramètre q par l'homozygotie attendue

      .

    10. Dans l'onglet Batch file, cochez  la case Theta values

    11. Lancez les cacluls en appuyant sur le bouton Start.

    12. Vous pouvez consulter le résumé des résultats des analyses des 100 fichiers avec Excel. Lancer Excel et droppez le fichier theta.sum généré par Arlequin. Vous verrez les estimations des valeurs de q par les 4 méthodes décrites plus haut pour chaque simulation. Calculez la moyenne des estimations et comparez les à la valeur attendue que vous avez calculé.

  2. Visualisation des arbres de coalescence avec le logiciel TreeView que vous pouvez télécharger sur http://taxonomy.zoology.gla.ac.uk/rod/treeview.html .
    1. Après l'avoir installée, lancez l'application Treeview.
    2. Glissez-collez  les fichiers avec l'extension *.trees générés par simcoal.exe, et observez les généalogies simulées.