GÉNET - Les outils de génétique moléculaire
    
 
Réseau
GÉNET
 
Les outils
de
génétique
moléculaire
  Les outils de génétique moléculaire
Le séquençage
Génome complet
Séquençage des "contigs" [1/2]

 
 
  Le séquençage automatique

L'établissement des séquences a beaucoup évolué ces dernières années avec la progression des séquenceurs automatiques. Ces derniers réalisent deux opérations :
  • La lecture
    Ils sont équipés d'un système optique qui balaye le bas du gel d'électrophorèse : le signal obtenu est interprété par un programme informatique qui reconstituera la séquence originale du fragment d'ADN analysé. Un séquenceur automatique peut par opération unitaire, ou "lecture", déterminer l'enchaînement de 500 à 1000 nucléotides. Les molécules d'ADN à séquencer étant beaucoup plus longues que les lectures, il est nécessaire de réaliser des lectures redondantes qu'il faut ensuite raccorder les unes aux autres. Un "run" correspond à une expérience d'électrophorèse et il permet de faire entre 60 et 100 lectures.
  • L'assemblage
    C'est à cette dernière étape qu'intervient traditionnellement la bioinformatique. Pour reconstituer la séquence initiale, les lectures doivent en effet être ordonnées les unes par rapport aux autres par la mise en évidence de recouvrements (extrémités chevauchantes), c'est à dire des régions terminales présentant un enchaînement de nucléotides identiques (aux erreurs de séquençage près). Une "contig" désigne deux ou plusieurs fragments chevauchants.
    Le but du projet est d'aboutir (par recouvrements successifs de l'ensemble des contigs) à une contig unique correspondant à la séquence consensus.
    Outre des erreurs ponctuelles (la disparition d'une base ou sa substitution par une autre), des erreurs dans l'ordre des sous-séquences restent possibles. Le taux d'erreur peut approcher 1%. De plus, certaines portions (zones répétées ...) de la molécule d'ADN sont plus délicates à séquencer et l'obtention d'une séquence qui couvre 100% d'un génome est particulièrement coûteuse. C'est pour ces raisons que l'on qualifie de "brouillon" (working draft) certains génomes en voie d'achèvement de séquençage.
    

© Université de Tours - NET - 7 janvier, 2008