Réseau GÉNET Les outils de génétique moléculaire |
|
Les outils de génétique moléculaire
Le séquençage
Banques et séquençage d'ADNc
|
Un tel programme consiste à :
- Construire une banque d'ADNc :
A partir d'un tissu ou d'un type de cellules en culture, les ARNm sont purifiés, recopiés en ADNc simple brin à partir desquels sont synthétisés les ADNc double brin. Ces derniers sont alors clonés sous la forme d'une collection de clones indépendants.
- Séquencer l'ADNc :
Séquençage systématique, intensif mais partiel (pour réduire le temps et le coût) de grandes séries de clones avec des moyens techniques fortement robotisés et automatisés : chaque fragment d'ADNc cloné n'est séquencé qu'une seule fois sur quelques centaines de nucléotides de chacune de ses extrémités : on obtient les EST (marqueurs de séquences exprimées). Toutefois, cette méthodologie employée entraîne un taux important d'erreurs dans les séquences (environ 3%).
Jusqu'à ces dernières années, la plupart des séquences publiées étaient issues de recherches émanant d'un seul laboratoire et portant sur un gène particulier. Mais aujourd'hui, ce sont les divers projets de séquençage systématique qui deviennent les principaux producteurs de séquences.
La banque dbEST, banque publique créée en 1993, centralise les séquences EST issues des différents projets de séquençage. Mais la collection présente une forte redondance due au fait que ces séquences ont été obtenues à partir de clones pris au hasard dans de nombreuses banques d'ADNc établies à partir de divers tissus. Par conséquent, des EST peuvent correspondre à des parties différentes, souvent (mais pas toujours) chevauchantes d'un même gène exprimé.
Des banques tentent de regrouper (grâce à un ensemble de logiciels de clusterisation) les séquences qui à priori proviennent du même gène.
Parmi elles :
- UNIGENE
- TIGR Genes Indices
L'ensemble des EST consensus provenant de tous les tissus confondus (banque STACK) peut donner une évaluation du nombre total de gènes humains. Toutefois, la base de données dbEST peut être incomplète. Il peut en effet toujours exister des gènes très peu exprimés ou exprimés uniquement dans un tissu bien particulier à un instant précis du développement embryonnaire et qui échapperaient ainsi à ce comptage. Les premières estimations du nombre de gènes humains l'incluait dans une fourchette comprise entre 40000 et 100000. Les données issues de la dernière version du séquencage du génome humain (via la prédiction des ORFs notamment) l'évalue aujourd'hui à une valeur comprise entre 25000 et 40000.
|
|