FLUX D'INFORMATION GENETIQUE

1 - NOTION DE CODE GENETIQUE

L'hypothèse "un gène une protéine" évoquée au chapitre III a été confortée bien avant le développement des technologies de l'ADN recombinant.
Ingram, vers 1957 a été l'un des premiers à établir la relation précise entre une mutation bien caractérisée ayant comme manifestation phénotypique une maladie héréditaire grave : l'anémie falciforme (ainsi nommée en raison de la forme des hématies des sujets homozygotes pour la tare) et une protéine spécifique : l'hémoglobine. L'hémoglobine normale est de type A et composée de quatre motifs polypeptidiques : deux chaines alpha et deux chaines beta, l'hémoglobine S, des sujets atteints est également composée des quatre sous unités mais elle se distingue de la A par sa mobilité électrophorétique.
Par des méthodes d'analyse d'oligopeptides et de séquençage protéique que nous ne détaillerons pas, il fut montré que l'hémoglobine S diffère de la normale (A) par un seul acide aminé dans les chaines ß :

Le remplacement d'un acide aminé diacide (acide glutamique) par un neutre explique la différence de mobilité à l'éléctrophorèse. Par ailleurs, tous les autres acides aminés sont identiques, autrement dit, l'unité d'effet d'une mutation peut être le changement d'un seul acide aminé dans une protéine.

* Remarque : La biologie moléculaire des protéines a permis de comprendre qu'une très légère altération de la structure primaire pouvait bouleverser les structures secondaires et tertiaires avec des conséquences physiologiques considérables. Ce n'est pas toujours le cas, tout dépend de la position de la modification dans la protéine, certaines substitutions d'acides aminés ne peuvent avoir que peu ou pas d'effet.

Quelques années plus tard, Yanofsky établit une relation entre la structure du gène et la structure primaire de la protéine.
Par les techniques de cartographie à haute résolution adaptées aux bactéries, il positionne plusieurs mutations supposées ponctuelles dans un cistron codant pour une sous unité A de la tryptophane synthétase d'E. coli. Il parvient également à séquencer le produit de ce cistron (la protéine) pour le gène sauvage et les variants. L'étude de la séquence en acides aminés de la tryptophane synthétase A des mutants confirme les conclusions précédentes : le plus souvent, un seul acide aminé est modifié, cependant, dans certains cas, les protéines sont tronquées, l'extrémité COOH est prématurée.Yanofsky peut donc construire une carte des effets des mutations dans la séquence protéique et la confronter à la carte génétique des mutations.

La figure ci-dessus montre une extraordinaire colinéarité entre les deux. Ceci suppose que la structure primaire de toute protéine soit spécifiée par un "gène", soit une séquence d'ADN.

* Remarque : extraordinaire ne veut pas dire parfaite quant aux distances, il faut bien comprendre la différence technique de réalisation des deux cartes : pour les protéines, il s'agit de cartes physiques, positionnant les acides aminés les uns après les autres, pour le cistron, il s'agit de carte génétique reposant sur des phénomènes de recombinaison in vivo .

Ces découvertes montrent clairement que l'information est codée. Chaque "gène" code une protéine particulière.

La découverte de l'ADN en tant que support de l'information laisse supposer que la séquence des nucléotides n'a pas de rôle dans la structure de la molécule mais constitue le code de la séquence des acides aminés dans les protéines.

Il existe donc un transfert d'information. Le code génétique représente le système de correspondance entre la séquence des nucléotides dans les acides nucléiques et celle des acides aminés dans les protéines.
La correspondance n'est pas un nucléotide pour un acide aminé puisqu'il n'existe que 4 nucleotides différents pour 20 acides aminés différents. Le code génétique repose sur une combinaison de nucléotides. Une combinaison de 2 parmi 4 possibles ne peut suffire, une combinaison de 3 (64 possibilités) est vraisemblable et le système de triplets (3 nucléotides pour spécifier un acide aminé) est effectivement celui qui est universellement utilisé.

Bien avant que l'on ait réussi à déchiffrer l'intégralité du code, l'étude de certaines mutations a apporté des preuves génétiques à la colinéarité entre la séquence des triplets dans un cistron et celle des acides aminés dans la protéine qu'il spécifie.
Le mécanisme de traduction implique la lecture des triplets les uns après les autres si l'on suppose le code non chevauchant (le fait que des mutations n'entrainent la modification que d'un seul acide aminé dans une protéine le laisse supposer). Cette traduction implique une notion très importante, celle de cadre de lecture : dans toute séquence d'ADN, si l'on admet le système de triplets, il existe 3 cadres de lecture potentiels.

Par exemple, la séquence :

                          ... A C G A C G A C G A C G A C G A C G A C G A C G A C G A ...

peut etre décomposée en

                              ACG  ACG  ACG  ACG  ACG  etc

soit, comme on le verra plus tard, une série de mots de code pour l'acide aminé thréonine.

*Remarque : jamais on ne trouve de telles séquences monotones dans l'ADN, il s'agit d'aider à la compréhension.

ou en                  CGA  CGA  CGA  CGA  CGA etc  soit arginine

ou en                  GAC  GAC  GAC  GAC  GAC etc  soit acide aspartique

Bien entendu, pour un cistron donné,une seule possibilité peut conduire à une protéine normale, la traduction assurera une lecture correcte.
Des mutations par insertion ou délétion d'un seul nucléotide dans une séquence sauvage (correspondant à l'allèle habituel) ont permis de montrer l'importance du cadre de lecture.

Soit une séquence sauvage hypothétique (et peu vraisemblable) :

                     1 2 3  4 5 6 etc

               5'  GCT GCT GCT GCT GCT GCT GCT GCT GCT 3'

pour le brin codant, selon les conventions, le produit de transcription du brin complémentaire de celui-ci est

              5' GCU GCU GCU GCU GCU GCU GCU GCU GCU 3'

et la protéine :

                 NH2 Ala  Ala  Ala  Ala  Ala  Ala  Ala  Ala  Ala COOH

Supposons une mutation par insertion d'une adénosine en position 7 , les répercussions sont les suivantes:

                                    *
ADN :        GCT GCT AGC TGC TGC TGC TGC TGC TGC

ARN :        GCU GCU AGC UGC UGC UGC UGC UGC UGC

Protéine :     Ala  Ala  Ser  Cys  Cys  Cys  Cys  Cys  Cys

à partir de l'insertion, toute la protéine est fausse, et certainement non fonctionelle

De même, une mutation par déletion d'une Guanine en 16 a également un effet de décalage du cadre de lecture :

                                                            *
ADN :        GCT GCT GCT GCT GCT CTG CTG CTG CTG

ARN :       GCU GCU GCU GCU GCU CUG CUG CUG CUG

Protéine :      Ala  Ala  Ala  Ala  Ala  Leu  Leu  Leu  Leu

Par contre, si l'on examine un double mutant, on s'aperçoit que la 2ème mutation rétablit le cadre de lecture, elle supprime l'effet de la première.

                                                              *
ADN :        GCT GCT AGC TGC TGC  TCT GCT GCT GCT

ARN :       GCU GCU AGC UGC UGC U CU GCU GCU GCU

Protèine :           Ala Ala Ser Cys Cys Ser Ala Ala Ala

* Remarque : Cette suppression de l'effet d'une mutation par une autre est une notion importante. Elle est est, ici, intra génique la deuxième mutation a lieu dans le même cistron que la première. Ce n'est pas toujours le cas, le phénomène de suppression peut être inter génique, physiologique ...

Trois mutations successives auraient des effets différents selon leur signe (par convention : + = insertion, - = délétion)
Trois mutations de même signe rétablissent le cadre de lecture et le résultat est l'insertion ou la délétion d'un seul acide aminé dans la protéine.

Un acide aminé est donc bien spécifié par un système à trois nucléotides.

Par la suite, grâce à des expériences reposant sur des systèmes de synthèse protéique in vitro, la signification des 64 combinaisons possibles de trois nucléotides (parmi un choix de quatre) a pu être élucidée. Les résultats sont compilés dans le tableau ci-contre. Trois seulement n'ont pas de sens en termes d'acides aminés et des arguments génétiques montreront qu'il s'agit de signaux d'arrèt de la traduction. 61 triplets ont une signification pour l'un des 2O acides aminés et seront appelés des codons. Le tableau met en évidence de nombreux synonymes (on dit que le code est "dégénéré"). Seuls la méthionine et le tryptophane ne sont codés que par un seul triplet, les autres le sont par des familles de 2, 3, 4 et même 6 (arginine). A part cette exception (l'arginine), il est important de remarquer que les deux premiers nucléotides de triplets codant pour un acide aminé donné sont les mêmes, seul le troisième est variable.

Etant donné que l'ADN ne sert pas physiquement de support à la synthèse des protéines, il existe un flux d'information génétique dans la cellule.

*Remarque : Un premier flux d'information a déjà été étudié" avec la réplication de l'ADN, il représente l'état "reproduction" de la cellule, celui qui va être abordé représente l'aspect "métabolisme".


Ce flux d'information se fait en réalité en deux étapes : il existe un intermédiaire entre la séquence d'ADN - unité d'information et la protéine spécifiée : l'ARN messager. Par transcription, la séquence d'ADN est reproduite dans une séquence d'ARN qui repose, elle aussi sur un système à 4 nucléotides.
La seconde étape est la traduction c'est à dire la réalisation d'une protéine spécifiée par l'ARN messager avec passage d'un alphabet à 4 lettres à un alphabet à 20 lettres.

relire ? sommaire cours sommaire GENET