REGULATION DE L'EXPRESSION DES GENES

Comme nous l'avons vu, le programme de transcription n'est pas fixe. La cellule sait adapter ce programme aux conditions extérieures, au mieux de son économie ; chez les Eucaryotes, l'environnement peut être représenté par les cellules voisines, le développement, la différenciation supposent l'expression régulée de gènes différents dans les diverses cellules. La question qui se pose maintenant est celle du choix des portions du génome qui doivent être exprimées à un moment donné dans un environnement donné.
Dans une première partie, nous allons utiliser l'étude de la cellule procaryotique pour donner quelques exemples de contrôle de l'expression de gènes et dégager des notions fondamentales de régulation.

1 - LES PROCARYOTES
La cellule bactérienne est capable d'adapter très rapidement son métabolisme aux modifications de l'environnement. Prenons une suspension de cellules d'Escherichia coli . Une partie de la suspension est cultivée dans un milieu minimal contenant du lactose (disaccharide composé de deux molécules de glucose) comme seule source de carbone (milieu A). Une autre partie est cultivée dans le même milieu minimal mais contenant du glucose comme source de carbone et auquel on a ajouté les 20 acides aminés (milieu B). On constate que les cellules du milieu A croissent (prolifèrent), mais moins vite que celles du milieu B. Elles doivent en effet assurer le clivage du lactose en deux monosaccharides (glucose et galactose) assimilables et toute la biosynthèse des acides aminés.
L'étude biochimique et génétique de l'utilisation du lactose par E. coli va nous montrer comment l'économie réalisée par les cellules cultivées dans le milieu B (de génotype identique à celcelles cultivées sur le milieu A) se fait, par adaptation du programme d'expression des gènes, dès le niveau transcriptionnel. Ces résultats sont le fruit des travaux de Jacob, Monod et leurs collaborateurs dans les années 60.
Par des méthodes biochimiques appropriées, il est possible de doser l'activité de la béta-galactosidase (b-galactosidase), enzyme catalysant la dégradation du lactose. Cette activité est présente dans les cellules du milieu A mais absente (à la limite de la détection) dans les cellules du milieu B. Si des cellules "B", sont transférées dans le milieu A (ne contenant plus de glucose mais du lactose, une activité b-galactosidase apparaît très rapidement et s'amplifie d'un facteur 1000 en quelques 20 minutes.
L'activité enzymatique est donc induite par la présence de lactose dans le milieu.
Inversement, chez ces mêmes cellules transférées dans un milieu contenant à nouveau du glucose, l'activité enzymatique semble réprimée et disparaît.
Ainsi, la présence de lactose semble déclencher la synthèse d'enzymes spécifiques : la b-galactosidase, codée par le gène Lac Z, mais également une perméase (codée par le gène Lac Y), capable d'accélerer la pénétration du lactose dans la cellule et une transacétylase codée par le gène A), qui joue un rôle dans le métabolisme d'autres galactosides. Ces trois activités enzymatiques sont co-régulées (elles apparaissent en réponse à une même induction.
Des méthodes très fines de cartographie montrent que ces gènes sont adjacents dans une région "Lac" du chromosome bactérien.
* Remarque : L'apparition brutale d'une activité enzymatique ne suffit pas à prouver une régulation au niveau de la transcription des gènes. En effet, une enzyme peut être présente sous une forme inactive et l'induction représenter en fait l'activation de protéines préexistantes dans le cytoplasme. la preuve directe d'un contrôle au niveau transcriptionnel a été apportée plus tard grâce aux techniques permettant de doser des ARN messagers spécifiques. Un ADN complémentaire de l'ARN messager de la b-galactosidase a été inséré dans un vecteur de clonage. Après amplification, cette séquence a servi de sonde pour détecter, dans des préparations brutes d'ARN (extraits avant et après le passage au lactose), l'ARN messager de la b-galactosidase (seul capable de s'hybrider avec la sonde) et le quantifier. Les résultats indiquent que l'accumulation de ce messager débute dès l'induction, elle précède celle de l'enzyme. L'induction porte donc bien sur la transcription du gène lui-même.
*Remarque : Le lactose fait partie de ce que l'on appelle des molécules effectrices, c'est à dire des molécules capables de refléter l'environnement cellulaire et de transmettre un signal permettant un choix transcriptionnel. Il faut noter que, dans cet exemple particulier, le lactose est loin d'être le meilleur inducteur de la transcription des gènes impliqués, d'autres petites molécules glycosidiques, naturelles ou artificielles (telles que l'isopropyl-thiogalactoside ou IPTG) sont beaucoup plus efficaces et utilisées au laboratoire.
1.1. ANALYSE GENETIQUE DE LA REGULATION
L'analyse génétique des procaryotes, qui a permis d'élucider les mécanismes fondamentaux de la régulation, relève d'une gageure : il s'agit de cellules haploïdes tout au long de leur cycle, sans reproduction sexuée, nous privant, apparemment des deux outils de base que sont la recombinaison et la complémentation. En fait, dès 1946, Lederberg et Tatum utilisaient d'une façon très élégante les possibilités de mélange de matériel génétique chez les bactéries, liées au phénomène de conjugaison.
1.1.1. LA CONJUGAISON BACTERIENNE
Pour des souches possédant un certain génotype, les cellules sont capables d'émettre des prolongements cytoplasmiques jusqu'à des cellules d'un génotype différent et de faire circuler des éléments génétiques par ce pont. Les éléments génétiques ainsi transférés d'une cellule "donneuse" à une cellule receveuse (l'échange n'est pas réciproque) sont de nature variée. Le premier élément identifié a été baptisé facteur F (comme fertilité).
Il s'agit de l'une des "pièces détachées" du génome bactérien que sont les petites molécules d'ADN circulaire, extrachromosomiques, appelées plasmides. Dans le cas du facteur F, il s'agit en fait d'un épisome qui peut se comporter soit comme un plasmide soit, par un mécanisme de recombinaison, s'intégrer au chromosome bactérien. Dans ce dernier cas, son transfert, par conjugaison, peut entraîner un morceau du chromosome. Ce phénomène (rare) permet la formation de diploïdes partiels, c'est à dire que la bactérie receveuse possède des informations génétiques provenant d'une autre cellule. Le petit fragment de génome ainsi ajouté à l'ensemble résident est appelé exogénote. Sauf s'il possède une origine de réplication et se transmet de façon autonome, cet élément génétique n'est pas stable et se perd en quelques heures, dans certains cas, il peut cependant s'intégrer au chromosome de la bactérie receveuse par recombinaison homologue.


* Remarque : Pour des raisons mécaniques, le pont cytoplasmique de conjugaison est rapidement rompu, en aucun cas le transfert d'une copie complète du chromosome de la cellule donneuse ne peut avoir lieu. D'où le terme de mérozygote parfois utilisé pour désigner le diploïde partiel. Le mot zygote rappelle qu'il s'agit de sexualité, c'est à dire de mise en commun d'informations génétiques d'origines différentes mais, chez les procaryotes, la sexualité n'est pas associée à la reproduction.
Lederberg et Tatum ont apporté la preuve de ce transfert de gènes entre bactéries en réalisant l'expérience suivante. Elle consiste à mélanger deux souches porteuses de mutations différentes. Par exemple une souche A n'est capable de se développer dans un milieu minimal non supplémenté en méthionine et en biotine. Elles sont devenues auxotrophes pour ces composés par perte de fonction de gènes impliqués, l'un dans la biosynthèse de méthionine, l'autre dans la biosynthèse de la biotine. Ces mutations sont symbolisées par un génotype met- bio- . Une autre souche, la souche B, est de génotype thr- leu- et thi- , ici, trois gènes sont mutés et les cellules ont besoin de l'adjonction de thréonine, de leucine et de thiamine au milieu minimal pour se développer. Des bactéries des souches A et B sont mélangées et laissées environ 1 heure dans un milieu contenant tous les éléments nécessaires à la survie des deux ( méthionine, biotine, thréonine, leucine et thiamine). La suspension est étalée sur un milieu minimal (non supplémenté) et, après environ 12h, on voit se développer quelques rares colonies.
Rare excluant malgré tout une possibilité de réversion de mutation (voir le chapitre concernant la nature du matériel génétique), il faut conclure qu'un transfert d'allèles sauvages a été possible d'une cellule à une autre. (exercice)
Deux explications, non exclusives, permettent de rendre compte du phénotype sauvage : soit l'exogénote, qui présente une grande homologie avec une région précise du chromosome de la cellule receveuse, va s'échanger avec cette région par recombinaison, soit il est transmis à la descendance (parce qu'il possède une origine de réplication par exemple) et il est capable de complémenter les allèles défectueux des clones issus de la cellule receveuse. C'est ce dernier cas qui va être utilisé dans l'étude de la régulation.
* Remarque : La conjugaison représente un moyen naturel de transfert de matériel génétique. Par la suite, des souches dites Hfr (comme haute fréquence de recombinaison), dont le facteur F est toujours intégré dans le chromosome, ont été sélectionnées . Actuellement, la transformation, par des plasmides recombinés in vitro, apporte une grande souplesse et une grande efficacité dans la création de diploïdes partiels. De plus, des souches mutées, incapables de recombinaison (in vivo) permettent d'étudier, sans ambiguïté, les effets de complémentation.
1.1.2 EXEMPLE DE L'ADAPTATION A L'UTILISATION DU LACTOSE
Plusieurs types de mutation peuvent interférer avec l'utilisation du lactose.

Etant donné que les trois gènes cartographient côte à côte sur le chromosome, on peut supposer que leur expression est régulée par un même système et que les mutations constitutives affectent non pas une production d'enzyme mais un élément de contrôle. Cet ensemble forme ce que l'on appelle un opéron bactérien.
Les premières mutations constitutives étudiées ont été appelées I-et sont localisées près du gène Z, par la suite on a caractérisé des mutants constitutifs Oc, ces mutations sont situées encore plus près de Z.
L'analyse de ces mutants par des expériences très élégantes faisant appel à des diploïdes partiels a permis au groupe de Monod et Jacob d'élaborer le célèbre modèle de régulation de l'opéron lactose par répression de la transcription.
Le tableau ci-dessous rappelle les caractéristiques phénotypiques des mutants utilisés.

                                     
GENOTYPE PHENOTYPE
I+ O+ Z+ Y+ sauvage (inductible)
I+ O+ Z- Y+

I+ O+ Z+ Y-

Lac- (non inductible)
I- O+ Z+ Y+

I+ Oc Z+ Y+

     constitutif


Pour la conjugaison, des souches Hfr (F+), sensibles à la streptomycine (Sms) sont utilisées comme cellules donneuses, les souches receveuses sont résistantes à la streptomycine (Smr). Après contact, les cellules sont étalées sur un milieu contenant de la streptomycine et contenant ou non un inducteur (ici de l'IPTG). Le tableau suivant résume les principaux "croisements" réalisés et indique la production de b-galactosidase en présence ou en absence d'inducteur (+ indique une production, - son absence).

   sans
inducteur
IPTG
F+SmsI+O+Z+ / SmrI+O+Z-      -   +
F+SmsI+O+Z+ / SmrI-O+Z+      -   +
F+SmsI+O+Z+ / SmrI+OcZ+     +   +


*Remarque : Ce tableau est à analyser avec beaucoup d'attention, l'interprétation de tels résultats a valu le prix Nobel à F. Jacob, J. Monod et A. Lwoff.

1.1.3. MODELE DE REGULATION PAR REPRESSION DE LA TRANSCRIPTION
La présence de b-galactosidase chez un diploïde partiel Z-/Z+ indique qu'une complémentation est possible, l'allèle Z+ de la cellule donneuse est exprimé dans le cytoplasme de la cellule receveuse (on peut dire que l'allèle Z+, sauvage, est dominant par rapport à Z-, muté).
De même, la présence de l'allèle I+ rétablit le contrôle normal (inductible) de l'expression du gène Z. On peut en conclure que ce gène est exprimé en une protéine capable d'agir sur la transcription de l'opéron. Monod et Jacob proposent que cette protéine (produit du gène I) soit un répresseur de la transcription lorsque l'inducteur est absent (l'induction serait en fait une levée de la répression).
Les résultats obtenus avec les diploïdes partiels O+/Oc sont très différents, il n'y a pas complémentation, l'allèle muté semble dominant par rapport au sauvage. Ceci ne peut s'expliquer que si le locus O n'est pas un gène exprimé mais une séquence particulière d'ADN que l'on appellera le site opérateur. Le schéma de fonctionnement de l'opéron serait alors le suivant : en absence d'inducteur, le répresseur produit par le gène reconnaît spécifiquement le site O et s'y fixe. L'encombrement de ce complexe (on découvrira plus tard que c'est en fait un tétramère qui se fixe) est tel que l'ARN polymérase est incapable de se fixer au site promoteur. Le promoteur étant unique pour les trois unités de fonction Z, Y et A, on comprend que la répression bloque la transcription de l'ensemble.


Comment se fait l'induction ?
Une propriété très intéressante de certaines protéines est celle d'allostérie : la fixation d'une molécule particulière (ligand) peut provoquer une modification globale de la structure tridimensionnelle d'une protéine réceptrice. C'est ce qui ce produit ici, le lactose a une affinité pour la protéine répresseur et sa liaison provoque une transition allostérique de celui-ci. Si l'on tient compte du fait que l'interaction d'une protéine avec une séquence d'ADN nécessite l'établissement de liaisons hydrogène entre des atomes précis d'acides aminés précis et des atomes précis de bases, la déformation de la protéine ne permettra plus cette interaction et le complexe répresseur-inducteur sera incapable de se fixer à l'opérateur.


Le principe d'interaction protéine (en tant que séquence spécifique d'acides aminés conditionnant sa structure tridimensionnelle) et séquence d'ADN permet de comprendre l'effet des mutations I- et Oc.
Une mutation dans le locus I conduit à une altération de la structure du répresseur voire à une absence de la protéine (allèle nul). Dans tous les cas, une liaison répresseur - opérateur ne peut s'établir et l'ARN polymérase peut s'installer à l'opérateur. Si le répresseur possède une structure correcte mais que la séquence opératrice est altérée par une mutation (Oc par exemple), le résultat est le même : aucune possibilité de former un complexe répresseur - opérateur ; la transcription de l'opéron est possible en permanence.


1.1.4 LE REPRESSEUR
Une confirmation d'un mode de régulation par répression a été apportée par des mutations Is, s signifiant "super-réprimé". Ces mutants sont incapables d'utiliser le lactose car l'opéron est réprimé en permanence, le lactose ne peut induire la transcription. Les mutations affectent bien le gène I, mais dans une région importante pour la formation du complexe répresseur - inducteur. La région essentielle pour la liaison du répresseur à la séquence opératrice étant intacte, l'état réprimé est stable.
Ces observations permettent d'aborder un aspect plus général des protéines de régulation, celui de domaines fonctionnels spécialisés. L'analyse détaillée de la protéine après clonage du gène I dans un vecteur d'expression et surproduction par des clones bactériens transformés (voir le chapitre correspondant) confirmera ce concept. Les mutations I-, Is et d'autres ne sont pas disposées de façon aléatoire dans le gène mais leur cartographie reflète le fait qu'une partie de la protéine codée est essentielle dans la reconnaissance du site opérateur, une autre région est nécessaire pour la fixation de l'inducteur et la transition allostérique, une autre permet la formation d'un tétramère. Cette notion de protéines de régulation modulaires, séparables en domaines fonctionnels, se retrouvera chez les Eucaryotes.
1.1.5. OPERON INDUCTIBLE ET OPERON "REPRESSIBLE"
L'opéron lactose ne fonctionne que s'il est induit par une molécule effectrice capable de lever l'effet du répresseur, il est dit inductible. Dans d'autres cas c'est l'inverse, la molécule effectrice provoque la répression de la transcription, l'opéron est dit répressible.
Un exemple typique nous est fourni par un opéron intervenant dans la biosynthèse du tryptophane.
*Remarque : l'opéron lactose intervient dans le catabolisme, l'opéron tryptophane intervient dans l'anabolisme.

Cet opéron comporte cinq gènes codant pour des enzymes impliquées dans la synthèse du tryptophane (les cistrons trpE, D, C, Bet A) groupés, sous la dépendance d'un seul système promoteur - opérateur. Un gène, trp R, qui ne fait pas partie de l'opéron, code pour un répresseur spécifique de l'opéron tryptophane. Cette protéine est incapable de se lier au site opérateur, et par conséquent inactive, tant qu'elle n'est pas complexée avec une molécule effectrice : le tryptophane lui-même. Il agit donc comme un corépresseur dans ce mécanisme de régulation en retour par le produit final de la chaine métabolique de l'opéron.



1.1.6 CONTROLE NEGATIF ET CONTROLE POSITIF
Les gènes soumis à un contrôle négatif ne sont pas transcrits si un répresseur est lié à l'opérateur. C'est le cas des opérons lactose ou tryptophane.
Les gènes soumis à un contrôle positif ne sont transcrits efficacement que si une protéine régulatrice favorise l'initiation.
L'opéron lactose est également soumis à un contrôle positif. Il a été précisé au début de ce chapitre que la transcription est induite si l'on remplace le glucose par du lactose comme seule source de carbone dans le milieu minimal. En effet, si l'on ajoute du lactose, l'opéron n'est pas transcrit tant que le glucose n'est pas épuisé. Ce phénomène, qui concerne de nombreux opérons du catabolisme est appelé "effet glucose" ou encore "répression catabolique". Il repose, comme les autres modes de régulation sur une protéine à régulation allostérique et une molécule effectrice. Deux types de mutations abolissent l'effet glucose : le premier concerne les gènes impliqués dans la formation de l'adénosine monophosphate cyclique (AMPc,) notamment celui de l'adénylate cyclase, le second dans un gène codant pour une protéine appelée "CAP" comme protéine activatrice du catabolisme.
On a pu montrer que le glucose freine la production d'AMP cyclique à partir de l'ATP et maintient un très faible niveau d'AMPc. Lorsque le glucose diminue, la concentration en AMPc augmente, or cette molécule peut former un complexe spécifique avec la protéine CAP. Il en résulte une modification de la structure tridimensionnelle et le complexe est capable de se fixer sur l'ADN, au niveau d'une séquence particulière appelée site CAP, située un peu en amont du promoteur. La liaison entraîne une contrainte topologique de la double hélice d'ADN qui favorise l'initiation de la transcription.


1.2 CONCLUSION
Les quelques exemples qui ont été choisis (il existe d'autres mécanismes qui n'ont pas été décrits ici) montrent que quel que soit le mode de contrôle, positif ou négatif, quelles qu'en soient les modalités dans le détail, le schéma de base est le même.
Les gènes codant pour des enzymes (tels que LacZ, Y, TrpA ...) sont appelés des gènes de structure : leur produit participe directement à la structure de la cellule ou à son métabolisme (les enzymes, les protéines membranaires, les protéines des ribosomes etc sont codées par de tels gènes. A côté de celà, d'autres éléments informatifs interviennent dans le contrôle de l'expression des gènes de structure.


Au niveau transcriptionnel, on envisage des gènes de régulation codant pour des protéines sans fonction enzymatique, des protéines de régulation (le répresseur, la protéine CAP en sont des exemples) qui agissent en trans (sur un site pouvant être éloigné) en se fixant spécifiquement à une séquence précise d'ADN que l'on appellera site de régulation, ces sites assurent une cis-régulation sur l'efficacité du promoteur situé sur la molécule d'ADN. La relation avec l'environnement intra ou extra cellulaire est assurée par des molécules effectrices (le lactose, l'AMPc en sont des exemples). La souplesse de la régulation est liée aux propriétés de modifications allostériques des protéines de régulation, qui, selon leur conformation assurent ou n'assurent pas leur fonction.

Si la notion d'opéron est restreinte aux cellules Procaryotes (chaque cistron eucaryotique possède son propre promoteur), on verra que ce schéma de base est applicable au contrôle de l'expression des gènes des Eucaryotes.

relire ? sommaire cours sommaire GENET