ĐĎॹá > ţ˙ v x ţ˙˙˙ u ˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙˙ěĽÁ 9 đż { bjbjýĎýĎ 5˘ Ľ Ľ w ˙˙ ˙˙ ˙˙ l n n n n n n n Ä Ä Ä 8 ü $ t Š! ú (! *! *! *! *! *! *! $ Ł" Ă$ ^ N! n N! Î n n c! Î Î Î n n (! Î (! Î Ś Î t n n t ŕnťŤ!i B Ä t t ´ y! 0 Š! t !% . !% t Î n n n n Ů Génétique évolutive et théorie des jeux Extraits du polycopié de : Isabelle OLIVIERI Institut des Sciences de l'Evolution Université Montpellier II 34095 Montpellier cedex 5 et Pierre-Henri GOUYON Evolution et Systématique des Végétaux Université Paris-Sud, Bât. 362 91405 Orsay cedex Introduction La théorie des jeux, sous sa forme actuelle, a été fondée en 1953 par Von Neumann & Morgenstern dans le but de modéliser le fonctionnement de certains systčmes économiques. Cette théorie suppose l'existence de rčgles régissant un jeu et de joueurs, jouant si possible avec les męmes rčgles et cherchant ŕ maximiser leur gain individuel. Les rčgles permettent de déterminer le gain de chacun en fonction de ce qu'il a joué et de ce que l'autre (ou les autres) a (ont) joué. Pour ce faire, chaque joueur va devoir définir une stratégie, c'est-ŕ-dire un ensemble de décisions a priori sur la façon dont il conduira le jeu. Cette stratégie est choisie en fonction de ce que le joueur sait de la stratégie que va choisir l'autre, d'aprčs la rčgle du jeu ou de toute autre information. Cette formalisation s'applique particuličrement bien ŕ l'étude des mécanismes de l'évolution. Les informations génétiques sont portées par des individus qui les reproduisent. Entre différentes informations, celle qui est la mieux reproduite va envahir le milieu de sorte que le "gain" pour un gčne est clairement défini par le nombre de copies de lui-męme (fitness ou valeur sélective) qui existeront ŕ la génération suivante. Les gčnes qui existent aujourd'hui, aprčs quelques milliards d'années d'évolution sont ceux, et uniquement ceux qui, au cours des temps, ont "réussi": ceux qui avaient la meilleure stratégie possible. Il s'agit bien d'une stratégie au sens ci-dessus, puisque le génotype d'un individu est déterminé ŕ sa conception, avant qu'il ne joue, avant qu'il ne puisse connaître la stratégie adoptée par les autres. On peut donc tenter de comprendre toute une série de traits en cherchant ŕ en aborder la compréhension en terme de stratégie. 1) rappels sur la théorie des jeux a. Les jeux ŕ somme nulle: la rčgle du minimax. Ces jeux sont les moins intéressants pour le généticien mais ils permettent d'aborder la notion de stratégie stable. Dans un jeu ŕ somme nulle, le gain d'un joueur correspond ŕ une perte équivalente de l'autre. La matrice du jeu donne toujours, par convention, le gain du joueur 1; le terme de ligne i et de colonne j (aij) donne le gain du joueur 1 quand il joue la stratégie i et que le joueur 2 joue la stratégie j (le gain du joueur 2 est alors -aij). Dans un tel jeu, il existe une rčgle de décision qui est la rčgle du minimax. L'idée est que, ne sachant pas ce que va jouer l'autre, chaque joueur va juger la valeur de chaque coup qu'il peut jouer par le résultat obtenu si l'autre joueur joue au mieux. Par exemple, le joueur 1 ne va regarder de chaque ligne i que le résultat minimum Min(aij). Il choisira alors la ligne i qui maximise cette valeur, c'est-ŕ-dire que le joueur 1 doit choisir la ligne i déterminant le Maxi(Minj(aij)). A l'opposé, le joueur 2 doit choisir le Minj(Maxi(aij)). Si ces deux valeurs sont égales, le jeu est stable, c'est-ŕ-dire que toute déviation unilatérale de stratégie est perdante. Les trois matrices ci-dessous représentent deux cas de jeu instable (1 et 2) et un cas de jeu stable (3). Matrice 1 Matrice 2 Matrice 3 +9 +9 -1 +9 +9 +9 -1 -1 +9 +9 +9 -1 +7 +7 +7 -2 +7 +7 -2 +7 +7 +7 -2 -2 +2 +2 +2 +1 +2 +2 +2 +1 +2 +2 +2 +1 +3 -8 -8 -8 +3 -8 -8 -8 +3 -8 -8 -8 Dans les trois cas, le joueur 1 doit jouer la troisičme ligne (max des min) alors que le joueur 2 doit jouer respectivemant les colonnes 3, 3 et 4. Remarquons que la matrice 1 est instable du point de vue des deux joueurs (chacun des deux peut y gagner ŕ changer unilatéralement de stratégie) alors que la 2 n'est instable que du point de vue du joueur 2. b. Les jeux ŕ somme non nulle sont plus prčs des cas biologiques. Les différents organismes acquičrent des ressources, et ceci constitue un apport positif au départ. Il va ensuite s'agir pour chacun de se les attribuer. Dans de tels jeux, il est nécessaire de donner, dans le cas général, pour chaque couple de stratégies (i,j), le gain du joueur 1 et celui du joueur 2. On peut se passer de cette double matrice dans le cas oů les deux joueurs disposent exactement des męmes stratégies. Dans ce cas, par symétrie, les gains du joueur 2 sont aussi connus. Ici encore, on donne conventionnellement les gains du joueur 1. Ces jeux aboutissent ŕ différents résultats qui peuvent ętre illustrés par des exemples. Dans le jeu du conducteur fou (chicken game), deux files de voiture roulant en sens inverse doivent passer un goulet d'étranglement. La matrice du jeu s'écrit par exemple de la façon suivante: S'arręter Passer S'arręter 0 -1 Passer +1 -10 Une fois qu'une des deux files a forcé le passage, les joueurs adverses ne peuvent pas retourner la situation; il y a deux équilibres (victoire des joueurs 1 ou victoire des joueurs 2, et toute déviation unilatérale de stratégie est bien perdante), aucune coopération n'est gagnante. Ce jeu illustre la possibilité d'équilibres multiples. Dans le dilemme du prisonnier, qui se joue ŕ deux joueurs, chacun a le choix entre nier un crime et avouer: - si les deux avouent avoir commis le crime, ils sont légčrement comdamnés (par exemple un an de prison: gain=-1); - si les joueurs nient tous les deux, ils sont libérés (gain=0). - si l'un nie et l'autre avoue, celui qui a avoué est libéré et récompensé (gain=+1), alors que celui qui a nié est lourdement condamné (20 ans: gain=-20). La matrice du jeu est la suivante: Avouer Nier Avouer -1 +1 Nier -20 0 Dans ce jeu, la seule stratégie évolutivement stable est d'avouer. Cette stratégie ne maximise pas le gain total (ni donc celle de chaque joueur, puisqu'ils ont, ŕ l'équilibre, la męme stratégie). Ce gain est męme négatif. Ce jeu montre donc que le systčme n'optimise pas son ensemble, et illustre la différence entre stratégie stable (ou "équilibre de Nash") et stratégie optimale (ou "optimum de Paretto"). Il existe cependant dans ce jeu une stratégie stable, qui peut permettre de parvenir ŕ l'optimum. Elle suppose que les deux joueurs jouent un nombre infini de fois ensemble. Dans ce cas, on peut montrer (Maynard Smith, 1982, p.202-203) que la stratégie qui consiste ŕ commencer par avouer, puis, aux cours des parties suivantes jouer le męme coup que l'adversaire la fois précédente (stratégie du "tit-for-tat", ou "oeil-pour-oeil, dent-pour-dent), peut ętre gagnante. 2) Applications ŕ la génétique évolutive L'application ŕ la génétique évolutive de cette théorie a d'abord été proposée par Lewontin (1961) mais est l'oeuvre de Maynard-Smith (1982). Ces travaux permettent de répondre ŕ des questions trčs diverses autour d'un concept central, défini en 1973 par Maynard-Smith & Price: le concept de stratégie évolutivement stable (en abrégé, en français comme en anglais: ESS). Une stratégie est dite évolutivement stable si elle se détermine elle-męme comme optimale pour l'individu. En d'autres termes, une stratégie s* est une ESS si, lorsque toute la population a adopté cette stratégie, aucune stratégie déviante ne peut envahir la population. On ne va alors s'intéresser qu'aux cas oů l'une des stratégies est rare. Cela correspond aux recherches de protection de polymorphisme en génétique des populations: on fait tendre la fréquence de l'un des allčles vers zéro, et on voit si sa fréquence augmente au cours des générations suivantes. Si c'est le cas, cela signifie qu'il ne peut disparaître lorsqu'il est rare, on dit qu'il est "protégé". Cela signifie aussi qu'il augmente en fréquence aprčs ętre apparu par mutation ou migration. Si on appelle G(i,j) le gain apporté par la stratégie i lorsqu'elle rencontre la stratégie j, la définition de l'ESS devient: Pour tout s différent de s*, s* est une ESS si l'une des deux conditions suivantes est réalisée: (1) G(s,s*) < G(s*,s*) ou (2) G(s,s*) = G(s*,s*) et G(s*,s) > G(s,s). La premičre condition signifie que, dans une population ayant adopté la stratégie s*, toute stratégie rare déviante s est perdante (en effet, les seules confrontations sont alors de type s,s* et s*,s*). La deuxičme condition signifie que - la stratégie s considérée est telle qu'elle est équivalente ŕ la stratégie s* lorsque s est en fréquence rare; le choix de la stratégie est alors "neutre", s peut en particulier disparaître par dérive, puisque aucune force ne tend ŕ faire augmenter sa fréquence dans la population; - la stratégie s* est meilleure que la stratégie s lorsque s* est rare, c'est-ŕ-dire que s* est "protégée". Ceci signifie que si la fréquence de s augmente dans la population, alors s* est favorisé, au détriment de s. Lorsque l'ensemble des gains possibles est une fonction d'une variable de stratégie continue s, la recherche d'une ESS ne peut plus ętre que locale, c'est-ŕ-dire qu'on ne va se poser la question que pour des stratégies appartenant au voisinage de s*. La premičre condition pour que s* soit une ESS (locale) devient: condition (1): dG(s,s*)/ds = 0 au point s=s* (G(s,s*) est un extremum quand s=s*) et d2G(s,s*)/ds2 < 0 au point s=s* (G(s,s*) est un maximum local quand s=s*). En ce qui concerne la deuxičme condition, elle s'écrit en modčle discret: G(s,s*)=G(s*,s*) et G(s*,s) > G(s,s) c'est-ŕ-dire, pour tout s appartenant au voisinage de s*: dG(s,s*)/ds = 0, et G(s*,s)/G(s,s) > 1. Or, lorsque s=s*, G(s*,s)/G(s,s) = 1. Au point s=s*, la fonction G(s*,s)/G(s,s) atteint donc un minimum. Donc sa dérivée s'annule, et sa dérivée seconde est positive au point s=s*. La condition s'écrit donc: condition (2): dG(s,s*)/ds = 0 pour tout s au voisinage de s*, dG((s*,s)/G(s,s))/ds = 0 au point s=s*, et d2(G(s*,s)/G(s,s))/ds2 > 0 au point s=s*. Il est utile de distinguer les stratégies pures (un seul phénotype possible par individu) des stratégies mixtes (deux ou plusieurs phénotypes par individu). Dans ce dernier cas, la stratégie est alors définie par la probabilité de choisir tel ou tel phénotype. Dans le cas des stratégies de type variable continue, il n'est pas toujours aisé de faire la différence, comme on le verra plus loin. Il existe un théorčme, le théorčme de Bishop-Cannings (1978), qui permet de calculer la valeur des probabilités de chaque phénotype, définissant une stratégie mixte. Ce théorčme est le suivant: Si I est une stratégie mixte évolutivement stable qui comprend les stratégies pures A,B,..,.C,..., alors G(A,I)=G(B,I)=...=G(C,I)=G(I,I). Ceci signifie que dans les populations constituées en majorité d'individus de type I, toutes les stratégies se valent. La démonstration de ce théorčme est la suivante. Supposons qu'une stratégie A contenue dans I soit telle que G(A,I) < G(I,I). Soit p la probabilité de jouer A dans la stratégie I. (1-p) est donc la probabilité de jouer autre chose que A dans la stratégie I. Soit X l'ensemble des réponses ne contenant pas A, X est une stratégie mixte qui ne contient pas A. On a alors G(I,I) = p.G(A,I) + (1-p).G(X,I), < p.G(I,I) + (1-p).G(X,I). G(I,I) < G(X,I) On voit que G(A,I) < G(I,I) implique G(I,I) < G(X,I). Ceci implique que I n'est pas une ESS, ce qui est contraire ŕ l'hypothčse de départ. De męme, comme I est une ESS, par définition on ne peut avoir G(A,I) > G(I,I). Donc, pour toute stratégie A contenue dans I, on a G(A,I) = G(I,I). Nous verrons plus loin que ce théorčme ne s'applique que dans une population infinie oů une stratégie déviante n'a pas d'effet sur son propre environnement. Quelques exemples nous permettront ŕ présent ŕ illustrer l'intéręt de cette approche. a. Comportement animal On considčre une population dont les individus cherchent ŕ acquérir une certaine ressource de valeur unitaire R (en termes de valeur reproductive), dans laquelle chaque individu peut adopter l'une des stratégies F (Faucon) ou C (Colombe). F est une stratégie agressive et risquée, tandis que C est une stratégie de repli, non aggressive et sans risque. Le résultat du jeu peut ętre résumé en une matrice de gains par individu ŕ la suite du jeu. Un "faucon" rencontrant un "faucon" a une probabilité 1/2 de gagner la ressource de valeur R, et une probabilité 1/2 de perdre; dans ce dernier cas, on suppose alors qu'il perd une quantité équivalente ŕ P (en unités de ressources). S'il rencontre une colombe, il gagne la ressource, sans coűt. Si un individu "colombe" rencontre un autre individu "colombe", ils partagent cette ressource (gain=R/2 pour chacun), et cela ne leur coűte rien. Si une "colombe rencontre un "faucon", elle s'enfuit, et ne perd ni ne gagne rien. Précisons bien qu'il ne s'agit pas de décrire des interactions entre de vrais faucons et de vraies colombes. Ces termes décrivent des comportements adoptés par des individus de la męme population, de la męme espčce. La matrice des gains est donc la suivante: F C F (R-P)/2 R C 0 R/2 Aprčs un ou plusieurs jeux contre des opposants tirés au hasard dans la population, une nouvelle génération est produite. On suppose que chaque stratégie se reproduit telle quelle, et que chaque individu produit un nombre de descendants proportionnel aux nombre de gains accumulés. Rappelons que la stratégie évolutivement stable est définie ainsi: s* est une ESS si, pour tout s différent de s*, G(s*,s*) > G(s,s*) ou G(s*,s*) = G(s,s*) et G(s,s) < G(s*,s). La stratégie "Colombe" ne peut ętre une ESS, car on a toujours G(C,C) < G(F,C). La stratégie "Faucon" est une ESS si G(F,F) > G(C,F), c'est-ŕ-dire (R-P)/2 > R/2, ou R>P ou G(F,F) = G(C,F) et G(C,C) < G(F,C), c'est-ŕ-dire R=P (et R/2 < R, ce qui est toujours vrai). On voit que, bien qu'optimale pour la population, la stratégie C n'est jamais stable (en présence de C, F gagne), mais que F n'est stable que si R > P. Ainsi, si la ressource est supérieure ou męme égale au risque occasionné par un essai de son acquisition par la force, la stratégie d'aggression est l'ESS. Si en revanche, la ressource vaut moins que le coűt possible de son acquisition, ni F, ni C, ne sont des stratégies évolutivement stables. Ainsi, les individus "Colombe" seront avantagés dans les populations contenant beaucoup d'individus "Faucon", et les individus "Faucon" seront avantagés dans les populations contenant beaucoup d'individus "Colombe". Un polymorphisme sera maintenu, sous l'action d'une sélection fréquence-dépendante. On peut calculer quelle est la fréquence d'équilibre qe de F: cette fréquence doit ętre telle que les gains moyens de F et C, G(F) et G(C), sont égaux entre eux: G(F) = q.G(F,F) + (1-q).G(F,C) = q.(R-P)/2 + (1-q).R G(C) = q.G(C,F) + (1-q).G(C,C) = q.O + (1-q).R/2. L'équilibre s'obtient pour q=qe tel que qe.(R-P)/2 + (1-qe).R = (1-qe).R/2. c'est-ŕ-dire: qe = R/P La population est donc constituée d'individus de type "Faucon" en fréquence R/P (R
P, x est supérieur ŕ 1, ce qui est impossible: dans ce cas encore, la stratégie "Faucon" est une ESS. Si R
G(J,Ix), ou G(Ix,Ix)=G(J,Ix) et G(Ix,J) > G(J,J) Bien que les stratégies F et C soient de type "discret", x est une variable continue. On peut donc utiliser la définition d'une ESS donnée précédemment (condition (2)), appliquée ŕ la stratégie mixte telle que x*=R/P. On pourra vérifier que d(G(x,R/P)/dx = 0 pour tout x, et que d(G(R/P,x)/G(x,x))/dx est du signe de -(x.P-R).(x.´P-´R), et s'annule donc pour x=R/P et pour x=´(R/P). Comme R
´(R/P), et positive entre R/P et ´(R/P). Le point R/P est donc bien un minimum, donc la dérivée seconde d2(G(R/P,x)/G(x,x))/dx2 est positive au voisinage de R/P. On a donc démontré que la stratégie I contenant les stratégies "faucon" et "colombe" en probabilités R/P et 1-R/P est bien une ESS locale. Ainsi, ŕ partir de rčgles trčs simples et déterministes, il est possible que l'ESS soit une stratégie mixte, probabilisée. Notons que la stratégie optimale pour l'espčce C n'est jamais atteinte. Il pourrait exister une autre stratégie, la stratégie dite "bourgeois", qui consisterait ŕ se comporter en faucon" si l'on considčre ętre arrivé le premier (et donc comme propriétaire de la ressource ou du territoire), et en "colombe" si l'on arrive en second. Lorsque deux individus au hasard se rencontrent, la probabilité pour l'un d'ętre arrivé le premier vaut 1/2 quelque soit son comportement, ce qui permet de calculer l'espérance des gains de chacun (matrice de jeux ci-dessous). Ainsi, si deux "bourgeois" se rencontrent, ils ne se battent pas, et se comportent comme un "faucon" et une "colombe", ou une "colombe" et un "faucon". Le gain d'un bourgeois face ŕ un autre bourgeois vaut donc R.(1/2) + 0.(1/2), soit R/2. Si un bourgeois rencontre une colombe, il s'estime propriétaire et joue donc faucon dans un cas sur 2 (gain=R), et colombe dans un cas sur 2 (gain=R/2). De męme, si un bourgeois rencontre un faucon, il joue faucon dans un cas sur 2 (gain=(R-P)/2, et colombe dans un cas sur 2 (gain=0). Si un faucon rencontre un bourgeois, celui-ci joue faucon dans un cas sur 2 (gain=(R-P)/2) et colombe dans un cas sur 2 (gain=R). Si une colombe rencontre un bourgeois, celui-ci se comporte en faucon une fois sur deux (gain=0), et en colombe une fois sur 2 (gain=R/2). La matrice de jeu est alors de la forme: FCBF(R-P)/2R3R/4 -P/4C0R/2R/4B(R-P)/43R/4R/2 On pourra vérifier que la seule différence entre la stratégie "bourgeois" B et une stratégie mixte J (x=1/2), réside au niveau des confrontations entre "bourgeois" (gain=R/2 alors qu'une confrontation J-J donnerait un gain de (3R-P)/4). On peut montrer que si R>P, alors l'ESS est la stratégie "faucon". Si R