Analyse bioinformatique des séquences

5. - La comparaison de séquences

5.8 - L'alignement multiple


Introduction

La mise en évidence de similitude entre séquences sera renforcée si plusieurs séquences voisines issues de plusieurs espèces partagent des éléments en commun. Ceci peut aussi arriver pour une famille de gènes. La méthode permettant d'aligner globalement ces séquences conduit à la mise en évidence des résidus identiques ou similaires conservés pouvant être, pour des protéines par exemple, des éléments clés dans la fonction catalytique ou indispensable à la stabilité d'une structure 3D de la protéine. De même, l'étude de la diversité autour de ces séquences communes, permet par de nombreuses méthodes d'approcher la filiation évolutive de ces gènes [Nei87] et par là même conduire à des études phylogénétiques de plus en plus précises.

Les différents objectifs

Alignement de protéines homologues
Identification de résidus importants (conservés)
Logiciels : ClustalW et MultiAlin
Extraction de motifs communs
Génération de séquences consensus
Création de signatures fonctionnelles : constitution d'un dictionnaire de signatures
Logiciels :
Méthodes " purement algorithmique " basée sur une définition formelle précise des motifs (PRATT)
Méthodes " d'optimisation stochastique " basée sur une modélisation statistique des motifs. (MEME)

Les différentes étapes de l'alignement multiple

> Alignement 2 à 2 des séquences en utilisant une première série de paramètres et une méthode classique d'alignement de deux séquences.
> Elimination des séquences trop éloignées
> Construction de groupes de séquences
> Alignement multiple en utilisant une seconde série de paramètres et les groupes préalablement définis.
 
Exercice
S'exercer avec CLUSTALW


Ecran suivant

© Université de TOURS - NET

Document modifié, le 14 décembre, 2006