|
Analyse
bioinformatique des séquences
5. - La comparaison de séquences
5.4 - Les principes de base pour identifier la ressemblance entre deux
séquences
5.4.3 - Les différents types d'alignements
Global/Local
Un alignement global considère l'ensemble des éléments de chacune des séquences. Si les longueurs des séquences sont différentes, alors des insertions devront être faites dans la séquence la plus petite pour arriver à aligner les deux séquences d'une extrémité à l'autre. Dans le cas où les longueurs sont très différentes, il est possible d'appliquer ce principe d'alignement global seulement en considérant chaque position d'une séquence longue comme étant un point de départ d'alignement avec une séquence courte. C'est l'algorithme de type II au sens Collins et Coulson (1987) que l'on appelle aussi couramment l'algorithme de meilleure localisation.
Cependant dans un alignement global, si uniquement de courts segments sont très similaires entre deux séquences, les autres parties des séquences risquent de diminuer le poids de ces régions.
C'est pourquoi d'autres algorithmes d'alignements, dits locaux, basés sur la localisation des similarités sont nés. Le but de ces alignements locaux est de trouver sans prédétermination de longueur les zones les plus similaires entre deux séquences. L'alignement local comporte donc une partie de chacune des séquences et non la totalité des séquences comme dans la plupart des alignement globaux.
Avec/sans gap
On a vu qu'il pouvait être nécessaire, pour optimiser la comparaison de deux séquences, d'introduire des insertions ou des deletions de longueur variable à certaines positions des séquences. En fait, pour conserver l'intégralité de l'information biologique, le traitement d'une deletion à l'intérieur d'une séquence est considéré comme une insertion dans la séquence lui faisant face. Dans certaines publications, on trouvera le terme d'indel (INsertion-DELetion) pour nommer ces événements. On a vu également que les indels sont considérées comme des pénalités dans le calcul du score. Il existe néanmoins plusieurs manières d'exprimer cette pénalité.
© Université de TOURS - GÉNET
Document modifié,
le
14 décembre, 2006
|