Analyse bioinformatique des séquences

5. - La comparaison de séquences

5.5 - Les principaux logiciels et programmes de comparaison avec les bandes de séquences
5.5.4 - Généralités sur les paramètres des logiciels de comparaison de séquences


Les matrices protéiques liées à l'évolution [Suite]

Les matrices de type BLOSUM (BLOcks SUbstitution Matrix)

Une approche différente a été réalisée pour mettre en évidence le caractère de substitution des acides aminés.
Alors que les matrices de type PAM dérivent d'alignements globaux (cf. la recherche d'alignements optimaux) de protéines très semblables, ici le degré de substitution des acides aminés a été mesuré en observant des blocs d'acides aminés issus de protéines plus éloignées. Chaque bloc est obtenu par l'alignement multiple sans insertion-délétion de courtes régions très conservées (cf. la base BLOCK).
Ces blocs sont utilisés pour regrouper tous les segments de séquences ayant un pourcentage d'identité minimum au sein de leur bloc. On en déduit des fréquences de substitution pour chaque paire d'acides aminés et l'on calcule ensuite une matrice logarithmique de probabilité dénommée BLOSUM (BLOcks SUbstitution Matrix). A chaque pourcentage d'identité correspond une matrice particulière. Ainsi la matrice BLOSUM60 est obtenue en utilisant un seuil d'identité de 60%. Henikoff et Henikoff, (1992) ont réalisé un tel traitement à partir d'une base contenant plus de 2000 blocs.

Ecran suivant

© Université de TOURS - NET

Document modifié, le 14 décembre, 2006