Analyse bioinformatique des séquences

5. - La comparaison de séquences

5.1 - Introduction

 

La recherche de similitude entre séquences est un élément fondamental qui constitue souvent la première étape des analyses de séquences. Elémentaire, la question de la comparaison et de l'obtention d'un alignement optimal de 2 séquences biologiques, nécessite néanmoins la mise en œuvre de procédures de calcul et de modèles biologiques permettant de quantifier la notion de ressemblance entre ces séquences.

L'objectif est de révéler des régions proches dans leur séquence primaire en se basant sur le principe de parcimonie, c'est-à-dire en considérant le minimum de changements en insertion, suppression, ou substitution qui séparent deux séquences. On peut apprendre ainsi, par association, des informations importantes sur la structure, la fonction ou l'évolution des biomolécules.

Cette méthode est largement utilisée dans les recherches de motifs à travers une séquence, dans la caractérisation de régions communes ou similaires entre deux ou plusieurs séquences, dans la comparaison d'une séquence avec l'ensemble ou sous-ensemble des séquences d'une base de données, ou bien encore dans l'établissement d'un alignement multiple sur lequel sont basées les analyses d'évolution moléculaire.

Nous décrirons dans ce chapitre les principes fondamentaux qui sont indispensables à la compréhension de ces outils en illustrant nos propos par un certain nombre de programmes couramment utilisés dans le domaine.


Ecran suivant

© Université de TOURS - NET

Document modifié, le 14 décembre, 2006