Analyse bioinformatique des séquences

6. - L'analyse de séquences nucléiques

6.2 - Les différents types de motifs


Il existe plusieurs raisons de rechercher des motifs à travers les séquences car ils sont généralement impliqués dans des systèmes de régulation ou définissent des fonctions biologiques. Parmi ces raisons, on peut citer la détermination de la fonction d'une nouvelle séquence (par exemple en localisant un ou plusieurs motifs répertoriés dans des bases de motifs), l'identification dans une séquence nucléique de régions codantes (par exemple en repérant les codons d'initiation et de terminaison, les sites d'épissages et les zones de fixation des ribosomes), la recherche d'un motif particulier dans une séquence (par exemple en identifiant sur une séquence les sites de coupures d'enzymes de restriction ou des promoteurs spécifiques, etc...), ou bien l'extraction à partir des banques de données (par exemple extraire des séquences possédant le même signal de régulation ou la même signature protéique pour effectuer des études comparatives ultérieures).

Il est donc évident qu'il existe des niveaux de complexité très différents dans la définition des motifs. Certains sont précis et non ambigus comme les sites de reconnaissance des enzymes de restrictions ou comme certains motifs de protéases. D'autres peuvent être beaucoup plus flous et complexes comme les motifs consensus liés à des familles de protéines ou les facteurs de transcription. Dans ce cas, la difficulté est souvent de savoir quel motif utiliser et quelle est la pertinence de la définition.


Ecran suivant
© Université de TOURS - GENET

Document modifié, le 21 novembre, 2006

8 janvier, 2008