Analyse bioinformatique des séquences

4. - La manipulation des données

4.2 - Les formats
4.2.2 - Les formats liés aux banques [suite]

 


> Format PROSITE

La syntaxe d'un pattern PROSITE suit un certain nombre de règles :

- lettres A-Z correspondant aux acides aminés (minuscules ou majuscules)
- [] ambiguite inclusive EX: [ILVM]
- {} ambiguite exclusive EX: {FWY}
- X caractère positionnel indifférent
- (n) répétition n fixe d'un sous-motif EX: [RD](2)
- X(n,m) insertions min-max (insertion variable) EX: X(2,4)
- < au début du pattern : le pattern est cadré à gauche de la séquence
- > à la fin du pattern : le pattern est cadré à droite de la séquence
- le caractère '-' sépare chaque position
- le caractère '+' indique que la suite du pattern continue à la ligne suivante

Exemples de motifs :
C-{CPWHF}-X(2,4)-C-H-{CFYW}
AXGHXXX[QST]{DR}
[STANVF]-x(2)-F-x(4)-[DNS]-x(5,7)-[DENQTF]-Y-[HFY]-x(2)-[LIVMFY]-x(3)-+
[LIVM]-x(4)-[LIVM]-x(6,8)-Y-x(12,13)-[LIVM]-x(2)-N-[SACF]-x(2)-[FY]>


Ecran suivant

© Université de TOURS - NET Document modifié le 14 décembre, 2006->