Analyse bioinformatique des séquences

3. - Les banques et bases de séquences biologiques

3.5 - La diffusion et l'utilisation des banques de données - L'utilisation [suite]

 

Le logiciel ACNUC

Développé à Lyon chez le Professeur Grantham, il a été un des premiers logiciels pouvant répondre en peu de temps à des questions sophistiquées telles que : "je recherche dans l'EMBL les séquences codants pour des protéines de levure ou de souris qui ne soient pas mitochondriales et ayant une longueur supérieure à 500 paires de bases". Ceci a été réalisé grâce à la construction de fichiers index représentant des critères de sélection (mot-clé, auteurs, espèces, revues, type de molécule...) et une organisation des fichiers permettant d'effectuer des liens entre critères ainsi qu'un langage de requête basé sur les opérations logiques ET, OU et NON.

On peut regrouper en quatre catégories les commandes possibles qui servent à la manipulation du logiciel :

  • 1) sélection : Ces commandes permettent de constituer des listes de séquences qui correspondent à des sous-ensembles de la banque. Il est possible d'utiliser différents critères selon une syntaxe logique où les critères utilisés doivent être nommés explicitement (Exemple: SP pour species, KE pour keyword, AU pour author, M pour molécule...)
  • 2) définition : Ces commandes permettent de définir avec plus de précision les critères de sélection autorisés. On peut ainsi visualiser tout ou partie de l'arbre des espèces ou des mot-clés qui sont utilisés dans la base que l'on consulte.
  • 3) information : Ces commandes permettent l'édition de toute ou partie de l'information liée aux séquences sélectionnées.
  • 4) gestion : Ces commandes permettent de faire des modifications, des extractions, ou des suppressions dans les listes de séquences déjà sélectionnées.
Ce logiciel, très répandu en France, est l'un des plus performants pour l'interrogation malgré le nombre croissant de séquences dans les banques de données. Il est principalement utilisé pour les grandes banques généralistes (EMBL, GenBank, PIR-NBRF) même si certaines bases thématiques l'utilisent comme HOVERGEN, banque de données sur les gènes homologues de vertébrés (Duret et al., 1994) ou NRsub, base non redondante sur le génome de Bacillus subtilis (Perriere et al., 1994). Le logiciel intègre une interface graphique sous X Window ainsi qu'une interface WWW disponible sur le pôle bioinformatique lyonnais (Université Lyon1).

S'exercer avec ACNUC

Ecran suivant

© Université de TOURS - NET

Document modifié, le 13 septembre, 2007