Analyse bioinformatique des séquences

3. - Les banques et bases de séquences biologiques

3.5 - La diffusion et l'utilisation des banques de données - L'utilisation [suite]

 

Le logiciel SRS (Sequence Retrieval system)

C'est un système d'interrogation basé sur l'indexation des champs contenus dans les différents formats que proposent les banques de données.

Il est construit à l'aide de deux types de programmes distincts qui sont en étroite interaction. Les premiers, classiques, écrits en langage de programmation standard, servent entre autre à exploiter les données indexées. Les deuxièmes utilisent un langage de programmation propre ODD (Object Design and Definition) qui permet de reconnaître le format des banques utilisées et de rendre celui-ci indépendant de l'exploitation des données.

Ainsi le principal avantage de ce système est la possibilité de pouvoir indexer en même temps une grande quantité de banques sans se soucier de l'organisation de celles-ci et donc de pouvoir manipuler avec le même langage de requête les principales bases de séquences généralistes et beaucoup de bases spécialisées.

Le langage de requête est similaire à celui d'ACNUC, c'est-à-dire que l'on peut utiliser plusieurs critères de sélection avec les opérateurs logiques ET, OU et NON. Ce système permet néanmoins une moins grande puissance d'interrogation qu'ACNUC sur une base particulière mais a l'avantage de pouvoir faire des interrogations sur plusieurs bases à la fois ou de pouvoir utiliser les références croisées entre celles-ci. Par exemple, on peut rechercher dans l'EMBL les séquences issues d'une interrogation de SwissProt.

Ce logiciel dispose d'une interface WWW que la plupart des serveurs impliqués dans la diffusion et la consultation de données biologiques mettent à la disposition des utilisateurs.

S'exercer avec EMBL et SRS


En savoir plus sur les SGBD


Ecran suivant

© Université de TOURS - NET

Document modifié, le 28 juin, 2010