Analyse
bioinformatique des séquences
3. - Les banques et bases de séquences biologiques
3.5 - La diffusion et l'utilisation des banques de données -
La diffusion
La plupart des bases de données sont mises à jour par la production de versions actualisées. Le rythme est de trois à six versions par an pour les bases de données les plus couramment utilisées (actuellement, quatre versions par an pour L'EMBL et six pour GenBank) et de seulement une version par an ou tous les deux ans pour la plupart des autres.
Pendant longtemps, la principale distribution fut l'envoi postal de bandes magnétiques aux personnes ayant souscrit un abonnement. Progressivement le CD-ROM a remplacé ce support de stockage et a permis une plus grande diffusion des données. Depuis le début des années 90, avec l'installation massive des réseaux informatiques à hauts débits qui permettent d'atteindre une machine située à plusieurs milliers de kilomètres de son terminal, beaucoup de laboratoires rapatrient les bases de données via ces réseaux à partir de serveurs publics. Ces réseaux informatiques rapides et les services qui en découlent permettent une large diffusion des bases.
Ainsi beaucoup de serveurs mettent gratuitement à disposition de nombreuses bases, dont les grandes banques de séquences généralistes comme l'EMBL avec une mise à jour quotidienne des données, mais également un grand nombre d'autres bases dont la diffusion était auparavant plus restreinte. De ce fait, il résulte une banalisation de l'accès à l'information. Il n'est même plus nécessaire d'avoir localement les bases de données ou de se connecter par des procédures complexes à un centre serveur privilégié pour pouvoir exploiter aisément le contenu de ces bases. C'est ainsi que l'on estime maintenant le nombre total d'utilisateurs de la banque EMBL à plus de 50 000.