Analyse bioinformatique des séquences

3. - Les banques et bases de séquences biologiques

3.2 - Historique

 

C'est au début des années 80 que les premières banques de séquences sont apparues sous l'initiative de quelques équipes comme celle du Professeur Grantham à Lyon (Gautier et al., 1981). Très rapidement avec les évolutions techniques du séquençage, la collecte et la gestion des données ont nécessité une organisation plus conséquente. Ainsi, plusieurs organismes ont pris en charge la production de telles bases de données.

En Europe, financée par l'EMBO (European Moleculary Biology Organisation), une équipe s'est constituée pour développer une banque de séquences nucléiques (EMBL data library) et en assurer la diffusion (Hamm et Cameron, 1986). Cette équipe travaille au sein du Laboratoire Européen de Biologie Moléculaire qui est longtemps resté à Heidelberg et qui se trouve actuellement près de Cambridge au sein de l'EBI (European Bioinformatics Institute).

Du coté américain, soutenue par le NIH (National Institute of Health) une banque nucléique nommée GenBank a été créée à Los Alamos (Bilofsky et al., 1986). Cette base de données était distribuée par la société IntelliGenetics et est difusée maintenant par le NCBI (National Center for Biotechnology Information).

La collaboration entre ces deux banques a commencé relativement tôt. Elle s'est étendue en 1987 avec la participation de la DDBJ (Dna Data Bank) du Japon pour donner naissance finalement en 1990 à un format unique dans la description des caractéristiques biologiques qui accompagnent les séquences dans les banques de données nucléiques (The DDBJ/EMBL/GenBank feature table : Definitions, 1999).


Ecran suivant

© Université de TOURS - NET

Document modifié, le 14 décembre, 2006