Analyse
bioinformatique des séquences
En savoir plus sur ... Les Systèmes de Gestion de Bases de Données (SGBD) L'information structurée d'une base de données, qu'elle soit biologique ou pas, peut être exploitée par un SGBD pour gérer ou retrouver rapidement les données. La construction de la base passe par une définition des données qui est indépendante des programmes d'exploitation de ces données. Durant la définition, qui se fait sous forme de tables, on peut établir des liens qui vont déterminer une organisation logique des données qui sera ensuite exploitée à l'interrogation. Il existe plusieurs types de SGBD, le modèle dit Relationnel étant maintenant le plus utilisé à travers des systèmes comme Oracle, Sybase ou 4ème Dimension. Le langage de requête qu'ils utilisent est standard et permet d'exploiter la définition des données que l'on a faite. Pour plus d'informations sur les SGBDs, on peut consulter des ouvrages comme celui de Carrez (1990). Un des avantages de ces systèmes est leur mise en œuvre rapide car ils possèdent un certain nombre d'outils et de fonctionnalités de base qui facilitent certaines étapes de programmation comme la présentation des résultats ou les opérations d'ajout, de suppression, de recherche ou de tri d'information. Ils permettent également une évolution facile de la base par ajout de nouvelles entités et de nouveaux liens sans modification de la structure initiale. Cependant, indépendamment de leur coût financier, ils prennent souvent une part trop importante des ressources des machines sur lesquelles ils sont installés, limitant ainsi le nombre d'utilisateurs simultanés ou nécessitant l'exclusivité d'une machine. Dans le domaine de la biologie, ils sont généralement utilisés pour l'interrogation de bases qui ont un nombre limité d'entrées car les temps de réponse peuvent devenir importants lors d'interrogations qui nécessitent le croisement de plusieurs listes volumineuses, comme par exemple, la recherche de l'intersection entre toutes les séquences humaines et toutes les séquences codants pour des protéines dans une base comme l'EMBL. Par contre, ils sont souvent utilisés dans la construction des bases, notamment par les organismes qui gèrent les grandes bases de séquences.
|