Analyse bioinformatique des séquences

2. - L'information contenue dans les séquences biologiques

2.1 - Nature des données biologiques à traiter et de l'information contenue à l'intérieur

 

Les avancées en biologie moléculaire et en informatique appliquée à la comparaison des séquences, associées à une puissance de calcul accrue ont révolutionné l'importance des séquences (primaires) de biomolécules en biologie. Elles sont devenues des dénominateurs communs à l'interprétation de phénomènes biologiques complexes. La plupart des programmes utilisés en biologie manipulent ces séquences biologiques et en extraient des informations interprétables en termes biologiques.

La séquence en nucléotides de l'ADN correspond de manière universelle au niveau le plus fin de l'information génétique et sa connaissance conduit en particulier à la localisation des gènes, à la déduction de séquences en acides aminés des protéines codées par ces gènes, à la contribution à l'analyse moléculaire de leurs expressions et régulations, ainsi qu'à la mise en évidence de mutations ou modifications à l'origine des maladies. Les informations à traiter sont donc de nature variée (régions similaires entre plusieurs séquences, prédictions concernant les propriétés structurales des molécules, inférences phylogénétiques, etc.).