Exercises de bio-informatique Exercice 2 : Analyse d'une séquence de protéine hypothétique

Introduction

La séquence à étudier est issue de la traduction automatique de la séquence nucléotidique inconnu.seq . L'existence d'une telle protéine dite « hypothétique » ainsi que sa fonction ou son activité potentielle doivent toujours être confirmées par d'autres analyses qu'un simple logiciel de prédiction de régions codantes. In fine, ce seront les expériences biologiques qui permettront de valider les hypothèses proposées par l'analyse bioinformatique et de tirer des conclusions définitives sur cette éventuelle protéine. Ceci étant toutes les informations que l'analyse bioinformatique fournit sont des pistes capitales pour savoir quelles expériences mettre en place pour caractériser définitivement la protéine.

Pour la séquence protéique, il s'agit de répondre aux questions suivantes :

  • Quelles sont les caractéristiques physico-chimiques de la protéine étudiée ?
  •  Existe-il des protéines similaires dans les banques de données et si oui quelles informations apporte l'interrogation de ces banques ?
  •  La protéine contient-elle des motifs ou domaines particuliers qui permettent de mieux comprendre  sa nature et son rôle ?
  •  Quel est le degré de conservation de cette séquence avec celles d'autres organismes et peut on obtenir des informations sur l'évolution des gènes correspondants ?

    Pour chaque étape, vous disposez dans le cours « analyse bio-informatique des séquences », des liens vers les sites proposant les logiciels dont vous aurez besoin et surtout d'un petit exercice corrigé permettent de vous familiariser avec l'emploi de chacun de ces logiciels. N'hésitez pas en cas de difficulté avec un logiciel  à vous replonger dans ces petits exercices d'application.

    Si vous avez fait l'exercice 1, poursuivez avec votre fichier inconnu.prot. sinon cliquer ici, pour obtenir la protéine « hypothétique » sur laquelle vous allez travailler dans ce second exercice.