Analyse bioinformatique des séquences

4. - La manipulation des données

4.2 - Les formats
4.2.2 - Les formats liés aux banques [suite]

 


> Format GenBank

Les 12 premières colonnes contiennent le nom du champ et dans chaque champs on trouve des informations.

LOCUS
DEFINITION
ACCESSION
NID
KEYWORDS
SEGMENT
SOURCE
ORGANISM
REFERENCE
AUTHORS
TITLE
JOURNAL
MEDLINE
COMMENT
FEATURES
BASE COUNT
ORIGIN
//
Format de base :
Le fichier doit contenir l'en-tête "GENETIC SEQUENCE DATA BANK" et,
pour chaque entrée, présenter les lignes 10 à 16.
LINE 1 : GENETIC SEQUENCE DATA BANK
LINE 2 :
LINE 3 :
LINE 4 :
LINE 5 :
LINE 6 :
LINE 7 :
LINE 8 :
LINE 9 :
LINE 10 :LOCUS L_Name Length BP
LINE 11 :DEFINITION Describe the sequence any way you want
LINE 12 :ACCESSION Accession Number
LINE 13 :ORIGIN
LINE 14 : 1 acgtacgtac gtacgtacgt acgtacgtac gtacgtacgt a...
LINE 15 : 61 acgt...
LINE 16 ://

Ecran suivant

© Université de TOURS - NET

Document modifié, le 14 décembre, 2006