Analyse bioinformatique des séquences

4. - La manipulation des données

4.3 - Les outils de conversion de formats

 


> ReadSeq

READSEQ est un programme de reformatage général des séquences (conversion) avec reconnaissance automatique du format du fichier d'entrée. De nombreux formats de sortie sont autorisés par Readseq :


1. IG/Stanford used by Intelligenetics and others
2. GenBank/GB genbank flatfile format
3. NBRF format
4. EMB EMBL flatfile format
5. GCG single sequence format of GCG software
6. DNAStrider for common Mac program
7. Fitch format limited use
8. Pearson/Fasta a common format used by Fasta programs and others
9. Zuker format limited use. Input only.
10. Olsen format printed by Olsen VMS sequence editor.Input only.
11. Phylip3.2 sequential format for Phylip programs
12. Phylip interleaved format for Phylip programs (v3.3, v3.4, v3.5)
13. Plain/Raw sequence data only (no name, document, numbering)
14. PIR/CODATA format used by PIR
15. MSF multi sequence format used by GCG software
16. ASN.1 format used by NCBI
17. PAUP PAUP's multiple sequence (NEXUS) format
18. Pretty print with various options for nice looking output.


Readseq peut être utilisé de deux façons différentes :
Mode interactif :

READSEQ peut être lancé en interactif (au prompt de la machine) :
Selon un dialogue interactif en saisissant :
readseq
fichier de sortie (en premier),
choix du format de sortie (18 choix)
et fichier d'entrée (plusieurs fois éventuellemnt)
terminez par un vide (validation de la liste)

Mode en ligne :

Selon une commande en ligne :
readseq [-options] in.seq > out.seq
ex : readseq fichier_entree - All -f8 >fichier_sortie
readseq files* -All -f5 -outfile=fichier_sortie

Ecran suivant

© Université de TOURS - NET

Document modifié, le 14 décembre, 2006