format_fasta
Format FASTA
Le format FASTA est constitué d'un minimum de deux lignes. La ligne 1 décrit la séquence en commençant par le signe '>' suivi par d'autres informations tel que l'identifiant de la séquence. Le fichier FASTA qui contient la séquence peut avoir deux lignes (voir exemple A) ou plusieurs lignes (voir exemple B). L'outil de Classification des Virus Influenza Porcins (OCVIP) du CDPQ gère correctement ce types de formats.
Exemple A: la séquence de virus est sur une seule ligne
>Identifiant ATGAAGGCAATATTGTTGGTCTTGCTACATACATTTGCAGCCACAAGTGCAGACACAATATGTGTAGGTTATGAAGGCAATATTGTTGGTCTTGCTACATACATTTGCAGCCACAAGTGCAGACACAATATGTGTAGGTT
Exemple B: la séquence de virus est sur plusieurs lignes
>Identifiant ATGAAGGCAATATTGTTGGTCTTGCTACATACATTTGCAGCCACAAGTGCAGACACAATATGTGTAGGTT ATCATGCGAATAATTCAACTGACACTGTTGATACAGTCTTAGAAAAGAATGTAACAGTAACACACTCTGT CAACCTTCTAGAAGACAAACATAATGGGAAATTATGCAAACTAAGGGGAAAAGCCCCATTGTACTTGGGT AAATGTAACATTGCTGGATGGCTTTTGGGAAACCCAGAGTGTGAATTACTATTCACAGTAAGCTCATGGT Etc.
Références
format_fasta.txt · Dernière modification : 2023/09/26 05:53 de Christian Klopfenstein