Como converter um arquivo TXT para FASTA

Passo 1

Abra o arquivo de texto com a seqüência de proteínas que você deseja editar em um programa de edição de texto, como o Bloco de Notas.

Passo 2

Edite ou adicione a linha de descrição para seguir o formato FASTA. Por exemplo, > gi | 129295 | sp | P01013 | GENE X OVAX_CHICK PROTEIN (OVALBUMIN-RELATED) é uma linha de descrição FASTA válida. Essa linha fornece uma descrição exclusiva para a sequência de dados a seguir. O formato FASTA requer o uso do símbolo maior que (>) para que o programa possa identificar as informações descritivas exclusivas e evitar o processamento da descrição como uma linha de dados de sequência proteica.

Passo 3

Pressione "Enter" para inserir uma quebra de linha depois de editar a linha de descrição.

Passo 4

Edite ou adicione o formato da linha de dados da sequência de proteínas para estar em conformidade com os códigos IUB / IUPAC padrão. O padrão IUB / IUPAC utiliza letras do alfabeto para representar códigos aceitáveis ​​ou sequências de interrogação para aminoácidos ou ácidos nucleicos no formato FASTA. Por exemplo, QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE representa uma linha de sequência de dados válida, uma vez que começa com a letra "Q", representando glutamina, e termina com a letra "E", que representa o glutamato.

Passo 5

Adicione mais linhas de sequências de dados, editando as existentes ou adicionando quebras de linha após 80 caracteres, conforme necessário. A adição de padrões de linha e quebras de linha ao fluxo de dados FASTA garante que o programa siga as instruções relacionadas à glutamina, glutamato e outros códigos de letras. As letras no padrão IUB / IUPAC são simplesmente instruções para o programa que processa os dados no formato FASTA.

Passo 6

Clique em "Arquivo", selecione e clique no botão "Salvar". Seu arquivo TXT já está no formato FASTA.