Este conteúdo faz parte do livro “Introdução à Programação para Bioinformática com Perl“. Você pode adquirir a versão impressa desse livro aqui ou a versão para Kindle aqui. Para nos citar, consulte este link.
BioPerl é um conjunto de módulos e ferramentas para facilitar o desenvolvimento de aplicações para a Bioinformática utilizando a linguagem de programação Perl. BioPerl desempenhou um papel fundamental no desenvolvimento de ferramentas para analisar dados do Projeto Genoma Humano.
Em sua documentação oficial, BioPerl é descrito como um kit de ferramentas de código fonte aberto para Bioinformática utilizado por pesquisadores de todo o mundo. BioPerl faz parte dos chamados Bio* projects: projetos para o desenvolvimento de ferramentas para biologia molecular computacional em diversas linguagens de programação, como BioDAS, BioJava, BioMOBY, Biopython, BioPipe, BioRuby, BioPHP e BioSQL.

BioPerl apresenta um conjunto de módulos para análises e anotações de sequências biológicas. Também fornece métodos para acessar bancos de dados biológicos online, como por exemplo, os bancos mantidos pelo NCBI (National Center for Biotechnology Information).
História
Os primeiros códigos do BioPerl foram desenvolvidos por Tim Hubbard e Jong Bhak em 1995 quando trabalhavam no MRC Centre Cambridge, onde foi realizado o primeiro sequenciamento genômico pelo método de Sanger. Tim era um especialista em programação Perl e criou a biblioteca “th_lib.pl” com diversas sub-rotinas para análises em Bioinformática. Jong, que era o primeiro aluno de doutorado de Tim, também havia criado sua própria biblioteca “jong_lib.pl”. Por fim, Jong uniu as duas bibliotecas, e assim surgiu o BioPerl. A partir desse ponto, diversos especialistas trabalharam no aperfeiçoamento do BioPerl, entretanto somente em 2002 foi lançada a primeira versão estável. Atualmente a versão 1.6.0 é considerada a mais recente versão estável.
Para conhecer mais sobre a história do BioPerl acesse: <http://www.bioperl.org/wiki/History_of_BioPerl>.
Instalando BioPerl
O método de instalação BioPerl, em geral, envolve o CPAN, logo é bastante similar nos diversos sistemas operacionais. No sistema operacional Windows acesse o CMD em modo de administrador (busque “CMD” no menu iniciar, clique com o botão direito no ícone e vá em “abrir como administrador”). Em sistemas operacionais MacOS ou Linux acesse o terminal, entre em modo de “root” ou execute o primeiro comando inserindo “sudo” (pode ser necessário inserir a senha do administrador).
Primeiro verifique se o BioPerl já está instalado. Execute o comando:
perl -MBio::Perl -e 'print "BioPerl instalado.\n"'
Se obtiver como resultado a frase “BioPerl instalado” não é necessário seguir os passos a seguir. Caso obtenha uma mensagem de erro iniciado com: “Can’t locate Bio/Perl.pm in @INC” será necessário realizar a instalação. Ainda no terminal abra o CPAN com o comando:
sudo perl -MCPAN -e shell
No terminal interativo do CPAN digite:
d /bioperl/
Agora verifique quais opções de instalação estão disponíveis. Agora realize a instalação com:
force install CJFIELDS/BioPerl-1.6.901.tar.gz
Verifique se o nome do pacote está disponível na lista exibida anteriormente. A seguir, a instalação exibirá algumas perguntas. A primeira pergunta se deseja instalar todos os scripts do BioPerl, nenhum ou se deseja escolher grupos interativamente. Instale todos pressionando “a”. Em seguida, a instalação questionará se deseja realizar testes que requerem conexão com servidores na internet. BioPerl possui diversos scripts que requerem consultas a servidores remotos, como por exemplo, BLAST. Você pode testar essa conexão agora ou não. Para realizar uma instalação rápida, sugerimos pressionar “n” para não.
1. Install [a]ll BioPerl scripts, [n]one, or choose groups [i]nteractively? [a]
o Digite “a” e pressione enter.
2. Do you want to run tests that require connection to serv-ers across the internet (likely to cause some failures)? y/n [n] n
o Digite “n” e pressione enter.
Se tudo der certo você verá diversas linhas. Pressione “q” para sair do CPAN e verifique novamente se o BioPerl está instalado.
Método alternativo
Execute os comandos abaixo listados:
perl –MCPAN –e “shell”
cpan> install Bundle::BioPerl
cpan> quit
Método alternativo para Windows (ActivePerl)
O método mais simples de instalação em S.O. Windows é através do gerenciador de pacotes do ActivePerl (Perl Package Manager), mas para isso é necessário ter o ActivePerl instalado. Se você não o possua, faça o download da última versão em: <http://www.activestate.com/activeperl> e faça a instalação. A seguir abra o Perl Package Manager (menu iniciar > todos os programas).

Na janela aberta clique em Edit > Preferences. Em seguida clique na aba Repositories. Adicione o repositório do BioPerl. No campo Name adidicione “BioPerl-Regular Releases” e em Location adicione “http://bioperl.org/DIST”. Clique em Add e depois em OK.

Clique em View all packages (botão de ícone cinza logo abaixo do menu File) ou pressione Ctrl +1, e em seguida clique na seta circular verde para atualizar os pacotes. Em seguida, busque por BioPerl. Dois pacotes serão listados: BioPerl e Bundle-BioPerl-Core. Clique sobre cada um deles com o botão direito e, em seguida, em Install. Por fim, clique em Run marked actions (seta verde a direita) ou pressione Ctrl + ENTER. BioPerl será instalado em seu computador.

Para mais informações sobre o processo de instalação do BioPerl acesse: <http://www.bioperl.org/wiki/Installing_BioPerl>.
Uma breve introdução à orientação a objetos em Perl
BioPerl é um módulo orientado a objetos. Orientação a objetos constitui num paradigma de desenvolvimento de software na qual objetos, ou seja, instâncias de classes, interagem com outros objetos. Diferente do modo de programação estruturada, programas orientados a objetos não tendem a seguir um fluxo linear de execução, o que facilita a manutenção do código.
A razão por optarem em desenvolver BioPerl orientado a objetos se deve ao fato de módulos e objetos serem mais flexíveis, e isso pode ajudar a lidar com complexos dados biológicos.
Na prática um código em Perl orientado a objetos apresenta classes declaradas como pacote (palavra reservada package) e o método construtor declarado como uma sub-rotina chamada new. O método construtor deve instanciar o objeto, enquanto outros métodos criados poderão inferir ações ao objeto.
# Classe
package Minha_primeira_classe;
# Metodo construtor
sub new {
my ( $class ) = shift;
my $self = {
# ...
};
bless $self, $class;
return $self;
}
Para instanciar um objeto utiliza-se a seguinte sintaxe:
use Minha_primeira_classe;
$objeto = xxx->new($informacao);
Assim a variável $objeto passará a armazenar um objeto.
Este livro não tem por objetivo ensinar conceitos avançados de orientação a objetos, apenas apresentar uma breve introdução para que você entenda o que será feito com BioPerl.
“Hello world, BioPerl”
Aprendemos nos primeiros capítulos a executar uma linha de comando básica em Perl e imprimir na tela a frase “Hello World”. Em BioPerl, podemos considerar a leitura de sequências como o equivalente a um primeiro passo.
Em um arquivo de texto, insira o código abaixo:
# Hello world BioPerl
use Bio::Seq;
my $minha_sequencia = Bio::Seq->new(-seq => "AAATTTCCCGGG");
print $minha_sequencia->seq;
Na primeira linha declaramos que desejamos utilizar o módulo Bio::Seq
do BioPerl. Na segunda linha, declaramos a sequência “AAATTTCCCGGG”. Observe que a sequência é declarada não como uma string, mas como um objeto de Seq. O construtor da classe recebe como argumentos uma sequência (string). Para imprimir a sequência armazenada no objeto $minha_sequencia deve-se utilizar o método seq.
No próximo capítulo conheceremos mais sobre o módulo de análises de sequências do BioPerl.
Quer aprender mais? Conheça nossos cursos profissionalizantes à partir de R$19,99:
Capítulo 1
Introdução ao Perl
Capítulo 2
Comandos condicionais
Capítulo 3
Strings
Capítulo 4
Arrays
Capítulo 5
Laços de repetição
Capítulo 6
Manipulando arquivos
Capítulo 7
Sub-rotinas
Capítulo 8
“O guia de sobrevivência para expressões regulares em Perl”
Capítulo 9
Introdução ao BioPerl
Capítulo 10
Sequências
Capítulo 11
BLAST
Capítulo 12
Estruturas de proteínas
Capítulo 13
Hierarquia do BioPerl
Epílogo
Referências bibliográficas
Sobre os autores
Por favor, nos cite:
MARIANO, DIEGO CÉSAR BATISTA; de MELO-MINARDI, R. C. . Introdução à Programação para Bioinformática com Perl. 1. ed. North Charleston, SC (EUA): CreateSpace Independent Publishing Platform, 2016. v. 2. 200p .