Categorias
Introdução à Programação para Bioinformática com Perl

Introdução ao BioPerl

Capítulo 9

Este conteúdo faz parte do livro “Introdução à Programação para Bioinformática com Perl“. Você pode adquirir a versão impressa desse livro aqui ou a versão para Kindle aqui. Para nos citar, consulte este link.

BioPerl é um conjunto de módulos e ferramentas para facilitar o desenvolvimento de aplicações para a Bioinformática utilizando a linguagem de programação Perl. BioPerl desempenhou um papel fundamental no desenvolvimento de ferramentas para analisar dados do Projeto Genoma Humano.

Em sua documentação oficial, BioPerl é descrito como um kit de ferramentas de código fonte aberto para Bioinformática utilizado por pesquisadores de todo o mundo. BioPerl faz parte dos chamados Bio* projects: projetos para o desenvolvimento de ferramentas para biologia molecular computacional em diversas linguagens de programação, como BioDAS, BioJava, BioMOBY, Biopython, BioPipe, BioRuby, BioPHP e BioSQL.

BioPerl foi criador por Tim Hubbard e Jong Bhak. Página oficial: http://www.bioperl.org. Surgiu em: 2002. Mantido por: Open Bioinformatics Foundation. Fonte: https://github.com/bioperl

BioPerl apresenta um conjunto de módulos para análises e anotações de sequências biológicas. Também fornece métodos para acessar bancos de dados biológicos online, como por exemplo, os bancos mantidos pelo NCBI (National Center for Biotechnology Information).

História

Os primeiros códigos do BioPerl foram desenvolvidos por Tim Hubbard e Jong Bhak em 1995 quando trabalhavam no MRC Centre Cambridge, onde foi realizado o primeiro sequenciamento genômico pelo método de Sanger. Tim era um especialista em programação Perl e criou a biblioteca “th_lib.pl” com diversas sub-rotinas para análises em Bioinformática. Jong, que era o primeiro aluno de doutorado de Tim, também havia criado sua própria biblioteca “jong_lib.pl”. Por fim, Jong uniu as duas bibliotecas, e assim surgiu o BioPerl. A partir desse ponto, diversos especialistas trabalharam no aperfeiçoamento do BioPerl, entretanto somente em 2002 foi lançada a primeira versão estável. Atualmente a versão 1.6.0 é considerada a mais recente versão estável.

Para conhecer mais sobre a história do BioPerl acesse: <http://www.bioperl.org/wiki/History_of_BioPerl>.

Instalando BioPerl

O método de instalação BioPerl, em geral, envolve o CPAN, logo é bastante similar nos diversos sistemas operacionais. No sistema operacional Windows acesse o CMD em modo de administrador (busque “CMD” no menu iniciar, clique com o botão direito no ícone e vá em “abrir como administrador”). Em sistemas operacionais MacOS ou Linux acesse o terminal, entre em modo de “root” ou execute o primeiro comando inserindo “sudo” (pode ser necessário inserir a senha do administrador).

Primeiro verifique se o BioPerl já está instalado. Execute o comando:

perl -MBio::Perl -e 'print "BioPerl instalado.\n"'

Se obtiver como resultado a frase “BioPerl instalado” não é necessário seguir os passos a seguir. Caso obtenha uma mensagem de erro iniciado com: “Can’t locate Bio/Perl.pm in @INC” será necessário realizar a instalação. Ainda no terminal abra o CPAN com o comando:

sudo perl -MCPAN -e shell

No terminal interativo do CPAN digite:

d /bioperl/

Agora verifique quais opções de instalação estão disponíveis. Agora realize a instalação com:

force install CJFIELDS/BioPerl-1.6.901.tar.gz

Verifique se o nome do pacote está disponível na lista exibida anteriormente. A seguir, a instalação exibirá algumas perguntas. A primeira pergunta se deseja instalar todos os scripts do BioPerl, nenhum ou se deseja escolher grupos interativamente. Instale todos pressionando “a”. Em seguida, a instalação questionará se deseja realizar testes que requerem conexão com servidores na internet. BioPerl possui diversos scripts que requerem consultas a servidores remotos, como por exemplo, BLAST. Você pode testar essa conexão agora ou não. Para realizar uma instalação rápida, sugerimos pressionar “n” para não.

1. Install [a]ll BioPerl scripts, [n]one, or choose groups [i]nteractively? [a]
o Digite “a” e pressione enter.


2. Do you want to run tests that require connection to serv-ers across the internet (likely to cause some failures)? y/n [n] n
o Digite “n” e pressione enter.

Se tudo der certo você verá diversas linhas. Pressione “q” para sair do CPAN e verifique novamente se o BioPerl está instalado.

Método alternativo

Execute os comandos abaixo listados:

perl –MCPAN –e “shell”
cpan> install Bundle::BioPerl
cpan> quit

Método alternativo para Windows (ActivePerl)

O método mais simples de instalação em S.O. Windows é através do gerenciador de pacotes do ActivePerl (Perl Package Manager), mas para isso é necessário ter o ActivePerl instalado. Se você não o possua, faça o download da última versão em: <http://www.activestate.com/activeperl> e faça a instalação. A seguir abra o Perl Package Manager (menu iniciar > todos os programas).

Na janela aberta clique em Edit > Preferences. Em seguida clique na aba Repositories. Adicione o repositório do BioPerl. No campo Name adidicione “BioPerl-Regular Releases” e em Location adicione “http://bioperl.org/DIST”. Clique em Add e depois em OK.

Clique em View all packages (botão de ícone cinza logo abaixo do menu File) ou pressione Ctrl +1, e em seguida clique na seta circular verde para atualizar os pacotes. Em seguida, busque por BioPerl. Dois pacotes serão listados: BioPerl e Bundle-BioPerl-Core. Clique sobre cada um deles com o botão direito e, em seguida, em Install. Por fim, clique em Run marked actions (seta verde a direita) ou pressione Ctrl + ENTER. BioPerl será instalado em seu computador.

Para mais informações sobre o processo de instalação do BioPerl acesse: <http://www.bioperl.org/wiki/Installing_BioPerl>.

Uma breve introdução à orientação a objetos em Perl

BioPerl é um módulo orientado a objetos. Orientação a objetos constitui num paradigma de desenvolvimento de software na qual objetos, ou seja, instâncias de classes, interagem com outros objetos. Diferente do modo de programação estruturada, programas orientados a objetos não tendem a seguir um fluxo linear de execução, o que facilita a manutenção do código.

A razão por optarem em desenvolver BioPerl orientado a objetos se deve ao fato de módulos e objetos serem mais flexíveis, e isso pode ajudar a lidar com complexos dados biológicos.

Na prática um código em Perl orientado a objetos apresenta classes declaradas como pacote (palavra reservada package) e o método construtor declarado como uma sub-rotina chamada new. O método construtor deve instanciar o objeto, enquanto outros métodos criados poderão inferir ações ao objeto.

# Classe
package Minha_primeira_classe; 

# Metodo construtor
sub new {
    my ( $class ) = shift;
    my $self = { 
        # ... 
    };
    bless $self, $class;
    return $self;
}

Para instanciar um objeto utiliza-se a seguinte sintaxe:

use Minha_primeira_classe;
$objeto = xxx->new($informacao);

Assim a variável $objeto passará a armazenar um objeto.

Este livro não tem por objetivo ensinar conceitos avançados de orientação a objetos, apenas apresentar uma breve introdução para que você entenda o que será feito com BioPerl.

Hello world, BioPerl”

Aprendemos nos primeiros capítulos a executar uma linha de comando básica em Perl e imprimir na tela a frase “Hello World”. Em BioPerl, podemos considerar a leitura de sequências como o equivalente a um primeiro passo.

Em um arquivo de texto, insira o código abaixo:

# Hello world BioPerl
use Bio::Seq;

my $minha_sequencia = Bio::Seq->new(-seq => "AAATTTCCCGGG");

print $minha_sequencia->seq;

Na primeira linha declaramos que desejamos utilizar o módulo Bio::Seq do BioPerl. Na segunda linha, declaramos a sequência “AAATTTCCCGGG”. Observe que a sequência é declarada não como uma string, mas como um objeto de Seq. O construtor da classe recebe como argumentos uma sequência (string). Para imprimir a sequência armazenada no objeto $minha_sequencia deve-se utilizar o método seq.

No próximo capítulo conheceremos mais sobre o módulo de análises de sequências do BioPerl.

Quer aprender mais? Conheça nossos cursos profissionalizantes à partir de R$19,99:


Nota do autor
Prefácio

Capítulo 1
Introdução ao Perl

Capítulo 2
Comandos condicionais

Capítulo 3
Strings

Capítulo 4
Arrays

Capítulo 5
Laços de repetição

Capítulo 6
Manipulando arquivos

Capítulo 7
Sub-rotinas

Capítulo 8
“O guia de sobrevivência para expressões regulares em Perl”

Capítulo 9
Introdução ao BioPerl

Capítulo 10
Sequências

Capítulo 11
BLAST

Capítulo 12
Estruturas de proteínas

Capítulo 13
Hierarquia do BioPerl

Epílogo
Referências bibliográficas
Sobre os autores

Por favor, nos cite:

MARIANO, DIEGO CÉSAR BATISTA; de MELO-MINARDI, R. C. . Introdução à Programação para Bioinformática com Perl. 1. ed. North Charleston, SC (EUA): CreateSpace Independent Publishing Platform, 2016. v. 2. 200p .

Por Diego Mariano

Doutor em Bioinformática pela Universidade Federal de Minas Gerais com atuação na área de ciência de dados e aprendizado de máquina aplicados ao aperfeiçoamento de enzimas usadas na produção de biocombustíveis. Mestre em Bioinformática, também pela UFMG, atuando na área de desenvolvimento de sistemas Web para montagem de genomas. Atualmente realiza estágio pós-doutoral no Departamento de Ciência da Computação da UFMG com foco em desenvolvimento de sistemas Web para Bioinformática, análise exploratória e visualização de dados. Tem conhecimentos nas linguagens: PHP, JavaScript, Python, R, Perl, HTML, CSS e SQL.