Categorias
Introdução à Programação para Bioinformática com Biopython

Hierarquia do Biopython

Capítulo 15

Este conteúdo faz parte do livro “Introdução à Programação para Bioinformática com Biopython“. Você pode adquirir a versão impressa desse livro aqui ou a versão para Kindle aqui. Para nos citar, consulte este link.

O pacote Bio armazena toda a coleção de módulos que Biopython fornece para lidar com dados biológicos. Assim, analisar sua hierarquia nos dá uma visão geral do que se pode realizar com Biopython.

Neste capítulo apresentaremos uma breve descrição dos principais pacotes, módulos e classes presentes no Biopython (versão 1.65). Esperamos que este capítulo possa servir como guia para leitores que necessitem realizar alguma tarefa específica não citada nos capítulos anteriores.

Bio.Affy

O pacote Bio.Affy permite trabalhar com dados Affymetrix.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Affy-module.html>.

Módulos:

  • Bio.Affy.CelFile: módulo que apresenta classes para acessar informações em arquivos Affymetrix.

Bio.Align

Apresenta códigos para lidar com alinhamentos de sequências. É necessário que as ferramentas estejam instaladas no computador a qual os scripts serão executados.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Align-module.html>.

Módulos:

  • Bio.Align.AlignInfo: extrai informações de objetos de alinhamento.
  • Bio.Align.Applications: apresenta métodos de acesso a ferramentas externas de alinhamento por linha de comando (wrappers):
    • Bio.Align.Applications._ClustalOmega: permite a execução do programa de alinhamentos múltiplos Clustal Omega.
    • Bio.Align.Applications._Clustalw: permite a execução do programa de alinhamentos múltiplos Clustal W.
    • Bio.Align.Applications._Dialign: permite a execução do programa de alinhamentos múltiplos DIALIGN2-2.
    • Bio.Align.Applications._MSAProbs: permite a execução do programa de alinhamentos múltiplos MSAProbs.
    • Bio.Align.Applications._Mafft: permite a execução do programa de alinhamentos múltiplos MAFFT.
    • Bio.Align.Applications._Muscle: permite a execução do programa de alinhamentos múltiplos MUSCLE.
    • Bio.Align.Applications._Prank: permite a execução do programa de alinhamentos múltiplos PRANK.
    • Bio.Align.Applications._Probcons: permite a execução do programa de alinhamentos múltiplos PROBCONS.
    • Bio.Align.Applications._TCoffee: permite a execução do programa de alinhamentos múltiplos TCOFFEE.
  • Bio.Align.Generic: apresenta classes para alinhamento de sequências genéticas.

Bio.AlignIO

Permite a entrada e saída de alinhamentos de sequência múltiplos como objetos de alinhamento.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.AlignIO-module.html>.

Módulos:

  • Bio.AlignIO.ClustalIO: permite a análise de resultados obtidos do programa CLUSTAL W.
  • Bio.AlignIO.EmbossIO: permite a análise de resultados obtidos do programa EMBOSS.
  • Bio.AlignIO.FastaIO: permite a análise de resultados obtidos do programa Bill Pearson’s FASTA (formato “fasta-m10“).
  • Bio.AlignIO.Interfaces: módulo de suporte. Fornece classes para auxiliar na construção de novos parsers.
  • Bio.AlignIO.NexusIO: suporte ao formato de arquivos “nexus“.
  • Bio.AlignIO.PhylipIO: permite a análise de resultados no formato “phylip” obtidos do programa Joe Felsenstein’s PHYLIP.
  • Bio.AlignIO.StockholmIO: suporte ao formato de arquivos “stockholm” (usado nos bancos de dados PFAM).

Bio.Alphabet

Alfabetos usados nas declarações de objetos Seq. Utilizado por sequências que contêm um número finito de palavras semelhantes.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Alphabet-module.html>.

Módulos:

  • Bio.Alphabet.IUPAC: padrão de alfabetos de nucleotídeos e proteínas definidos pelo IUPAC.
  • Bio.Alphabet.Reduced: agrupa sequências de aminoácidos em uma única letra.

Bio.Application

Apresenta mecanismos gerais para acessar diversas aplicações pelo Biopython.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Application-module.html>.

Bio.Blast

Contém classes para trabalhar com a ferramenta BLAST.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Blast-module.html>.

Módulos:

  • Bio.Blast.Applications: permite a interação com aplicações relacionadas a suíte BLAST+.
  • Bio.Blast.NCBIWWW: permite a invocação do BLAST pela internet.
  • Bio.Blast.NCBIXML: permite a análise de resultados de BLAST em formato XML.
  • Bio.Blast.ParseBlastTable: permite análise do formato blastpgp.
  • Bio.Blast.Record: fornece classes de gravação para resultados de BLAST.

Bio.CAPS

Módulo desenvolvido para trabalhar com marcadores CAPS.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.CAPS-module.html>.

Bio.Cluster

Apresenta funções desenvolvidas principalmente para clusterização de dados de expressão gênica. Define-se clusterização como o método para criar conjuntos de objetos de tal forma que membros de cada conjunto (ou cluster) possuem maiores semelhanças entre si do que quando comparados com membros de outros clusters de acordo com algum determinado critério.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Cluster-module.html>.

Módulos:

  • Bio.Cluster.cluster: biblioteca de clusterização desenvolvida em C. Apresenta funções para detecção de centróides e determinação de matrizes de distância.

Bio.Compass

Fornece funções para análises de resultados do programa COMPASS.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.Compass-module.html>.

Bio.Crystal

Módulo que fornece métodos de análises de estruturas NDB Atlas (um subconjunto mínimo do formato PDB). NDB pode ser acessado a partir do endereço: <http://ndbserver.rutgers.edu/NDB/index.html>.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.Crystal-module.html>.

Bio.Data

Coleção com informações úteis para dados biológicos.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Data-module.html>.

Módulos:

  • Bio.Data.CodonTable: tabelas de códons baseadas nas encontradas no NCBI.
  • Bio.Data.IUPACData: informações sobre alfabetos IUPAC.
  • Bio.Data.SCOPData: fornece alfabetos de proteínas adicionais utilizados no banco de dados do SCOP e em arquivos PDB.

Bio.DocSQL 

Bio.DocSQL: fácil acesso à API do banco de dados.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.DocSQL-module.html>

Bio.Emboss 

Fornece códigos para interagir com programas EMBOSS.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Emboss-module.html>

Módulos:

  • Bio.Emboss.Applications: fornece códigos para executar programas EMBOSS.
  • Bio.Emboss.Primer3: fornece códigos para analisar resultados do programa EMBOSS eprimer3.
  • Bio.Emboss.PrimerSearch: fornece códigos para interagir com o programa de busca de primers da EMBOSS.

Bio.Entrez

Fornece métodos para acessar o NCBI através da internet.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Entrez-module.html>.

Módulos:

  • Bio.Entrez.Parser: analisa resultados em XML obtidos pelo Entrez Utilities do NCBI.

Bio.ExPASy

Fornece métodos para acessar recursos do ExPASy através da internet. Para mais informações sobre o ExPASy acesse: <http://www.expasy.org/>.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.ExPASy-module.html>.

Módulos:

  • Bio.ExPASy.Enzyme: este módulo fornece códigos para trabalhar com arquivos enzyme.dat do Enzyme.
  • Bio.ExPASy.Prodoc: fornece códigos para trabalhar com arquivos “prosite.doc” do Prosite.
  • Bio.ExPASy.Prosite: fornece códigos para trabalhar com arquivos “prosite dat” do Prosite.
  • Bio.ExPASy.ScanProsite: permite a execução de buscas no ScanProsite.

Bio.FSSP

Analisador de arquivos FSSP usados em um banco de dados de classificações de enovelamento de proteínas.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.FSSP-module.html>.

Módulos:

  • Bio.FSSP.FSSPTools
  • Bio.FSSP.fssp_rec

Bio.File

Fornece códigos para lidar com grandes arquivo. Classes particulares adicionais utilizados na Bio.SeqIO e Bio.SearchIO para indexação de arquivos também são definidos pelo módulo Bio.File, mas essas não podem ser utilizadas diretamente.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.File-module.html>.

Bio.GA

Esse pacote apresenta um conjunto de códigos para algoritmo genético.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.GA-module.html>.

Módulos:

  • Bio.GA.Crossover
    • Bio.GA.Crossover.General: apresenta diversas funcionalidades para realização de cruzamento.
    • Bio.GA.Crossover.GeneralPoint: permite a execução de n pontos de cruzamentos entre genomas.
    • Bio.GA.Crossover.Point: permite a execução de um único ponto de cruzamento entre genomas de dois organismos.
    • Bio.GA.Crossover.TwoPoint: permite a execução de dois pontos de cruzamentos entre genomas de dois organismos.
    • Bio.GA.Crossover.Uniform: permite a execução de cruzamentos uniformes entre genomas de dois organismos.
  • Bio.GA.Evolver: apresenta códigos para gerenciar a evolução de populações de indivíduos e cuidar da transição de geração para geração.
  • Bio.GA.Mutation
    • Bio.GA.Mutation.General: apresenta funcionalidades gerais para mutações.
    • Bio.GA.Mutation.Simple: permite a execução de mutações simples em um genoma de um organismo.
  • Bio.GA.Organism: apresenta classes para lidar com organismos em populações do algoritmo genético.
  • Bio.GA.Repair
    • Bio.GA.Repair.Stabilizing: apresenta métodos para execução de reparos que estabilizam genomas.
  • Bio.GA.Selection
    • Bio.GA.Selection.Abstract: classe  de seleção básica a qual todos os seletores devem se derivar.
    • Bio.GA.Selection.Diversity: seleciona indivíduos dentro de uma nova população tentando manter a diversidade.
    • Bio.GA.Selection.RouletteWheel: implementa seleção por roleta em uma população.
    • Bio.GA.Selection.Tournament: implementa seleção do tipo torneio.

Bio.GenBank

Apresenta códigos para trabalhar com arquivos no formato GenBank (“genbank” ou “embl”). Entretanto, cabe ressaltar que o pacote Bio.SeqIO fornece métodos mais eficientes para trabalhar com arquivos GenBank por permitir convertê-los para diversos outros formatos.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.GenBank-module.html>.

Módulos:

  • Bio.GenBank.Record: Mantém dados GenBank em um formato simples.
  • Bio.GenBank.Scanner: códigos internos para analisar arquivos GenBank ou EMBL (privado).
  • Bio.GenBank.utils: contém utilitários para ajudar a analisar arquivos GenBank.

Bio.Geo

Permite análises de arquivos do banco de dados do NCBI GEO (Gene Expression Omnibus).

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Geo-module.html>.

Módulos:

  • Bio.Geo.Record: permite análise de dados do GEO de maneira simplificada.

Bio.Graphics

O pacote Bio.Graphics oferece classes para produção de gráficos usando a biblioteca de terceiros ReportLab: <http://www.reportlab.com>.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Graphics-module.html>.

Módulos:

  • Bio.Graphics.BasicChromosome: desenha representações de cromossomos de organismos com informações adicionais. Útil para inserir marcadores em cromossomos ou visualizar sintenia entre genomas.
  • Bio.Graphics.ColorSpiral: gera cores RGB adequadas para distinguir categorias de dados.
  • Bio.Graphics.Comparative: fornece plotagens para comparação de informações entre diferentes fontes.
  • Bio.Graphics.DisplayRepresentation: apresenta classes que auxiliam no desenho de gráficos.
  • Bio.Graphics.Distribution: permite a visualização de valores distribuídos.
  • Bio.Graphics.GenomeDiagram
    • Bio.Graphics.GenomeDiagram._CircularDrawer: permite o desenho de diagramas circulares.
    • Bio.Graphics.GenomeDiagram._Colors: módulo que contém métodos para conversão de padrões de cores.
    • Bio.Graphics.GenomeDiagram._CrossLink: permite ligações entre diagramas de genomas. Útil para criação de gráficos de sintenia.
    • Bio.Graphics.GenomeDiagram._Diagram: módulo para criação de diagramas.
    • Bio.Graphics.GenomeDiagram._Feature: fornece classes para análise de características (features) de genomas.
    • Bio.Graphics.GenomeDiagram._FeatureSet: contém códigos para trabalhar com conjuntos de features.
    • Bio.Graphics.GenomeDiagram._Graph: contém dados a partir do qual gráficos são desenhados e informações sobre sua apresentação.
    • Bio.Graphics.GenomeDiagram._GraphSet: permite trabalhar com objetos GraphData.
    • Bio.Graphics.GenomeDiagram._LinearDrawer: fornece métodos para desenhar diagramas lineares.
    • Bio.Graphics.GenomeDiagram._Track: módulo para criação de faixas onde serão impressas os objetos produzidos por FeatureSet e GraphSet.
  • Bio.Graphics.KGML_vis: este módulo fornece classes e funções para visualizar diagramas produzidos com KGML (KEGG Markup Language).

Bio.HMM

Esse módulo fornece uma série de códigos para trabalhar com modelo oculto de Markov (do inglês Hidden Markov Model ou HMM).

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.HMM-module.html>.

Módulos:

  • Bio.HMM.DynamicProgramming: fornece algoritmos de programação dinâmica para uso geral.
  • Bio.HMM.MarkovModel: lida com representações de Modelos de Markov.
  • Bio.HMM.Trainer: fornece métodos para treinamento.
  • Bio.HMM.Utilities: funções genéricas que podem ser úteis para trabalhar com HMM.

15.23 Bio.KDTree

Estruturas de dados de árvores KD podem ser utilizadas para buscas em vetores com n dimensões, como por exemplo, busca por pontos vizinhos dentro de um raio delimitador. Para mais informações pesquise por “Computational Geometry: Algorithms and Applications” dos autores Mark de Berg, Marc van Kreveld, Mark Overmars e Otfried Schwarzkopf.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.KDTree-module.html>.

Módulos:

  • Bio.KDTree.KDTree
  • Bio.KDTree._CKDTree

15.24 Bio.KEGG

Este módulo fornece códigos para trabalhar com dados obtidos de bancos de dados KEGG (Kyoto Encyclopedia of Genes and Genomes).

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.KEGG-module.html>.

Módulos:

  • Bio.KEGG.Compound: fornece códigos para trabalhar com o banco de dados de ligantes e compostos do KEGG.
  • Bio.KEGG.Enzyme: fornece códigos para trabalhar com o banco de dados de enzimas do KEGG.
  • Bio.KEGG.KGML: fornece códigos para trabalhar com dados do KEGG.
    • Bio.KEGG.KGML.KGML_parser: fornece classes e funções para analisar mapas do KGML Pathway.
    • Bio.KEGG.KGML.KGML_pathway: fornece classes para representar mapas do KGML Pathway.
  • Bio.KEGG.Map: este módulo fornece códigos para importar mapas do KEGG Pathway e para usá-los com o módulo Biopython Pathway.
  • Bio.KEGG.REST: fornece códigos para acessar a API da plataforma online KEGG através de um método REST (Representational State Transfer).

15.25 Bio.LogisticRegression

Fornece códigos para realização de regressão logística.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.LogisticRegression-module.html>.

15.26 Bio.MarkovModel

Fornece uma implementação do Modelo de Markov usando treinamentos com o algoritmo de Baum-Welch e com MLE (Maximum Likelihoood Estimates).

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.MarkovModel-module.html>.

15.27 Bio.MaxEntropy 

Fornece códigos para cálculo da entropia máxima usando Improved Iterative Scaling.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.MaxEntropy-module.html>.

15.28 Bio.Medline

Fornece códigos para trabalhar com dados do Medline (NCBI).

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.Medline-module.html>.

15.29 Bio.motifs

Fornece ferramentas para trabalhar com análises de regiões motivos em sequências. Também inclui diversas funcionalidades para se analisar resultados obtidos pelos programas AlignACE, MEME e MAST, além de arquivos no formato TRANSFAC.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.motifs-module.html>.

Módulos:

  • Bio.motifs._pwm: permite rápidos cálculos envolvendo matrizes de peso de posição.
  • Bio.motifs.alignace: permite a análise de resultados do programa AlignACE.
  • Bio.motifs.applications: permite a execução por linha de comando de ferramentas para cálculo de motivos.
    • Bio.motifs.applications._alignace: fornece códigos para trabalhar com a versão local da ferramenta AlignACE, para busca de regiões motivos em sequências de DNA.
    • Bio.motifs.applications._xxmotifwrapper para execução por linha de comando da ferramenta XXmotif.
  • Bio.motifs.jaspar: módulo JASPAR2014.
    • Bio.motifs.jaspar.db: permite acesso para leitura para banco de dados no formato JASPAR5.
  • Bio.motifs.mast
  • Bio.motifs.matrix: permite a implementação de matrizes de frequência, matrizes de peso de posição e matrizes de pontuação de posição específica.
  • Bio.motifs.meme: fornece métodos para analisar resultados da ferramenta MEME (Multiple EM for Motif Elicitation).
  • Bio.motifs.thresholds: realiza cálculos aproximados de adequação do thresholds para buscar motivos.
  • Bio.motifs.transfac: analisa arquivos TRANSFAC.

15.30 Bio.NMR

Fornece códigos para trabalhar com dados de NMR.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.NMR-module.html>.

Módulos:

  • Bio.NMR.NOEtools: permite a predição das chamadas coordenadas NOE usando NOEtools.
  • Bio.NMR.xpktools:  fornece ferramentas para manipular dados de arquivos nmrview (.xpk).

15.31 Bio.NeuralNetwork

Fornece classes e métodos para trabalhar com redes neurais.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.NeuralNetwork-module.html>.

Módulos:

  • Bio.NeuralNetwork.BackPropagation
    • Bio.NeuralNetwork.BackPropagation.Layer: permite a modelagem de uma única camada de uma rede neural.
    • Bio.NeuralNetwork.BackPropagation.Network: representa redes neurais.
  • Bio.NeuralNetwork.Gene
    • Bio.NeuralNetwork.Gene.Motif: procura e lida com regiões motivo em dados de sequências biológicas.
    • Bio.NeuralNetwork.Gene.Pattern: funcionalidades genéricas úteis para representações de genes.
    • Bio.NeuralNetwork.Gene.Schema: lida com motivos permitindo ambiguidade nas sequências.
    • Bio.NeuralNetwork.Gene.Signature: procura e lida com signatures em dados de sequências biológicas.
  • Bio.NeuralNetwork.StopTraining: Classes para ajudar a lidar com paradas no treinamento de redes neurais.
  • Bio.NeuralNetwork.Training: fornece classes para lidar com treinamento de redes neurais.

15.32 Bio.Nexus

Este pacote contém classes e métodos para analisar arquivos NEXUS e objetos para modelar tais dados.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Nexus-module.html>.

Módulos:

  • Bio.Nexus.Nexus: permite a análise do conteúdo de arquivos NEXUS.
  • Bio.Nexus.Nodes: permite a análise de cada nó. Também armazena uma lista de nós que estão interligados.
  • Bio.Nexus.Trees: fornece classes para lidar com árvores filogenéticas.
  • Bio.Nexus.cnexus: verifica arquivos e lida com comentários e citações.

15.33 Bio.PDB

Apresenta classes e métodos para lidar com estruturas tridimensionais de macromoléculas. Inclui ferramentas para analisar arquivos PDB e mmCIF, uma classe para análise de estruturas (Structure), um módulo para manter uma cópia de arquivos PDB atualizados, além de métodos de abertura e gravação de arquivos no formato PDB.

Criado por Thomas Hamelryck e Kristian Rother.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.PDB-module.html>.

Módulos:

  • Bio.PDB.AbstractPropertyMap: classe que realiza o mapeamento (chain_id e residue_id) para determinar as propriedades de um resíduo.
  • Bio.PDB.Atom: classe de átomos usada em objetos Structure.
  • Bio.PDB.Chain: classe de cadeias usada em objetos Structure.
  • Bio.PDB.DSSP: usa o programa DSSP para calcular a estrutura secundária e a acessibilidade.
  • Bio.PDB.Dice
  • Bio.PDB.Entity
  • Bio.PDB.FragmentMapper: classifica a estrutura de backbone de proteínas de acordo com a biblioteca de fragmentos de Kolodny e colaboradores. Para mais informações consulte:

Kolodny R, Koehl P, Guibas L, Levitt M. Small libraries of protein fragments model native protein structures accurately. J Mol Biol. 2002 323(2):297-307.

  • Bio.PDB.HSExposure: realiza o cálculo de exposição de meia esfera e número de coordenação.
  • Bio.PDB.MMCIF2Dict: transforma um arquivo mmCIF em um dicionário.
  • Bio.PDB.MMCIFParser: fornece métodos de análise para arquivos mmCIF.
  • Bio.PDB.Model: classe modelo usada em objetos Structure.
  • Bio.PDB.NACCESS
  • Bio.PDB.NeighborSearch: busca por átomos vizinhos usando uma árvore KD (implementada na linguagem de programação C++).
  • Bio.PDB.PDBExceptions: apresenta algumas exceções específicas para o Bio.PDB.
  • Bio.PDB.PDBIO: salva arquivos no formato PDB.
  • Bio.PDB.PDBList: lista estruturas PDB com base em consultas a bancos de dados na internet, o que permite o download de estruturas.
  • Bio.PDB.PDBParser: permite a análise de arquivos PDB.
  • Bio.PDB.PSEA: permite o uso do programa PSEA usado para atribuição de estrutura secundária.
  • Bio.PDB.Polypeptide: apresenta classes para construção e representação de polipeptídios.
  • Bio.PDB.Residue: permite a representação de resíduos.
  • Bio.PDB.ResidueDepth: permite o calculo de profundidade de um resíduo usando a ferramenta por linha de comando MSMS.
  • Bio.PDB.Selection: permite a seleção de átomos, resíduos, cadeias e estruturas.
  • Bio.PDB.Structure: classe que representa estruturas de macromoléculas. Permite a criação de objetos Structure (objetos de estruturas).
  • Bio.PDB.StructureAlignment: permite o mapeamento de resíduos de duas estruturas baseado em um arquivo de alinhamentos FASTA.
  • Bio.PDB.StructureBuilder: classe que permite a construção de objetos Structure.
  • Bio.PDB.Superimposer: permite a sobreposição de duas estruturas.
  • Bio.PDB.Vector: inclui funções relacionadas com rotações.
  • Bio.PDB.parse_pdb_header: permite a análise de cabeçalhos de arquivos PDB.

15.34 Bio.Pathway

Permite intercâmbio de dados e pré-processamento entre bancos de dados de pathway. Apresenta representações de interações entre qualquer número de espécies bioquímicas.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Pathway-module.html>.

Módulos:

  • Bio.Pathway.Rep: módulo de suporte do BioPython Pathway.
    • Bio.Pathway.Rep.Graph
    • Bio.Pathway.Rep.MultiGraph

15.35 Bio.Phylo 

Pacote para trabalhar com árvores filogenéticas.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Phylo-module.html>.

Módulos:

  • Bio.Phylo.Applications: permite a execução de ferramentas de filogenética por linha de comando.
    • Bio.Phylo.Applications._Fasttree: permite a execução da ferramenta de inferência de árvores Fasttree.
    • Bio.Phylo.Applications._Phyml: permite a execução da ferramenta de inferência de árvores PhyML.
    • Bio.Phylo.Applications._Raxml: permite a execução da ferramenta de inferência de árvores RAxML.
  • Bio.Phylo.BaseTree: classe para criação de objetos Bio.Phylo.
  • Bio.Phylo.CDAO: classe correspondente a árvores CDAO.
  • Bio.Phylo.CDAOIO: permite a leitura e gravação de arquivos no formato RDF/CDAO.
  • Bio.Phylo.Consensus: classes e métodos para busca de árvores consenso.
  • Bio.Phylo.NeXML: classe correspondente a árvores NeXML.
  • Bio.Phylo.NeXMLIO: permite a leitura e gravação de arquivos no formato NeXML.
  • Bio.Phylo.Newick: classe correspondente a árvores Newick, também utilizada para árvores Nexus.
  • Bio.Phylo.NewickIO: permite a leitura e gravação de arquivos no formato Newick.
  • Bio.Phylo.NexusIO: permite a leitura e gravação para árvores Bio.Nexus.
  • Bio.Phylo.PAML
  • Bio.Phylo.PhyloXML: classe correspondente a elementos phyloXML.
  • Bio.Phylo.PhyloXMLIO: permite a leitura, análise, escrita com PhyloXML.
  • Bio.Phylo.TreeConstruction: classes e métodos para construção de árvores.
  • Bio.Phylo._io: permite a leitura e gravação de diversos formatos de árvores filogenéticas.
  • Bio.Phylo._utils: apresenta diversos utilitários para manipulação, exibição e exportação de árvores filogenéticas.

15.36 Bio.PopGen

PopGen é um pacote que permite lidar com populações genéticas e genômicas.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.PopGen-module.html>.

Módulos:

  • Bio.PopGen.Async: suporte a execução assíncrona.
    • Bio.PopGen.Async.Local: permite execução local assíncrona.
  • Bio.PopGen.FDist: este módulo fornece códigos para trabalhar com FDist.
    • Bio.PopGen.FDist.Async: permite a execução assíncrona de Fdist e divisão de cargas.
    • Bio.PopGen.FDist.Controller: permite controlar o Fdist.
    • Bio.PopGen.FDist.Utils
  • Bio.PopGen.GenePop: contém códigos para trabalhar com GenePop.
    • Bio.PopGen.GenePop.Controller: permite controlar o GenePop.
    • Bio.PopGen.GenePop.EasyController: permite controlar o GenePop através de uma interface simplificada.
    • Bio.PopGen.GenePop.FileParser: permite analisar arquivos BIG GenePop.
    • Bio.PopGen.GenePop.LargeFileParser: permite análise de grandes arquivos GenePop.
    • Bio.PopGen.GenePop.Utils
  • Bio.PopGen.SimCoal: permite a execução do SimCoal2 e apresenta funções de suporte.
    • Bio.PopGen.SimCoal.Controller: este módulo permite controlar o Simcoal2 e o FastSimcoal.
    • Bio.PopGen.SimCoal.Template

15.37 Bio.Restriction

Contém métodos para trabalhar com enzimas de restrições. Apresenta sítios de restrição, além de outras informações de aproximadamente 779 enzimas de restrição, que vão desde a AanI a Zsp2I.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Restriction-module.html>.

Módulos:

  • Bio.Restriction.PrintFormat: imprime análises de enzimas de restrição.
  • Bio.Restriction.RanaConfig
  • Bio.Restriction.Restriction: classes de enzimas de restrição.
  • Bio.Restriction.Restriction_Dictionary

15.38 Bio.SCOP

O banco de dados SCOP (Structural Classification of Proteins) fornece uma classificação manual de todas as estruturas de proteínas conhecidas através de hierarquias, como família, superfamília e enovelamento. Este pacote apresenta métodos para acessar o SCOP pela internet.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.SCOP-module.html>.

Módulos:

  • Bio.SCOP.Cla: permite a manipulação de arquivos de classificação SCOP, que descreve os domínios SCOP.
  • Bio.SCOP.Des: permite a manipulação de arquivos de descrição SCOP.
  • Bio.SCOP.Dom: permite a manipulação de arquivos de domínio SCOP.
  • Bio.SCOP.Hie: permite a manipulação de arquivos de hierarquia SCOP através de identificadores únicos.
  • Bio.SCOP.Raf: mapas de sequências ASTRAL RAF (Rapid Access Format).
  • Bio.SCOP.Residues: apresenta uma coleção de resíduos de estruturas PDB.

15.39 Bio.SVDSuperimposer

SVDSuperimposer utiliza o algoritmo de decomposição de valores singulares (SVD) para detectar a melhor rotação e translação, e assim, colocar dois conjuntos de pontos um em cima do outro minimizando a RMSD. Útil para sobrepor estruturas cristalográficas.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.SVDSuperimposer-module.html>.

15.40 Bio.SearchIO

Interface do Biopython para análise de resultados de programas de buscas de sequências.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.SearchIO-module.html>.

Módulos:

  • Bio.SearchIO.BlastIO:  suporte do Bio.SearchIO a formatos de resultados de programas da suíte BLAST+.
    • Bio.SearchIO.BlastIO.blast_tab: permite a análise de resultados tabulares (com ou sem comentários) de programas da suíte BLAST+.
    • Bio.SearchIO.BlastIO.blast_text: permite a análise de resultados em formato textual de programas da suíte BLAST+.
    • Bio.SearchIO.BlastIO.blast_xml: permite a análise de resultados em formato XML de programas da suíte BLAST+.
  • Bio.SearchIO.BlatIO: permite a análise do formato BLAT.
  • Bio.SearchIO.ExonerateIO: suporte do Bio.SearchIO a formatos de resultados do programa Exonerate.
    • Bio.SearchIO.ExonerateIO._base: permite a análise de resultados do formato padrão Exonerate.
    • Bio.SearchIO.ExonerateIO.exonerate_cigar: permite a análise de resultados do formato cigar do programa Exonerate.
    • Bio.SearchIO.ExonerateIO.exonerate_text: permite a análise de resultados de texto simples do programa Exonerate.
    • Bio.SearchIO.ExonerateIO.exonerate_vulgar: permite a análise de resultados em formato vulgar do programa Exonerate.
  • Bio.SearchIO.FastaIO: suporte para o programa Bill Pearson’s FASTA.
  • Bio.SearchIO.HmmerIO: suporte para resultados do programa HMMER.
    • Bio.SearchIO.HmmerIO._base: fornece classes básicas para códigos relacionados com HMMER.
    • Bio.SearchIO.HmmerIO.hmmer2_text: permite análises de resultados do programa HMMER 2 em formato textual.
    • Bio.SearchIO.HmmerIO.hmmer3_domtab: permite análises de resultados de tabela de domínio do programa HMMER 3.
    • Bio.SearchIO.HmmerIO.hmmer3_tab: permite análises de resultados do programa HMMER 3 em formato tabular.
    • Bio.SearchIO.HmmerIO.hmmer3_text: permite análises de resultados do programa HMMER 3 em formato de texto simples.
  • Bio.SearchIO._index: permite uma indexação customizada de objetos Bio.SearchIO.
  • Bio.SearchIO._model: permite o uso de objetos Bio.SearchIO para modelar resultados do programa de busca por similaridade.
    • Bio.SearchIO._model._base: classe abstrata para objetos modelo SearchIO.
    • Bio.SearchIO._model.hit: objeto Bio.SearchIO para modelar um único hit no banco de dados.
    • Bio.SearchIO._model.hsp: objeto Bio.SearchIO para modelar regiões de alta pontuação entre query e hit.
    • Bio.SearchIO._model.query: objeto Bio.SearchIO para modelar resultados de buscas de uma única query.
  • Bio.SearchIO._utils: funções comuns de utilidade SearchIO.

15.41 Bio.Seq

Fornece objetos para representar sequências biológicas com alfabetos. Possui funções para criação de objetos Seq, determinação da sequência reverso complementar, transcrição de sequências de DNA em RNA e tradução.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.Seq-module.html>.

15.42 Bio.SeqFeature

Útil para trabalhar com features de sequências.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.SeqFeature-module.html>.

15.43 Bio.SeqIO

Permite a leitura e gravação de sequências como objeto SeqRecord.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.SeqIO-module.html>.

Módulos:

  • Bio.SeqIO.AbiIO: permite análises de arquivos no formato ABI.
  • Bio.SeqIO.AceIO: permite análises de arquivos no formato “ace“.
  • Bio.SeqIO.FastaIO: permite análises de arquivos no formato “fasta“.
  • Bio.SeqIO.IgIO: permite análises de arquivos no formato “ig” (IntelliGenetics ou MASE).
  • Bio.SeqIO.InsdcIO: permite análises de arquivos nos formatos “genbank” e “embl“.
  • Bio.SeqIO.Interfaces: módulo de suporte.
  • Bio.SeqIO.PhdIO: permite análises de arquivos no formato “phd“.
  • Bio.SeqIO.PirIO: permite análises de arquivos no formato “pir” (PIR ou NBRF).
  • Bio.SeqIO.QualityIO: permite análises de arquivos nos formatos FASTQ e QUAL.
  • Bio.SeqIO.SeqXmlIO: permite análises de arquivos no formato “seqxml“.
  • Bio.SeqIO.SffIO: permite análises de arquivos binários no formato SFF (Standard Flowgram Format).
  • Bio.SeqIO.SwissIO: permite análises de arquivos no formato “swiss” (SwissProt/UniProt).
  • Bio.SeqIO.TabIO: permite análises de arquivos no formato “tab” (texto separado por tabulações).
  • Bio.SeqIO.UniprotIO: permite análises de arquivos no formato “uniprot-xml“.

15.44 Bio.SeqRecord

Permite obter informações sobre anotações de sequências.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.SeqRecord-module.html>.

15.45 Bio.SeqUtils 

Apresenta funções auxiliares para lidar com sequências.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.SeqUtils-module.html>.

Módulos:

  • Bio.SeqUtils.CheckSum: funções para calcular as somas de verificação de sequência desordenadas.
  • Bio.SeqUtils.CodonUsage: funções para determinação de codon usage.
  • Bio.SeqUtils.CodonUsageIndices: define um índice de códons de acordo com o trabalho publicado na revista “Nucleic Acids Res” por Sharp e Li (1987).
  • Bio.SeqUtils.IsoelectricPoint: permite o cálculo de pontos isoelétricos de polipeptídios usando o método de Bjellqvist.
  • Bio.SeqUtils.MeltingTemp: permite o cálculo da temperatura de fusão de sequências de nucleotídeos.
  • Bio.SeqUtils.ProtParam: permite simples análises de proteínas.
  • Bio.SeqUtils.ProtParamData: este módulo contém índices que podem ser usados pelo ProtParam.
  • Bio.SeqUtils.lcc: permite a determinação do LCC (Local Composition Complexity) para uma sequência.

15.46 Bio.Sequencing

Fornece códigos para lidar com vários programas, com dados de sequenciamento e realizar montagem de genomas

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Sequencing-module.html>.

Módulos:

  • Bio.Sequencing.Ace: fornece métodos para análises de arquivos no formato ACE obtidos pelo programa PHRAP.
  • Bio.Sequencing.Applications: contém classes para executar diversas aplicações por linha de comando através do Biopython.
    • Bio.Sequencing.Applications._Novoalign: permite a execução do programa Novoalign (Novocraft).
    • Bio.Sequencing.Applications._bwa: permite a execução do programa bwa.
    • Bio.Sequencing.Applications._samtools: permite a execução do programa samtools.
  • Bio.Sequencing.Phd: permite análises de arquivos no formato PHD.

15.47 Bio.Statistics

Apresenta funções estatísticas.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.Statistics-module.html>.

Módulos:

  • Bio.Statistics.lowess: implementa a função Lowess para regressão não paramétrica.

15.48 Bio.SubsMat

Este módulo fornece classes e rotinas para geração de matrizes de substituição, similares as matrizes PAM e BLOSSUM.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.SubsMat-module.html>.

Módulos:

  • Bio.SubsMat.FreqTable
  • Bio.SubsMat.MatrixInfo: permite a geração de matrizes de substituição usadas em alinhamentos.

15.49 Bio.SwissProt

Esse pacote fornece códigos para trabalhar com o arquivo “sprotXX.dat” do SwissProt.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.SwissProt-module.html>.

Módulos:

  • Bio.SwissProt.KeyWList: permite a análise do arquivo “keywlist.txt” do SwissProt/UniProt.

15.50 Bio.TogoWS

Fornece códigos para acessar os webservices integrados do TogoWS (DBCLS, Japão).

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.TogoWS-module.html>.

15.51 Bio.UniGene

Permite a análise de arquivos Unigene, como os arquivos Hs.data.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.UniGene-module.html>.

15.52 Bio.UniProt

Fornece códigos para trabalhar com arquivos de formatos desordenados do UniProt.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.UniProt-module.html>.

Módulos:

  • Bio.UniProt.GOA: permite análises de arquivos GAF, GPA e GPI (UniProt-GOA).

15.53 Bio._utils

Contém diversas funções e utilitários comuns para vários submódulos Bio, como por exemplo, uma função que permite a contagem de itens em uma iteração.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio._utils-module.html>.

15.54 Bio.bgzf

Permite a leitura e escrita de arquivos compactados no formato BGZF.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.bgzf-module.html>.

15.55 Bio.codonalign 

Fornece códigos para trabalhar com alinhamentos de códons.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/Bio.codonalign-module.html>.

Módulos:

  • Bio.codonalign.chisq: implementação em Python do chisqprob (não necessita do SciPy).
  • Bio.codonalign.codonalignment: permite lidar com alinhamentos de códons.
  • Bio.codonalign.codonalphabet: fornece um alfabeto de códons.
  • Bio.codonalign.codonseq: fornece códigos para lidar com sequências codificantes.

15.56 Bio.kNN

Fornece código para realizar classificações usando k-nearest-neighbors.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.kNN-module.html>.

15.57 Bio.pairwise2

Este pacote implementa alinhamento de sequências par-a-par usando algoritmo de programação dinâmica.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.pairwise2-module.html>.

15.58 Bio.trie

Este módulo implementa uma estrutura de dados trie.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.trie-module.html>.

15.59 Bio.triefind 

Dada uma trie, este módulo fornece métodos de detectar todas as ocorrências de uma palavra buscando por substrings.

Documentação do módulo disponível em: <http://biopython.org/DIST/docs/api/Bio.triefind-module.html>.

15.60 BioSQL

Biopython fornece módulos para acessar e recuperar informações de bancos de dados relacionais BioSQL. Não faz parte do pacote Bio. Para mais informações acesse: <http://www.biosql.org/>.

Documentação do pacote disponível em: <http://biopython.org/DIST/docs/api/BioSQL-module.html>.

Módulos:

  • BioSQL.BioSeq: implementações de objetos Seq do Biopython no BioSQL.
  • BioSQL.BioSeqDatabase: permite a conexão com uma base de dados do BioSQL e o carregamento de objetos do Biopython nela.
  • BioSQL.DBUtils: fornece utilitários para acesso a bases BioSQL.
  • BioSQL.Loader: carrega objetos do Biopython em um base de dados BioSQL para armazenamento persistente.

Quer aprender mais? Conheça nossos cursos profissionalizantes à partir de R$19,99:

Livro Introdução à Programação para Bioinformática com Biopython

Capítulo 1
Introdução ao Python

Capítulo 2
Comandos condicionais

Capítulo 3
Laços de repetição

Capítulo 4
Trabalhando com strings

Capítulo 5
Listas

Capítulo 6
Manipulando arquivos

Capítulo 7
Funções

Capítulo 8
Princípios da orientação a objetos

Capítulo 9
Introdução ao Biopython

Capítulo 10
Sequências

Capítulo 11
BLAST

Capítulo 12
PDB

Capítulo 13
Visualização de dados em Python

Capítulo 14
Outras coisas interessantes que se pode fazer com Biopython

Capítulo 15
Hierarquia do Biopython

Por favor, nos cite:

MARIANO, D. C. B.; BARROSO, J. R. P. M. ; CORREIA, T. S. ; de MELO-MINARDI, R. C. . Introdução à Programação para Bioinformática com Biopython. 3. ed. North Charleston, SC (EUA): CreateSpace Independent Publishing Platform, 2015. v. 1. 230p .

Por Diego Mariano

Doutor em Bioinformática pela Universidade Federal de Minas Gerais com atuação na área de ciência de dados e aprendizado de máquina aplicados ao aperfeiçoamento de enzimas usadas na produção de biocombustíveis. Mestre em Bioinformática, também pela UFMG, atuando na área de desenvolvimento de sistemas Web para montagem de genomas. Atualmente realiza estágio pós-doutoral no Departamento de Ciência da Computação da UFMG com foco em desenvolvimento de sistemas Web para Bioinformática, análise exploratória e visualização de dados. Tem conhecimentos nas linguagens: PHP, JavaScript, Python, R, Perl, HTML, CSS e SQL.