Please use this identifier to cite or link to this item: https://bdm.ufpa.br:8443/jspui/handle/prefix/2366
Compartilhar:
metadata.dc.type: Trabalho de Conclusão de Curso - Graduação
Title: Um estudo comparativo de ferramentas de binning de metagenomas utilizando dados simulados microbianos
metadata.dc.creator: PARÁ, Rodrigo de Britto Pontes Rodrigues
metadata.dc.contributor.advisor1: FRANCÊS, Regiane Silva Kawasaki
metadata.dc.contributor.advisor-co1: OLIVEIRA, Renato Renison Moreira
Issue Date: 2019
Citation: PARÁ, Rodrigo de Britto Pontes Rodrigues. Um estudo comparativo de ferramentas de binning de metagenomas utilizando dados simulados microbianos. Orientadora: Regiane Silva Kawasaki Francês. 2019. 63 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Faculdade de Computação, Instituto de Ciências Exatas e Naturais, Universidade Federal do Pará, Belém, 2019. Disponível em: http://bdm.ufpa.br/jspui/handle/prefix/2366. Acesso em:.
metadata.dc.description.resumo: A Metagenômica é uma derivação do ramo tradicional da Genômica que estuda o genoma de comunidades de microrganismos retirados diretamente do seu habitat, eliminando a necessidade do cultivo laboratorial. A reconstrução da cadeia de DNA de um genoma é feita através do processo de sequenciamento onde são criados fragmentos menores de DNA, que serão posteriormente montados em sequências maiores a fim de se chegar no genoma original. Para dados metagenômicos, esse processo de montagem é mais trabalhoso, dado que vários genomas de organismos diferentes estão presentes na amostra. Separar as sequências obtidas no processo de montagem em categorias distintas de acordo com o nível taxonômico dos organismos é um processo denominado binning, e é importante para facilitar a posterior análise da composição da amostra, para a descoberta de relações filogenéticas e de novos genes. Este trabalho busca comparar os resultados de ferramentas de binning através da definição de um pipeline de análise de dados metagenômicos, utilizando dois conjuntos de dados simulados de 10 e 100 espécies de bactérias. Utilizou-se o software Metaquast para a comparação de três softwares de montagem (IDBA_UD, Megahit e MetasSPAdes) e dois softwares de binning (MetaBAT-2.12.1 e MaxBin-2.2.4). A qualidade dos bins gerados por cada ferramenta foi comparada através da construção de uma Matriz de Confusão e da comparação das métricas de Acurácia, Sensibilidade, Especificidade e Precisão. Como resultado, o MetaBAT se sobressai ao MaxBin na qualidade dos bins gerados em ambos os conjuntos de dados, provando ser uma boa opção na realização do binning de metagenomas.
Abstract: Metagenomics is a derivation of the traditional branch of Genomics that studies the genome of communities of microorganisms extracted directly from their habitat, eliminating the need for laboratory cultivation. The reconstruction of the DNA strand of a genome is done through the sequencing process where smaller fragments of DNA are created, which will later be assembled into larger sequences in order to reach the original genome. For metagenomic data, this assembly process is more laborious, since several genomes of different organisms are present in the sample. Separating the sequences obtained in the assembly process into distinct categories according to the taxonomic level of organisms is a process called binning and is important to facilitate the subsequent analysis of the composition of the sample, for the discovery of phylogenetic relationships and new genes. This work seeks to compare the results of binning tools by defining a pipeline of metagenomic data analysis using two simulated datasets of 10 and 100 species of bacteria. Metaquast software was used to compare three assembly softwares (IDBA_UD, Megahit and MetasSPAdes) and two binning softwares (MetaBAT-2.12.1 and MaxBin-2.2.4). The quality of the bins generated by each tool was compared by constructing a Confusion Matrix and comparing the Accuracy, Sensitivity, Specificity and Accuracy metrics. As a result, MetaBAT excels at MaxBin in the quality of the bins generated in both sets of data, proving to be a good choice in performing binning of metagenomes.
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Keywords: Bioinformática
Metagenômica
Montagem de metagenomas
Binning de metagenomas
Dados simulados
metadata.dc.rights: Acesso Aberto
Appears in Collections:Faculdade de Computação - FC/ICEN

Files in This Item:
File Description SizeFormat 
TCC_EstudoComparativoFerramentas.pdf1,05 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons