Analyzing the impact of dimensionality reduction over human intestinal absorption prediction through machine learning

dc.contributor.advisor-co1RODRIGUES, Caio Marcos Flexa
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/7685787461835870pt_BR
dc.contributor.advisor1SALES JÚNIOR, Claudomiro de Souza de
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4742268936279649pt_BR
dc.creatorCARDOSO, Eduardo Gil Serrão
dc.creator.Latteshttp://lattes.cnpq.br/6737018795026043pt_BR
dc.date.accessioned2025-03-12T17:50:42Z
dc.date.available2025-03-12T17:50:42Z
dc.date.issued2022-02
dc.description.abstractA desirable property in drug development is oral delivery. Virtual screening of chemical compounds according to their oral bioavailability with computational intelligence could accelerate the prediction of their human intestinal absorption (HIA). Despite the existence of several studies aimed at predicting the intestinal permeability of chemical compounds, none attempted to evaluate the impact of using physicochemical and structural properties related to oral bioavailability with both dimensionality reduction (DR) and machine learning (ML) techniques. This case study presents an analysis on the impact of applying DR techniques such as Principal Component Analysis (PCA), Kernel PCA (KPCA), Ivis, Truncated Singular Vector Decomposition (TSVD) and Uniform Manifold Approximation and Projection (UMAP) along with ML predictors such as K-Nearest Neighbors (KNN), Multi-Layer Perceptron (MLP), Support Vector Machine (SVM) and Random Forest (RF) in predicting HIA of small molecules, shedding light in the models behavior as dimensionality changes. Results demonstrate that, despite reducing the dimensionality by more than 90%, lower-dimensional models for KNN, SVM and RF still delivered competitive results, demonstrating the viability and potential of projection-based DR as a pre-processing step.pt_BR
dc.description.resumoUma propriedade desejável no desenvolvimento de drogas é entrega oral. A triagem virtual de compostos químicos de acordo com sua biodisponibilidade oral com inteligência computacional pode acelerar a predição de sua absorção intestinal humana (HIA). A despeito da existência de vários estudos almejando predizer a permeabilidade intestinal de compostos químicos, nenhum tentou avaliar o impacto do uso de propriedades fisicoquímicas e estruturais relacionadas à biodisponibilidade oral com técnicas de redução de dimensionalidade (DR) e aprendizado de máquina (ML). Este estudo de caso apresenta uma análise sobre o impacto da aplicação de técnicas de redução de dimensionalidade tais como Análise de Componentes Principais (PCA), PCA baseado em Kernel (KPCA), Ivis, Aproximação e Projeção de Manifold Uniforme (UMAP) e Decomposição de Valor Singular Truncado(TSVD), conjuntamente com preditores de ML tais como Redes Neurais Artificiais (ANN), K-Vizinhos mais Próximos (KNN), Máquina de Vetores de Suporte (SVM) e Floresta Aleatória (RF) na predição de HIA de pequenas moléculas, dando foco ao comportamento dos modelos conforme a dimensionalidade varia. Os resultados demonstram que, apesar de reduzir a dimensionalidade em mais de 90%, os modelos de menor dimensionalidade para o KNN, RF e SVM ainda apresentaram resultados competitivos, demonstrando a viabilidade e o potencial de técnicas de DR enquanto etapa de pré-processamento.pt_BR
dc.identifier.citationCARDOSO, Eduardo Gil Serrão. Analyzing the impact of dimensionality reduction over human intestinal absorption prediction through machine learning. Orientador: Claudomiro de Souza de Sales Júnior. 2022. 173 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Faculdade de Computação, Instituto de Ciências Exatas e Naturais, Universidade Federal do Pará, Belém, 2022. Disponível em: https://bdm.ufpa.br/jspui/handle/prefix/7851. Acesso em:.pt_BR
dc.identifier.urihttps://bdm.ufpa.br/jspui/handle/prefix/7851
dc.rightsAcesso Abertopt_BR
dc.source1 CD-ROMpt_BR
dc.subjectRedução de dimensionalidade baseada em projeçãopt_BR
dc.subjectAprendizado profundopt_BR
dc.subjectDescoberta de drogaspt_BR
dc.subjectAbsorção intestinal humanapt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectProjection-based dimensionality reductionpt_BR
dc.subjectDeep learningpt_BR
dc.subjectDrug discoverypt_BR
dc.subjectHuman intestinal absorptionpt_BR
dc.subjectMachine learningpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.titleAnalyzing the impact of dimensionality reduction over human intestinal absorption prediction through machine learningpt_BR
dc.typeTrabalho de Curso - Graduação - Monografiapt_BR

Arquivo(s)

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCC_AnalyzingImpactDimensionality.pdf
Tamanho:
2.02 MB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.84 KB
Formato:
Item-specific license agreed upon to submission
Descrição: