Uma metodologia em cascata de quatro etapas para classificar códigos NCM usando técnicas de PLN

dc.contributor.advisor1GONZÁLEZ, Marcos Tulio Amaris
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/9970287865377659pt_BR
dc.creatorPINHEIRO, Pedro Luiz Braga
dc.creator.Latteshttp://lattes.cnpq.br/4700792753830171pt_BR
dc.date.accessioned2023-01-16T14:29:14Z
dc.date.available2023-01-16T14:29:14Z
dc.date.issued2022-09-30
dc.description.abstractThis work aims to develop a process to classify the descriptions of products present in electronic invoices (NF-e). This classification is based on the 8 digits of the Common Mercosur Nomenclature (NCM), separated into 4 parts, Chapter, Position, Subheading and item/Subitem. The classification was performed using the Support Vector Machine (SVM) algorithm and the Naıve Bayess algorithm together with Natural Language Processing (NLP) techniques, for processing a database of 340,000 different products. The data were divided into 80% training and 20% testing and an accuracy of 90% was obtained for a total of 98 classes.pt_BR
dc.description.resumoEsse trabalho tem como objetivo desenvolver um processo para classificar as descrições dos produtos presentes nas Notas Ficais eletrônicas (NF-e). Essa classificação e feita sobre os 8 dígitos da Nomenclatura Comum do Mercosul (NCM), separado em 4 partes, Capítulo, Posição, Subposição e item/Subitem. A classificação foi realizada utilizando o algoritmo de Máquina de Vetores de Suporte (SVM) e o algoritmo de Naive Bayes em conjunto com as técnicas de Processamento Natural de Linguagem (PNL), para o processamento de uma base de dados de 340.000 produtos distintos. Os dados foram divididos em 80% treinamento e 20% teste e obteve-se um acurácia de 90% para um total de 98 classes.pt_BR
dc.identifier.citationPINHEIRO, Pedro Luiz Braga. Uma metodologia em cascata de quatro etapas para classificar códigos NCM usando técnicas de PLN. Orientador: Marcos Tulio Amaris Gonzalez. 2022. [18] f. Trabalho de Curso (Bacharelado em Engenharia da Computação) – Faculdade de Engenharia da Computação, Campus Universitário de Tucuruí, Universidade Federal do Pará, Tucuruí, 2022. Disponível em: https://bdm.ufpa.br:8443/jspui/handle/prefix/5010. Acesso em:.pt_BR
dc.identifier.urihttps://bdm.ufpa.br/handle/prefix/5010
dc.rightsAcesso Abertopt_BR
dc.source.uriDisponível na Internet via Sagittapt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectAprendizagem de máquinapt_BR
dc.subjectClassificação de textopt_BR
dc.subjectNomenclatura Comum do Mercosulpt_BR
dc.subjectNatural processing languagept_BR
dc.subjectMachine learningpt_BR
dc.subjectText classificationpt_BR
dc.subjectMercosul Common Nomenclaturept_BR
dc.subject.cnpqCNPQ::ENGENHARIASpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOpt_BR
dc.titleUma metodologia em cascata de quatro etapas para classificar códigos NCM usando técnicas de PLNpt_BR
dc.typeTrabalho de Curso - Graduação - Artigopt_BR

Arquivo(s)

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCC_Artigo_MetodologiaCascataQuatro.pdf
Tamanho:
996.12 KB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.84 KB
Formato:
Item-specific license agreed upon to submission
Descrição: