Fastlattes: uma ferramenta para extração de dados acadêmicos de currículos lattes

dc.contributor.advisor1SANTOS FILHO, Reginaldo Cordeiro dos
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/9157422386900321pt_BR
dc.contributor.advisor1ORCIDhttps://orcid.org/0000-0002-0456-8547pt_BR
dc.creatorHANTANI, Guilherme Eiji Enomoto
dc.creator.Latteshttp://lattes.cnpq.br/4554111675883844pt_BR
dc.date.accessioned2025-02-28T21:52:01Z
dc.date.available2025-02-28T21:52:01Z
dc.date.issued2022-12-20
dc.description.abstractDue to the big quantity of existing Lattes resumes in the Lattes plataform, combined with the fact that the plataform disposes of few resources to visualization of quantitative data, many institutions, such as postgraduate programs, need to make the accounting of scientific works by hand, leading to an exausting and laborious process, prone to mistakes. Thus, the objective of this paper is developing an web system capable of extracting, in an automatic way, data and information from an set of Lattes resumes, and presenting statistic info through visual graphs generated by it. For that, two requirements lists were defined, functional and not-functional, in addition to a case-use UML diagram, and also, 5 Python external libraries were selected to assist in the development of the tool. The web system also counts with another visual resource, word clouds, which are capable of capturing the frequency of which some important words repeat themselves on the resume of the researcher, informing the user about the occupational profile of the researcher. The aplication is also publicly avaiable and can be used to analyze an particular resume of a researcher, or to do joint analyzes, considering, for example, an whole postgraduate program collegiate.pt_BR
dc.description.resumoDevido a grande quantidade de currículos Lattes existente na plataforma Lattes, combinado com o fato de que a plataforma possui poucos recursos para visualização de dados quantitativos, muitas instituições, como programas de Pós-graduação, precisam fazer a contabilização de trabalhos científicos dos pesquisadores de maneira manual, formando um processo bem cansativo, trabalhoso e propenso a erros. Dessa forma, o objetivo deste trabalho é desenvolver um sistema web que seja capaz de extrair, de maneira automatizada, dados e informações de um conjunto de currículos Lattes, e apresente informações estatísticas por meio de gráficos visuais gerados pelo mesmo. Para isso, foram definidas duas listas de requisitos, funcionais e não-funcionais, além de um diagrama de casos de uso UML, e também, foram selecionadas 5 bibliotecas externas do Python para auxiliar no desenvolvimento da ferramenta. O sistema web também conta com outro recurso visual, nuvens de palavras, a qual conseguem capturar a frequência com que algumas palavras importantes se repetem no currículo do pesquisador, informando ao usuário sobre o perfil de atuação do pesquisador. A aplicação está disponível publicamente e pode ser utilizada tanto para analisar um currículo particular de um pesquisador quanto para realizar análises conjuntas, considerando, por exemplo, um colegiado inteiro de um programa de pós-graduação.pt_BR
dc.identifier.citationHANTANI, Guilherme Eiji Enomoto. Fastlattes: uma ferramenta para extração de dados acadêmicos de currículos lattes. Orientador: Reginaldo Cordeiro dos Santos Filho. 2022. 41 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Faculdade de Computação, Instituto de Ciências Exatas e Naturais, Universidade Federal do Pará, Belém, 2022. Disponível em:. Acesso em:.pt_BR
dc.identifier.urihttps://bdm.ufpa.br/jspui/handle/prefix/7757
dc.rightsAcesso Abertopt_BR
dc.source1 CD-ROMpt_BR
dc.subjectLattespt_BR
dc.subjectExtração de dadospt_BR
dc.subjectPythonpt_BR
dc.subjectAutomatizaçãopt_BR
dc.subjectData extractionpt_BR
dc.subjectPythonpt_BR
dc.subjectAutomationpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.titleFastlattes: uma ferramenta para extração de dados acadêmicos de currículos lattespt_BR
dc.typeTrabalho de Curso - Graduação - Monografiapt_BR

Arquivo(s)

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCC_FastlasttesFerramentaExtracao.pdf
Tamanho:
1.8 MB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.84 KB
Formato:
Item-specific license agreed upon to submission
Descrição: