Please use this identifier to cite or link to this item:
https://bdm.ufpa.br/jspui/handle/prefix/5880
Compartilhar:
Type: | Trabalho de Conclusão de Curso - Graduação |
Issue Date: | 10-Jul-2023 |
Title: | Sistema de classificação de imagens utilizando uma rede neural Squeezenet embarcada em uma Raspberry Pi |
Creator: | SILVA, Kamilla Taiwhscki Barros |
First advisor: | SILVA, Cleison Daniel |
Citation: | SILVA, Kamilla Taiwhscki Barros. Sistema de classificação de imagens utilizando uma rede neural Squeezenet embarcada em uma Raspberry Pi. Orientador: Cleison Daniel Silva. 2023. 72 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) – Campus Universitário de Tucuruí, Universidade Federal do Pará, Tucuruí, 2023. Disponível em: https://bdm.ufpa.br:8443/jspui/handle/prefix/5880. Acesso em:. |
Resumo: | A Visão Computacional é um campo da Inteligência Artificial caracterizado pelo estudo das informações existentes em imagens, identificando suas características intrínsecas. O estudo da Visão Computacional tem como objetivo a criação de modelos artificiais que imitem as habilidades analíticas da visão humana, para isso são utilizados conceitos de Processamento Digital de Imagens para extrair informações a serem estudadas. Realizar essas operações exige uma grande quantidade de dados para ser efetiva e para isso necessitam-se de algoritmos capazes de processarem essas informações. Nesse contexto, algoritmos de Aprendizado Profundo são ideais para trabalharem com uma imensa quantidade de dados, visto estes possuem eficiência e eficácia para tal. Dessa forma, o uso de Redes Neurais para este propósito se torna bastante adequado, pois essa ferramenta permite que seja possível aprender a partir de um conjunto de exemplos de forma que a generalização dos dados seja adequada aos exemplos fornecidos. No caso de imagens, Redes Neurais Convolucionais são o estado da arte na área de Visão Computacional, sendo possível observar diversas aplicações que envolvem a classificação de imagens, identificação de objetos e reconhecimento de faces. Porém, esses algoritmos são robustos e apresentam uma complexa implementação, possuindo diversos parâmetros livres que são determinados durante a execução, exigindo que o hardware que o comporta possua elevada capacidade computacional para funcionar sem erros ou com tempo de execução exacerbado. Para o caso de sistemas embarcados que necessitam de baixo custo de implementação, computadores de placa única são comumente adotados, considerando que tais hardwares podem ser aplicados em diversos contextos e possuem baixo custo de execução. Todavia, esses dispositivos são restritos em relação ao poder computacional e é necessário um grande estudo das técnicas que permitam a execução de algoritmos complexos em seus hardwares. Dessa forma, este trabalho tem o intuito de apresentar um exemplo de implementação de um classificador de imagens em um Computador de Placa Única com uma Rede Neural Convolucional (CNN) sendo executada. São expostos os conceitos de CNNs e de Processamento Digital de Imagens utilizados durante o desenvolvimento do projeto. O classificador desenvolvido captura imagens de dígitos manuscritos e classifica-os em tempo real em 10 classes distribuídas de 0 a 9. Além disso, demonstra-se as técnicas de Processamento Digital de Imagens desenvolvidas, que utilizam o Filtro Gaussiano para aproximar as imagens utilizadas para o treinamento da CNN e as imagens utilizadas durante o teste do classificador embarcado. Os resultados da classificação do sistema demonstram-se razoáveis para o cenário estabelecido, sendo resultados relevantes para o trabalho em questão, em especial ao que diz respeito a acurácia de classificação do sistema de 76% e uma precisão de 80% ao classificar as imagens. |
Abstract: | Computer Vision is a field of Artificial Intelligence characterized by the study of existing information in images, identifying their intrinsic characteristics. The study of Computer Vision aims to create artificial models that mimic the analytical skills of human vision, for this, concepts of Digital Image Processing are used to extract information to be studied. Performing these operations requires a large amount of data to be effective and for that, algorithms capable of processing this information are needed. In this context, Deep Learning algorithms are ideal for working with a huge amount of data, as they are efficient and effective. In this way, the use of Neural Networks for this purpose becomes quite suitable, as this tool allows it to be possible to learn from a set of examples so that the generalization of the data is adequate to the examples provided. In the case of images, Convolutional Neural Networks are the state of the art in the area of Computer Vision, and it is possible to observe several applications involving image classification, object identification and face recognition. However, these algorithms are robust and have a complex implementation, having several free parameters that are determined during execution, requiring that the hardware that supports it has high computational capacity to function without errors or with exacerbated execution time. For the case of embedded systems that require low implementation cost, single board computers are commonly adopted, considering that such hardware can be applied in different contexts and have low execution cost. However, these devices are restricted in terms of computational power and a major study of techniques that allow the execution of complex algorithms on their hardware is necessary. Thus, this work aims to present an example of implementation of an image classifier in a Single Board Computer with a Convolutional Neural Network (CNN) running. The concepts of CNNs and Digital Image Processing used during the development of the project are exposed. The developed classifier captures images of handwritten digits and classifies them in real time into 10 classes distributed from 0 to 9. In addition, the developed Digital Image Processing techniques are demonstrated, which use the Gaussian Filter to approximate the images used to the CNN training and the images used during the test of the embedded classifier. The results of the system’s classification prove to be reasonable for the established scenario, being relevant results for the work in question, in particular with regard to the classification accuracy of the system of 76% and a precision of 80% when classifying the images. |
CNPq: | CNPQ::ENGENHARIAS CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::ANALISE DE ALGORITMOS E COMPLEXIDADE DE COMPUTACAO |
Keywords: | Aprendizado de máquina Classificação Raspberry Pi MNIST Machine Learning Classification |
Type of access: | Acesso Aberto |
URI Source: | Disponível na Internet via Sagitta |
Appears in Collections: | Faculdade de Engenharia da Computação - FECOMP/CAMTUC |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
TCC_SistemaClassificacaoImagens.pdf | 5,39 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License