Sistema de classificação de imagens utilizando uma rede neural Squeezenet embarcada em uma Raspberry Pi

SILVA, Kamilla Taiwhscki Barros

Sistema de classificação de imagens utilizando uma rede neural Squeezenet embarcada em uma Raspberry Pi

Arquivo(s)

TCC_SistemaClassificacaoImagens.pdf (5.26 MB)

Tipo de Documento

Trabalho de Curso - Graduação - Monografia

Data

10-07-2023

Autor(es)

SILVA, Kamilla Taiwhscki Barros

Orientador(es)

SILVA, Cleison Daniel

Tipo de acesso

Acesso Aberto

Citar como

SILVA, Kamilla Taiwhscki Barros. Sistema de classificação de imagens utilizando uma rede neural Squeezenet embarcada em uma Raspberry Pi. Orientador: Cleison Daniel Silva. 2023. 72 f. Trabalho de Curso (Bacharelado em Engenharia da Computação) – Faculdade de Engenharia da Computação, Campus Universitário de Tucuruí, Universidade Federal do Pará, Tucuruí, 2023. Disponível em: https://bdm.ufpa.br:8443/jspui/handle/prefix/5880. Acesso em:.

A Visão Computacional é um campo da Inteligência Artificial caracterizado pelo estudo das informações existentes em imagens, identificando suas características intrínsecas. O estudo da Visão Computacional tem como objetivo a criação de modelos artificiais que imitem as habilidades analíticas da visão humana, para isso são utilizados conceitos de Processamento Digital de Imagens para extrair informações a serem estudadas. Realizar essas operações exige uma grande quantidade de dados para ser efetiva e para isso necessitam-se de algoritmos capazes de processarem essas informações. Nesse contexto, algoritmos de Aprendizado Profundo são ideais para trabalharem com uma imensa quantidade de dados, visto estes possuem eficiência e eficácia para tal. Dessa forma, o uso de Redes Neurais para este propósito se torna bastante adequado, pois essa ferramenta permite que seja possível aprender a partir de um conjunto de exemplos de forma que a generalização dos dados seja adequada aos exemplos fornecidos. No caso de imagens, Redes Neurais Convolucionais são o estado da arte na área de Visão Computacional, sendo possível observar diversas aplicações que envolvem a classificação de imagens, identificação de objetos e reconhecimento de faces. Porém, esses algoritmos são robustos e apresentam uma complexa implementação, possuindo diversos parâmetros livres que são determinados durante a execução, exigindo que o hardware que o comporta possua elevada capacidade computacional para funcionar sem erros ou com tempo de execução exacerbado. Para o caso de sistemas embarcados que necessitam de baixo custo de implementação, computadores de placa única são comumente adotados, considerando que tais hardwares podem ser aplicados em diversos contextos e possuem baixo custo de execução. Todavia, esses dispositivos são restritos em relação ao poder computacional e é necessário um grande estudo das técnicas que permitam a execução de algoritmos complexos em seus hardwares. Dessa forma, este trabalho tem o intuito de apresentar um exemplo de implementação de um classificador de imagens em um Computador de Placa Única com uma Rede Neural Convolucional (CNN) sendo executada. São expostos os conceitos de CNNs e de Processamento Digital de Imagens utilizados durante o desenvolvimento do projeto. O classificador desenvolvido captura imagens de dígitos manuscritos e classifica-os em tempo real em 10 classes distribuídas de 0 a 9. Além disso, demonstra-se as técnicas de Processamento Digital de Imagens desenvolvidas, que utilizam o Filtro Gaussiano para aproximar as imagens utilizadas para o treinamento da CNN e as imagens utilizadas durante o teste do classificador embarcado. Os resultados da classificação do sistema demonstram-se razoáveis para o cenário estabelecido, sendo resultados relevantes para o trabalho em questão, em especial ao que diz respeito a acurácia de classificação do sistema de 76% e uma precisão de 80% ao classificar as imagens.