Um Framework para a classificação de imagens em fluxos de dados utilizando aprendizado profundo

Authors

  • Orlando da Silva Junior
  • Jorge Rady de Almeida Junior

DOI:

https://doi.org/10.55905/oelv22n3-013

Keywords:

aprendizado profundo, classificação de imagens, redes neurais convolucionais, fluxos de dados

Abstract

A classificação de imagens é uma das principais tarefas da visão computacional, tendo como solução trivial o uso de algoritmos de aprendizado profundo. No entanto, a classificação de imagens em fluxos de dados continua sendo um desafio, pois o modelo de decisão requer que as imagens sejam aprendidas em tempo de processamento constante e sem que a rede neural esqueça o que foi aprendido. Neste trabalho, apresentamos um framework para a classificação de imagens em fluxos de dados utilizando aprendizado profundo. Avaliamos a capacidade preditiva do framework em classificar novas imagens a partir de um conjunto de experimentos sobre três bases de imagens distintas e comparamos os resultados com os obtidos por métodos do estado-da-arte. Os resultados mostram que o nosso framework supera os métodos comparados quando o lote seleciona um número maior de imagens para serem treinadas pela rede neural.

References

CHU, D.; LIAO, L.-Z.; NG, M. K.-P.; WANG, X. Incremental linear discriminant analysis: A fast algorithm and comparisons. IEEE transactions on neural networks and learning systems, IEEE, v. 26, n. 11, p. 2716–2735, 2015.

HAYES, T. L.; CAHILL, N. D.; KANAN, C. Memory efficient experience replay for streaming learning. In: IEEE. 2019 International Conference on Robotics and Automation (ICRA). [S.l.], 2019. p. 9769–9776. HAYES, T. L.; KANAN, C. Lifelong machine learning with deep streaming linear discriminant analysis. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. [S.l.: s.n.], 2020. p. 220–221.

HE, K.; ZHANG, X.; REN, S.; SUN, J. Deep residual learning for image recognition. In: Proceedings of the IEEE conference on computer vision and pattern recognition. [S.l.: s.n.], 2016. p. 770–778.

JAMES, G.; WITTEN, D.; HASTIE, T.; TIBSHIRANI, R.; TAYLOR, J. An Introduction to Statistical Learning with Applications in Python. [S.l.]: Springer, 2023.

KRIZHEVSKY, A.; HINTON, G. et al. Learning multiple layers of features from tiny images. Toronto, ON, Canada, 2009.

LECUN, Y.; CORTES, C.; BURGES, C. et al. MNIST handwritten digit database. [S.l.]: Florham Park, NJ, USA, 2010.

MAI, Z.; LI, R.; JEONG, J.; QUISPE, D.; KIM, H.; SANNER, S. Online continual learning in image classification: An empirical survey. Neurocomputing, Elsevier, v. 469, p. 28–51, 2022.

O’MAHONY, N.; CAMPBELL, S.; CARVALHO, A.; HARAPANAHALLI, S.; HERNANDEZ, G. V.; KRPALKOVA, L.; RIORDAN, D.; WALSH, J. Deep learning vs. traditional computer vision. In: SPRINGER. Advances in Computer Vision: Proceedings of the 2019 Computer Vision Conference (CVC), Volume 1 1. [S.l.], 2020. p. 128–144.

PANG, S.; OZAWA, S.; KASABOV, N. Incremental linear discriminant analysis for classification of data streams. IEEE transactions on Systems, Man, and Cybernetics, part B (Cybernetics), IEEE, v. 35, n. 5, p. 905–914, 2005.

RUSSAKOVSKY, O.; DENG, J.; SU, H.; KRAUSE, J.; SATHEESH, S.; MA, S.; HUANG, Z.; KARPATHY, A.; KHOSLA, A.; BERNSTEIN, M. et al. Imagenet large scale visual recognition challenge. International journal of computer vision, Springer, v. 115, p. 211–252, 2015.

SIMONYAN, K.; ZISSERMAN, A. Very deep convolutional networks for large-scale image recognition. arXiv preprint arXiv:1409.1556, 2014.

SINGLA, A.; YUAN, L.; EBRAHIMI, T. Food/non-food image classification and food categorization using pre-trained googlenet model. In: Proceedings of the 2nd International Workshop on Multimedia Assisted Dietary Management. [S.l.: s.n.], 2016. p. 3–11.

SZEGEDY, C.; LIU, W.; JIA, Y.; SERMANET, P.; REED, S.; ANGUELOV, D.; ERHAN, D.; VANHOUCKE, V.; RABINOVICH, A. Going deeper with convolutions. In: Proceedings of the IEEE conference on computer vision and pattern recognition. [S.l.: s.n.], 2015. p. 1–9.

Published

2024-03-01

How to Cite

da Silva Junior, O., & de Almeida Junior, J. R. (2024). Um Framework para a classificação de imagens em fluxos de dados utilizando aprendizado profundo. OBSERVATÓRIO DE LA ECONOMÍA LATINOAMERICANA, 22(3), e3570. https://doi.org/10.55905/oelv22n3-013

Issue

Section

Articles

Most read articles by the same author(s)