Predição do desfecho de pacientes com Tuberculose

Authors

  • Adelmo Inacio Bertolde
  • Luiz Henrique Quinelato
  • Iara Arruda
  • Priscilla Carminati Siqueira
  • Anne Caroline Cerqueira Vieira
  • Carolina Maia Martins Sales

DOI:

https://doi.org/10.55905/oelv21n9-094

Keywords:

aprendizado de máquina, tuberculose, modelos estatísticos

Abstract

Introdução: Modelos para identificação de padrões usam correlações para predizer desfechos de doenças. Se inseri nesse tema a Tuberculose (TB), uma doença infecciosa e transmissível, e uma das principais causas de morbimortalidade. Em 2020, no mundo, cerca de 9,9 milhões de pessoas adoeceu com TB, e 1,3 milhão foram a óbito.  Objetivo: Nesse trabalho foram aplicadas técnicas de Machine  Learning  para predizer o desfecho da TB no Brasil.  Métodos: Os dados utilizados foram extraídos do SINAM, de pacientes notificados com TB no período de 2016 a 2018 no Brasil.  O desfecho foi tratado como binomial (Cura ou Não Cura) e trinomial (Cura, Abandono ou Óbito).  Resultados: para modelos com resposta trinomial sem balanceamento, o que apresentou o melhor grau de ajuste foi via imputação missForest, com modelo de classificação Árvore de Decisão (acurácia de  0.8327 e índice Kappa de  0.2782). Ainda nessa classe de modelos, porém, com balanceamento, o modelo de melhor grau de ajuste, também via imputação missForest, foi o Floresta  Aleatória (acurácia  de  0.6723 e  Kappa  de 0,5068). Dos modelos com resposta binomial, os mesmos modelos tiveram os melhores ajustes, com imputação missForest e com balanceamento, sendo Árvore  de  Decisão (acurácia de 0,7267 e Kappa de 0.4376) e Floresta  Aleatória (acurácia de 0.8349 e Kappa de 0.3257).  Conclusão: Os achados permitem concluir que o uso de modelos de Machine  Learning, com uso de imputação e balanceamento dos dados, podem ser um instrumento eficiente para predizer o desfecho do tratamento de TB no Brasil.

References

WHO. World Health Organization Global Tuberculosis Report 2021. Geneva: WHO; 2021 [citado em: 10 jul. 2022]. Disponivel em: https://www.who.int/publications/digital/global-tuberculosis-report-2021.

Ministério da Saúde. Brasil reduz em 8% o número de mortes por tuberculose na última década. Disponível em: https://www.saude.gov.br/noticias/agencia-saude/46592-brasil-reduz-em-8-o-numero-de-mortes-por-tuberculose-na-ultima-decada. Acesso em: 11/Abril. 2020.

SAS. Machine Learning O que é qual sua importância? 2019. Disponível em https://www.sas.com/ptr/insights/analytics/machine−learning.html >.Acesso em: 10/Abril. 2020.

Belo EN, Orellana JDY, Levino A, Basta PC. Tuberculose nos municípios amazonenses da fronteira Brasil-Colômbia-Peru-Venezuela: situação epidemiológica e fatores associados ao abandono. Rev Panam Salud Publica. 2013; 34(5):321–9.

Swaminathan S, Pasipanodya JG, Ramachandran G, Hemanth Kumar AK, Srivastava S, Deshpande D, Nuermberger E, Gumbo T. Drug Concentration Thresholds Predictive of Therapy Failure and Death in Children With Tuberculosis: Bread Crumb Trails in Random Forests. Clin Infect Dis. 2016 Nov 1;63(suppl 3):S63-S74. doi: 10.1093/cid/ciw471. PMID: 27742636; PMCID: PMC5064152.

Singh H, Ramamohan V. A model-based investigation into urban-rural disparities in tuberculosis treatment outcomes under the Revised National Tuberculosis Control Programme in India. PLoS One. 2020 Feb 14;15(2):e0228712. doi: 10.1371/journal.pone.0228712. PMID: 32059003; PMCID: PMC7021308.

Nunes, Luciana Neves, Klück, Mariza Machado e Fachel, Jandyra Maria GuimarãesUso da imputação múltipla de dados faltantes: uma simulação utilizando dados epidemiológicos. Cadernos de Saúde Pública [online]. 2009, v. 25, n. 2 [Acessado 10 Julho 2022] , pp. 268-278. Disponível em: <https://doi.org/10.1590/S0102-311X2009000200005>. Epub 04 Fev 2009. ISSN 1678-4464. https://doi.org/10.1590/S0102-311X2009000200005.

Azur MJ, Stuart EA, Frangakis C, Leaf PJ. Multiple imputation by chained equations: what is it and how does it work? Int J Methods Psychiatr Res.; 20(1):40-9. doi: 10.1002/mpr.329. PMID: 21499542; PMCID: PMC3074241. Mar, 2011.

Daniel J. Stekhoven, Peter Bühlmann, MissForest—non-parametric missing value imputation for mixed-type data, Bioinformatics, Volume 28, Issue 1, Pages 112–118, https://doi.org/10.1093/bioinformatics/btr597. 1 January 2012.

T. Ho, "The Random Subspace Method for Constructing Decision Forests" in IEEE Transactions on Pattern Analysis & Machine Intelligence, vol. 20, no. 08, pp. 832-844, 1998. doi: 10.1109/34.709601

Narayanan, I. Arora, and A. Bhatia. 2013. Fast and accurate sentiment classification using an enhanced Naive Bayes’model. Intelligent Data Engineering and Automated Learning IDEAL function Lecture Notes in Computer Science, 8206:194 - 201.

Agresti, Alan. (2002). Categorical Data Analysis. [S.l.]: New York: Wiley-Interscience. ISBN 0-471-36093-7

Guo, G., Wang, H., Bell, D., Bi, Y., Greer, K. (2003). KNN Model-Based Approach in Classification. In: Meersman, R., Tari, Z., Schmidt, D.C. (eds) On The Move to Meaningful Internet Systems 2003: CoopIS, DOA, and ODBASE. OTM 2003. Lecture Notes in Computer Science, vol 2888. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-540-39964-3_62

MONARD, M. C.; BARANAUSKAS, J. A. Conceitos sobre aprendizado de máquina. In: Sistemas Inteligentes Fundamentos e Aplicações. 1. ed. Barueri-SP: Manole Ltda, 2003. p. 89–114. ISBN 85-204-168.

Breiman, L. Bagging predictors. Mach Learn 24, 123–140 (1996). https://doi.org/10.1007/BF00058655

CHAWLA, Nitesh V. et al. SMOTE: synthetic minority over-sampling technique. Journal of artificial intelligence research, v. 16, p. 321-357, 2002.

Sauer CM, Sasson D, Paik KE, McCague N, Celi LA, Sánchez Fernández I, et al. (2018) Seleção de recursos e previsão de falha no tratamento da tuberculose. PLoS ONE 13(11): e0207491. https://doi.org/10.1371/journal.pone.0207491.

Muhammad Asad, Azhar Mahmood, Muhammad Usman, A machine learning-based framework for Predicting Treatment Failure in tuberculosis: A case study of six countries, Tuberculosis, Volume 123, 2020, 101944, ISSN 1472-9792, https://doi.org/10.1016/j.tube.2020.101944.

Published

2023-09-22

How to Cite

Bertolde, A. I., Quinelato, L. H., Arruda, I., Siqueira, P. C., Cerqueira Vieira, A. C., & Sales, C. M. M. (2023). Predição do desfecho de pacientes com Tuberculose. OBSERVATÓRIO DE LA ECONOMÍA LATINOAMERICANA, 21(9), 12263–12280. https://doi.org/10.55905/oelv21n9-094

Issue

Section

Articles