Author:
Bertolde Adelmo Inacio,Quinelato Luiz Henrique,Arruda Iara,Siqueira Priscilla Carminati,Cerqueira Vieira Anne Caroline,Sales Carolina Maia Martins
Abstract
Introdução: Modelos para identificação de padrões usam correlações para predizer desfechos de doenças. Se inseri nesse tema a Tuberculose (TB), uma doença infecciosa e transmissível, e uma das principais causas de morbimortalidade. Em 2020, no mundo, cerca de 9,9 milhões de pessoas adoeceu com TB, e 1,3 milhão foram a óbito. Objetivo: Nesse trabalho foram aplicadas técnicas de Machine Learning para predizer o desfecho da TB no Brasil. Métodos: Os dados utilizados foram extraídos do SINAM, de pacientes notificados com TB no período de 2016 a 2018 no Brasil. O desfecho foi tratado como binomial (Cura ou Não Cura) e trinomial (Cura, Abandono ou Óbito). Resultados: para modelos com resposta trinomial sem balanceamento, o que apresentou o melhor grau de ajuste foi via imputação missForest, com modelo de classificação Árvore de Decisão (acurácia de 0.8327 e índice Kappa de 0.2782). Ainda nessa classe de modelos, porém, com balanceamento, o modelo de melhor grau de ajuste, também via imputação missForest, foi o Floresta Aleatória (acurácia de 0.6723 e Kappa de 0,5068). Dos modelos com resposta binomial, os mesmos modelos tiveram os melhores ajustes, com imputação missForest e com balanceamento, sendo Árvore de Decisão (acurácia de 0,7267 e Kappa de 0.4376) e Floresta Aleatória (acurácia de 0.8349 e Kappa de 0.3257). Conclusão: Os achados permitem concluir que o uso de modelos de Machine Learning, com uso de imputação e balanceamento dos dados, podem ser um instrumento eficiente para predizer o desfecho do tratamento de TB no Brasil.
Publisher
South Florida Publishing LLC
Cited by
1 articles.
订阅此论文施引文献
订阅此论文施引文献,注册后可以免费订阅5篇论文的施引文献,订阅后可以查看论文全部施引文献