Author:
Ferreira Tarcísio Lima,Oliveira Marcelo Costa,Vieira Thales Miranda de Almeida
Abstract
O câncer do pulmão é o segundo câncer mais frequentemente diagnosticado. Representa a forma mais mortal de neoplasia maligna, resultando em cerca de 1,8 milhão de mortes em 2020. O Lung-RADS é uma diretriz utilizada para o rastreio e o acompanhamento de lesões pulmonares suspeitas. Neste contexto, o principal objetivo deste trabalho é avaliar a eficácia de três técnicas de Reconhecimento de Entidades Nomeadas, CNN, BiLSTM e BERT, para extrair características de nódulos pulmonares em relatórios de TC de tórax e calcular o índice de probabilidade de malignidade usando a diretriz Lung-RADS. O nosso modelo com melhor desempenho foi o BiLSTM-CRF, que obteve uma precisão de 96%, uma revocação de 88% e um F1-score de 90%.
Publisher
Sociedade Brasileira de Computação - SBC
Reference24 articles.
1. (2023). Lung ct screening reporting data system. [link]. Accessed: 2023-05-01.
2. Beyer, S. E., McKee, B. J., Regis, S. M., McKee, A. B., Flacke, S., El Saadawi, G., and Wald, C. (2017). Automatic Lung-RADS™ classification with a natural language processing system. J Thorac Dis, 9(9):3114–3122.
3. da Rocha, N. C., Barbosa, A. M. P., Schnr, Y. O., Machado-Rugolo, J., de Andrade, L. G. M., Corrente, J. E., and de Arruda Silveira, L. V. (2023). Natural language processing to extract information from portuguese-language medical records. Data, 8(1).
4. Devlin, J., Chang, M., Lee, K., and Toutanova, K. (2018). BERT: pre-training of deep bidirectional transformers for language understanding. CoRR, abs/1810.04805.
5. Fei, X., Chen, P., Wei, L., Huang, Y., Xin, Y., and Li, J. (2022). Quality management of pulmonary nodule radiology reports based on natural language processing. Bioengineering (Basel), 9(6).