Author:
Juchneski Márcio,Moura Eudoxia Lottie Silva,Resmini Roger,Conci Aura
Abstract
Este trabalho concentra-se na verificação da importância da completude dos metadados em sistemas de auxílio ao diagnóstico de mamas. Objetiva-se investigar a possibilidade de utilizar abordagens já conhecidas para tratar dados faltantes e verificar sua influência na classificação dos exames. Para se ter um exemplo em um caso real é utilizado o Dataset for Mastologic Research (DMR), desenvolvido e disponibilizado no IC/UFF. Esse conjunto além dos dados clínicos imagens térmicas da mama, mamografias e diagnósticos. Após uma revisão bibliográfica de possíveis técnicas a Hot Deck se mostrou a mais adequada para uma comparação com a simples exclusão dos atributos com muitos dados faltantes na classificação dos casos com diagnóstico comprovado. No entanto, seu uso na classificação entre pacientes normais ou com algum problema nas mamas, com todo o dataset fez com que o resultado final tivesse 94% de acerto na Área Sob a Curva Receiver Operating Characteristic (AUC) versus 92% nos casos em que os seis atributos com maior quantidade de dados faltantes fossem simplesmente desconsiderados.
Publisher
Sociedade Brasileira de Computação - SBC