Author:
Holsbach Nicole,Fogliatto Flávio Sanson,Anzanello Michel Jose
Abstract
Na maioria dos países, o câncer de mama entre as mulheres é predominante. Se diagnosticado precocemente, apresenta alta probabilidade de cura. Diversas abordagens baseadas em Estatística foram desenvolvidas para auxiliar na sua detecção precoce. Este artigo apresenta um método para a seleção de variáveis para classificação dos casos em duas classes de resultado, benigno ou maligno, baseado na análise citopatológica de amostras de célula da mama de pacientes. As variáveis são ordenadas de acordo com um novo índice de importância de variáveis que combina os pesos de importância da Análise de Componentes Principais e a variância explicada a partir de cada componente retido. Observações da amostra de treino são categorizadas em duas classes através das ferramentas k-vizinhos mais próximos e Análise Discriminante, seguida pela eliminação da variável com o menor índice de importância. Usa-se o subconjunto com a máxima acurácia para classificar as observações na amostra de teste. Aplicando ao Wisconsin Breast Cancer Database, o método proposto apresentou uma média de 97,77% de acurácia de classificação, retendo uma média de 5,8 variáveis.
Subject
Public Health, Environmental and Occupational Health,Health Policy
Reference33 articles.
1. Global estimates of cancer prevalence for 27 sites in the adult population in 2008;Bray F;Int J Cancer,2013
2. IARC Handbooks of Cancer Prevention. Vol. 7 . Breast Cancer Screening,2002
3. Cancer control: knowledge into action: WHO guide for effective programmes: early detection.,2007
4. Informações de saúde. Indicadores de saúde. [site da Internet],2011
5. Controle do Câncer de Mama. Documento de Consenso. INCA [site na Internet],2004
Cited by
6 articles.
订阅此论文施引文献
订阅此论文施引文献,注册后可以免费订阅5篇论文的施引文献,订阅后可以查看论文全部施引文献