Affiliation:
1. Universidade Federal do Rio Grande do Sul, Brasil
Abstract
Bancos de dados caracterizados por elevado número de variáveis correlacionadas são usualmente encontrados em ambientes industriais, dificultando a identificação das variáveis de processo mais relevantes. A regressão por quadrados parciais mínimos (Partial Least Square - PLS) tem sido amplamente utilizada para a seleção de variáveis com propósitos de predição. No entanto, muitas aplicações práticas priorizam a correta categorização de lotes produtivos em classes, de acordo com determinada especificação do produto final. Neste artigo, a regressão PLS é integrada às ferramentas de classificação z vizinhos mais próximos (z-Nearest Neighbor) e máquina de suporte vetorial (Support Vector Machine) com visando a seleção de variáveis para fins de categorização de bateladas de produção em duas classes. Índices de Importância das Variáveis (IIV) baseados nos parâmetros da regressão PLS são desenvolvidos para o ordenamento das variáveis de processo, de acordo com sua relevância para a caracterização da variável de produto, e então integrados às ferramentas de classificação. O subconjunto de variáveis retidas é identificado através do monitoramento do perfil de acurácia gerado com a remoção sistemática das variáveis menos relevantes. Aplicada em três bancos de dados, a metodologia proposta reduziu o número de variáveis de processo necessárias para classificação de bateladas em 90,6% e elevou a acurácia média de classificação em 29,2%, quando comparada à aplicação de ferramentas de classificação na totalidade das variáveis.
Subject
Industrial and Manufacturing Engineering,Business and International Management
Reference29 articles.
1. Partial Least Squares (PLS) Regression, in Encyclopedia of Social Sciences Research Methods;ABDI H.,2003
2. Selecting the best variables for classifying production batches into two quality levels;ANZANELLO M.;Chemometrics and Intelligent Laboratory Systems,2009
3. On the time series k-nearest neighbor classification of abnormal brain activity;CHAOVALITWONGSE W.;IEEE Transactions on Systems, Man and Cybernetics A,2007
4. Performance of some variable selection methods when multicollinearity is present;CHONG I.;Chemometrics and Intelligent Laboratory Systems,2005
5. An Introduction to Support Vector Machines and other kernel-based learning methods;CRISTIANINI N.,2000
Cited by
1 articles.
订阅此论文施引文献
订阅此论文施引文献,注册后可以免费订阅5篇论文的施引文献,订阅后可以查看论文全部施引文献