Um novo método para seleção de variáveis preditivas com base em índices de importância

O grande volume de variáveis coletadas em processos industriais impõe dificuldades ao controle e monitoramento de tais processos. A regressão PLS (partial least squares) vem sendo amplamente utilizada em procedimentos de seleção de variáveis por sua capacidade de operar com grande número de variávei...

Full description

Saved in:
Bibliographic Details
Main Authors: Juliano Zimmer, Michel José Anzanello
Format: Article
Language:English
Published: Associação Brasileira de Engenharia de Produção (ABEPRO) 2013-06-01
Series:Production
Subjects:
Online Access:http://www.scielo.br/pdf/prod/v24n1/aop_t6_0002_0792.pdf
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:O grande volume de variáveis coletadas em processos industriais impõe dificuldades ao controle e monitoramento de tais processos. A regressão PLS (partial least squares) vem sendo amplamente utilizada em procedimentos de seleção de variáveis por sua capacidade de operar com grande número de variáveis correlacionadas e afetadas por ruído. Este artigo propõe um método para identificar o melhor subconjunto de variáveis de processo para a predição das variáveis de resposta. Indicadores de importância das variáveis são desenvolvidos a partir de parâmetros da regressão PLS e guiam a eliminação das variáveis irrelevantes. Tais índices são então testados em termos de seu desempenho. Ao ser aplicado em cinco bancos de dados industriais, o método utilizando o índice recomendado reteve apenas 31% das variáveis originais e aumentou a acurácia de predição do conjunto de teste em 6%. O método proposto também superou a acurácia do método Stepwise, tradicionalmente utilizado em procedimentos de seleção com propósitos de predição.
ISSN:1980-5411