regressão passo a passo
O que é regressão gradual?
A regressão passo a passo é a construção iterativa passo a passo de um modelo de regressão que envolve a seleção de variáveis independentes a serem usadas em um modelo final. Envolve adicionar ou remover possÃveis variáveis explicativas em sucessão e testar a significância estatÃstica após cada iteração.
A disponibilidade de pacotes de software estatÃstico possibilita a regressão gradual, mesmo em modelos com centenas de variáveis.
Tipos de regressão gradual
O objetivo subjacente da regressão stepwise é, através de uma série de testes (por exemplo, testes F, testes t ) encontrar um conjunto de variáveis independentes que influenciam significativamente a variável dependente. Isso é feito com computadores por meio de iteração, que é o processo de chegar a resultados ou decisões passando por repetidas rodadas ou ciclos de análise. A realização de testes automaticamente com a ajuda de pacotes de software estatÃstico tem a vantagem de economizar tempo e limitar erros.
A regressão passo a passo pode ser alcançada experimentando uma variável independente de cada vez e incluindo-a no modelo de regressão se for estatisticamente significativa ou incluindo todas as variáveis independentes potenciais no modelo e eliminando aquelas que não são estatisticamente significativas. Alguns usam uma combinação de ambos os métodos e, portanto, existem três abordagens para a regressão gradual:
A seleção direta começa sem variáveis no modelo, testa cada variável à medida que é adicionada ao modelo e, em seguida, mantém aquelas consideradas estatisticamente mais significativas — repetindo o processo até que os resultados sejam ótimos.
A eliminação para trás começa com um conjunto de variáveis independentes, excluindo uma de cada vez e, em seguida, testando se a variável removida é estatisticamente significativa.
Eliminação bidirecional é uma combinação dos dois primeiros métodos que testam quais variáveis devem ser incluÃdas ou excluÃdas.
exemplo
Um exemplo de regressão passo a passo usando o método de eliminação para trás seria uma tentativa de entender o uso de energia em uma fábrica usando variáveis como tempo de execução do equipamento, idade do equipamento, tamanho da equipe, temperaturas externas e época do ano. O modelo inclui todas as variáveis - então cada uma é removida, uma de cada vez, para determinar qual é menos significativa estatisticamente. No final, o modelo pode mostrar que a época do ano e as temperaturas são mais significativas, possivelmente sugerindo que o pico de consumo de energia na fábrica é quando o uso do ar condicionado é mais alto.
Limitações da regressão gradual
A análise de regressão, tanto linear quanto multivariada, é amplamente utilizada no mundo da economia e dos investimentos atualmente. A ideia é muitas vezes encontrar padrões que existiram no passado que também podem se repetir no futuro. Uma regressão linear simples, por exemplo, pode observar as relações preço-lucro e os retornos das ações ao longo de muitos anos para determinar se as ações com baixos Ãndices P/L (variável independente) oferecem retornos mais altos (variável dependente). O problema com essa abordagem é que as condições de mercado muitas vezes mudam e os relacionamentos que se mantiveram no passado não necessariamente se mantêm verdadeiros no presente ou no futuro.
Enquanto isso, o processo de regressão gradual tem muitos crÃticos e há até mesmo pedidos para parar de usar o método completamente. Os estatÃsticos observam várias desvantagens da abordagem, incluindo resultados incorretos, um viés inerente ao próprio processo e a necessidade de poder computacional significativo para desenvolver modelos de regressão complexos por meio de iteração.
##Destaques
A regressão passo a passo tem suas desvantagens, no entanto, pois é uma abordagem que ajusta os dados em um modelo para alcançar o resultado desejado.
O método de eliminação para trás começa com um modelo completo carregado com várias variáveis e, em seguida, remove uma variável para testar sua importância em relação aos resultados gerais.
A regressão passo a passo é um método que examina iterativamente a significância estatÃstica de cada variável independente em um modelo de regressão linear.
A abordagem de seleção direta começa com nada e adiciona cada nova variável de forma incremental, testando a significância estatÃstica.