Investor's wiki

regressão passo a passo

regressão passo a passo

O que é regressão gradual?

A regressão passo a passo é a construção iterativa passo a passo de um modelo de regressão que envolve a seleção de variáveis independentes a serem usadas em um modelo final. Envolve adicionar ou remover possíveis variáveis explicativas em sucessão e testar a significância estatística após cada iteração.

A disponibilidade de pacotes de software estatístico possibilita a regressão gradual, mesmo em modelos com centenas de variáveis.

Tipos de regressão gradual

O objetivo subjacente da regressão stepwise é, através de uma série de testes (por exemplo, testes F, testes t ) encontrar um conjunto de variáveis independentes que influenciam significativamente a variável dependente. Isso é feito com computadores por meio de iteração, que é o processo de chegar a resultados ou decisões passando por repetidas rodadas ou ciclos de análise. A realização de testes automaticamente com a ajuda de pacotes de software estatístico tem a vantagem de economizar tempo e limitar erros.

A regressão passo a passo pode ser alcançada experimentando uma variável independente de cada vez e incluindo-a no modelo de regressão se for estatisticamente significativa ou incluindo todas as variáveis independentes potenciais no modelo e eliminando aquelas que não são estatisticamente significativas. Alguns usam uma combinação de ambos os métodos e, portanto, existem três abordagens para a regressão gradual:

  1. A seleção direta começa sem variáveis no modelo, testa cada variável à medida que é adicionada ao modelo e, em seguida, mantém aquelas consideradas estatisticamente mais significativas — repetindo o processo até que os resultados sejam ótimos.

  2. A eliminação para trás começa com um conjunto de variáveis independentes, excluindo uma de cada vez e, em seguida, testando se a variável removida é estatisticamente significativa.

  3. Eliminação bidirecional é uma combinação dos dois primeiros métodos que testam quais variáveis devem ser incluídas ou excluídas.

exemplo

Um exemplo de regressão passo a passo usando o método de eliminação para trás seria uma tentativa de entender o uso de energia em uma fábrica usando variáveis como tempo de execução do equipamento, idade do equipamento, tamanho da equipe, temperaturas externas e época do ano. O modelo inclui todas as variáveis - então cada uma é removida, uma de cada vez, para determinar qual é menos significativa estatisticamente. No final, o modelo pode mostrar que a época do ano e as temperaturas são mais significativas, possivelmente sugerindo que o pico de consumo de energia na fábrica é quando o uso do ar condicionado é mais alto.

Limitações da regressão gradual

A análise de regressão, tanto linear quanto multivariada, é amplamente utilizada no mundo da economia e dos investimentos atualmente. A ideia é muitas vezes encontrar padrões que existiram no passado que também podem se repetir no futuro. Uma regressão linear simples, por exemplo, pode observar as relações preço-lucro e os retornos das ações ao longo de muitos anos para determinar se as ações com baixos índices P/L (variável independente) oferecem retornos mais altos (variável dependente). O problema com essa abordagem é que as condições de mercado muitas vezes mudam e os relacionamentos que se mantiveram no passado não necessariamente se mantêm verdadeiros no presente ou no futuro.

Enquanto isso, o processo de regressão gradual tem muitos críticos e há até mesmo pedidos para parar de usar o método completamente. Os estatísticos observam várias desvantagens da abordagem, incluindo resultados incorretos, um viés inerente ao próprio processo e a necessidade de poder computacional significativo para desenvolver modelos de regressão complexos por meio de iteração.

##Destaques

  • A regressão passo a passo tem suas desvantagens, no entanto, pois é uma abordagem que ajusta os dados em um modelo para alcançar o resultado desejado.

  • O método de eliminação para trás começa com um modelo completo carregado com várias variáveis e, em seguida, remove uma variável para testar sua importância em relação aos resultados gerais.

  • A regressão passo a passo é um método que examina iterativamente a significância estatística de cada variável independente em um modelo de regressão linear.

  • A abordagem de seleção direta começa com nada e adiciona cada nova variável de forma incremental, testando a significância estatística.