Investor's wiki

Multicolinearidade

Multicolinearidade

O que é multicolinearidade?

A multicolinearidade é a ocorrência de altas intercorrelações entre duas ou mais variáveis independentes em um modelo de regressão múltipla. A multicolinearidade pode levar a resultados distorcidos ou enganosos quando um pesquisador ou analista tenta determinar quão bem cada variável independente pode ser usada de forma mais eficaz para prever ou entender a variável dependente em um modelo estatístico.

Em geral, a multicolinearidade pode levar a intervalos de confiança mais amplos que produzem probabilidades menos confiáveis em termos do efeito de variáveis independentes em um modelo.

Entendendo a multicolinearidade

analistas estatísticos usam modelos de regressão múltipla para prever o valor de uma variável dependente especificada com base nos valores de duas ou mais variáveis independentes. A variável dependente às vezes é chamada de variável de resultado, alvo ou critério.

Um exemplo é um modelo de regressão multivariada que tenta antecipar os retornos das ações com base em itens como relações preço/lucro (razões P/L), capitalização de mercado, desempenho passado ou outros dados. O retorno das ações é a variável dependente e os vários bits de dados financeiros são as variáveis independentes.

A multicolinearidade em um modelo de regressão múltipla indica que as variáveis independentes colineares estão relacionadas de alguma forma, embora a relação possa ou não ser casual. Por exemplo, o desempenho passado pode estar relacionado à capitalização de mercado,. pois as ações que tiveram bom desempenho no passado terão valores de mercado crescentes.

Em outras palavras, a multicolinearidade pode existir quando duas variáveis independentes são altamente correlacionadas. Também pode acontecer se uma variável independente for calculada a partir de outras variáveis no conjunto de dados ou se duas variáveis independentes fornecerem resultados semelhantes e repetitivos.

Considerações Especiais

Uma das maneiras mais comuns de eliminar o problema da multicolinearidade é primeiro identificar variáveis independentes colineares e depois remover todas menos uma.

Também é possível eliminar a multicolinearidade combinando duas ou mais variáveis colineares em uma única variável. A análise estatística pode então ser conduzida para estudar a relação entre a variável dependente especificada e apenas uma única variável independente.

As inferências estatísticas de um modelo que contém multicolinearidade podem não ser confiáveis.

Exemplos de multicolinearidade

###Investir

Para investir, a multicolinearidade é uma consideração comum ao realizar análises técnicas para prever prováveis movimentos futuros de preços de um título, como uma ação ou um futuro de commodity.

Os analistas de mercado querem evitar o uso de indicadores técnicos colineares, pois são baseados em entradas muito semelhantes ou relacionadas; eles tendem a revelar previsões semelhantes em relação à variável dependente do movimento dos preços. Em vez disso, a análise de mercado deve ser baseada em variáveis independentes marcadamente diferentes para garantir que elas analisem o mercado de diferentes pontos de vista analíticos independentes.

Um exemplo de um potencial problema de multicolinearidade é realizar uma análise técnica usando apenas vários indicadores semelhantes.

O notável analista técnico John Bollinger, criador do indicador Bollinger Bands,. observa que "uma regra fundamental para o uso bem-sucedido da análise técnica requer evitar a multicolinearidade entre os indicadores". Para resolver o problema, os analistas evitam usar dois ou mais indicadores técnicos do mesmo tipo. Em vez disso, eles analisam um título usando um tipo de indicador, como um indicador de momento, e depois fazem uma análise separada usando um tipo diferente de indicador, como um indicador de tendência.

Por exemplo, stochastics,. o índice de força relativa (RSI) e Williams %R são todos indicadores de momento que dependem de entradas semelhantes e provavelmente produzirão resultados semelhantes. Nesse caso, é melhor remover todos os indicadores, exceto um, ou encontrar uma maneira de mesclar vários deles em apenas um indicador, além de adicionar um indicador de tendência que provavelmente não será altamente correlacionado com o indicador de momento.

###Em Biologia

A multicolinearidade também é observada em muitos outros contextos. Um desses contextos é a biologia humana. Por exemplo, a pressão arterial de um indivíduo não é colinear com a idade, mas também com peso, estresse e pulso.

##Destaques

  • A multicolinearidade é um conceito estatístico onde várias variáveis independentes em um modelo são correlacionadas.

  • A multicolinearidade entre variáveis independentes resultará em inferências estatísticas menos confiáveis.

  • É melhor usar variáveis independentes que não sejam correlacionadas ou repetitivas ao construir modelos de regressão múltipla que usam duas ou mais variáveis.

  • Duas variáveis são consideradas perfeitamente colineares se o seu coeficiente de correlação for +/- 1,0.

  • A existência de multicolinearidade em um conjunto de dados pode levar a resultados menos confiáveis devido a erros padrão maiores.

##PERGUNTAS FREQUENTES

Por que a multicolinearidade é um problema?

A multicolinearidade é um problema porque produz resultados do modelo de regressão menos confiáveis. Isso se deve a intervalos de confiança mais amplos ( erros padrão maiores ) que podem diminuir a significância estatística dos coeficientes de regressão.

Como lidar com a multicolinearidade?

Para reduzir a quantidade de multicolinearidade encontrada em um modelo, pode-se remover as variáveis específicas que são identificadas como as mais colineares. Você também pode tentar combinar ou transformar as variáveis problemáticas para diminuir sua correlação. Se isso não funcionar ou for inatingível, existem modelos de regressão modificados que lidam melhor com a multicolinearidade, como a regressão em cume, a regressão de componentes principais ou a regressão de mínimos quadrados parciais.

Como você detecta a multicolinearidade?

Uma técnica estatística chamada fator de inflação de variância (VIF) é usada para detectar e medir a quantidade de colinearidade em um modelo de regressão múltipla.

O que é colinearidade perfeita?

A colinearidade perfeita existe quando há uma correspondência exata de 1:1 entre duas variáveis independentes em um modelo. Isso pode ser uma correlação de +1,0 ou -1,0.