Investor's wiki

Correlação espúria

Correlação espúria

O que é correlação espúria?

Em estatística,. uma correlação espúria (ou espúria) refere-se a uma conexão entre duas variáveis que parece ser causal, mas não é. Com correlação espúria, quaisquer dependências observadas entre as variáveis são meramente devido ao acaso ou ambas estão relacionadas a algum fator de confusão invisível.

Entendendo a correlação espúria

As relações espúrias aparecerão inicialmente para mostrar que uma variável afeta diretamente a outra, mas esse não é o caso. Essa correlação enganosa é frequentemente causada por um terceiro fator que não é aparente no momento do exame, às vezes chamado de fator de confusão.

Quando duas variáveis aleatórias se acompanham de perto em um gráfico, é fácil suspeitar de correlação onde uma mudança em uma variável causa uma mudança na outra variável. Deixando de lado a causalidade, que é outro tópico, essa observação pode levar o leitor do gráfico a acreditar que o movimento da variável A está ligado ao movimento da variável B ou vice-versa.

No entanto, um exame estatístico mais detalhado pode mostrar que os movimentos alinhados são coincidentes ou causados por um terceiro fator que afeta as duas variáveis. Esta é uma correlação espúria. A pesquisa realizada com amostras pequenas ou endpoints arbitrários é particularmente suscetível a espúrias.

Detectando Espúrios

A maneira mais óbvia de identificar uma relação espúria nos resultados da pesquisa é usar o bom senso. Só porque duas coisas ocorrem e parecem estar ligadas não significa que não haja outros fatores em ação. No entanto, para saber com certeza, os métodos de pesquisa são examinados criticamente.

Nos estudos, todas as variáveis que possam impactar os achados devem ser incluídas no modelo estatístico para controlar seu impacto na variável dependente.

Correlação espúria

Muitas relações espúrias podem ser identificadas usando o bom senso. Se uma correlação for encontrada, geralmente há mais de uma variável em jogo, e as variáveis geralmente não são imediatamente óbvias.

Exemplos de Correlação Espúrios

Correlações interessantes são fáceis de encontrar, mas muitas se tornarão espúrias. Três exemplos são a teoria do comprimento da saia, o indicador do super bowl e uma correlação sugerida entre a corrida e as taxas de conclusão da faculdade.

  1. Teoria do Comprimento da Saia: Originada na década de 1920, a teoria do comprimento da saia sustenta que o comprimento da saia e a direção do mercado de ações estão correlacionados. Se os comprimentos das saias forem longos, a correlação é que o mercado de ações está em baixa. Se os comprimentos das camisas são curtos, o mercado está em alta.

  2. Indicador do Super Bowl: No final de janeiro, muitas vezes há conversas sobre o chamado indicador do Super Bowl, o que sugere que uma vitória da equipe da American Football Conference provavelmente significa que o mercado de ações cairá nos próximos ano, enquanto uma vitória da equipe da Conferência Nacional de Futebol pressagia um aumento no mercado. Desde o início da era do Super Bowl, o indicador tem sido preciso em cerca de 74% das vezes, ou 40 dos 54 anos, de acordo com a OpenMarkets. É uma conversa divertida, mas provavelmente não é algo que um consultor financeiro sério recomendaria como estratégia de investimento para clientes.

  3. Desenvolvimento Educacional e Raça: Os cientistas sociais se concentraram em identificar quais variáveis impactam o desempenho educacional. De acordo com pesquisas do governo, 56% dos brancos de 25 a 29 anos concluíram um curso universitário em 2019, em comparação com apenas 36% dos negros da mesma idade. A implicação é que a raça tem um efeito causal nas taxas de conclusão da faculdade.

No entanto, pode não ser a raça em si que afeta o nível educacional. Os resultados também podem ser devidos aos efeitos do racismo na sociedade, que poderia ser a terceira variável “oculta”. O racismo afeta as pessoas de cor, colocando-as em desvantagem educacional e econômica. Por exemplo, as escolas em comunidades não brancas enfrentam maiores desafios e recebem menos financiamento, pais em populações não brancas têm empregos com salários mais baixos e menos recursos para dedicar à educação de seus filhos, e muitas famílias vivem em desertos alimentares e sofrem de desnutrição . Racismo, em vez de raça, pode ser visto como uma variável causal que afeta o nível educacional.

Destaques

  • O aparecimento de uma relação causal é muitas vezes devido a um movimento semelhante em um gráfico que acaba sendo uma coincidência ou causado por um terceiro fator de "confusão".

  • Correlação espúria, ou espúria, ocorre quando dois fatores aparecem casualmente relacionados um ao outro, mas não são.

  • Confirmar uma relação causal requer um estudo que controle todas as variáveis possíveis.

  • Estatísticos e cientistas usam análises estatísticas cuidadosas para determinar relações espúrias.

  • Correlação espúria pode ser causada por tamanhos de amostra pequenos ou endpoints arbitrários.

PERGUNTAS FREQUENTES

O que é regressão espúria?

A regressão espúria é um modelo estatístico que mostra evidências estatísticas enganosas de uma relação linear; em outras palavras, uma correlação espúria entre variáveis independentes não estacionárias.

O que é um exemplo de correlação, mas não de causalidade?

Um exemplo de correlação é que mais sono leva a um melhor desempenho durante o dia. Embora haja uma correlação, não há necessariamente causalidade. Mais sono pode não ser a razão de um indivíduo ter um desempenho melhor; por exemplo, eles podem estar usando uma nova ferramenta de software que está aumentando sua produtividade. Para encontrar a causa, deve haver evidências factuais de um estudo que mostre uma relação causal entre sono e desempenho.

Como identificar uma correlação espúria?

Estatísticos e outros cientistas que analisam dados devem estar atentos a relações espúrias o tempo todo. Existem vários métodos que eles usam para identificá-los, incluindo: - Garantir uma amostra representativa adequada - Obter um tamanho de amostra adequado - Ser cauteloso com parâmetros arbitrários - Controlar o maior número possível de variáveis externas - Usar uma hipótese nula e verificar um p forte -valor

O que é falsa causalidade?

A falsa causalidade refere-se à suposição feita de que uma coisa causa outra por causa de uma relação entre elas. Por exemplo, podemos supor que Harry está treinando duro para se tornar um corredor mais rápido porque seus tempos de corrida melhoraram. No entanto, a realidade pode ser que os tempos de corrida de Harry tenham melhorado porque ele tem novos tênis de corrida feitos com a mais recente tecnologia. A suposição inicial era uma falsa causalidade.