Investor's wiki

Correlazione spuria

Correlazione spuria

Che cos'è la correlazione spuria?

In statistica,. una correlazione spuria (o spurie) si riferisce a una connessione tra due variabili che sembra essere causale ma non lo è. Con la correlazione spuria, tutte le dipendenze osservate tra le variabili sono semplicemente dovute al caso o sono entrambe legate a qualche confondente invisibile.

Capire la correlazione spuria

Inizialmente le relazioni spurie sembreranno mostrare che una variabile influisce direttamente su un'altra, ma non è così. Questa correlazione fuorviante è spesso causata da un terzo fattore che non è evidente al momento dell'esame, a volte chiamato fattore confondente.

Quando due variabili casuali si seguono da vicino su un grafico, è facile sospettare una correlazione in cui un cambiamento in una variabile provoca un cambiamento nell'altra variabile. Mettendo da parte la causalità, che è un altro argomento, questa osservazione può portare il lettore del grafico a credere che il movimento della variabile A sia legato al movimento della variabile B o viceversa.

Tuttavia, un esame statistico più attento può mostrare che i movimenti allineati sono casuali o causati da un terzo fattore che influisce sulle due variabili. Questa è una correlazione spuria. La ricerca condotta con campioni di piccole dimensioni o endpoint arbitrari è particolarmente suscettibile di falsità.

Spotting spurie

Il modo più ovvio per individuare una relazione spuria nei risultati della ricerca è usare il buon senso. Solo perché due cose si verificano e sembrano essere collegate non significa che non ci siano altri fattori all'opera. Tuttavia, per esserne certi, i metodi di ricerca sono esaminati criticamente.

Negli studi, tutte le variabili che potrebbero influire sui risultati dovrebbero essere incluse nel modello statistico per controllarne l'impatto sulla variabile dipendente.

Correlazione spuria

Molte relazioni spurie possono essere identificate usando il buon senso. Se viene trovata una correlazione, di solito c'è più di una variabile in gioco e le variabili spesso non sono immediatamente evidenti.

Esempi di correlazione spuria

È facile trovare correlazioni interessanti, ma molte si riveleranno spurie. Tre esempi sono la teoria della lunghezza della gonna, l'indicatore del super bowl e una correlazione suggerita tra i tassi di completamento della gara e del college.

  1. Teoria della lunghezza della gonna: nata negli anni '20, la teoria della lunghezza della gonna sostiene che le lunghezze della gonna e la direzione del mercato azionario sono correlate. Se le lunghezze della gonna sono lunghe, la correlazione è che il mercato azionario è ribassista. Se le magliette sono corte, il mercato è rialzista.

  2. Indicatore del Super Bowl: a fine gennaio, si parla spesso del cosiddetto indicatore del Super Bowl, il che suggerisce che una vittoria della squadra dell'American Football Conference probabilmente significa che il mercato azionario scenderà in futuro anno, mentre una vittoria della squadra della National Football Conference fa presagire un aumento del mercato. Dall'inizio dell'era del Super Bowl, l'indicatore è stato accurato circa il 74% delle volte, o 40 anni su 54, secondo OpenMarkets. È un pezzo di conversazione divertente, ma probabilmente non è qualcosa che un consulente finanziario serio raccomanderebbe come strategia di investimento per i clienti.

  3. Risultato scolastico e razza: gli scienziati sociali si sono concentrati sull'identificazione delle variabili che influiscono sul rendimento scolastico. Secondo una ricerca del governo, il 56% dei bianchi tra i 25 ei 29 anni aveva completato una laurea nel 2019, rispetto a solo il 36% dei neri della stessa età. L'implicazione è che la razza ha un effetto causale sui tassi di completamento del college.

Tuttavia, potrebbe non essere la razza stessa ad avere un impatto sul rendimento scolastico. I risultati potrebbero anche essere dovuti agli effetti del razzismo nella società, che potrebbe essere la terza variabile "nascosta". Il razzismo colpisce le persone di colore, mettendole in una posizione di svantaggio dal punto di vista educativo ed economico. Ad esempio, le scuole nelle comunità non bianche devono affrontare sfide maggiori e ricevono meno finanziamenti, i genitori delle popolazioni non bianche hanno lavori meno retribuiti e meno risorse da dedicare all'istruzione dei propri figli e molte famiglie vivono in deserti alimentari e soffrono di malnutrizione . Il razzismo, piuttosto che la razza, potrebbe essere visto come una variabile causale che incide sul livello di istruzione.

Mette in risalto

  • La comparsa di una relazione causale è spesso dovuta a un movimento simile su un grafico che risulta essere casuale o causato da un terzo fattore di "confusione".

  • La correlazione spuria, o spuria, si verifica quando due fattori sembrano casualmente correlati tra loro ma non lo sono.

  • La conferma di una relazione causale richiede uno studio che controlli tutte le possibili variabili.

  • Statistici e scienziati utilizzano un'analisi statistica attenta per determinare le relazioni spurie.

  • La correlazione spuria può essere causata da campioni di piccole dimensioni o da punti finali arbitrari.

FAQ

Cos'è la regressione spuria?

La regressione spuria è un modello statistico che mostra prove statistiche fuorvianti di una relazione lineare; in altre parole, una correlazione spuria tra variabili non stazionarie indipendenti.

Che cos'è un esempio di correlazione ma non di causalità?

Un esempio di correlazione è che più sonno porta a prestazioni migliori durante il giorno. Sebbene ci sia una correlazione, non c'è necessariamente una causalità. Più sonno potrebbe non essere il motivo per cui un individuo ha prestazioni migliori; ad esempio, potrebbero utilizzare un nuovo strumento software che sta aumentando la loro produttività. Per trovare la causalità, ci devono essere prove fattuali da uno studio che mostra una relazione causale tra sonno e prestazioni.

Come individuare la correlazione spuria?

Gli statistici e altri scienziati che analizzano i dati devono stare sempre alla ricerca di relazioni spurie. Esistono numerosi metodi utilizzati per identificarli, tra cui: - Garantire un campione rappresentativo adeguato - Ottenere una dimensione del campione adeguata - Diffidare di endpoint arbitrari - Controllare quante più variabili esterne possibile - Utilizzare un'ipotesi nulla e verificare una p forte -valore

Che cos'è la falsa causalità?

La falsa causalità si riferisce all'assunto fatto che una cosa causi qualcos'altro a causa di una relazione tra di loro. Ad esempio, possiamo presumere che Harry si sia allenato duramente per diventare un corridore più veloce perché i suoi tempi di gara sono migliorati. Tuttavia, la realtà potrebbe essere che i tempi di gara di Harry sono migliorati perché ha nuove scarpe da corsa realizzate con la tecnologia più recente. L'ipotesi iniziale era una falsa causalità.