Investor's wiki

Multicollinearità

Multicollinearità

Che cos'è la multicollinearità?

La multicollinearità è il verificarsi di elevate intercorrelazioni tra due o più variabili indipendenti in un modello di regressione multipla. La multicollinearità può portare a risultati distorti o fuorvianti quando un ricercatore o un analista tenta di determinare quanto bene ciascuna variabile indipendente può essere utilizzata in modo più efficace per prevedere o comprendere la variabile dipendente in un modello statistico.

In generale, la multicollinearità può portare a intervalli di confidenza più ampi che producono probabilità meno affidabili in termini di effetto di variabili indipendenti in un modello.

Capire la multicollinearità

Gli analisti statistici utilizzano più modelli di regressione per prevedere il valore di una variabile dipendente specificata in base ai valori di due o più variabili indipendenti. La variabile dipendente viene talvolta definita variabile di risultato, obiettivo o criterio.

Un esempio è un modello di regressione multivariato che tenta di anticipare i rendimenti delle azioni sulla base di elementi quali il rapporto prezzo/utili (rapporti P/E), la capitalizzazione di mercato, la performance passata o altri dati. Il rendimento del titolo è la variabile dipendente ei vari bit di dati finanziari sono le variabili indipendenti.

La multicollinearità in un modello di regressione multipla indica che le variabili collineari indipendenti sono in qualche modo correlate, sebbene la relazione possa essere casuale o meno. Ad esempio, la performance passata potrebbe essere correlata alla capitalizzazione di mercato,. poiché i titoli che hanno registrato buone performance in passato avranno valori di mercato in aumento.

In altre parole, la multicollinearità può esistere quando due variabili indipendenti sono altamente correlate. Può anche accadere se una variabile indipendente viene calcolata da altre variabili nel set di dati o se due variabili indipendenti forniscono risultati simili e ripetitivi.

Considerazioni speciali

Uno dei modi più comuni per eliminare il problema della multicollinearità consiste nell'identificare prima le variabili collineari indipendenti e quindi rimuoverle tutte tranne una.

È anche possibile eliminare la multicollinearità combinando due o più variabili collineari in un'unica variabile. L'analisi statistica può quindi essere condotta per studiare la relazione tra la variabile dipendente specificata e solo una singola variabile indipendente.

Le inferenze statistiche da un modello che contiene multicollinearità potrebbero non essere affidabili.

Esempi di multicollinearità

Negli investimenti

Per gli investimenti, la multicollinearità è una considerazione comune quando si esegue l'analisi tecnica per prevedere i probabili movimenti futuri dei prezzi di un titolo, come un'azione o un future su materie prime.

Gli analisti di mercato vogliono evitare di utilizzare indicatori tecnici collineari in quanto basati su input molto simili o correlati; tendono a rivelare previsioni simili per quanto riguarda la variabile dipendente del movimento dei prezzi. Al contrario, l'analisi di mercato deve basarsi su variabili indipendenti marcatamente diverse per garantire che analizzino il mercato da diversi punti di vista analitici indipendenti.

Un esempio di un potenziale problema di multicollinearità è l'esecuzione dell'analisi tecnica utilizzando solo diversi indicatori simili.

Il noto analista tecnico John Bollinger, creatore dell'indicatore Bollinger Bands,. osserva che "una regola fondamentale per l'uso efficace dell'analisi tecnica richiede di evitare la multicollinearità tra gli indicatori". Per risolvere il problema, gli analisti evitano di utilizzare due o più indicatori tecnici dello stesso tipo. Invece, analizzano un titolo utilizzando un tipo di indicatore, come un indicatore di momentum, e quindi eseguono un'analisi separata utilizzando un tipo diverso di indicatore, come un indicatore di tendenza.

Ad esempio, lo stocastico,. l' indice di forza relativa (RSI) e la %R di Williams sono tutti indicatori di momentum che si basano su input simili ed è probabile che producano risultati simili. In questo caso, è meglio rimuovere tutti gli indicatori tranne uno o trovare un modo per unirne diversi in un solo indicatore, aggiungendo anche un indicatore di tendenza che probabilmente non sarà altamente correlato all'indicatore di momentum.

In biologia

La multicollinearità si osserva anche in molti altri contesti. Uno di questi contesti è la biologia umana. Ad esempio, la pressione sanguigna di un individuo non è collineare con l'età, ma anche con il peso, lo stress e il polso.

Mette in risalto

  • La multicollinearità è un concetto statistico in cui sono correlate diverse variabili indipendenti in un modello.

  • La multicollinearità tra variabili indipendenti risulterà in inferenze statistiche meno affidabili.

  • È meglio utilizzare variabili indipendenti che non sono correlate o ripetitive quando si costruiscono modelli di regressione multipli che utilizzano due o più variabili.

  • Due variabili sono considerate perfettamente collineari se il loro coefficiente di correlazione è +/- 1,0.

  • L'esistenza di multicollinearità in un set di dati può portare a risultati meno affidabili a causa di errori standard più grandi.

FAQ

Perché la multicollinearità è un problema?

La multicollinearità è un problema perché produce risultati del modello di regressione meno affidabili. Ciò è dovuto a intervalli di confidenza più ampi ( errori standard maggiori ) che possono ridurre la significatività statistica dei coefficienti di regressione.

Come si può gestire la multicollinearità?

Per ridurre la quantità di multicollinearità riscontrata in un modello, è possibile rimuovere le variabili specifiche identificate come le più collineari. Puoi anche provare a combinare o trasformare le variabili incriminate per ridurre la loro correlazione. Se ciò non funziona o è irraggiungibile, esistono modelli di regressione modificati che gestiscono meglio la multicollinearità, come la regressione della cresta, la regressione delle componenti principali o la regressione parziale dei minimi quadrati.

Come si rileva la multicollinearità?

Una tecnica statistica chiamata fattore di inflazione della varianza (VIF) viene utilizzata per rilevare e misurare la quantità di collinearità in un modello di regressione multipla.

Che cos'è la collinearità perfetta?

La collinearità perfetta esiste quando esiste un'esatta corrispondenza 1:1 tra due variabili indipendenti in un modello. Può essere una correlazione di +1,0 o -1,0.