Investor's wiki

Regressione lineare multipla (MLR)

Regressione lineare multipla (MLR)

Che cos'è la regressione lineare multipla (MLR)?

La regressione lineare multipla (MLR), nota anche semplicemente come regressione multipla, è una tecnica statistica che utilizza diverse variabili esplicative per prevedere l'esito di una variabile di risposta. L'obiettivo della regressione lineare multipla è modellare la relazione lineare tra le variabili esplicative (indipendenti) e le variabili di risposta (dipendenti). In sostanza, la regressione multipla è l'estensione della regressione dei minimi quadrati ordinari (OLS) perché coinvolge più di una variabile esplicativa.

Formula e calcolo della regressione lineare multipla

yi= β0+β1 xi1+ β2xi< mn>2+..< mi mathvariant="normal">.+βpx iop+ϵ dove, per io=n osservazioni:</ mrow>y i=variabile dipendente</ mrow>xi=variabili esplicative β0=< mtesto>y-intercetta (c termine immediato)< /mstyle>βp</ mi>=Coefficienti di pendenza per ciascuna variabile esplicativa< mstyle scriptlevel="0" displaystyle="true">< /mrow>ϵ=il termine di errore del modello (noto anche come residuo)< /mtr>\begin&y_i = \beta_0 + \beta 1 x + \beta 2 x + ... + \beta p x + \epsilon\&\textbf{dove, per } i = n \textbf\&y_i=\text\&x_i=\ text\&\beta_0=\text{y-intercept (termine costante)}\&\beta_p=\text\&\epsilon=\text{il termine di errore del modello (noto anche come residui)}\end< span class="katex-html" aria-hidden="true">< /span> < span class="pstrut" style="height:2.84em;">​ yi​=β0</ span>​+β1< /span>​< span>xi1 ​ +β2​</ span>xi2​< span class="mspace" style="margin-right:0.2222222222222222em;">+...+β< span class="mord mathnormal mtight">p​</ span>xip< /span>​< /span>+ϵ< /span>dove, per i=n osservazioni : y< /span> i​ =< /span>variabile dipendente< span class="mord mathnormal">xi​= variabili esplicativeβ0</sp an>​=y-intercept (termine costante)β< span class="vlist" style="height:0.15139200000000003em;">p​< span class="vlist" style="height:0.286108em;">=</ span>Coefficienti di pendenza per ciascuna variabile esplicativaϵ=il termine di errore del modello (noto anche come residuo)</ span>​< /span>

Cosa può dirti la regressione lineare multipla

La regressione lineare semplice è una funzione che consente a un analista o a uno statistico di fare previsioni su una variabile in base alle informazioni note su un'altra variabile. La regressione lineare può essere utilizzata solo quando si hanno due variabili continue: una variabile indipendente e una variabile dipendente. La variabile indipendente è il parametro utilizzato per calcolare la variabile dipendente o il risultato. Un modello di regressione multipla si estende a diverse variabili esplicative.

Il modello di regressione multipla si basa sulle seguenti ipotesi:

  • Esiste una relazione lineare tra le variabili dipendenti e le variabili indipendenti

  • Le variabili indipendenti non sono troppo correlate tra loro

  • le osservazioni yi sono selezionate indipendentemente e casualmente dalla popolazione

  • I residui dovrebbero essere normalmente distribuiti con media 0 e varianza σ

Il c oefficiente di determinazione (R-quadrato) è una metrica statistica che viene utilizzata per misurare quanto della variazione del risultato può essere spiegato dalla variazione delle variabili indipendenti. R2 aumenta sempre man mano che vengono aggiunti più predittori al modello MLR, anche se i predittori potrebbero non essere correlati alla variabile di risultato.

R2 di per sé non può quindi essere utilizzato per identificare quali predittori dovrebbero essere inclusi in un modello e quali dovrebbero essere esclusi. R2 può essere solo compreso tra 0 e 1, dove 0 indica che il risultato non può essere previsto da nessuna delle variabili indipendenti e 1 indica che il risultato può essere previsto senza errori dalle variabili indipendenti.

Quando si interpretano i risultati di una regressione multipla, i coefficienti beta sono validi mantenendo tutte le altre variabili costanti ("tutto il resto uguale"). L'output di una regressione multipla può essere visualizzato orizzontalmente come un'equazione o verticalmente sotto forma di tabella.

Esempio di come utilizzare la regressione lineare multipla

Ad esempio, un analista potrebbe voler sapere come il movimento del mercato influisca sul prezzo di ExxonMobil (XOM). In questo caso, la loro equazione lineare avrà il valore dell'indice S&P 500 come variabile indipendente, o predittore, e il prezzo di XOM come variabile dipendente.

In realtà, molteplici fattori predicono l'esito di un evento. Il movimento dei prezzi di ExxonMobil, ad esempio, non dipende solo dall'andamento del mercato generale. Altri predittori come il prezzo del petrolio, i tassi di interesse e il movimento dei prezzi dei futures sul petrolio possono influenzare il prezzo di XOM e i prezzi delle azioni di altre compagnie petrolifere. Per comprendere una relazione in cui sono presenti più di due variabili, viene utilizzata la regressione lineare multipla.

La regressione lineare multipla (MLR) viene utilizzata per determinare una relazione matematica tra diverse variabili casuali. In altri termini, MLR esamina come più variabili indipendenti sono correlate a una variabile dipendente. Una volta che ciascuno dei fattori indipendenti è stato determinato per prevedere la variabile dipendente, le informazioni sulle variabili multiple possono essere utilizzate per creare una previsione accurata sul livello di effetto che hanno sulla variabile di risultato. Il modello crea una relazione sotto forma di una linea retta (lineare) che approssima al meglio tutti i singoli punti dati.

Facendo riferimento all'equazione MLR sopra, nel nostro esempio:

  • yi = variabile dipendente: il prezzo di XOM

  • xi1 = tassi di interesse

  • xi2 = prezzo del petrolio

  • xi3 = valore dell'indice S&P 500

  • xi4= prezzo dei futures sul petrolio

  • B0 = y-intercetta al tempo zero

  • B1 = coefficiente di regressione che misura una variazione unitaria nella variabile dipendente al variare di xi1 - la variazione del prezzo XOM al variare dei tassi di interesse

  • B2 = valore del coefficiente che misura una variazione unitaria nella variabile dipendente quando cambia xi2: la variazione del prezzo XOM quando cambiano i prezzi del petrolio

Le stime dei minimi quadrati—B0, B1, B2…Bp—sono solitamente calcolate da un software statistico. Tante variabili possono essere incluse nel modello di regressione in cui ogni variabile indipendente è differenziata con un numero: 1,2, 3, 4...p. Il modello di regressione multipla consente a un analista di prevedere un risultato in base alle informazioni fornite su più variabili esplicative.

Tuttavia, il modello non è sempre perfettamente accurato poiché ogni punto dati può differire leggermente dal risultato previsto dal modello. Il valore residuo, E, che è la differenza tra il risultato effettivo e il risultato previsto, è incluso nel modello per tenere conto di tali lievi variazioni.

Supponendo di eseguire il nostro modello di regressione dei prezzi XOM attraverso un software di calcolo statistico, questo restituisce questo output:

Un analista interpreterebbe questo output nel senso che se altre variabili vengono mantenute costanti, il prezzo di XOM aumenterà del 7,8% se il prezzo del petrolio sui mercati aumenta dell'1%. Il modello mostra anche che il prezzo di XOM diminuirà dell'1,5% a seguito di un aumento dell'1% dei tassi di interesse. R2 indica che l'86,5% delle variazioni del prezzo delle azioni della Exxon Mobil può essere spiegato dalle variazioni del tasso di interesse, del prezzo del petrolio, dei futures sul petrolio e dell'indice S&P 500.

La differenza tra regressione lineare e multipla

dei quadrati lineari ordinari (OLS) confronta la risposta di una variabile dipendente data una modifica in alcune variabili esplicative. Tuttavia, una variabile dipendente è raramente spiegata da una sola variabile. In questo caso, un analista utilizza la regressione multipla, che tenta di spiegare una variabile dipendente utilizzando più di una variabile indipendente. Regressioni multiple possono essere lineari e non lineari.

Le regressioni multiple si basano sul presupposto che esista una relazione lineare tra le variabili dipendenti e indipendenti. Inoltre, non presuppone alcuna correlazione importante tra le variabili indipendenti.

Mette in risalto

  • La regressione multipla è un'estensione della regressione lineare (OLS) che utilizza una sola variabile esplicativa.

  • La regressione lineare multipla (MLR), nota anche semplicemente come regressione multipla, è una tecnica statistica che utilizza diverse variabili esplicative per prevedere l'esito di una variabile di risposta.

  • MLR è ampiamente utilizzato in econometria e inferenza finanziaria.

FAQ

Cosa significa per una regressione multipla essere lineare?

Nella regressione lineare multipla, il modello calcola la linea di miglior adattamento che riduce al minimo le varianze di ciascuna delle variabili incluse in relazione alla variabile dipendente. Poiché si adatta a una linea, è un modello lineare. Esistono anche modelli di regressione non lineare che coinvolgono più variabili, come la regressione logistica, la regressione quadratica e i modelli probit.

Come vengono utilizzati più modelli di regressione in finanza?

Qualsiasi modello econometrico che consideri più di una variabile può essere un multiplo. I modelli fattoriali confrontano due o più fattori per analizzare le relazioni tra le variabili e le prestazioni risultanti. Il Fama e il francese Three-Factor Mod è un modello di questo tipo che espande il modello di determinazione del prezzo del capitale (CAPM) aggiungendo il rischio dimensionale e i fattori di rischio di valore al fattore di rischio di mercato nel CAPM (che è esso stesso un modello di regressione). Includendo questi due fattori aggiuntivi, il modello si adegua a questa tendenza a sovraperformare, che si ritiene lo renda uno strumento migliore per valutare la performance del gestore.

Posso eseguire manualmente una regressione multipla?

È improbabile che più modelli di regressione siano complessi e lo diventino ancora di più quando sono incluse più variabili nel modello o quando la quantità di dati da analizzare aumenta. Per eseguire una regressione multipla sarà probabilmente necessario utilizzare software statistici specializzati o funzioni all'interno di programmi come Excel.

Cosa rende multipla una regressione multipla?

Una regressione multipla considera l'effetto di più di una variabile esplicativa su alcuni risultati di interesse. Valuta l'effetto relativo di queste variabili esplicative o indipendenti sulla variabile dipendente quando si mantengono tutte le altre variabili nel modello costanti.

Perché si dovrebbe usare una regressione multipla su una semplice regressione OLS?

Una variabile dipendente è raramente spiegata da una sola variabile. In questi casi, un analista utilizza la regressione multipla, che tenta di spiegare una variabile dipendente utilizzando più di una variabile indipendente. Il modello, tuttavia, presuppone che non vi siano grandi correlazioni tra le variabili indipendenti.