Investor's wiki

Mehrfache lineare Regression (MLR)

Mehrfache lineare Regression (MLR)

Was ist multiple lineare Regression (MLR)?

Die multiple lineare Regression (MLR), auch einfach als multiple Regression bekannt, ist eine statistische Technik, die mehrere erklÀrende Variablen verwendet, um das Ergebnis einer Antwortvariablen vorherzusagen. Das Ziel der multiplen linearen Regression besteht darin, die lineare Beziehung zwischen den erklÀrenden (unabhÀngigen) Variablen und den (abhÀngigen) Antwortvariablen zu modellieren. Im Wesentlichen ist die multiple Regression die Erweiterung der gewöhnlichen Regression der kleinsten Quadrate (OLS) , da sie mehr als eine erklÀrende Variable umfasst.

Formel und Berechnung der multiplen linearen Regression

yi= ÎČ0+ÎČ1 xi1+ ÎČ2xi< mn>2+..< mi mathvariant="normal">.+ÎČpx ip+Ï” wobei, fĂŒr i=n Beobachtungen:</ mrow>y i=abhĂ€ngige Variable</ mrow>xi=erklĂ€rende Variablen ÎČ0=< mtext>y-Achsenabschnitt (c Dauerbegriff)< /mstyle>ÎČp</ mi>=Steigungskoeffizienten fĂŒr jede erklĂ€rende Variable< mstyle scriptlevel="0" displaystyle="true">< /mrow>Ï”=der Fehlerterm des Modells (auch bekannt als Residuen)< /mtr>\begin&y_i = \beta_0 + \beta 1 x + \beta 2 x + ... + \beta p x + \epsilon\&\textbf{wobei fĂŒr } i = n \textbf\&y_i=\text{abhĂ€ngige Variable}\&x_i=\ text{erklĂ€rende Variablen}\&\beta_0=\text{y-Achsenabschnitt (konstanter Term)}\&\beta_p=\text{Steigungskoeffizienten fĂŒr jede erklĂ€rende Variable le}\&\epsilon=\text{der Fehlerterm des Modells (auch bekannt als Residuen)}\end< span class="katex-html" aria-hidden="true">< /span> < span class="pstrut" style="height:2.84em;">​ yi=ÎČ0</ span>​+ÎČ1< /span>​< span>xi1 ​ +ÎČ2​</ span>xi2< span class="mspace" style="margin-right:0.2222222222222222em;">+...+ÎČ<span-Klasse ="vlist-t vlist-t2">< span class="mord mathnormal mtight">p​</ span>xip< /span>​< /span>+Ï”< /span>wobei fĂŒr i=n Beobachtungen : y< /span> i​ =< /span>abhĂ€ngige Variable< span class="mord mathnormal">xi​= erklĂ€rende VariablenÎČ0</sp an>​=y-Achsenabschnitt (Konstante)ÎČ< span class="vlist" style="height:0.15139200000000003em;">p< span class="vlist" style="height:0.286108em;">=</ span>Steigungskoeffizienten fĂŒr jede erklĂ€rende VariableÏ”=der Fehlerterm des Modells (auch als Residuen bekannt)</ span>< /span>

Was Ihnen die multiple lineare Regression sagen kann

Die einfache lineare Regression ist eine Funktion, die es einem Analysten oder Statistiker ermöglicht, Vorhersagen ĂŒber eine Variable auf der Grundlage der Informationen zu treffen, die ĂŒber eine andere Variable bekannt sind. Die lineare Regression kann nur verwendet werden, wenn man zwei kontinuierliche Variablen hat – eine unabhĂ€ngige Variable und eine abhĂ€ngige Variable. Die unabhĂ€ngige Variable ist der Parameter, der verwendet wird, um die abhĂ€ngige Variable oder das Ergebnis zu berechnen. Ein multiples Regressionsmodell erstreckt sich auf mehrere erklĂ€rende Variablen.

Das multiple Regressionsmodell basiert auf den folgenden Annahmen:

  • Es besteht eine lineare Beziehung zwischen den abhĂ€ngigen Variablen und den unabhĂ€ngigen Variablen

  • Die unabhĂ€ngigen Variablen sind nicht zu stark miteinander korreliert

  • yi Beobachtungen werden unabhĂ€ngig und zufĂ€llig aus der Grundgesamtheit ausgewĂ€hlt

  • Residuen sollten normalverteilt sein mit einem Mittelwert von 0 und Varianz σ

Das Bestimmtheitsmaß (R-Quadrat) ist eine statistische Metrik, die verwendet wird, um zu messen, wie viel der Variation des Ergebnisses durch die Variation der unabhĂ€ngigen Variablen erklĂ€rt werden kann. R2 nimmt immer zu, wenn dem MLR-Modell weitere PrĂ€diktoren hinzugefĂŒgt werden, auch wenn die PrĂ€diktoren möglicherweise nicht mit der Ergebnisvariablen in Beziehung stehen.

R2 allein kann daher nicht verwendet werden, um zu identifizieren, welche PrÀdiktoren in ein Modell aufgenommen und welche ausgeschlossen werden sollten. R2 kann nur zwischen 0 und 1 liegen, wobei 0 angibt, dass das Ergebnis durch keine der unabhÀngigen Variablen vorhergesagt werden kann, und 1 angibt, dass das Ergebnis ohne Fehler aus den unabhÀngigen Variablen vorhergesagt werden kann.

Bei der Interpretation der Ergebnisse der multiplen Regression sind Beta-Koeffizienten gĂŒltig, wĂ€hrend alle anderen Variablen konstant gehalten werden ("alles andere gleich"). Die Ausgabe einer multiplen Regression kann horizontal als Gleichung oder vertikal in Tabellenform angezeigt werden.

Beispiel fĂŒr die Verwendung der multiplen linearen Regression

Ein Analyst möchte beispielsweise wissen, wie sich die Marktbewegung auf den Preis von ExxonMobil (XOM) auswirkt. In diesem Fall hat ihre lineare Gleichung den Wert des S&P 500-Index als unabhÀngige Variable oder PrÀdiktor und den Preis von XOM als abhÀngige Variable.

In Wirklichkeit sagen mehrere Faktoren den Ausgang eines Ereignisses voraus. Die Preisentwicklung von ExxonMobil beispielsweise hĂ€ngt nicht nur von der Entwicklung des Gesamtmarktes ab. Andere PrĂ€diktoren wie der Ölpreis, die ZinssĂ€tze und die Preisbewegung von Öl- Futures können den Preis von XOM und die Aktienkurse anderer Ölunternehmen beeinflussen. Um eine Beziehung zu verstehen, in der mehr als zwei Variablen vorhanden sind, wird die multiple lineare Regression verwendet.

Die multiple lineare Regression (MLR) wird verwendet, um eine mathematische Beziehung zwischen mehreren Zufallsvariablen zu bestimmen. Mit anderen Worten, MLR untersucht, wie mehrere unabhĂ€ngige Variablen mit einer abhĂ€ngigen Variablen zusammenhĂ€ngen. Sobald jeder der unabhĂ€ngigen Faktoren bestimmt wurde, um die abhĂ€ngige Variable vorherzusagen, können die Informationen zu den mehreren Variablen verwendet werden, um eine genaue Vorhersage ĂŒber das Ausmaß der Auswirkungen zu erstellen, die sie auf die Ergebnisvariable haben. Das Modell stellt einen Zusammenhang in Form einer Geraden (linear) her, der alle einzelnen Datenpunkte am besten annĂ€hert.

Unter Bezugnahme auf die obige MLR-Gleichung in unserem Beispiel:

  • yi = abhĂ€ngige Variable – der Preis von XOM

  • xi1 = ZinssĂ€tze

  • xi2 = Ölpreis

  • xi3 = Wert des S&P 500-Index

  • xi4= Preis von Öl-Futures

  • B0 = y-Achsenabschnitt zum Zeitpunkt Null

  • B1 = Regressionskoeffizient,. der eine EinheitsĂ€nderung in der abhĂ€ngigen Variablen misst, wenn sich xi1 Ă€ndert - die Änderung des XOM-Preises, wenn sich die ZinssĂ€tze Ă€ndern

  • B2 = Koeffizientenwert, der eine EinheitsĂ€nderung in der abhĂ€ngigen Variablen misst, wenn sich xi2 Ă€ndert – die Änderung des XOM-Preises, wenn sich der Ölpreis Ă€ndert

Die Kleinste-Quadrate-SchĂ€tzungen – B0, B1, B2
Bp – werden normalerweise von statistischer Software berechnet. In das Regressionsmodell können beliebig viele Variablen aufgenommen werden, wobei jede unabhĂ€ngige Variable mit einer Zahl differenziert wird – 1,2, 3, 4...p. Das multiple Regressionsmodell ermöglicht es einem Analysten, ein Ergebnis auf der Grundlage von Informationen vorherzusagen, die fĂŒr mehrere erklĂ€rende Variablen bereitgestellt werden.

Dennoch ist das Modell nicht immer absolut genau, da jeder Datenpunkt geringfĂŒgig von dem vom Modell vorhergesagten Ergebnis abweichen kann. Der Residualwert E, der die Differenz zwischen dem tatsĂ€chlichen Ergebnis und dem vorhergesagten Ergebnis darstellt, wird in das Modell aufgenommen, um solche geringfĂŒgigen Abweichungen zu berĂŒcksichtigen.

Angenommen, wir fĂŒhren unser XOM-Preisregressionsmodell durch eine Statistikberechnungssoftware, die diese Ausgabe zurĂŒckgibt:

Ein Analyst wĂŒrde diese Ausgabe dahingehend interpretieren, dass, wenn andere Variablen konstant gehalten werden, der Preis von XOM um 7,8 % steigen wird, wenn der Ölpreis an den MĂ€rkten um 1 % steigt. Das Modell zeigt auch, dass der Preis von XOM nach einem Anstieg der ZinssĂ€tze um 1 % um 1,5 % sinken wird. R2 gibt an, dass 86,5 % der Schwankungen des Aktienkurses von Exxon Mobil durch Änderungen des Zinssatzes, des Ölpreises, der Öl-Futures und des S&P 500-Index erklĂ€rt werden können.

Der Unterschied zwischen linearer und multipler Regression

gewöhnlichen linearen Quadrate (OLS) vergleicht die Reaktion einer abhĂ€ngigen Variablen bei einer Änderung einiger erklĂ€render Variablen. Eine abhĂ€ngige Variable wird jedoch selten durch nur eine Variable erklĂ€rt. In diesem Fall verwendet ein Analytiker die multiple Regression, die versucht, eine abhĂ€ngige Variable mit mehr als einer unabhĂ€ngigen Variablen zu erklĂ€ren. Multiple Regressionen können linear und nichtlinear sein.

Multiple Regressionen basieren auf der Annahme, dass es eine lineare Beziehung zwischen den abhĂ€ngigen und unabhĂ€ngigen Variablen gibt. Es wird auch keine grĂ¶ĂŸere Korrelation zwischen den unabhĂ€ngigen Variablen angenommen.

Höhepunkte

  • Multiple Regression ist eine Erweiterung der linearen (OLS) Regression, die nur eine erklĂ€rende Variable verwendet.

  • Die multiple lineare Regression (MLR), auch einfach als multiple Regression bekannt, ist eine statistische Technik, die mehrere erklĂ€rende Variablen verwendet, um das Ergebnis einer Antwortvariablen vorherzusagen.

  • MLR wird ausgiebig in der Ökonometrie und Finanzinferenz verwendet.

FAQ

Was bedeutet es, dass eine multiple Regression linear ist?

Bei der multiplen linearen Regression berechnet das Modell die Linie der besten Anpassung,. die die Varianzen jeder der eingeschlossenen Variablen in Bezug auf die abhÀngige Variable minimiert. Da es sich an eine Linie anpasst, handelt es sich um ein lineares Modell. Es gibt auch nichtlineare Regressionsmodelle mit mehreren Variablen, wie z. B. logistische Regression, quadratische Regression und Probit-Modelle.

Wie werden multiple Regressionsmodelle im Finanzwesen verwendet?

Jedes ökonometrische Modell, das mehr als eine Variable betrachtet, kann ein Vielfaches sein. Faktormodelle vergleichen zwei oder mehr Faktoren, um Beziehungen zwischen Variablen und der daraus resultierenden Leistung zu analysieren. Das Fama und French Three-Factor Mod ist ein solches Modell, das das Capital Asset Pricing Model (CAPM) erweitert, indem GrĂ¶ĂŸenrisiko- und Wertrisikofaktoren zum Marktrisikofaktor in CAPM (das selbst ein Regressionsmodell ist) hinzugefĂŒgt werden. Durch die Einbeziehung dieser beiden zusĂ€tzlichen Faktoren passt sich das Modell dieser Outperformance-Tendenz an, was es zu einem besseren Instrument zur Bewertung der Managerleistung machen soll.

Kann ich eine multiple Regression manuell durchfĂŒhren?

Dies ist unwahrscheinlich, da mehrere Regressionsmodelle komplex sind und noch komplexer werden, wenn mehr Variablen in das Modell aufgenommen werden oder wenn die Menge der zu analysierenden Daten wĂ€chst. Um eine multiple Regression durchzufĂŒhren, mĂŒssen Sie wahrscheinlich spezielle statistische Software oder Funktionen in Programmen wie Excel verwenden.

Was macht eine multiple Regression multiple?

Eine multiple Regression berĂŒcksichtigt die Wirkung von mehr als einer erklĂ€renden Variablen auf ein bestimmtes Ergebnis. Es bewertet die relative Wirkung dieser erklĂ€renden oder unabhĂ€ngigen Variablen auf die abhĂ€ngige Variable, wenn alle anderen Variablen im Modell konstant gehalten werden.

Warum sollte man eine multiple Regression gegenĂŒber einer einfachen OLS-Regression verwenden?

Eine abhĂ€ngige Variable wird selten durch nur eine Variable erklĂ€rt. In solchen FĂ€llen verwendet ein Analytiker die multiple Regression, die versucht, eine abhĂ€ngige Variable mit mehr als einer unabhĂ€ngigen Variablen zu erklĂ€ren. Das Modell geht jedoch davon aus, dass es keine grĂ¶ĂŸeren Korrelationen zwischen den unabhĂ€ngigen Variablen gibt.