Investor's wiki

Multipel linjär regression (MLR)

Multipel linjär regression (MLR)

Vad Àr multipel linjÀr regression (MLR)?

Multipel linjÀr regression (MLR), Àven kÀnd helt enkelt som multipel regression, Àr en statistisk teknik som anvÀnder flera förklarande variabler för att förutsÀga resultatet av en svarsvariabel. MÄlet med multipel linjÀr regression Àr att modellera det linjÀra sambandet mellan de förklarande (oberoende) variablerna och responsvariablerna (beroende). I huvudsak Àr multipel regression en förlÀngning av vanlig minsta kvadraters (OLS) regression eftersom den involverar mer Àn en förklarande variabel.

Formel och berÀkning av multipel linjÀr regression

yi= ÎČ0+ÎČ1 xi1+ ÎČ2xi< mn>2+..< mi mathvariant="normal">.+ÎČpx ip+Ï” var, för i=n observationer:</ mrow>y i=beroende variabel</ mrow>xi=förklarande variabler ÎČ0=< mtext>y-intercept (c onstant term)< /mstyle>ÎČp</ mi>=lutningskoefficienter för varje förklarande variabel< mstyle scriptlevel="0" displaystyle="true">< /mrow>Ï”=modellens felterm (Ă€ven kĂ€nd som residualerna)< /mtr>\begin&y_i = \beta_0 + \beta 1 x + \beta 2 x + ... + \beta p x + \epsilon\&\textbf{dĂ€r, för } i = n \textbf\&y_i=\text\&x_i=\ text{förklarande variabler}\&\beta_0=\text{y-avsnitt (konstant term)}\&\beta_p=\text{lutningskoefficienter för varje förklaringsvariab le}\&\epsilon=\text{modellens felterm (Ă€ven kĂ€nd som residualerna)}\end< span class="katex-html" aria-hidden="true">< /span> < span class="psrut" style="height:2.84em;">​ yi​=ÎČ0</ span>​+ÎČ1< /span>​< span>xi1 ​ +ÎČ2​</ span>xi2​< span class="mspace" style="margin-right:0.22222222222222222em;">+...+ÎČ< span class="mord mathnormal mtight">p​</ span>xip< /span>​< /span>+Ï”< /span>var, för i=n observationer : y< /span> i​ =< /span>beroende variabel>< span class="mord mathnormal">xi​= förklarande variablerÎČ0</sp an>​=y-intercept (konstant term)ÎČ>< span class="vlist" style="height:0.151392000000000003em;">p​​ span class="vlist" style="height:0.286108em;">=</ span>lutningskoefficienter för varje förklarande variabelÏ”=modellens felterm (Ă€ven kĂ€nd som residualerna)</ span>​< /span>

Vad multipel linjÀr regression kan berÀtta för dig

Enkel linjÀr regression Àr en funktion som gör att en analytiker eller statistiker kan göra förutsÀgelser om en variabel baserat pÄ den information som Àr kÀnd om en annan variabel. LinjÀr regression kan endast anvÀndas nÀr man har tvÄ kontinuerliga variabler - en oberoende variabel och en beroende variabel. Den oberoende variabeln Àr den parameter som anvÀnds för att berÀkna den beroende variabeln eller utfallet. En multipel regressionsmodell strÀcker sig till flera förklaringsvariabler.

Multipel regressionsmodellen Àr baserad pÄ följande antaganden:

– Det finns ett linjĂ€rt samband mellan de beroende variablerna och de oberoende variablerna

– De oberoende variablerna Ă€r inte för högt korrelerade med varandra

  • yi observationer vĂ€ljs oberoende och slumpmĂ€ssigt frĂ„n populationen

  • Rester ska vara normalfördelade med medelvĂ€rdet 0 och varians σ

BestÀmningskoefficienten ( R -kvadrat) Àr ett statistiskt mÄtt som anvÀnds för att mÀta hur mycket av variationen i utfall som kan förklaras av variationen i de oberoende variablerna. R2 ökar alltid nÀr fler prediktorer lÀggs till i MLR-modellen, Àven om prediktorerna kanske inte Àr relaterade till utfallsvariabeln.

R2 i sig kan alltsÄ inte anvÀndas för att identifiera vilka prediktorer som bör inkluderas i en modell och vilka som bör exkluderas. R2 kan bara vara mellan 0 och 1, dÀr 0 indikerar att utfallet inte kan förutsÀgas av nÄgon av de oberoende variablerna och 1 indikerar att utfallet kan förutsÀgas utan fel frÄn de oberoende variablerna.

NÀr man tolkar resultaten av multipel regression Àr beta-koefficienter giltiga medan alla andra variabler hÄlls konstanta ("allt annat lika"). Utdata frÄn en multipel regression kan visas horisontellt som en ekvation eller vertikalt i tabellform.

Exempel pÄ hur man anvÀnder multipel linjÀr regression

Som ett exempel kan en analytiker vilja veta hur marknadens rörelser pÄverkar priset pÄ ExxonMobil (XOM). I det hÀr fallet kommer deras linjÀra ekvation att ha vÀrdet av S&P 500-indexet som den oberoende variabeln, eller prediktorn, och priset pÄ XOM som den beroende variabeln.

I verkligheten förutsÀger flera faktorer resultatet av en hÀndelse. Prisrörelsen för ExxonMobil beror till exempel pÄ mer Àn bara prestanda pÄ den totala marknaden. Andra prediktorer som oljepriset, rÀntor och prisrörelsen pÄ oljeterminer kan pÄverka priset pÄ XOM och andra oljebolags aktiekurser. För att förstÄ ett samband dÀr fler Àn tvÄ variabler finns, anvÀnds multipel linjÀr regression.

Multipel linjÀr regression (MLR) anvÀnds för att bestÀmma ett matematiskt samband mellan flera slumpvariabler. Med andra ord undersöker MLR hur flera oberoende variabler Àr relaterade till en beroende variabel. NÀr var och en av de oberoende faktorerna har bestÀmts för att förutsÀga den beroende variabeln, kan informationen om de multipla variablerna anvÀndas för att skapa en korrekt förutsÀgelse om nivÄn av effekt de har pÄ utfallsvariabeln. Modellen skapar ett samband i form av en rÀt linje (linjÀr) som bÀst approximerar alla individuella datapunkter.

Med hÀnvisning till MLR-ekvationen ovan, i vÄrt exempel:

  • yi = beroende variabel—priset pĂ„ XOM

  • xi1 = rĂ€ntor

  • xi2 = oljepris

  • xi3 = vĂ€rde pĂ„ S&P 500-index

  • xi4= pris pĂ„ oljeterminer

  • B0 = y-skĂ€rning vid tidpunkt noll

  • B1 = regressionskoefficient som mĂ€ter en enhetsförĂ€ndring i den beroende variabeln nĂ€r xi1 Ă€ndras - förĂ€ndringen i XOM-priset nĂ€r rĂ€ntorna Ă€ndras

  • B2 = koefficientvĂ€rde som mĂ€ter en enhetsförĂ€ndring i den beroende variabeln nĂ€r xi2 Ă€ndras - förĂ€ndringen i XOM-priset nĂ€r oljepriset Ă€ndras

Uppskattningarna av minsta kvadrater - B0, B1, B2...Bp - berĂ€knas vanligtvis av statistisk programvara. Lika mĂ„nga variabler kan inkluderas i regressionsmodellen dĂ€r varje oberoende variabel Ă€r differentierad med ett tal—1,2, 3, 4...s. Multipelregressionsmodellen tillĂ„ter en analytiker att förutsĂ€ga ett resultat baserat pĂ„ information som tillhandahĂ„lls om flera förklarande variabler.

ÄndĂ„ Ă€r modellen inte alltid helt korrekt eftersom varje datapunkt kan skilja sig nĂ„got frĂ„n det resultat som modellen förutspĂ„tt. RestvĂ€rdet, E, som Ă€r skillnaden mellan det faktiska utfallet och det förutsagda utfallet, ingĂ„r i modellen för att ta hĂ€nsyn till sĂ„dana smĂ„ variationer.

Om vi antar att vi kör vÄr XOM-prisregressionsmodell genom en programvara för statistikberÀkning, som returnerar denna utdata:

En analytiker skulle tolka denna produktion som att om andra variabler hÄlls konstanta, kommer priset pÄ XOM att öka med 7,8 % om oljepriset pÄ marknaderna ökar med 1 %. Modellen visar ocksÄ att priset pÄ XOM kommer att sjunka med 1,5 % efter en rÀnteuppgÄng pÄ 1 %. R2 indikerar att 86,5 % av variationerna i aktiekursen för Exxon Mobil kan förklaras av förÀndringar i rÀntan, oljepriset, oljeterminer och S&P 500-index.

Skillnaden mellan linjÀr och multipel regression

vanliga linjÀra kvadrater (OLS) jÀmför svaret frÄn en beroende variabel givet en förÀndring i vissa förklarande variabler. En beroende variabel förklaras dock sÀllan av endast en variabel. I det hÀr fallet anvÀnder en analytiker multipel regression, som försöker förklara en beroende variabel med mer Àn en oberoende variabel. Flera regressioner kan vara linjÀra och olinjÀra.

Flera regressioner bygger pÄ antagandet att det finns ett linjÀrt samband mellan bÄde de beroende och oberoende variablerna. Det antar inte heller nÄgon större korrelation mellan de oberoende variablerna.

Höjdpunkter

  • Multipel regression Ă€r en förlĂ€ngning av linjĂ€r (OLS) regression som anvĂ€nder bara en förklarande variabel.

  • Multipel linjĂ€r regression (MLR), Ă€ven kĂ€nd helt enkelt som multipel regression, Ă€r en statistisk teknik som anvĂ€nder flera förklarande variabler för att förutsĂ€ga resultatet av en svarsvariabel.

  • MLR anvĂ€nds flitigt inom ekonometri och finansiell slutledning.

Vanliga frÄgor

Vad betyder det att en multipel regression Àr linjÀr?

Vid multipel linjÀr regression berÀknar modellen linjen med bÀsta passform som minimerar varianserna för var och en av de inkluderade variablerna nÀr den relaterar till den beroende variabeln. Eftersom det passar en linje Àr det en linjÀr modell. Det finns ocksÄ icke-linjÀra regressionsmodeller som involverar flera variabler, sÄsom logistisk regression, kvadratisk regression och probitmodeller.

Hur anvÀnds multipla regressionsmodeller i finans?

Varje ekonometrisk modell som tittar pÄ mer Àn en variabel kan vara en multipel. Faktormodeller jÀmför tvÄ eller flera faktorer för att analysera sambanden mellan variabler och den resulterande prestandan. Fama and French Three-Factor Mod Àr en sÄdan modell som expanderar pÄ kapitaltillgÄngsprissÀttningsmodellen (CAPM) genom att lÀgga till storleksrisk och vÀrderiskfaktorer till marknadsriskfaktorn i CAPM (som i sig Àr en regressionsmodell). Genom att inkludera dessa tvÄ ytterligare faktorer, justerar modellen för denna överpresterande tendens, vilket anses göra den till ett bÀttre verktyg för att utvÀrdera chefsprestationer.

Kan jag göra en multipel regression för hand?

Det Àr osannolikt eftersom flera regressionsmodeller Àr komplexa och blir Ànnu mer sÄ nÀr det finns fler variabler som ingÄr i modellen eller nÀr mÀngden data att analysera vÀxer. För att köra en multipel regression kommer du sannolikt att behöva anvÀnda specialiserad statistisk programvara eller funktioner i program som Excel.

Vad gör en multipel regression till multipel?

En multipel regression tar hÀnsyn till effekten av mer Àn en förklarande variabel pÄ ett visst resultat av intresse. Den utvÀrderar den relativa effekten av dessa förklarande, eller oberoende, variabler pÄ den beroende variabeln nÀr alla andra variabler i modellen hÄlls konstanta.

Varför skulle man anvÀnda en multipel regression framför en enkel OLS-regression?

En beroende variabel förklaras sÀllan av endast en variabel. I sÄdana fall anvÀnder en analytiker multipel regression, som försöker förklara en beroende variabel med mer Àn en oberoende variabel. Modellen antar dock att det inte finns nÄgra större korrelationer mellan de oberoende variablerna.