Multipel linjär regression (MLR)
Vad Àr multipel linjÀr regression (MLR)?
Multipel linjÀr regression (MLR), Àven kÀnd helt enkelt som multipel regression, Àr en statistisk teknik som anvÀnder flera förklarande variabler för att förutsÀga resultatet av en svarsvariabel. MÄlet med multipel linjÀr regression Àr att modellera det linjÀra sambandet mellan de förklarande (oberoende) variablerna och responsvariablerna (beroende). I huvudsak Àr multipel regression en förlÀngning av vanlig minsta kvadraters (OLS) regression eftersom den involverar mer Àn en förklarande variabel.
Formel och berÀkning av multipel linjÀr regression
< span class="katex-html" aria-hidden="true">< /span> < span class="psrut" style="height:2.84em;">â yiâ=ÎČ0</ span>â+ÎČ1< /span>â< span>xi1 â +ÎČ2â</ span>xi2â< span class="mspace" style="margin-right:0.22222222222222222em;">+...+ÎČ< span class="mord mathnormal mtight">pâ</ span>xip< /span>â< /span>+Ï”< /span>var, för i=n observationer : y< /span> iâ =< /span>beroende variabel>< span class="mord mathnormal">xiâ= förklarande variablerÎČ0</sp an>â=y-intercept (konstant term)ÎČ>< span class="vlist" style="height:0.151392000000000003em;">pââ span class="vlist" style="height:0.286108em;">=</ span>lutningskoefficienter för varje förklarande variabelÏ”=modellens felterm (Ă€ven kĂ€nd som residualerna)</ span>â< /span>
Vad multipel linjÀr regression kan berÀtta för dig
Enkel linjÀr regression Àr en funktion som gör att en analytiker eller statistiker kan göra förutsÀgelser om en variabel baserat pÄ den information som Àr kÀnd om en annan variabel. LinjÀr regression kan endast anvÀndas nÀr man har tvÄ kontinuerliga variabler - en oberoende variabel och en beroende variabel. Den oberoende variabeln Àr den parameter som anvÀnds för att berÀkna den beroende variabeln eller utfallet. En multipel regressionsmodell strÀcker sig till flera förklaringsvariabler.
Multipel regressionsmodellen Àr baserad pÄ följande antaganden:
â Det finns ett linjĂ€rt samband mellan de beroende variablerna och de oberoende variablerna
â De oberoende variablerna Ă€r inte för högt korrelerade med varandra
yi observationer vÀljs oberoende och slumpmÀssigt frÄn populationen
Rester ska vara normalfördelade med medelvĂ€rdet 0 och varians Ï
BestÀmningskoefficienten ( R -kvadrat) Àr ett statistiskt mÄtt som anvÀnds för att mÀta hur mycket av variationen i utfall som kan förklaras av variationen i de oberoende variablerna. R2 ökar alltid nÀr fler prediktorer lÀggs till i MLR-modellen, Àven om prediktorerna kanske inte Àr relaterade till utfallsvariabeln.
R2 i sig kan alltsÄ inte anvÀndas för att identifiera vilka prediktorer som bör inkluderas i en modell och vilka som bör exkluderas. R2 kan bara vara mellan 0 och 1, dÀr 0 indikerar att utfallet inte kan förutsÀgas av nÄgon av de oberoende variablerna och 1 indikerar att utfallet kan förutsÀgas utan fel frÄn de oberoende variablerna.
NÀr man tolkar resultaten av multipel regression Àr beta-koefficienter giltiga medan alla andra variabler hÄlls konstanta ("allt annat lika"). Utdata frÄn en multipel regression kan visas horisontellt som en ekvation eller vertikalt i tabellform.
Exempel pÄ hur man anvÀnder multipel linjÀr regression
Som ett exempel kan en analytiker vilja veta hur marknadens rörelser pÄverkar priset pÄ ExxonMobil (XOM). I det hÀr fallet kommer deras linjÀra ekvation att ha vÀrdet av S&P 500-indexet som den oberoende variabeln, eller prediktorn, och priset pÄ XOM som den beroende variabeln.
I verkligheten förutsÀger flera faktorer resultatet av en hÀndelse. Prisrörelsen för ExxonMobil beror till exempel pÄ mer Àn bara prestanda pÄ den totala marknaden. Andra prediktorer som oljepriset, rÀntor och prisrörelsen pÄ oljeterminer kan pÄverka priset pÄ XOM och andra oljebolags aktiekurser. För att förstÄ ett samband dÀr fler Àn tvÄ variabler finns, anvÀnds multipel linjÀr regression.
Multipel linjÀr regression (MLR) anvÀnds för att bestÀmma ett matematiskt samband mellan flera slumpvariabler. Med andra ord undersöker MLR hur flera oberoende variabler Àr relaterade till en beroende variabel. NÀr var och en av de oberoende faktorerna har bestÀmts för att förutsÀga den beroende variabeln, kan informationen om de multipla variablerna anvÀndas för att skapa en korrekt förutsÀgelse om nivÄn av effekt de har pÄ utfallsvariabeln. Modellen skapar ett samband i form av en rÀt linje (linjÀr) som bÀst approximerar alla individuella datapunkter.
Med hÀnvisning till MLR-ekvationen ovan, i vÄrt exempel:
yi = beroende variabelâpriset pĂ„ XOM
xi1 = rÀntor
xi2 = oljepris
xi3 = vÀrde pÄ S&P 500-index
xi4= pris pÄ oljeterminer
B0 = y-skÀrning vid tidpunkt noll
B1 = regressionskoefficient som mÀter en enhetsförÀndring i den beroende variabeln nÀr xi1 Àndras - förÀndringen i XOM-priset nÀr rÀntorna Àndras
B2 = koefficientvÀrde som mÀter en enhetsförÀndring i den beroende variabeln nÀr xi2 Àndras - förÀndringen i XOM-priset nÀr oljepriset Àndras
Uppskattningarna av minsta kvadrater - B0, B1, B2...Bp - berĂ€knas vanligtvis av statistisk programvara. Lika mĂ„nga variabler kan inkluderas i regressionsmodellen dĂ€r varje oberoende variabel Ă€r differentierad med ett talâ1,2, 3, 4...s. Multipelregressionsmodellen tillĂ„ter en analytiker att förutsĂ€ga ett resultat baserat pĂ„ information som tillhandahĂ„lls om flera förklarande variabler.
ĂndĂ„ Ă€r modellen inte alltid helt korrekt eftersom varje datapunkt kan skilja sig nĂ„got frĂ„n det resultat som modellen förutspĂ„tt. RestvĂ€rdet, E, som Ă€r skillnaden mellan det faktiska utfallet och det förutsagda utfallet, ingĂ„r i modellen för att ta hĂ€nsyn till sĂ„dana smĂ„ variationer.
Om vi antar att vi kör vÄr XOM-prisregressionsmodell genom en programvara för statistikberÀkning, som returnerar denna utdata:
En analytiker skulle tolka denna produktion som att om andra variabler hÄlls konstanta, kommer priset pÄ XOM att öka med 7,8 % om oljepriset pÄ marknaderna ökar med 1 %. Modellen visar ocksÄ att priset pÄ XOM kommer att sjunka med 1,5 % efter en rÀnteuppgÄng pÄ 1 %. R2 indikerar att 86,5 % av variationerna i aktiekursen för Exxon Mobil kan förklaras av förÀndringar i rÀntan, oljepriset, oljeterminer och S&P 500-index.
Skillnaden mellan linjÀr och multipel regression
vanliga linjÀra kvadrater (OLS) jÀmför svaret frÄn en beroende variabel givet en förÀndring i vissa förklarande variabler. En beroende variabel förklaras dock sÀllan av endast en variabel. I det hÀr fallet anvÀnder en analytiker multipel regression, som försöker förklara en beroende variabel med mer Àn en oberoende variabel. Flera regressioner kan vara linjÀra och olinjÀra.
Flera regressioner bygger pÄ antagandet att det finns ett linjÀrt samband mellan bÄde de beroende och oberoende variablerna. Det antar inte heller nÄgon större korrelation mellan de oberoende variablerna.
Höjdpunkter
Multipel regression Àr en förlÀngning av linjÀr (OLS) regression som anvÀnder bara en förklarande variabel.
Multipel linjÀr regression (MLR), Àven kÀnd helt enkelt som multipel regression, Àr en statistisk teknik som anvÀnder flera förklarande variabler för att förutsÀga resultatet av en svarsvariabel.
MLR anvÀnds flitigt inom ekonometri och finansiell slutledning.
Vanliga frÄgor
Vad betyder det att en multipel regression Àr linjÀr?
Vid multipel linjÀr regression berÀknar modellen linjen med bÀsta passform som minimerar varianserna för var och en av de inkluderade variablerna nÀr den relaterar till den beroende variabeln. Eftersom det passar en linje Àr det en linjÀr modell. Det finns ocksÄ icke-linjÀra regressionsmodeller som involverar flera variabler, sÄsom logistisk regression, kvadratisk regression och probitmodeller.
Hur anvÀnds multipla regressionsmodeller i finans?
Varje ekonometrisk modell som tittar pÄ mer Àn en variabel kan vara en multipel. Faktormodeller jÀmför tvÄ eller flera faktorer för att analysera sambanden mellan variabler och den resulterande prestandan. Fama and French Three-Factor Mod Àr en sÄdan modell som expanderar pÄ kapitaltillgÄngsprissÀttningsmodellen (CAPM) genom att lÀgga till storleksrisk och vÀrderiskfaktorer till marknadsriskfaktorn i CAPM (som i sig Àr en regressionsmodell). Genom att inkludera dessa tvÄ ytterligare faktorer, justerar modellen för denna överpresterande tendens, vilket anses göra den till ett bÀttre verktyg för att utvÀrdera chefsprestationer.
Kan jag göra en multipel regression för hand?
Det Àr osannolikt eftersom flera regressionsmodeller Àr komplexa och blir Ànnu mer sÄ nÀr det finns fler variabler som ingÄr i modellen eller nÀr mÀngden data att analysera vÀxer. För att köra en multipel regression kommer du sannolikt att behöva anvÀnda specialiserad statistisk programvara eller funktioner i program som Excel.
Vad gör en multipel regression till multipel?
En multipel regression tar hÀnsyn till effekten av mer Àn en förklarande variabel pÄ ett visst resultat av intresse. Den utvÀrderar den relativa effekten av dessa förklarande, eller oberoende, variabler pÄ den beroende variabeln nÀr alla andra variabler i modellen hÄlls konstanta.
Varför skulle man anvÀnda en multipel regression framför en enkel OLS-regression?
En beroende variabel förklaras sÀllan av endast en variabel. I sÄdana fall anvÀnder en analytiker multipel regression, som försöker förklara en beroende variabel med mer Àn en oberoende variabel. Modellen antar dock att det inte finns nÄgra större korrelationer mellan de oberoende variablerna.