Investor's wiki

Multippel lineær regresjon (MLR)

Multippel lineær regresjon (MLR)

Hva er multippel lineær regresjon (MLR)?

Multippel lineær regresjon (MLR), også kjent ganske enkelt som multippel regresjon, er en statistisk teknikk som bruker flere forklarende variabler for å forutsi utfallet av en responsvariabel. Målet med multippel lineær regresjon er å modellere det lineære forholdet mellom de forklarende (uavhengige) variablene og respons (avhengige) variabler. I hovedsak er multippel regresjon utvidelsen av vanlig minste kvadraters (OLS) regresjon fordi den involverer mer enn én forklarende variabel.

Formel og beregning av multippel lineær regresjon

yi= β0+β1 xi1+ β2xi< mn>2+..< mi mathvariant="normal">.+βpx ip+ϵ hvor, for i=n observasjoner:</ mrow>y i=avhengig variabel</ mrow>xi=forklarende variabler β0=< mtext>y-avskjæring (ca onstant term)< /mstyle>βp</ mi>=helningskoeffisienter for hver forklaringsvariabel< mstyle scriptlevel="0" displaystyle="true">< /mrow>ϵ=modellens feilterm (også kjent som residualene)< /mtr>\begin&y_i = \beta_0 + \beta 1 x + \beta 2 x + ... + \beta p x + \epsilon\&\textbf{hvor, for } i = n \textbf\&y_i=\text\&x_i=\ tekst\&\beta_0=\tekst{y-avskjæring (konstant ledd)}\&\beta_p=\text\&\epsilon=\text{modellens feilterm (også kjent som residualene)}\end< span class="katex-html" aria-hidden="true">< /span> < span class="psrut" style="height:2.84em;"> yi<​</ span ></ span >=β0</ span> +β1< / span>< span> xi1 < /span>+β2<< span class="vlist-r">< / span>x< span class="psrut" style="height:2.7em;"><span class="mord mathnormal mtight" " >i2<​< /span >< /span >< span class="mspace" style="margin-right:0.22222222222222222em;">+...+β< span class="mord mathnormal mtight">p<</ span>xip< /span>< / span>+ϵ< / span>hvor, for i=n observasjoner : y< /span> i =< /span>avhengig variabel>< span class="mord mathnormal">xi = < span class="mord">forklarende variablerβ0</sp an>= y-avskjæring (konstant term)β< span class="vlist" style="height:0.151392000000000003em;">p< span class="vlist" style="height:0.286108em;">=</ span >hellingskoeffisienter for hver forklaringsvariabelϵ=modellens feilterm (også kjent som residualene)</ span >< /span>

Hva multippel lineær regresjon kan fortelle deg

Enkel lineær regresjon er en funksjon som lar en analytiker eller statistiker komme med spådommer om en variabel basert på informasjonen som er kjent om en annen variabel. Lineær regresjon kan bare brukes når man har to kontinuerlige variabler - en uavhengig variabel og en avhengig variabel. Den uavhengige variabelen er parameteren som brukes til å beregne den avhengige variabelen eller utfallet. En multippel regresjonsmodell strekker seg til flere forklaringsvariabler.

Multippel regresjonsmodellen er basert på følgende forutsetninger:

– Det er en lineær sammenheng mellom de avhengige variablene og de uavhengige variablene

– De uavhengige variablene er ikke for høyt korrelert med hverandre

  • yi observasjoner velges uavhengig og tilfeldig fra populasjonen

  • Residualer skal være normalfordelt med et gjennomsnitt på 0 og varians σ

Bestemmelseskoeffisienten (R- kvadrert ) er en statistisk metrikk som brukes til å måle hvor mye av variasjonen i utfall som kan forklares med variasjonen i de uavhengige variablene. R2 øker alltid etter hvert som flere prediktorer legges til MLR-modellen, selv om prediktorene kanskje ikke er relatert til utfallsvariabelen.

R2 i seg selv kan derfor ikke brukes til å identifisere hvilke prediktorer som bør inkluderes i en modell og hvilke som bør ekskluderes. R2 kan bare være mellom 0 og 1, der 0 indikerer at utfallet ikke kan forutsies av noen av de uavhengige variablene og 1 indikerer at utfallet kan forutsies uten feil fra de uavhengige variablene.

Når du tolker resultatene av multippel regresjon, er beta-koeffisienter gyldige mens de holder alle andre variabler konstante ("alt annet like"). Utdata fra en multippel regresjon kan vises horisontalt som en ligning, eller vertikalt i tabellform.

Eksempel på hvordan du bruker multippel lineær regresjon

Som et eksempel kan en analytiker ønske å vite hvordan bevegelsen i markedet påvirker prisen på ExxonMobil (XOM). I dette tilfellet vil deres lineære ligning ha verdien av S&P 500-indeksen som den uavhengige variabelen, eller prediktoren, og prisen på XOM som den avhengige variabelen.

I virkeligheten forutsier flere faktorer utfallet av en hendelse. Prisbevegelsen til ExxonMobil, for eksempel, avhenger av mer enn bare ytelsen til det totale markedet. Andre prediktorer som oljeprisen, renter og prisbevegelsen på fremtidig olje kan påvirke prisen på XOM og aksjekursene til andre oljeselskaper . For å forstå en sammenheng der mer enn to variabler er til stede, brukes multippel lineær regresjon.

Multippel lineær regresjon (MLR) brukes til å bestemme en matematisk sammenheng mellom flere tilfeldige variabler. Med andre ord undersøker MLR hvordan flere uavhengige variabler er relatert til en avhengig variabel. Når hver av de uavhengige faktorene har blitt bestemt til å forutsi den avhengige variabelen, kan informasjonen om de flere variablene brukes til å lage en nøyaktig prediksjon om nivået av effekt de har på utfallsvariabelen. Modellen skaper en relasjon i form av en rett linje (lineær) som best tilnærmer alle de enkelte datapunktene.

Med henvisning til MLR-ligningen ovenfor, i vårt eksempel:

  • yi = avhengig variabel—prisen på XOM

  • xi1 = renter

  • xi2 = oljepris

  • xi3 = verdien av S&P 500-indeksen

  • xi4= pris på oljefutures

  • B0 = y-skjæringspunktet ved tiden null

  • B1 = regresjonskoeffisient som måler en enhetsendring i den avhengige variabelen når xi1 endres - endringen i XOM-pris når rentene endres

  • B2 = koeffisientverdi som måler en enhetsendring i den avhengige variabelen når xi2 endres—endringen i XOM-pris når oljeprisen endres

Estimatene for minste kvadrater - B0, B1, B2...Bp - beregnes vanligvis av statistisk programvare. Like mange variabler kan inkluderes i regresjonsmodellen der hver uavhengig variabel er differensiert med et tall—1,2, 3, 4...s. Multippel regresjonsmodellen lar en analytiker forutsi et utfall basert på informasjon gitt om flere forklaringsvariabler.

Likevel er ikke modellen alltid helt nøyaktig, da hvert datapunkt kan avvike litt fra utfallet forutsagt av modellen. Restverdien, E, som er differansen mellom det faktiske utfallet og det predikerte utfallet, er inkludert i modellen for å ta hensyn til slike små variasjoner.

Forutsatt at vi kjører vår XOM-prisregresjonsmodell gjennom en programvare for statistikkberegning, som returnerer denne utgangen:

En analytiker vil tolke denne produksjonen slik at hvis andre variabler holdes konstante, vil prisen på XOM øke med 7,8 % dersom oljeprisen i markedene øker med 1 %. Modellen viser også at prisen på XOM vil synke med 1,5 % etter en renteøkning på 1 %. R2 indikerer at 86,5 % av variasjonene i aksjekursen til Exxon Mobil kan forklares av endringer i renten, oljeprisen, oljefutures og S&P 500-indeksen.

Forskjellen mellom lineær og multippel regresjon

vanlige lineære kvadrater (OLS) sammenligner responsen til en avhengig variabel gitt en endring i noen forklaringsvariabler. En avhengig variabel forklares imidlertid sjelden med bare én variabel. I dette tilfellet bruker en analytiker multippel regresjon, som prøver å forklare en avhengig variabel ved å bruke mer enn én uavhengig variabel. Flere regresjoner kan være lineære og ikke-lineære.

Multiple regresjoner er basert på antakelsen om at det er en lineær sammenheng mellom både de avhengige og uavhengige variablene. Den antar heller ingen større korrelasjon mellom de uavhengige variablene.

##Høydepunkter

  • Multippel regresjon er en utvidelse av lineær (OLS) regresjon som bruker bare én forklarende variabel.

– Multippel lineær regresjon (MLR), også kjent ganske enkelt som multippel regresjon, er en statistisk teknikk som bruker flere forklaringsvariabler for å forutsi utfallet av en responsvariabel.

  • MLR brukes mye i økonometri og finansiell slutning.

##FAQ

Hva betyr det at en multippel regresjon er lineær?

Ved multippel lineær regresjon beregner modellen linjen med beste tilpasning som minimerer variansene til hver av variablene som er inkludert i forhold til den avhengige variabelen. Fordi den passer til en linje, er den en lineær modell. Det er også ikke-lineære regresjonsmodeller som involverer flere variabler, for eksempel logistisk regresjon, kvadratisk regresjon og probitmodeller.

Hvordan brukes multiple regresjonsmodeller i finans?

Enhver økonometrisk modell som ser på mer enn én variabel kan være et multiplum. Faktormodeller sammenligner to eller flere faktorer for å analysere sammenhenger mellom variabler og den resulterende ytelsen. Fama and French Three-Factor Mod er en slik modell som utvider kapitalkapitalprisingsmodellen (CAPM) ved å legge størrelsesrisiko og verdirisikofaktorer til markedsrisikofaktoren i CAPM (som i seg selv er en regresjonsmodell). Ved å inkludere disse to tilleggsfaktorene, justerer modellen for denne utkonkurrerende tendensen, noe som antas å gjøre den til et bedre verktøy for å evaluere lederprestasjoner.

Kan jeg gjøre en multippel regresjon for hånd?

Det er usannsynlig siden flere regresjonsmodeller er komplekse og blir enda mer når det er flere variabler inkludert i modellen eller når mengden data som skal analyseres vokser. For å kjøre en multippel regresjon må du sannsynligvis bruke spesialisert statistisk programvare eller funksjoner i programmer som Excel.

Hva gjør en multippel regresjon til multiplum?

En multippel regresjon vurderer effekten av mer enn én forklaringsvariabel på et eller annet resultat av interesse. Den evaluerer den relative effekten av disse forklarende, eller uavhengige, variablene på den avhengige variabelen når alle de andre variablene i modellen holdes konstante.

Hvorfor ville man bruke en multippel regresjon over en enkel OLS-regresjon?

En avhengig variabel forklares sjelden med bare én variabel. I slike tilfeller bruker en analytiker multippel regresjon, som forsøker å forklare en avhengig variabel ved å bruke mer enn én uavhengig variabel. Modellen antar imidlertid at det ikke er noen store sammenhenger mellom de uavhengige variablene.