Investor's wiki

Trinnvis regresjon

Trinnvis regresjon

Hva er trinnvis regresjon?

Trinnvis regresjon er den trinnvise iterative konstruksjonen av en regresjonsmodell som involverer valg av uavhengige variabler som skal brukes i en endelig modell. Det innebærer å legge til eller fjerne potensielle forklaringsvariabler etter hverandre og teste for statistisk signifikans etter hver iterasjon.

Tilgjengeligheten av statistiske programvarepakker gjør trinnvis regresjon mulig, selv i modeller med hundrevis av variabler.

Typer trinnvis regresjon

Det underliggende målet med trinnvis regresjon er, gjennom en rekke tester (f.eks. F-tester, t-tester ) å finne et sett med uavhengige variabler som signifikant påvirker den avhengige variabelen. Dette gjøres med datamaskiner gjennom iterasjon, som er prosessen med å komme frem til resultater eller beslutninger ved å gå gjennom gjentatte runder eller sykluser med analyse. Å utføre tester automatisk med hjelp fra statistiske programvarepakker har fordelen av å spare tid og begrense feil.

Trinnvis regresjon kan oppnås enten ved å prøve ut én uavhengig variabel om gangen og inkludere den i regresjonsmodellen hvis den er statistisk signifikant eller ved å inkludere alle potensielle uavhengige variabler i modellen og eliminere de som ikke er statistisk signifikante. Noen bruker en kombinasjon av begge metodene, og derfor er det tre tilnærminger til trinnvis regresjon:

  1. Fremovervalg begynner uten variabler i modellen, tester hver variabel etter hvert som den legges til modellen, og beholder deretter de som anses som mest statistisk signifikante – og gjentar prosessen til resultatene er optimale.

  2. Eliminering bakover starter med et sett med uavhengige variabler, sletter én om gangen, og tester deretter for å se om den fjernede variabelen er statistisk signifikant.

  3. Toveis eliminering er en kombinasjon av de to første metodene som tester hvilke variabler som skal inkluderes eller ekskluderes.

Eksempel

Et eksempel på en trinnvis regresjon ved bruk av bakover-elimineringsmetoden vil være et forsøk på å forstå energibruken på en fabrikk ved å bruke variabler som utstyrsdriftstid, utstyrsalder, personalstørrelse, temperaturer ute og tid på året. Modellen inkluderer alle variablene - så fjernes hver av dem, én om gangen, for å bestemme hvilken som er minst statistisk signifikant. Til slutt kan modellen vise at tiden på året og temperaturene er mest betydningsfulle, noe som muligens antyder at det høyeste energiforbruket på fabrikken er når bruken av klimaanlegget er på sitt høyeste.

Begrensninger for trinnvis regresjon

Regresjonsanalyse, både lineær og multivariat, er mye brukt i økonomi- og investeringsverdenen i dag. Tanken er ofte å finne mønstre som fantes i fortiden som også kan gjenta seg i fremtiden. En enkel lineær regresjon, for eksempel, kan se på pris-til-inntjening-forhold og aksjeavkastning over mange år for å finne ut om aksjer med lave P/E-forhold (uavhengig variabel) gir høyere avkastning (avhengig variabel). Problemet med denne tilnærmingen er at markedsforholdene ofte endres og forhold som har holdt i fortiden, ikke nødvendigvis stemmer i nåtid eller fremtid.

I mellomtiden har den trinnvise regresjonsprosessen mange kritikere, og det er til og med oppfordringer om å slutte å bruke metoden helt. Statistikere bemerker flere ulemper ved tilnærmingen, inkludert feil resultater, en iboende skjevhet i selve prosessen, og nødvendigheten av betydelig datakraft for å utvikle komplekse regresjonsmodeller gjennom iterasjon.

Høydepunkter

– Trinnvis regresjon har imidlertid sine ulemper, da det er en tilnærming som passer data inn i en modell for å oppnå ønsket resultat.

  • Metoden for bakover eliminering begynner med en full modell lastet med flere variabler og fjerner deretter én variabel for å teste dens betydning i forhold til generelle resultater.

– Trinnvis regresjon er en metode som iterativt undersøker den statistiske signifikansen til hver uavhengig variabel i en lineær regresjonsmodell.

  • Forward selection-tilnærmingen starter med ingenting og legger til hver ny variabel trinnvis, tester for statistisk signifikans.