Investor's wiki

Stegvis regression

Stegvis regression

Vad Àr stegvis regression?

Stegvis regression Àr den steg-för-steg iterativa konstruktionen av en regressionsmodell som involverar urvalet av oberoende variabler som ska anvÀndas i en slutlig modell. Det innebÀr att man lÀgger till eller tar bort potentiella förklarande variabler i följd och testar för statistisk signifikans efter varje iteration.

TillgÀngligheten av statistiska programvarupaket gör stegvis regression möjlig, Àven i modeller med hundratals variabler.

Typer av stegvis regression

Det underliggande mÄlet med stegvis regression Àr att genom en serie tester (t.ex. F-test, t-test ) hitta en uppsÀttning oberoende variabler som signifikant pÄverkar den beroende variabeln. Detta görs med datorer genom iteration, vilket Àr processen att komma fram till resultat eller beslut genom att gÄ igenom upprepade omgÄngar eller cykler av analys. Att utföra tester automatiskt med hjÀlp av statistiska mjukvarupaket har fördelen att spara tid och begrÀnsa misstag.

Stegvis regression kan uppnÄs antingen genom att pröva en oberoende variabel Ät gÄngen och inkludera den i regressionsmodellen om den Àr statistiskt signifikant eller genom att inkludera alla potentiella oberoende variabler i modellen och eliminera de som inte Àr statistiskt signifikanta. Vissa anvÀnder en kombination av bÄda metoderna och dÀrför finns det tre metoder för stegvis regression:

  1. Selektion framĂ„t börjar utan variabler i modellen, testar varje variabel nĂ€r den lĂ€ggs till modellen, och behĂ„ller sedan de som anses vara mest statistiskt signifikanta – och upprepar processen tills resultaten Ă€r optimala.

  2. BakÄteliminering börjar med en uppsÀttning oberoende variabler, tar bort en i taget och testar sedan för att se om den borttagna variabeln Àr statistiskt signifikant.

  3. Dubbelriktad eliminering Àr en kombination av de tvÄ första metoderna som testar vilka variabler som ska inkluderas eller exkluderas.

Exempel

Ett exempel pÄ en stegvis regression med anvÀndning av bakÄtelimineringsmetoden skulle vara ett försök att förstÄ energianvÀndningen i en fabrik med hjÀlp av variabler som utrustningens gÄngtid, utrustningens Älder, personalstorlek, temperaturer utomhus och tid pÄ Äret. Modellen inkluderar alla variabler - sedan tas var och en bort, en i taget, för att avgöra vilken som Àr minst statistiskt signifikant. I slutÀndan kan modellen visa att tid pÄ Äret och temperaturer Àr mest betydelsefulla, vilket möjligen tyder pÄ att den maximala energiförbrukningen pÄ fabriken Àr nÀr luftkonditioneringsanvÀndningen Àr som högst.

BegrÀnsningar av stegvis regression

Regressionsanalys, bÄde linjÀr och multivariat, anvÀnds idag flitigt inom ekonomi- och investeringsvÀrlden. Tanken Àr ofta att hitta mönster som funnits i det förflutna som ocksÄ kan Äterkomma i framtiden. En enkel linjÀr regression, till exempel, kan titta pÄ pris-till-vinst-förhÄllanden och aktieavkastning under mÄnga Är för att avgöra om aktier med lÄga P/E-tal (oberoende variabel) erbjuder högre avkastning (beroende variabel). Problemet med detta tillvÀgagÄngssÀtt Àr att marknadsförhÄllandena ofta förÀndras och relationer som har hÄllit i det förflutna inte nödvÀndigtvis stÀmmer i nuet eller framtiden.

Samtidigt har den stegvisa regressionsprocessen mÄnga kritiker och det finns till och med uppmaningar att helt sluta anvÀnda metoden. Statistiker noterar flera nackdelar med tillvÀgagÄngssÀttet, inklusive felaktiga resultat, en inneboende bias i sjÀlva processen och nödvÀndigheten av betydande datorkraft för att utveckla komplexa regressionsmodeller genom iteration.

Höjdpunkter

– Stegvis regression har dock sina baksidor dĂ„ det Ă€r ett tillvĂ€gagĂ„ngssĂ€tt som passar in data i en modell för att uppnĂ„ önskat resultat.

  • BakĂ„telimineringsmetoden börjar med en fullstĂ€ndig modell laddad med flera variabler och tar sedan bort en variabel för att testa dess betydelse i förhĂ„llande till övergripande resultat.

– Stegvis regression Ă€r en metod som iterativt undersöker den statistiska signifikansen för varje oberoende variabel i en linjĂ€r regressionsmodell.

  • FramĂ„tvalsmetoden börjar med ingenting och lĂ€gger till varje ny variabel stegvis, testar för statistisk signifikans.