Investor's wiki

Restsumma av kvadrater (RSS)

Restsumma av kvadrater (RSS)

Vad Àr den resterande summan av kvadrater (RSS)?

Residualsumman av kvadrater (RSS) Àr en statistisk teknik som anvÀnds för att mÀta mÀngden varians i en datamÀngd som inte förklaras av en regressionsmodell i sig. IstÀllet uppskattar den variansen i residualerna eller feltermen.

LinjÀr regression Àr ett mÄtt som hjÀlper till att bestÀmma styrkan i sambandet mellan en beroende variabel och en eller flera andra faktorer, sÄ kallade oberoende eller förklarande variabler.

FörstÄ den ÄterstÄende summan av kvadrater

I allmÀnna termer Àr summan av kvadrater en statistisk teknik som anvÀnds i regressionsanalys för att bestÀmma spridningen av datapunkter. I en regressionsanalys Àr mÄlet att bestÀmma hur vÀl en dataserie kan anpassas till en funktion som kan hjÀlpa till att förklara hur dataserien genererades. Summan av kvadrater anvÀnds som ett matematiskt sÀtt att hitta den funktion som bÀst passar (varierar minst) frÄn data.

RSS mÀter mÀngden fel som ÄterstÄr mellan regressionsfunktionen och datamÀngden efter att modellen har körts. En mindre RSS-siffra representerar en regressionsfunktion som Àr vÀl anpassad till data.

RSS, Àven kÀnd som summan av kvadrerade residualer, avgör i huvudsak hur vÀl en regressionsmodell förklarar eller representerar data i modellen.

Hur man berÀknar restsumman av kvadrater

RSS = ∑ni=1 (yi - f(xi))2

Var:

yi = det ite vÀrdet för variabeln som ska förutsÀgas

f(xi) = förutsagt vÀrde pÄ yi

n = övre grÀns för summering

Residual Sum of Squares (RSS) vs. Residual Standard Error (RSE)

Det ÄterstÄende standardfelet (RSE) Àr en annan statistisk term som anvÀnds för att beskriva skillnaden i standardavvikelser för observerade vÀrden kontra förutsagda vÀrden som visas av punkter i en regressionsanalys. Det Àr ett bra mÄtt som kan anvÀndas för att analysera hur vÀl en uppsÀttning datapunkter passar med den faktiska modellen.

RSE berÀknas genom att dividera RSS med antalet observationer i urvalet minus 2 och sedan ta kvadratroten: RSE = [RSS/(n-2)]1/2

SÀrskilda övervÀganden

Finansmarknaderna har blivit mer kvantitativt styrda; som sĂ„dan, i jakten pĂ„ en fördel, anvĂ€nder mĂ„nga investerare avancerade statistiska tekniker för att hjĂ€lpa till i sina beslut. Big data, maskininlĂ€rning och artificiell intelligens krĂ€ver vidare anvĂ€ndningen av statistiska egenskaper för att vĂ€gleda samtida investeringsstrategier. Restsumman av kvadrater – eller RSS-statistik – Ă€r en av mĂ„nga statistiska egenskaper som fĂ„r en renĂ€ssans.

Statistiska modeller anvÀnds av investerare och portföljförvaltare för att spÄra en investeringspris och anvÀnda dessa data för att förutsÀga framtida rörelser. Studien - kallad regressionsanalys - kan innebÀra att analysera förhÄllandet i prisrörelser mellan en vara och aktierna i företag som Àr engagerade i att producera varan.

Att hitta restsumman av kvadrater (RSS) för hand kan vara svÄrt och tidskrÀvande. Eftersom det innebÀr mycket att subtrahera, kvadrera och summera, kan berÀkningarna vara benÀgna att göra fel. Av denna anledning kan du vÀlja att anvÀnda programvara, som Excel, för att göra berÀkningarna.

Alla modeller kan ha avvikelser mellan de förutsagda vĂ€rdena och faktiska resultat. Även om varianserna kan förklaras av regressionsanalysen, representerar RSS de varianser eller fel som inte förklaras.

Eftersom en tillrÀckligt komplex regressionsfunktion kan göras för att passa praktiskt taget vilken datauppsÀttning som helst, Àr ytterligare studier nödvÀndig för att avgöra om regressionsfunktionen faktiskt Àr anvÀndbar för att förklara variansen i datamÀngden.

Vanligtvis Àr dock ett mindre eller lÀgre vÀrde för RSS idealiskt i alla modeller eftersom det betyder att det finns mindre variation i datamÀngden. Med andra ord, ju lÀgre summan av kvadrerade residualer Àr, desto bÀttre Àr regressionsmodellen pÄ att förklara data.

Exempel pÄ restsumman av kvadrater

För en enkel (men lÄng) demonstration av RSS-berÀkningen, övervÀg det vÀlkÀnda sambandet mellan ett lands konsumtionsutgifter och dess BNP. Följande diagram Äterspeglar de publicerade vÀrdena för konsumenternas vÀntande och bruttonationalprodukten för de 27 delstaterna i Europeiska unionen, frÄn och med 2020.

TTT

VĂ€rldsbanken, 2020.

Konsumentutgifter och BNP har en stark positiv korrelation, och det Àr möjligt att förutsÀga ett lands BNP baserat pÄ konsumentutgifter (CS). Med hjÀlp av formeln för en linje som passar bÀst kan detta förhÄllande uppskattas som:

BNP = 1,3232 x CS + 10447

Enheterna för bÄde BNP och konsumtionsutgifter Àr i miljoner amerikanska dollar.

Denna formel Àr mycket exakt för de flesta ÀndamÄl, men den Àr inte perfekt pÄ grund av de individuella variationerna i varje lands ekonomi. Följande diagram jÀmför den prognostiserade BNP för varje land, baserat pÄ formeln ovan, och den faktiska BNP som registrerats av VÀrldsbanken.

TTT

VĂ€rldsbanken, 2020.

Kolumnen till höger indikerar kvarvarande kvadrater – den kvadratiska skillnaden mellan varje projicerat vĂ€rde och dess faktiska vĂ€rde. Siffrorna verkar stora, men deras summa Ă€r faktiskt lĂ€gre Ă€n RSS för nĂ„gon annan möjlig trendlinje. Om en annan linje hade en lĂ€gre RSS för dessa datapunkter, skulle den linjen vara den linje som passar bĂ€st.

##Höjdpunkter

  • Ett vĂ€rde pĂ„ noll betyder att din modell passar perfekt.

  • RSS anvĂ€nds av finansanalytiker för att uppskatta giltigheten av deras ekonometriska modeller.

  • Residualsumman av kvadrater (RSS) mĂ€ter variansnivĂ„n i feltermen, eller residualerna, för en regressionsmodell.

  • Statistiska modeller anvĂ€nds av investerare och portföljförvaltare för att spĂ„ra en investerings pris och anvĂ€nda dessa data för att förutsĂ€ga framtida rörelser.

  • Ju mindre restsumman av kvadrater, desto bĂ€ttre passar din modell dina data; ju större restsumman av kvadrater, desto sĂ€mre passar din modell dina data.

##FAQ

Är RSS detsamma som summan av kvadratisk uppskattning av fel (SSE)?

Residualsumman av kvadrater (RSS) Àr ocksÄ kÀnd som summan av kvadratisk uppskattning av fel (SSE).

Vad Àr skillnaden mellan den resterande summan av kvadrater och den totala summan av kvadrater?

Totalsumman av kvadrater (TSS) mÀter hur mycket variation det finns i de observerade data, medan den resterande summan av kvadrater mÀter variationen i felet mellan de observerade data och modellerade vÀrden. I statistik jÀmförs ofta vÀrdena för restsumman av kvadrater och totalsumman av kvadrater (TSS) med varandra.

Är den Ă„terstĂ„ende summan av kvadrater densamma som R-kvadrat?

Residualsumman av kvadrater (RSS) Àr den absoluta mÀngden förklarad variation, medan R-kvadrat Àr den absoluta mÀngden variation som en andel av den totala variationen.

Kan en restsumma av kvadrater vara noll?

Restsumman av kvadrater kan vara noll. Ju mindre restsumman av kvadrater, desto bÀttre passar din modell dina data; ju större restsumman av kvadrater, desto sÀmre passar din modell dina data. Ett vÀrde pÄ noll betyder att din modell passar perfekt.