Reststandardavvik

Hva er gjenværende standardavvik?

Resterende standardavvik er et statistisk begrep som brukes for å beskrive forskjellen i standardavvik for observerte verdier kontra predikerte verdier som vist ved punkter i en regresjonsanalyse.

Regresjonsanalyse er en metode som brukes i statistikk for å vise en sammenheng mellom to forskjellige variabler, og for å beskrive hvor godt man kan forutsi oppførselen til en variabel ut fra en annens oppførsel.

Resterende standardavvik omtales også som standardavviket for punkter rundt en tilpasset linje eller standardavviket for estimatet.

Forstå gjenværende standardavvik

Resterende standardavvik er et goodness-of-fit- mål som kan brukes til å analysere hvor godt et sett med datapunkter passer med den faktiske modellen. I en forretningssetting for eksempel, etter å ha utført en regresjonsanalyse på flere datapunkter for kostnader over tid, kan det gjenværende standardavviket gi en bedriftseier informasjon om forskjellen mellom faktiske kostnader og anslåtte kostnader, og en ide om hvor mye anslått. kostnadene kan variere fra gjennomsnittet av de historiske kostnadsdataene.

Formel for gjenværende standardavvik

$\begin &\text=\left(Y-Y_\right)\ &amp ;S_=\sqrt{\frac{\sum \left(Y-Y_\right)^2}}\ &\textbf\ &S_ =\text\ &Y=\tekst\ &Y_=\text{Estimert eller anslått verdi}\ &n=\tekst\ \end$

c339.3,-1799.3,509.3,-2700,510,-2702 l0 -0

c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7

s-90.5,478,-276.2,1466c-185.7,988,-279.5,1483,-281.5,1485c-2,6,-10,9,-24,9

c-8,0,-12,-0,7,-12,-2c0,-1,3,-5,3,-32,-16,-92c-50,7,-293,3,-119,7,-693,3,-207,-1200

c0,-1,3,-5,3,8,7,-16,30c-10,7,21,3,-21,3,42,7,-32,64s-16,33,-16,33s-26,-26,-26,-26

s76,-153,76,-153s77,-151,77,-151c0.7,0.7,35.7,202,105,604c67.3,400.7,102,602.7,104,

606zM1001 80h400000v40H1017.7z'/> hvor:Sres=Resterende standardavvikY=Observert verdi Y est =Estimert eller anslått verdin=Datapunkter i populasjon

Hvordan beregne gjenværende standardavvik

For å beregne gjenværende standardavvik, må differansen mellom de predikerte verdiene og faktiske verdier dannet rundt en tilpasset linje beregnes først. Denne forskjellen er kjent som restverdien eller, ganske enkelt, residualer eller avstanden mellom kjente datapunkter og de datapunktene som er forutsagt av modellen.

For å beregne det gjenværende standardavviket, plugg restene inn i den gjenværende standardavviksligningen for å løse formelen.

Eksempel på gjenværende standardavvik

Start med å beregne restverdier. Hvis du for eksempel antar at du har et sett med fire observerte verdier for et eksperiment uten navn, viser tabellen nedenfor y-verdier observert og registrert for gitte verdier av x:

TTT

Hvis den lineære ligningen eller helningen til linjen predikert av dataene i modellen er gitt som y_est = 1x + 2 hvor y_est = predikert y-verdi, kan residualet for hver observasjon bli funnet.

Residualet er lik (y - y_est), så for det første settet er den faktiske y-verdien 1 og den predikerte y_est-verdien gitt av ligningen er y_est = 1(1) + 2 = 3. Restverdien er altså 1 – 3 = -2, en negativ restverdi.

For det andre settet med x- og y-datapunkter kan den anslåtte y-verdien når x er 2 og y er 4 beregnes som 1 (2) + 2 = 4.

I dette tilfellet er de faktiske og anslåtte verdiene de samme, så restverdien vil være null. Du vil bruke den samme prosessen for å komme frem til de predikerte verdiene for y i de resterende to datasettene.

Når du har beregnet residualene for alle punkter ved hjelp av tabellen eller en graf, bruker du formelen for gjenværende standardavvik.

Ved å utvide tabellen ovenfor, beregner du gjenværende standardavvik:

TTT

Legg merke til at summen av de kvadrerte residualene = 6, som representerer telleren for gjenværende standardavviksligning.

For den nederste delen eller nevneren av reststandardavviksligningen, n = antall datapunkter, som er 4 i dette tilfellet. Regn ut nevneren til ligningen som:

(Antall rester - 2) = (4 - 2) = 2

Beregn til slutt kvadratroten av resultatene:

Resterende standardavvik: √(6/2) = √3 ≈ 1,732

Størrelsen på en typisk rest kan gi deg en følelse av generelt hvor nærme estimatene dine er. Jo mindre gjenværende standardavvik, desto nærmere passer estimatet til de faktiske dataene. Faktisk, jo mindre gjenværende standardavvik er sammenlignet med prøvestandardavviket,. jo mer prediktiv eller nyttig er modellen.

Reststandardavviket kan beregnes når en regresjonsanalyse er utført, samt en variansanalyse (ANOVA). Ved fastsettelse av en grense for kvantifisering (LoQ) er bruk av et gjenværende standardavvik tillatt i stedet for standardavviket.

Høydepunkter

– Standardavviket til residualene beregner hvor mye datapunktene sprer seg rundt regresjonslinjen.

– Resultatet brukes til å måle feilen på regresjonslinjens forutsigbarhet.

Reststandardavvik er standardavviket til restverdiene, eller differansen mellom et sett med observerte og predikerte verdier.

– Jo mindre gjenværende standardavvik er sammenlignet med utvalgets standardavvik, jo mer prediktiv, eller nyttig, er modellen.