Investor's wiki

Summen av kvadrater

Summen av kvadrater

Hva er summen av kvadrater?

Sum av kvadrater er en statistisk teknikk som brukes i regresjonsanalyse for å bestemme spredningen av datapunkter. I en regresjonsanalyse er målet å bestemme hvor godt en dataserie kan tilpasses en funksjon som kan bidra til å forklare hvordan dataserien ble generert. Sum av kvadrater brukes som en matematisk måte å finne funksjonen som passer best (varierer minst) fra dataene.

Formelen for summen av kvadrater er

For et sett X av < mi>n elementer:Summen av kvadrater</ mtext>=∑i=0</ mrow>n(Xi</ mi>−X‾)2hvor:</ mrow>X i=it h element i settet X‾=Gjennomsnittet av alle elementer i settet</ mstyle>(Xi< /mi>−X‾)=Avviket for hvert element fra gjennomsnittet \begin &\text X \text n \text\ &amp ;\text=\sum_^\left(X_i-\overline\right)2\ &\textbf\ &X_i =\text i \text\ &\overline=\text\ &\left(X_i- \overline\right) = \text\ \end

Summen av kvadrater er også kjent som variasjon.

Hva forteller summen av kvadrater deg?

Summen av kvadrater er et mål på avvik fra gjennomsnittet. I statistikk er gjennomsnittet gjennomsnittet av et sett med tall og er det mest brukte målet på sentral tendens. Det aritmetiske gjennomsnittet beregnes ganske enkelt ved å summere verdiene i datasettet og dele på antall verdier.

La oss si at sluttkursene til Microsoft (MSFT) de siste fem dagene var 74,01, 74,77, 73,94, 73,61 og 73,40 i amerikanske dollar. Summen av de totale prisene er $369,73 og gjennomsnittsprisen eller gjennomsnittsprisen for læreboken vil dermed være $369,73 / 5 = $73,95.

Men å vite gjennomsnittet av et målesett er ikke alltid nok. Noen ganger er det nyttig å vite hvor mye variasjon det er i et sett med målinger. Hvor langt fra hverandre de enkelte verdiene er fra gjennomsnittet kan gi et visst innblikk i hvor passform observasjonene eller verdiene er til regresjonsmodellen som skapes.

For eksempel, hvis en analytiker ønsket å vite om aksjekursen til MSFT beveger seg i takt med prisen på Apple (AAPL), kan de liste opp settet med observasjoner for prosessen til begge aksjene i en viss periode, for eksempel 1, 2 , eller 10 år og lag en lineær modell med hver av observasjonene eller målingene registrert. Hvis forholdet mellom begge variablene (dvs. prisen på AAPL og prisen på MSFT) ikke er en rett linje, er det variasjoner i datasettet som må granskes.

Hvis linjen i den lineære modellen som er opprettet ikke går gjennom alle verdimålingene, er noe av variasjonen som har blitt observert i aksjekursene uforklarlig i statistikk. Summen av kvadrater brukes til å beregne om det eksisterer et lineært forhold mellom to variabler, og enhver uforklarlig variasjon omtales som restsummen av kvadrater.

Summen av kvadrater er summen av kvadratet av variasjon, der variasjon er definert som spredningen mellom hver enkelt verdi og gjennomsnittet. For å bestemme summen av kvadrater, kvadreres avstanden mellom hvert datapunkt og linjen med best passform og deretter summeres. Linjen med best passform vil minimere denne verdien.

Hvordan beregne summen av kvadrater

Nå kan du se hvorfor målingen kalles summen av kvadrerte avvik, eller summen av kvadrater for kort. Ved å bruke vårt MSFT-eksempel ovenfor, kan summen av kvadrater beregnes som:

  • SS = (74,01 - 73,95)2 + (74,77 - 73,95)2 + (73,94 - 73,95)2 + (73,61 - 73,95)2 + (73,40 - 73,95)2

  • SS = (0,06) 2 + (0,82)2 + (-0,01)2 + (-0,34)2 + (-0,55)2

  • SS = 1,0942

Å legge til summen av avvikene alene uten kvadrering vil resultere i et tall som er lik eller nær null siden de negative avvikene vil nesten perfekt oppveie de positive avvikene. For å få et mer realistisk tall må summen av avvik kvadreres. Summen av kvadrater vil alltid være et positivt tall fordi kvadratet av et hvilket som helst tall, enten positivt eller negativt, alltid er positivt.

Eksempel på hvordan du bruker summen av kvadrater

Basert på resultatene av MSFT-beregningen, indikerer en høy sum av kvadrater at de fleste verdiene er lenger unna gjennomsnittet, og derfor er det stor variasjon i dataene. En lav sum av kvadrater refererer til lav variasjon i settet med observasjoner.

I eksemplet ovenfor viser 1,0942 at variasjonen i aksjekursen til MSFT de siste fem dagene er svært lav, og investorer som ønsker å investere i aksjer preget av prisstabilitet og lav volatilitet kan velge MSFT.

Begrensninger ved bruk av summen av kvadrater

Å ta en investeringsbeslutning om hvilken aksje som skal kjøpes krever mange flere observasjoner enn de som er oppført her. En analytiker må kanskje jobbe med årevis med data for å vite med større sikkerhet hvor høy eller lav variabiliteten til en eiendel er. Ettersom flere datapunkter legges til settet, blir summen av kvadrater større ettersom verdiene blir mer spredt.

De mest brukte målingene av variasjon er standardavvik og varians. Men for å beregne en av de to metrikkene, må summen av kvadrater først beregnes. Variansen er gjennomsnittet av summen av kvadrater (dvs. summen av kvadrater delt på antall observasjoner). Standardavviket er kvadratroten av variansen.

Det er to metoder for regresjonsanalyse som bruker summen av kvadrater: den lineære minste kvadraters metoden og den ikke-lineære minste kvadraters metoden. Minste kvadraters metode refererer til det faktum at regresjonsfunksjonen minimerer summen av kvadratene av variansen fra de faktiske datapunktene. På denne måten er det mulig å tegne en funksjon som statistisk gir best passform for dataene. Merk at en regresjonsfunksjon enten kan være lineær (en rett linje) eller ikke-lineær (en buet linje).

Høydepunkter

  • Summen av kvadrater mÃ¥ler avviket til datapunkter bort fra middelverdien.

– Et høyere kvadratsum-resultat indikerer stor grad av variasjon innenfor datasettet, mens et lavere resultat indikerer at dataene ikke avviker vesentlig fra middelverdien.