Investor's wiki

Summan av kvadrater

Summan av kvadrater

Vad Àr summan av kvadrater?

Summa av kvadrater Àr en statistisk teknik som anvÀnds i regressionsanalys för att bestÀmma spridningen av datapunkter. I en regressionsanalys Àr mÄlet att bestÀmma hur vÀl en dataserie kan anpassas till en funktion som kan hjÀlpa till att förklara hur dataserien genererades. Summa av kvadrater anvÀnds som ett matematiskt sÀtt att hitta den funktion som bÀst passar (varierar minst) frÄn data.

Formeln för summan av kvadrater Àr

För en uppsĂ€ttning X av < mi>n objekt:Summan av kvadrater</ mtext>=∑i=0</ mrow>n(Xi</ mi>−X‟)2dĂ€r:</ mrow>X i=it h objekt i uppsĂ€ttningen X‟=MedelvĂ€rdet av alla objekt i uppsĂ€ttningen</ mstyle>(Xi< /mi>−X‟)=Avvikelsen för varje objekt frĂ„n medelvĂ€rdet \begin &\text{För en uppsĂ€ttning } X \text n \text\ &amp ;\text=\sum_^\left(X_i-\överlinje\right)2\ &\textbf{dĂ€r:}\ &X_i =\text i \text{-objektet i uppsĂ€ttningen}\ &\overline=\text{MedelvĂ€rdet av alla poster i uppsĂ€ttningen}\ &\left(X_i- \overline\right) = \text{Avvikelsen för varje objekt frĂ„n medelvĂ€rdet}\ \end

Summan av kvadrater Àr ocksÄ kÀnd som variation.

Vad sÀger summan av kvadrater dig?

Summan av kvadrater Àr ett mÄtt pÄ avvikelsen frÄn medelvÀrdet. I statistik Àr medelvÀrdet medelvÀrdet av en uppsÀttning siffror och Àr det vanligaste mÄttet pÄ central tendens. Det aritmetiska medelvÀrdet berÀknas helt enkelt genom att summera vÀrdena i datamÀngden och dividera med antalet vÀrden.

LÄt oss sÀga att stÀngningspriserna för Microsoft (MSFT) under de senaste fem dagarna var 74,01, 74,77, 73,94, 73,61 och 73,40 i amerikanska dollar. Summan av de totala priserna Àr $369,73 och medel- eller medelpriset för lÀroboken skulle dÀrmed vara $369,73 / 5 = $73,95.

Men det rÀcker inte alltid att kÀnna till medelvÀrdet för en mÀtuppsÀttning. Ibland Àr det bra att veta hur stor variation det finns i en uppsÀttning mÄtt. Hur lÄngt ifrÄn de enskilda vÀrdena Àr frÄn medelvÀrdet kan ge en viss insikt i hur passande observationerna eller vÀrdena Àr till den regressionsmodell som skapas.

Till exempel, om en analytiker ville veta om aktiekursen pÄ MSFT rör sig i takt med Apples (AAPL) pris, kan de lista ut uppsÀttningen observationer för processen för bÄda aktierna under en viss period, sÀg 1, 2 , eller 10 Är och skapa en linjÀr modell med var och en av observationerna eller mÀtningarna registrerade. Om förhÄllandet mellan bÄda variablerna (dvs. priset pÄ AAPL och priset pÄ MSFT) inte Àr en rak linje, sÄ finns det variationer i datamÀngden som mÄste granskas.

I statistiksprÄket, om linjen i den skapade linjÀra modellen inte gÄr igenom alla vÀrdemÀtningar, Àr en del av variationen som har observerats i aktiekurserna oförklarad. Summan av kvadrater anvÀnds för att berÀkna om det finns ett linjÀrt samband mellan tvÄ variabler, och varje oförklarad variabilitet kallas restsumman av kvadrater.

Summan av kvadrater Àr summan av kvadraten av variation, dÀr variation definieras som spridningen mellan varje enskilt vÀrde och medelvÀrdet. För att bestÀmma summan av kvadrater kvadreras avstÄndet mellan varje datapunkt och linjen med bÀsta passform och summeras sedan. Linjen med bÀsta passform kommer att minimera detta vÀrde.

Hur man berÀknar summan av kvadrater

Nu kan du se varför mÄttet kallas summan av kvadratavvikelser, eller summan av kvadrater för kort. Med hjÀlp av vÄrt MSFT-exempel ovan kan summan av kvadrater berÀknas som:

  • SS = (74,01 - 73,95)2 + (74,77 - 73,95)2 + (73,94 - 73,95)2 + (73,61 - 73,95)2 + (73,40 - 73,95)2

  • SS = (0,06) 2 + (0,82)2 + (-0,01)2 + (-0,34)2 + (-0,55)2

  • SS = 1,0942

Att enbart addera summan av avvikelserna utan att kvadrera kommer att resultera i ett tal lika med eller nÀra noll eftersom de negativa avvikelserna nÀstan perfekt kompenserar de positiva avvikelserna. För att fÄ ett mer realistiskt tal mÄste summan av avvikelserna kvadreras. Summan av kvadrater kommer alltid att vara ett positivt tal eftersom kvadraten pÄ ett tal, oavsett om det Àr positivt eller negativt, alltid Àr positivt.

Exempel pÄ hur man anvÀnder summan av kvadrater

Baserat pÄ resultaten av MSFT-berÀkningen indikerar en hög summa av kvadrater att de flesta av vÀrdena Àr lÀngre bort frÄn medelvÀrdet, och dÀrför finns det stor variation i data. En lÄg summa av kvadrater hÀnvisar till lÄg variabilitet i uppsÀttningen av observationer.

I exemplet ovan visar 1,0942 att variationen i aktiekursen för MSFT under de senaste fem dagarna Àr mycket lÄg och investerare som vill investera i aktier som kÀnnetecknas av prisstabilitet och lÄg volatilitet kan vÀlja MSFT.

BegrÀnsningar för att anvÀnda summan av kvadrater

Att fatta ett investeringsbeslut om vilken aktie som ska köpas krÀver mÄnga fler observationer Àn de som listas hÀr. En analytiker kan behöva arbeta med Är av data för att med högre sÀkerhet veta hur hög eller lÄg variabiliteten hos en tillgÄng Àr. NÀr fler datapunkter lÀggs till i uppsÀttningen blir summan av kvadrater större eftersom vÀrdena blir mer utspridda.

De mest anvÀnda mÄtten pÄ variation Àr standardavvikelsen och variansen. Men för att berÀkna nÄgon av de tvÄ mÄtten mÄste summan av kvadrater först berÀknas. Variansen Àr medelvÀrdet av summan av kvadrater (dvs summan av kvadrater dividerat med antalet observationer). Standardavvikelsen Àr kvadratroten av variansen.

Det finns tvÄ metoder för regressionsanalys som anvÀnder summan av kvadrater: den linjÀra minsta kvadratmetoden och den icke-linjÀra minsta kvadratmetoden. Minsta kvadratmetoden hÀnvisar till det faktum att regressionsfunktionen minimerar summan av kvadraterna av variansen frÄn de faktiska datapunkterna. PÄ sÄ sÀtt Àr det möjligt att rita en funktion som statistiskt ger den bÀsta passformen för datan. Observera att en regressionsfunktion antingen kan vara linjÀr (en rÀt linje) eller icke-linjÀr (en krökt linje).

Höjdpunkter

  • Summan av kvadrater mĂ€ter avvikelsen för datapunkter bort frĂ„n medelvĂ€rdet.

  • Ett högre kvadratsummaresultat indikerar en stor grad av variabilitet inom datamĂ€ngden, medan ett lĂ€gre resultat indikerar att data inte avviker avsevĂ€rt frĂ„n medelvĂ€rdet.