Investor's wiki

Quadratsumme

Quadratsumme

Was ist die Summe der Quadrate?

Die Summe der Quadrate ist eine statistische Technik, die in der Regressionsanalyse verwendet wird, um die Streuung von Datenpunkten zu bestimmen. Bei einer Regressionsanalyse ist das Ziel festzustellen, wie gut eine Datenreihe an eine Funktion angepasst werden kann, die helfen könnte zu erklÀren, wie die Datenreihe generiert wurde. Die Summe der Quadrate wird als mathematischer Weg verwendet, um die Funktion zu finden, die am besten zu den Daten passt (sich am wenigsten unterscheidet).

Die Formel fĂŒr die Summe der Quadrate lautet

FĂŒr eine Menge X von < mi>n Elemente:Quadratsumme</ mtext>=∑i=0</ mrow>n(Xi</ mi>−X‟)2wobei:</ mrow>X i=Das it h-Element im Satz X‟=Der Mittelwert aller Elemente in der Satz</ mstyle>(Xich< /mi>−X‟)=Die Abweichung jedes Elements vom Mittelwert \begin &\text{FĂŒr eine Menge } X \text n \text\ &amp ;\text=\sum_^\left(X_i-\overline\right)2\ &\textbf\ &X_i =\text i \text\ &\overline=\text\ &\left(X_i- \overline\right) = \text\ \end

Die Summe der Quadrate wird auch als Variation bezeichnet.

Was sagt dir die Summe der Quadrate?

Die Summe der Quadrate ist ein Maß fĂŒr die Abweichung vom Mittelwert. In der Statistik ist der Mittelwert der Durchschnitt einer Reihe von Zahlen und das am hĂ€ufigsten verwendete Maß fĂŒr die zentrale Tendenz. Der arithmetische Mittelwert wird einfach berechnet, indem die Werte im Datensatz aufsummiert und durch die Anzahl der Werte dividiert werden.

Nehmen wir an, die Schlusskurse von Microsoft (MSFT) in den letzten fĂŒnf Tagen waren 74,01, 74,77, 73,94, 73,61 und 73,40 in US-Dollar. Die Summe der Gesamtpreise betrĂ€gt 369,73 $ und der mittlere oder durchschnittliche Preis des Lehrbuchs wĂ€re somit 369,73 $ / 5 = 73,95 $.

Es reicht jedoch nicht immer aus, den Mittelwert einer Messreihe zu kennen. Manchmal ist es hilfreich zu wissen, wie viel Variation es in einer Reihe von Messungen gibt. Wie weit die einzelnen Werte vom Mittelwert entfernt sind, kann Aufschluss darĂŒber geben, wie passend die Beobachtungen oder Werte zu dem erstellten Regressionsmodell sind.

Wenn ein Analyst beispielsweise wissen möchte, ob sich der Aktienkurs von MSFT parallel zum Kurs von Apple (AAPL) bewegt, kann er die Beobachtungen fĂŒr den Verlauf beider Aktien fĂŒr einen bestimmten Zeitraum auflisten, z. B. 1, 2 , oder 10 Jahre und erstellen Sie ein lineares Modell mit jeder der aufgezeichneten Beobachtungen oder Messungen. Wenn die Beziehung zwischen beiden Variablen (dh dem Preis von AAPL und dem Preis von MSFT) keine gerade Linie ist, dann gibt es Abweichungen im Datensatz, die untersucht werden mĂŒssen.

Wenn die Linie im erstellten linearen Modell nicht durch alle Wertmessungen verlÀuft, ist ein Teil der Schwankungen, die bei den Aktienkursen beobachtet wurden, unerklÀrlich. Die Summe der Quadrate wird verwendet, um zu berechnen, ob eine lineare Beziehung zwischen zwei Variablen besteht, und jede unerklÀrte VariabilitÀt wird als Residualsumme der Quadrate bezeichnet.

Die Summe der Quadrate ist die Summe der Schwankungsquadrate, wobei die Schwankung als die Spanne zwischen jedem Einzelwert und dem Mittelwert definiert ist. Um die Summe der Quadrate zu bestimmen, wird der Abstand zwischen jedem Datenpunkt und der Linie der besten Anpassung quadriert und dann aufsummiert. Die Linie der besten Anpassung minimiert diesen Wert.

Wie man die Summe der Quadrate berechnet

Jetzt können Sie sehen, warum die Messung Summe der quadratischen Abweichungen oder kurz Summe der Quadrate genannt wird. Unter Verwendung unseres obigen MSFT-Beispiels kann die Summe der Quadrate wie folgt berechnet werden:

  • SS = (74,01 - 73,95)2 + (74,77 - 73,95)2 + (73,94 - 73,95)2 + (73,61 - 73,95)2 + (73,40 - 73,95)2

-SS = (0,06) 2 + (0,82)2 + (-0,01)2 + (-0,34)2 + (-0,55)2

  • SS = 1,0942

Das Addieren der Summe der Abweichungen allein ohne Quadrierung fĂŒhrt zu einer Zahl gleich oder nahe Null, da die negativen Abweichungen die positiven Abweichungen fast vollstĂ€ndig ausgleichen. Um eine realistischere Zahl zu erhalten, muss die Summe der Abweichungen quadriert werden. Die Summe der Quadrate ist immer eine positive Zahl, weil das Quadrat jeder Zahl, egal ob positiv oder negativ, immer positiv ist.

Beispiel fĂŒr die Verwendung der Quadratsumme

Basierend auf den Ergebnissen der MSFT-Berechnung weist eine hohe Summe von Quadraten darauf hin, dass die meisten Werte weiter vom Mittelwert entfernt sind und daher eine große VariabilitĂ€t in den Daten besteht. Eine niedrige Summe der Quadrate weist auf eine geringe VariabilitĂ€t in der Menge der Beobachtungen hin.

Im obigen Beispiel zeigt 1,0942, dass die Schwankungen des MSFT-Aktienkurses in den letzten fĂŒnf Tagen sehr gering waren und Anleger, die in Aktien investieren möchten, die sich durch PreisstabilitĂ€t und geringe VolatilitĂ€t auszeichnen, können sich fĂŒr MSFT entscheiden.

EinschrÀnkungen bei der Verwendung der Summe der Quadrate

Um eine Investitionsentscheidung zu treffen, welche Aktien gekauft werden sollen, sind viel mehr Beobachtungen erforderlich als die hier aufgefĂŒhrten. Ein Analyst muss möglicherweise mit jahrelangen Daten arbeiten, um mit grĂ¶ĂŸerer Gewissheit zu wissen, wie hoch oder niedrig die VariabilitĂ€t eines Vermögenswerts ist. Je mehr Datenpunkte dem Satz hinzugefĂŒgt werden, desto grĂ¶ĂŸer wird die Summe der Quadrate, da die Werte weiter gestreut werden.

Die am hĂ€ufigsten verwendeten Variationsmaße sind die Standardabweichung und die Varianz. Um jedoch eine der beiden Metriken zu berechnen, muss zuerst die Summe der Quadrate berechnet werden. Die Varianz ist der Durchschnitt der Summe der Quadrate (dh die Summe der Quadrate dividiert durch die Anzahl der Beobachtungen). Die Standardabweichung ist die Quadratwurzel der Varianz.

Es gibt zwei Methoden der Regressionsanalyse, die die Summe der Quadrate verwenden: die lineare Methode der kleinsten Quadrate und die nichtlineare Methode der kleinsten Quadrate. Die Methode der kleinsten Quadrate bezieht sich auf die Tatsache, dass die Regressionsfunktion die Summe der Quadrate der Abweichung von den tatsĂ€chlichen Datenpunkten minimiert. Auf diese Weise ist es möglich, eine Funktion zu zeichnen, die statistisch am besten zu den Daten passt. Beachten Sie, dass eine Regressionsfunktion entweder linear (eine gerade Linie) oder nichtlinear (eine gekrĂŒmmte Linie) sein kann.

Höhepunkte

  • Die Summe der Quadrate misst die Abweichung der Datenpunkte vom Mittelwert.

  • Ein höheres Quadratsummenergebnis weist auf eine große VariabilitĂ€t innerhalb des Datensatzes hin, wĂ€hrend ein niedrigeres Ergebnis darauf hinweist, dass die Daten nicht wesentlich vom Mittelwert abweichen.