Investor's wiki

Residualsumme der Quadrate (RSS)

Residualsumme der Quadrate (RSS)

Was ist die Residualsumme der Quadrate (RSS)?

Die Residuensumme der Quadrate (RSS) ist eine statistische Technik, mit der die Varianz in einem Datensatz gemessen wird, die nicht durch ein Regressionsmodell selbst erklÀrt wird. Stattdessen wird die Varianz in den Residuen oder dem Fehlerterm geschÀtzt.

lineare Regression ist eine Messung, die hilft, die StÀrke der Beziehung zwischen einer abhÀngigen Variablen und einem oder mehreren anderen Faktoren zu bestimmen, die als unabhÀngige oder erklÀrende Variablen bekannt sind.

Die Residualsumme der Quadrate verstehen

Allgemein ausgedrĂŒckt ist die Summe der Quadrate eine statistische Technik, die in der Regressionsanalyse verwendet wird, um die Streuung von Datenpunkten zu bestimmen. Bei einer Regressionsanalyse soll ermittelt werden, wie gut eine Datenreihe an eine Funktion angepasst werden kann, die helfen könnte, zu erklĂ€ren, wie die Datenreihe generiert wurde. Die Summe der Quadrate wird als mathematischer Weg verwendet, um die Funktion zu finden, die am besten zu den Daten passt (am wenigsten variiert).

Der RSS misst die verbleibende Fehlermenge zwischen der Regressionsfunktion und dem Datensatz, nachdem das Modell ausgefĂŒhrt wurde. Eine kleinere RSS-Zahl stellt eine Regressionsfunktion dar, die gut an die Daten angepasst ist.

Der RSS, auch bekannt als Summe quadrierter Residuen, bestimmt im Wesentlichen, wie gut ein Regressionsmodell die Daten im Modell erklÀrt oder darstellt.

So berechnen Sie die Residualsumme der Quadrate

RSS = ∑ni=1 (yi - f(xi))2

Wo:

yi = der ite Wert der vorherzusagenden Variablen

f(xi) = vorhergesagter Wert von yi

n = Obergrenze der Summierung

Restquadratsumme (RSS) vs. Reststandardfehler (RSE)

Der Reststandardfehler (RSE) ist ein weiterer statistischer Begriff, der verwendet wird, um die Differenz der Standardabweichungen von beobachteten Werten gegenĂŒber vorhergesagten Werten zu beschreiben, wie durch Punkte in einer Regressionsanalyse gezeigt. Es ist ein Maß fĂŒr die AnpassungsgĂŒte,. mit dem analysiert werden kann, wie gut ein Satz von Datenpunkten mit dem tatsĂ€chlichen Modell ĂŒbereinstimmt.

RSE wird berechnet, indem der RSS durch die Anzahl der Beobachtungen in der Stichprobe minus 2 dividiert und dann die Quadratwurzel gezogen wird: RSE = [RSS/(n-2)]1/2

Besondere Überlegungen

Die FinanzmĂ€rkte sind zunehmend quantitativ getrieben; Daher verwenden viele Anleger auf der Suche nach einem Vorteil fortschrittliche statistische Techniken, um ihre Entscheidungen zu unterstĂŒtzen. Big Data, maschinelles Lernen und Anwendungen der kĂŒnstlichen Intelligenz erfordern außerdem die Verwendung statistischer Eigenschaften, um zeitgemĂ€ĂŸe Anlagestrategien zu steuern. Die Residualsumme der Quadrate – oder RSS-Statistik – ist eine von vielen statistischen Eigenschaften, die eine Renaissance erleben.

Statistische Modelle werden von Anlegern und Portfoliomanagern verwendet, um den Preis einer Anlage zu verfolgen und diese Daten zu verwenden, um zukĂŒnftige Bewegungen vorherzusagen. Die Studie – Regressionsanalyse genannt – kann die Analyse der Beziehung der Preisbewegungen zwischen einem Rohstoff und den Aktien von Unternehmen umfassen, die an der Herstellung des Rohstoffs beteiligt sind.

Das manuelle Ermitteln der Residuensumme der Quadrate (RSS) kann schwierig und zeitaufwĂ€ndig sein. Da dabei viel subtrahiert, quadriert und summiert wird, können die Berechnungen fehleranfĂ€llig sein. Aus diesem Grund können Sie sich fĂŒr die Verwendung von Software wie Excel entscheiden, um die Berechnungen durchzufĂŒhren.

Jedes Modell kann Abweichungen zwischen den vorhergesagten Werten und den tatsÀchlichen Ergebnissen aufweisen. Obwohl die Varianzen durch die Regressionsanalyse erklÀrt werden könnten, stellt die RSS die Varianzen oder Fehler dar, die nicht erklÀrt werden.

Da eine ausreichend komplexe Regressionsfunktion so erstellt werden kann, dass sie praktisch zu jedem Datensatz passt, sind weitere Untersuchungen erforderlich, um festzustellen, ob die Regressionsfunktion tatsĂ€chlich nĂŒtzlich ist, um die Varianz des Datensatzes zu erklĂ€ren.

Typischerweise ist jedoch ein kleinerer oder niedrigerer Wert fĂŒr den RSS in jedem Modell ideal, da dies bedeutet, dass es weniger Variationen im Datensatz gibt. Mit anderen Worten, je niedriger die Summe der quadrierten Residuen ist, desto besser kann das Regressionsmodell die Daten erklĂ€ren.

Beispiel fĂŒr die Residuensumme der Quadrate

Betrachten Sie fĂŒr eine einfache (aber ausfĂŒhrliche) Demonstration der RSS-Berechnung die bekannte Korrelation zwischen den Verbraucherausgaben eines Landes und seinem BIP. Die folgende Grafik zeigt die veröffentlichten Werte der Verbraucherwarteschlangen und des Bruttoinlandsprodukts fĂŒr die 27 Staaten der EuropĂ€ischen Union, Stand 2020.

TTT

Weltbank, 2020.

Die Verbraucherausgaben und das BIP weisen eine starke positive Korrelation auf, und es ist möglich, das BIP eines Landes auf der Grundlage der Verbraucherausgaben (CS) vorherzusagen. Unter Verwendung der Formel fĂŒr eine Best-Fit-Linie kann diese Beziehung wie folgt angenĂ€hert werden:

BIP = 1,3232 x CS + 10447

Die Einheiten fĂŒr das BIP und die Verbraucherausgaben sind in Millionen US-Dollar angegeben.

Diese Formel ist fĂŒr die meisten Zwecke sehr genau, aber aufgrund der individuellen Schwankungen in der Wirtschaft jedes Landes nicht perfekt. Das folgende Diagramm vergleicht das prognostizierte BIP jedes Landes, basierend auf der obigen Formel, und das tatsĂ€chliche BIP, wie es von der Weltbank aufgezeichnet wurde.

TTT

Weltbank, 2020.

Die rechte Spalte zeigt die Residuenquadrate – die quadrierte Differenz zwischen jedem projizierten Wert und seinem tatsĂ€chlichen Wert. Die Zahlen erscheinen groß, aber ihre Summe ist tatsĂ€chlich niedriger als der RSS fĂŒr jede andere mögliche Trendlinie. Wenn eine andere Linie einen niedrigeren RSS fĂŒr diese Datenpunkte hĂ€tte, wĂ€re diese Linie die am besten passende Linie.

Höhepunkte

  • Ein Wert von Null bedeutet, dass Ihr Modell perfekt passt.

  • RSS wird von Finanzanalysten verwendet, um die ValiditĂ€t ihrer ökonometrischen Modelle einzuschĂ€tzen.

  • Die Residuensumme der Quadrate (RSS) misst das Varianzniveau im Fehlerterm oder den Residuen eines Regressionsmodells.

  • Statistische Modelle werden von Anlegern und Portfoliomanagern verwendet, um den Preis einer Anlage zu verfolgen und diese Daten zu verwenden, um zukĂŒnftige Bewegungen vorherzusagen.

  • Je kleiner die Residuensumme der Quadrate, desto besser passt Ihr Modell zu Ihren Daten; Je grĂ¶ĂŸer die Residuensumme der Quadrate ist, desto schlechter passt Ihr Modell zu Ihren Daten.

FAQ

Ist RSS dasselbe wie die FehlersummenschÀtzung (SSE)?

Die Residuensumme der Quadrate (RSS) wird auch als Summe der quadrierten SchÀtzung von Fehlern (SSE) bezeichnet.

Was ist der Unterschied zwischen der Residualsumme der Quadrate und der Gesamtsumme der Quadrate?

Die Gesamtsumme der Quadrate (TSS) misst, wie viel Variation in den beobachteten Daten vorhanden ist, wĂ€hrend die Residuensumme der Quadrate die Variation des Fehlers zwischen den beobachteten Daten und den modellierten Werten misst. In der Statistik werden hĂ€ufig die Werte fĂŒr die Residuensumme der Quadrate und die Gesamtsumme der Quadrate (TSS) miteinander verglichen.

Ist die Residuensumme der Quadrate dasselbe wie R-Quadrat?

Die Residualsumme der Quadrate (RSS) ist der absolute Betrag der erklÀrten Variation, wÀhrend R-Quadrat der absolute Betrag der Variation als Anteil der Gesamtvariation ist.

Kann eine Residuensumme von Quadraten Null sein?

Die Residuensumme der Quadrate kann Null sein. Je kleiner die Residualsumme der Quadrate ist, desto besser passt Ihr Modell zu Ihren Daten; Je grĂ¶ĂŸer die Residuensumme der Quadrate ist, desto schlechter passt Ihr Modell zu Ihren Daten. Ein Wert von Null bedeutet, dass Ihr Modell perfekt passt.