Investor's wiki

Homoskedastisch

Homoskedastisch

Was ist homoskedastisch?

Homoskedastisch (auch „homoskedastisch“ geschrieben) bezieht sich auf eine Bedingung, in der die Varianz des Residuums oder Fehlerterms in einem Regressionsmodell konstant ist. Das heißt, der Fehlerterm ändert sich nicht sehr, wenn sich der Wert der Prädiktorvariablen ändert. Anders gesagt ist die Varianz der Datenpunkte für alle Datenpunkte ungefähr gleich.

Dies deutet auf ein gewisses Maß an Konsistenz hin und erleichtert die Modellierung und Arbeit mit den Daten durch Regression; Das Fehlen von Homoskedastizität kann jedoch darauf hindeuten, dass das Regressionsmodell möglicherweise zusätzliche Prädiktorvariablen enthalten muss, um die Leistung der abhängigen Variablen zu erklären.

Wie Homoskedastizität funktioniert

Homoskedastizität ist eine Annahme der nahezu regressiven Modellierung,. und Daten dieser Art funktionieren gut mit der Methode der kleinsten Quadrate. Wenn die Varianz der Fehler um die Regressionslinie stark variiert, ist das Regressionsmodell möglicherweise schlecht definiert.

Das Gegenteil von Homoskedastizität ist Heteroskedastizität, genauso wie das Gegenteil von „homogen“ „heterogen“ ist. Heteroskedastizität (auch als „Heteroskedastizität“ bezeichnet) bezieht sich auf eine Bedingung, bei der die Varianz des Fehlerterms in einer Regressionsgleichung nicht konstant ist.

Besondere Ăśberlegungen

Ein einfaches Regressionsmodell oder eine Gleichung besteht aus vier Termen. Auf der linken Seite befindet sich die abhängige Variable. Es stellt das Phänomen dar, das das Modell zu „erklären“ versucht. Auf der rechten Seite befinden sich eine Konstante, eine Prädiktorvariable und ein Rest- oder Fehlerterm. Der Fehlerterm zeigt das Ausmaß der Variabilität in der abhängigen Variablen, die nicht durch die Prädiktorvariable erklärt wird.

Beispiel fĂĽr Homoskedastic

Angenommen, Sie möchten die Testergebnisse der Schüler anhand der Zeit erklären, die jeder Schüler mit dem Lernen verbracht hat. In diesem Fall wären die Testergebnisse die abhängige Variable und die Lernzeit die Prädiktorvariable.

Der Fehlerterm würde die Varianz in den Testergebnissen zeigen, die nicht durch die Zeitdauer des Lernens erklärt wurde. Wenn diese Varianz einheitlich oder homoskedastisch ist, dann würde dies darauf hindeuten, dass das Modell eine angemessene Erklärung für die Testleistung sein könnte – es in Bezug auf die Zeit, die mit dem Lernen verbracht wird, erklärt.

Aber die Varianz kann heteroskedastisch sein. Ein Diagramm der Fehlertermdaten kann zeigen, dass eine groĂźe Menge an Studienzeit sehr eng mit hohen Testergebnissen korrespondierte, dass Testergebnisse mit niedriger Studienzeit jedoch stark variierten und sogar einige sehr hohe Ergebnisse enthielten.

Die Varianz der Punktzahlen wäre also nicht gut durch eine Prädiktorvariable zu erklären – die Zeitdauer des Lernens. In diesem Fall ist wahrscheinlich ein anderer Faktor am Werk, und das Modell muss möglicherweise verbessert werden, um ihn oder sie zu identifizieren.

Wenn man bedenkt, dass die Varianz die gemessene Differenz zwischen dem vorhergesagten Ergebnis und dem tatsächlichen Ergebnis einer bestimmten Situation ist, kann die Bestimmung der Homoskedastizität dabei helfen, zu bestimmen, welche Faktoren für die Genauigkeit angepasst werden müssen.

Weitere Untersuchungen können ergeben, dass einige Schüler die Antworten auf den Test im Voraus gesehen hatten oder dass sie zuvor einen ähnlichen Test absolviert hatten und daher nicht für diesen speziellen Test lernen mussten. In diesem Zusammenhang kann sich herausstellen, dass die Schüler unabhängig von ihrer Studienzeit und ihrer Leistung bei früheren Tests, unabhängig vom Fach, unterschiedliche Fähigkeiten zum Bestehen von Tests hatten.

Um das Regressionsmodell zu verbessern, müsste der Forscher andere erklärende Variablen ausprobieren, die eine genauere Anpassung an die Daten liefern könnten. Wenn beispielsweise einige Schüler die Antworten im Voraus gesehen hätten, hätte das Regressionsmodell dann zwei erklärende Variablen: Lernzeit und ob der Schüler die Antworten vorher kannte.

Mit diesen beiden Variablen würde mehr von der Varianz der Testergebnisse erklärt und die Varianz des Fehlerterms könnte dann homoskedastisch sein, was darauf hindeutet, dass das Modell wohldefiniert war.

Höhepunkte

  • Wenn die Varianz des Fehlerterms homoskedastisch ist, war das Modell wohldefiniert. Wenn die Varianz zu groĂź ist, ist das Modell möglicherweise nicht gut definiert.

  • Homoskedastizität tritt auf, wenn die Varianz des Fehlerterms in einem Regressionsmodell konstant ist.

  • Umgekehrt tritt Heteroskedastizität auf, wenn die Varianz des Fehlerterms nicht konstant ist.

  • Das HinzufĂĽgen zusätzlicher Prädiktorvariablen kann helfen, die Leistung der abhängigen Variablen zu erklären.

FAQ

Warum ist Homoskedastizität wichtig?

Homoskedastizität ist wichtig, weil sie Unähnlichkeiten in einer Population identifiziert. Jede Varianz in einer Population oder Stichprobe, die nicht gleichmäßig ist, führt zu verzerrten oder voreingenommenen Ergebnissen, wodurch die Analyse falsch oder wertlos wird.

Was bedeutet Heteroskedastizität?

Heteroskedastizität in der Statistik ist die Fehlervarianz. Dies ist die Abhängigkeit der Streuung, die innerhalb einer Probe mit mindestens einer unabhängigen Variablen auftritt. Dies bedeutet, dass die Standardabweichung einer vorhersagbaren Variablen nicht konstant ist.

Woran erkennt man, ob eine Regression homoskedastisch ist?

Sie können erkennen, ob eine Regression homoskedastisch ist, indem Sie sich das Verhältnis zwischen der größten Varianz und der kleinsten Varianz ansehen. Wenn das Verhältnis 1,5 oder kleiner ist, ist die Regression homoskedastisch.