Schrittweise Regression
Was ist schrittweise Regression?
Schrittweise Regression ist die schrittweise iterative Konstruktion eines Regressionsmodells,. bei der unabhängige Variablen ausgewählt werden, die in einem endgültigen Modell verwendet werden sollen. Es beinhaltet das Hinzufügen oder Entfernen potenzieller erklärender Variablen nacheinander und das Testen auf statistische Signifikanz nach jeder Iteration.
Die Verfügbarkeit statistischer Softwarepakete ermöglicht eine schrittweise Regression, selbst in Modellen mit Hunderten von Variablen.
Arten der schrittweisen Regression
Das zugrunde liegende Ziel der schrittweisen Regression besteht darin, durch eine Reihe von Tests (z. B. F-Tests, t-Tests ) eine Menge unabhängiger Variablen zu finden, die die abhängige Variable signifikant beeinflussen. Dies geschieht mit Computern durch Iteration, bei der Ergebnisse oder Entscheidungen durch wiederholte Runden oder Analysezyklen erzielt werden. Die automatische Durchführung von Tests mit Hilfe von Statistiksoftwarepaketen hat den Vorteil, Zeit zu sparen und Fehler zu begrenzen.
Eine schrittweise Regression kann erreicht werden, indem entweder jeweils eine unabhängige Variable ausprobiert und in das Regressionsmodell aufgenommen wird, wenn sie statistisch signifikant ist, oder indem alle potenziellen unabhängigen Variablen in das Modell aufgenommen und die statistisch nicht signifikanten eliminiert werden. Einige verwenden eine Kombination beider Methoden und daher gibt es drei Ansätze für die schrittweise Regression:
Die Vorwärtsauswahl beginnt ohne Variablen im Modell, testet jede Variable, wenn sie dem Modell hinzugefügt wird, behält dann diejenigen bei, die als statistisch am signifikantesten erachtet werden, und wiederholt den Vorgang, bis die Ergebnisse optimal sind.
Die Rückwärtseliminierung beginnt mit einem Satz unabhängiger Variablen, löscht jeweils eine und testet dann, ob die entfernte Variable statistisch signifikant ist.
Bidirektionale Eliminierung ist eine Kombination der ersten beiden Methoden, die testen, welche Variablen eingeschlossen oder ausgeschlossen werden sollen.
Beispiel
Ein Beispiel für eine schrittweise Regression unter Verwendung der Rückwärtseliminierungsmethode wäre der Versuch, den Energieverbrauch in einer Fabrik anhand von Variablen wie Betriebszeit der Ausrüstung, Alter der Ausrüstung, Mitarbeitergröße, Außentemperatur und Jahreszeit zu verstehen. Das Modell enthält alle Variablen – dann wird jede nacheinander entfernt, um zu bestimmen, welche statistisch am wenigsten signifikant ist. Am Ende könnte das Modell zeigen, dass die Jahreszeit und die Temperaturen am wichtigsten sind, was möglicherweise darauf hindeutet, dass der Spitzenenergieverbrauch in der Fabrik dann am höchsten ist, wenn die Nutzung der Klimaanlage am höchsten ist.
Einschränkungen der schrittweisen Regression
Regressionsanalysen, sowohl lineare als auch multivariate, werden heute in der Wirtschafts- und Investmentwelt häufig verwendet. Die Idee ist oft, Muster zu finden, die in der Vergangenheit existierten und sich auch in der Zukunft wiederholen könnten. Eine einfache lineare Regression könnte beispielsweise die Kurs-Gewinn-Verhältnisse und Aktienrenditen über viele Jahre hinweg betrachten, um festzustellen, ob Aktien mit niedrigem KGV (unabhängige Variable) höhere Renditen bieten (abhängige Variable). Das Problem bei diesem Ansatz besteht darin, dass sich die Marktbedingungen häufig ändern und Beziehungen, die in der Vergangenheit bestanden haben, nicht unbedingt für die Gegenwart oder Zukunft gelten.
Inzwischen hat das schrittweise Regressionsverfahren viele Kritiker und es gibt sogar Forderungen, die Methode ganz einzustellen. Statistiker stellen mehrere Nachteile des Ansatzes fest, darunter falsche Ergebnisse, eine inhärente Verzerrung des Prozesses selbst und die Notwendigkeit einer erheblichen Rechenleistung, um komplexe Regressionsmodelle durch Iteration zu entwickeln.
Höhepunkte
Die schrittweise Regression hat jedoch ihre Nachteile, da es sich um einen Ansatz handelt, der Daten in ein Modell einfĂĽgt, um das gewĂĽnschte Ergebnis zu erzielen.
Die Rückwärtseliminationsmethode beginnt mit einem vollständigen Modell, das mit mehreren Variablen geladen ist, und entfernt dann eine Variable, um ihre Bedeutung im Verhältnis zu den Gesamtergebnissen zu testen.
Die schrittweise Regression ist eine Methode, die die statistische Signifikanz jeder unabhängigen Variablen in einem linearen Regressionsmodell iterativ untersucht.
Der Vorwärtsauswahlansatz beginnt mit nichts und fügt jede neue Variable inkrementell hinzu, um auf statistische Signifikanz zu testen.