Investor's wiki

Statistische Signifikanz

Statistische Signifikanz

Was ist statistische Signifikanz?

Statistische Signifikanz bezieht sich auf die Behauptung, dass eine Reihe von beobachteten Daten nicht das Ergebnis eines Zufalls ist, sondern stattdessen einer bestimmten Ursache zugeschrieben werden kann. Statistische Signifikanz ist wichtig für akademische Disziplinen oder Praktiker, die sich stark auf die Analyse von Daten und Forschung verlassen, wie z. B. Wirtschaft, Finanzen,. Investitionen,. Medizin, Physik und Biologie.

Die statistische Signifikanz kann als stark oder schwach betrachtet werden. Bei der Analyse eines Datensatzes und der Durchführung der erforderlichen Tests, um festzustellen, ob eine oder mehrere Variablen einen Einfluss auf ein Ergebnis haben, unterstützt eine starke statistische Signifikanz die Tatsache, dass die Ergebnisse real sind und nicht durch Glück oder Zufall verursacht wurden. Einfach gesagt, wenn ein p-Wert klein ist, gilt das Ergebnis als zuverlässiger.

Bei statistischen Signifikanztests treten Probleme auf, da die Forscher normalerweise mit Stichproben aus größeren Populationen und nicht mit den Populationen selbst arbeiten. Daher müssen die Stichproben repräsentativ für die Bevölkerung sein, sodass die in der Stichprobe enthaltenen Daten in keiner Weise verzerrt sein dürfen. In den meisten Wissenschaften, einschließlich der Wirtschaftswissenschaften, kann ein Ergebnis als statistisch signifikant angesehen werden, wenn es ein Konfidenzniveau von 95 % (oder manchmal 99 %) hat.

Statistische Signifikanz verstehen

Die Berechnung der statistischen Signifikanz (Signifikanztest) ist mit einem gewissen Fehler behaftet. Selbst wenn die Daten eine starke Beziehung zu haben scheinen, müssen die Forscher die Möglichkeit berücksichtigen, dass eine offensichtliche Korrelation aufgrund von Zufall oder einem Stichprobenfehler entstanden ist.

Die Stichprobengröße ist eine wichtige Komponente von statistischer Signifikanz, da größere Stichproben weniger anfällig für Egel sind. Für Signifikanztests sollten nur zufällig ausgewählte, repräsentative Stichproben verwendet werden. Das Niveau, ab dem angenommen werden kann, ob ein Ereignis statistisch signifikant ist, wird als Signifikanzniveau bezeichnet.

Forscher einen sogenannten p-Wert : Wenn der p-Wert unter das Signifikanzniveau fällt, ist das Ergebnis statistisch signifikant. Der p-Wert ist eine Funktion der Mittelwerte und Standardabweichungen der Datenstichproben.

Der p-Wert gibt die Wahrscheinlichkeit an, mit der das gegebene statistische Ergebnis eingetreten ist, wenn allein der Zufall für das Ergebnis verantwortlich ist. Wenn diese Wahrscheinlichkeit gering ist, kann der Forscher schlussfolgern, dass ein anderer Faktor für die beobachteten Daten verantwortlich sein könnte.

Das Gegenteil des Signifikanzniveaus, berechnet als 1 minus Signifikanzniveau, ist das Konfidenzniveau. Sie gibt den Grad der Sicherheit an, dass das statistische Ergebnis nicht zufällig oder durch einen Stichprobenfehler entstanden ist. Das übliche Konfidenzniveau in vielen statistischen Tests beträgt 95 %, was zu einem üblichen Signifikanzniveau oder p-Wert von 5 % führt.

„P-Hacking“ ist die Praxis, viele verschiedene Datensätze auf der Suche nach einem statistisch signifikanten Ergebnis erschöpfend zu vergleichen. Dies unterliegt einer Verzerrung der Berichterstattung, da die Forscher nur positive Ergebnisse melden – keine negativen.

Besondere Überlegungen

Statistische Signifikanz bedeutet nicht immer praktische Signifikanz, d. h. die Ergebnisse können nicht auf reale Geschäftssituationen übertragen werden. Darüber hinaus kann die statistische Signifikanz falsch interpretiert werden, wenn Forscher bei der Berichterstattung über ihre Ergebnisse die Sprache nicht sorgfältig verwenden. Die Tatsache, dass ein Ergebnis statistisch signifikant ist, bedeutet nicht, dass es nicht das Ergebnis eines Zufalls ist, sondern nur, dass dies weniger wahrscheinlich ist.

Nur weil zwei Datenreihen eine starke Korrelation zueinander aufweisen, impliziert dies keine Kausalität. Beispielsweise korreliert die Anzahl der Filme, in denen der Schauspieler Nicolas Cage in einem bestimmten Jahr die Hauptrolle spielt, sehr stark mit der Anzahl der versehentlichen Ertrinkungen in Schwimmbädern. Aber diese Korrelation ist falsch,. da es keinen theoretischen kausalen Anspruch gibt, der aufgestellt werden kann.

Ein weiteres Problem, das bei statistischer Signifikanz auftreten kann, besteht darin, dass vergangene Daten und die Ergebnisse aus diesen Daten, ob statistisch signifikant oder nicht, laufende oder zukünftige Bedingungen möglicherweise nicht widerspiegeln. Beim Investieren kann sich dies in einem Preismodell manifestieren, das in Zeiten der Finanzkrise zusammenbricht, da sich Korrelationen ändern und Variablen nicht wie üblich interagieren. Die statistische Signifikanz kann einem Anleger auch dabei helfen, zu erkennen, ob ein Asset-Pricing-Modell besser ist als ein anderes.

Arten von statistischen Signifikanztests

Je nach durchgeführter Forschung werden verschiedene Arten von Signifikanztests verwendet. Beispielsweise können Tests für eine, zwei oder mehr Datenstichproben unterschiedlicher Größe für Mittelwerte, Varianzen, Anteile, gepaarte oder ungepaarte Daten oder unterschiedliche Datenverteilungen verwendet werden.

Je nach Art der verfügbaren Daten gibt es auch unterschiedliche Ansätze für Signifikanztests. Ronald Fisher wird die Formulierung eines der flexibelsten Ansätze sowie die Festlegung der Signifikanznorm auf p < 0,05 zugeschrieben. Da die meiste Arbeit erledigt werden kann, nachdem die Daten bereits gesammelt wurden, bleibt diese Methode für kurzfristige oder Ad-hoc-Forschungsprojekte beliebt.

Um auf Fishers Methode aufzubauen, entwickelten Jerzy Neyman und Egon Pearson schließlich einen alternativen Ansatz. Diese Methode erfordert mehr Arbeit, bevor die Daten gesammelt werden, ermöglicht es den Forschern jedoch, ihre Studie so zu gestalten, dass die Wahrscheinlichkeit, zu falschen Schlussfolgerungen zu gelangen, kontrolliert wird.

Testen von Nullhypothesen

Statistische Signifikanz wird beim Testen von Nullhypothesen verwendet, bei denen Forscher versuchen, ihre Theorien zu stützen, indem sie andere Erklärungen ablehnen. Obwohl die Methode manchmal missverstanden wird, bleibt sie die beliebteste Methode zum Testen von Daten in der Medizin, Psychologie und anderen Bereichen.

Die häufigste Nullhypothese ist, dass der fragliche Parameter gleich Null ist (was typischerweise anzeigt, dass eine Variable keine Auswirkung auf das interessierende Ergebnis hat). Wenn Forscher die Nullhypothese mit einer Konfidenz von 95 % oder besser ablehnen, können sie behaupten, dass eine beobachtete Beziehung statistisch signifikant ist. Nullhypothesen können auch auf Wirkungsgleichheit für zwei oder mehr Alternativbehandlungen getestet werden.

Entgegen weit verbreiteter Missverständnisse kann ein hohes Maß an statistischer Signifikanz nicht beweisen, dass eine Hypothese wahr oder falsch ist. In Wirklichkeit misst die statistische Signifikanz die Wahrscheinlichkeit, dass ein beobachtetes Ergebnis eingetreten wäre, vorausgesetzt, dass die Nullhypothese wahr ist.

Die Ablehnung der Nullhypothese, selbst wenn ein sehr hohes Maß an statistischer Signifikanz niemals etwas beweisen kann, kann eine bestehende Hypothese nur unterstützen. Andererseits ist das Versäumnis, eine Nullhypothese abzulehnen, oft ein Grund, eine Hypothese abzulehnen.

Außerdem kann ein Effekt statistisch signifikant sein, aber nur einen sehr geringen Einfluss haben. Beispielsweise kann es statistisch signifikant sein, dass Unternehmen, die doppellagiges Toilettenpapier in ihren Badezimmern verwenden, produktivere Mitarbeiter haben, aber die Verbesserung der absoluten Produktivität jedes Mitarbeiters ist wahrscheinlich winzig.

Korrektur – 15. Mai 2022: Dieser Artikel wurde bearbeitet, um mögliche Irrtümer bei Signifikanztests hervorzuheben.

Höhepunkte

  • Statistische Signifikanz bezieht sich auf die Behauptung, dass ein Ergebnis aus Daten, die durch Tests oder Experimente generiert wurden, wahrscheinlich auf eine bestimmte Ursache zurückzuführen ist.

  • Die Berechnung der statistischen Signifikanz ist mit einem gewissen Fehler behaftet.

  • Ein hohes Maß an statistischer Signifikanz weist darauf hin, dass ein beobachteter Zusammenhang wahrscheinlich nicht auf Zufall beruht.

  • Je nach durchgeführter Forschung werden verschiedene Arten von Signifikanztests verwendet.

  • Statistische Signifikanz kann falsch interpretiert werden, wenn Forscher bei der Berichterstattung über ihre Ergebnisse die Sprache nicht sorgfältig verwenden.