P-Wert

Was ist der P-Wert?

In der Statistik ist der p-Wert die Wahrscheinlichkeit, Ergebnisse zu erhalten, die mindestens so extrem sind wie die beobachteten Ergebnisse eines statistischen Hypothesentests,. vorausgesetzt, dass die Nullhypothese richtig ist. Der p-Wert dient als Alternative zu Ablehnungspunkten, um das kleinste Signifikanzniveau anzugeben, bei dem die Nullhypothese abgelehnt würde. Ein kleinerer p-Wert bedeutet, dass es stärkere Beweise zugunsten der Alternativhypothese gibt.

Der P-Wert wird häufig verwendet, um die Glaubwürdigkeit von Studien oder Berichten von Regierungsbehörden zu fördern. Beispielsweise schreibt das United States Census Bureau vor, dass jede Analyse mit einem p-Wert größer als 0,10 von einer Erklärung begleitet sein muss, dass sich die Differenz statistisch nicht von Null unterscheidet. Das Census Bureau hat auch Standards festgelegt, die festlegen, wofür p-Werte akzeptabel sind verschiedene Veröffentlichungen.

Wie wird der P-Wert berechnet?

P-Werte werden normalerweise mithilfe von p-Wert-Tabellen oder Tabellenkalkulationen/Statistiksoftware gefunden. Diese Berechnungen basieren auf der angenommenen oder bekannten Wahrscheinlichkeitsverteilung der getesteten spezifischen Statistik. P-Werte werden aus der Abweichung zwischen dem beobachteten Wert und einem gewählten Referenzwert berechnet, wobei die Wahrscheinlichkeitsverteilung der Statistik gegeben ist, wobei eine größere Differenz zwischen den beiden Werten einem niedrigeren p-Wert entspricht.

Mathematisch berechnet sich der p-Wert per Integralrechnung aus der Fläche unter der Wahrscheinlichkeitsverteilungskurve für alle Statistikwerte, die mindestens so weit vom Referenzwert entfernt sind wie der beobachtete Wert, relativ zur gesamten Fläche unter der Wahrscheinlichkeitsverteilungskurve . Die Berechnung für einen p-Wert variiert je nach Art des durchgeführten Tests. Die drei Testtypen beschreiben die Position auf der Wahrscheinlichkeitsverteilungskurve: Lower-Tailed-Test, Upper-Tailed-Test oder zweiseitiger Test.

Kurz gesagt, je größer der Unterschied zwischen zwei beobachteten Werten ist, desto unwahrscheinlicher ist es, dass der Unterschied auf einen einfachen Zufall zurückzuführen ist, was sich in einem niedrigeren p-Wert widerspiegelt.

Der P-Wert-Ansatz zum Testen von Hypothesen

Der p-Wert-Ansatz zum Testen von Hypothesen verwendet die berechnete Wahrscheinlichkeit, um zu bestimmen, ob es Beweise dafür gibt, die Nullhypothese abzulehnen. Die Nullhypothese, auch als „Vermutung“ bekannt, ist die anfängliche Behauptung über eine Population (oder einen datenerzeugenden Prozess). Die Alternativhypothese gibt an, ob sich der Populationsparameter von dem in der Vermutung angegebenen Wert des Populationsparameters unterscheidet.

In der Praxis wird vorab das Signifikanzniveau angegeben, um festzulegen, wie klein der p-Wert sein muss, um die Nullhypothese abzulehnen. Da verschiedene Forscher bei der Untersuchung einer Frage unterschiedliche Signifikanzniveaus verwenden, kann ein Leser manchmal Schwierigkeiten haben, die Ergebnisse zweier verschiedener Tests zu vergleichen. P-Werte bieten eine Lösung für dieses Problem.

Angenommen, eine Studie, in der die Renditen zweier bestimmter Vermögenswerte verglichen werden, wurde von verschiedenen Forschern durchgeführt, die dieselben Daten, aber unterschiedliche Signifikanzniveaus verwendet haben. Die Forscher könnten zu gegensätzlichen Schlussfolgerungen kommen, wenn es darum geht, ob sich die Vermögenswerte unterscheiden. Wenn ein Forscher ein Konfidenzniveau von 90 % verwendet und der andere ein Konfidenzniveau von 95 % verlangt, um die Nullhypothese abzulehnen, und der p-Wert der beobachteten Differenz zwischen den beiden Renditen 0,08 beträgt (entsprechend einem Konfidenzniveau von 92 %). , dann würde der erste Forscher feststellen, dass die beiden Vermögenswerte einen statistisch signifikanten Unterschied aufweisen,. während der zweite keinen statistisch signifikanten Unterschied zwischen den Renditen feststellen würde.

Um dieses Problem zu vermeiden, könnten die Forscher den p-Wert des Hypothesentests angeben und es den Lesern ermöglichen, die statistische Signifikanz selbst zu interpretieren. Dies wird als p-Wert-Ansatz zum Testen von Hypothesen bezeichnet. Unabhängige Beobachter könnten den p-Wert notieren und selbst entscheiden, ob das einen statistisch signifikanten Unterschied darstellt oder nicht.

Beispiel für P-Wert

Ein Anleger behauptet, dass die Wertentwicklung seines Anlageportfolios der des Standard & Poor's (S&P) 500 Index entspricht. Um dies festzustellen, führt der Investor einen zweiseitigen Test durch. Die Nullhypothese besagt, dass die Renditen des Portfolios über einen bestimmten Zeitraum den Renditen des S&P 500 entsprechen, während die Alternativhypothese besagt, dass die Renditen des Portfolios und die Renditen des S&P 500 nicht äquivalent sind – wenn der Investor einen einseitigen Test durchgeführt hat, die Alternative Die Hypothese besagt, dass die Renditen des Portfolios entweder unter oder über den Renditen des S&P 500 liegen.

Der p-Wert-Hypothesentest verwendet nicht unbedingt ein vorgewähltes Konfidenzniveau, bei dem der Anleger die Nullhypothese, dass die Renditen gleichwertig sind, zurücksetzen sollte. Stattdessen liefert es ein Maß dafür, wie viele Beweise es gibt, um die Nullhypothese abzulehnen. Je kleiner der p-Wert, desto mehr Beweise sprechen gegen die Nullhypothese. Wenn der Anleger also feststellt, dass der p-Wert 0,001 beträgt, gibt es starke Beweise gegen die Nullhypothese, und der Anleger kann zuversichtlich schlussfolgern, dass die Renditen des Portfolios und die Renditen des S&P 500 nicht gleichwertig sind.

Dies gibt zwar keine genaue Schwelle an, wann der Investor die Nullhypothese akzeptieren oder ablehnen sollte, hat aber einen weiteren sehr praktischen Vorteil. P-Wert-Hypothesentests bieten eine direkte Möglichkeit, das relative Vertrauen zu vergleichen, das der Anleger haben kann, wenn er zwischen mehreren verschiedenen Arten von Investitionen oder Portfolios im Vergleich zu einer Benchmark wie dem S&P 500 wählt.

Beispielsweise kann der Anleger bei zwei Portfolios A und B, deren Performance sich mit p-Werten von 0,10 bzw. 0,01 vom S&P 500 unterscheidet, viel sicherer sein, dass Portfolio B mit einem niedrigeren p-Wert tatsächlich abschneiden wird durchweg unterschiedliche Ergebnisse.

Korrektur – 2. April 2022: In einer früheren Version wurde der p-Wert fälschlicherweise als die Wahrscheinlichkeit von Ergebnissen beschrieben, die durch Zufall entstehen.

Höhepunkte

Ein p-Wert ist ein statistisches Maß, das verwendet wird, um eine Hypothese anhand von beobachteten Daten zu validieren.
Je niedriger der p-Wert, desto größer die statistische Signifikanz des beobachteten Unterschieds.
P-Wert kann als Alternative oder zusätzlich zu vorgewählten Konfidenzniveaus für Hypothesentests dienen.
Ein p-Wert von 0,05 oder niedriger wird im Allgemeinen als statistisch signifikant angesehen.
Ein p-Wert misst die Wahrscheinlichkeit, die beobachteten Ergebnisse zu erhalten, unter der Annahme, dass die Nullhypothese wahr ist.

FAQ

Ist ein P-Wert von 0,05 signifikant?

Ein p-Wert von weniger als 0,05 wird typischerweise als statistisch signifikant angesehen, in diesem Fall sollte die Nullhypothese verworfen werden. Ein p-Wert größer als 0,05 bedeutet, dass die Abweichung von der Nullhypothese statistisch nicht signifikant ist und die Nullhypothese nicht verworfen wird.

Was bedeutet ein P-Wert von 0,001?

Ein p-Wert von 0,001 gibt an, dass, wenn die getestete Nullhypothese tatsächlich wahr wäre, eine Chance von eins zu 1.000 bestünde, mindestens so extreme Ergebnisse zu beobachten. Dies führt dazu, dass der Beobachter die Nullhypothese ablehnt, da entweder ein sehr seltenes Datenergebnis beobachtet wurde oder die Nullhypothese falsch ist.

Wie können Sie den p-Wert verwenden, um zwei verschiedene Ergebnisse eines Hypothesentests zu vergleichen?

Wenn Sie zwei unterschiedliche Ergebnisse haben, eines mit einem p-Wert von 0,04 und eines mit einem p-Wert von 0,06, wird 0,04 als statistisch signifikant betrachtet, während 0,06 dies nicht ist. Über dieses vereinfachte Beispiel hinaus könnten Sie einen p-Wert von 0,04 mit einem p-Wert von 0,001 vergleichen. Beide sind statistisch signifikant, aber 0,001 liefert ein noch stärkeres Argument gegen die Nullhypothese als 0,04.