Investor's wiki

Nichtparametrische Statistik

Nichtparametrische Statistik

Was sind nichtparametrische Statistiken?

Nichtparametrische Statistik bezieht sich auf eine statistische Methode, bei der nicht angenommen wird, dass die Daten aus vorgeschriebenen Modellen stammen, die durch eine kleine Anzahl von Parametern bestimmt werden; Beispiele fĂŒr solche Modelle sind das Normalverteilungsmodell und das lineare Regressionsmodell. Nichtparametrische Statistiken verwenden manchmal Daten, die ordinal sind, was bedeutet, dass sie sich nicht auf Zahlen verlassen, sondern auf eine Rangfolge oder eine Art Reihenfolge. Beispielsweise wĂŒrde eine Umfrage, die VerbraucherprĂ€ferenzen von Vorlieben bis Abneigungen vermittelt, als Ordinaldaten betrachtet.

Die nichtparametrische Statistik umfasst die nichtparametrische deskriptive Statistik,. statistische Modelle, Inferenz und statistische Tests. Die Modellstruktur von nichtparametrischen Modellen ist nicht a priori vorgegeben, sondern wird aus Daten bestimmt. Der Begriff nichtparametrisch soll nicht implizieren, dass solchen Modellen Parameter völlig fehlen, sondern vielmehr, dass die Anzahl und Art der Parameter flexibel und nicht im Voraus festgelegt sind. Ein Histogramm ist ein Beispiel fĂŒr eine nichtparametrische SchĂ€tzung einer Wahrscheinlichkeitsverteilung.

Nichtparametrische Statistik verstehen

In der Statistik umfasst die parametrische Statistik Parameter wie Mittelwert, Standardabweichung, Pearson-Korrelation, Varianz usw. Diese Form der Statistik verwendet die beobachteten Daten, um die Parameter der Verteilung zu schĂ€tzen. In der parametrischen Statistik wird hĂ€ufig angenommen, dass Daten aus einer Normalverteilung mit unbekannten Parametern ÎŒ (Mittelwert der Grundgesamtheit) und σ2 (Varianz der Grundgesamtheit) stammen, die dann anhand des Stichprobenmittelwerts und der Stichprobenvarianz geschĂ€tzt werden.

Die nichtparametrische Statistik macht keine Annahmen ĂŒber die StichprobengrĂ¶ĂŸe oder ob die beobachteten Daten quantitativ sind.

Die nichtparametrische Statistik geht nicht davon aus, dass Daten aus einer Normalverteilung stammen. Stattdessen wird bei dieser Form der statistischen Messung die Form der Verteilung geschÀtzt. WÀhrend es viele Situationen gibt, in denen eine Normalverteilung angenommen werden kann, gibt es auch einige Szenarien, in denen der wahre Datengenerierungsprozess weit von einer Normalverteilung entfernt ist.

Beispiele nichtparametrischer Statistik

Stellen Sie sich im ersten Beispiel einen Finanzanalysten vor, der den Value-at-Risk (VaR) einer Anlage schĂ€tzen möchte. Der Analyst sammelt Ertragsdaten von Hunderten Ă€hnlicher Investitionen ĂŒber einen Ă€hnlichen Zeithorizont. Anstatt davon auszugehen, dass die Einnahmen einer Normalverteilung folgen, verwenden sie das Histogramm, um die Verteilung nichtparametrisch zu schĂ€tzen. Das 5. Perzentil dieses Histogramms liefert dem Analysten dann eine nichtparametrische SchĂ€tzung des VaR.

Betrachten Sie als zweites Beispiel einen anderen Forscher, der wissen möchte, ob die durchschnittliche Schlafdauer mit der HĂ€ufigkeit von Krankheiten zusammenhĂ€ngt. Da viele Menschen selten oder gar nicht krank werden und andere gelegentlich viel hĂ€ufiger erkranken als die meisten anderen, ist die Verteilung der KrankheitshĂ€ufigkeit eindeutig nicht normal, da sie rechtsschief und anfĂ€llig fĂŒr Ausreißer ist. Anstatt also eine Methode zu verwenden, die eine Normalverteilung fĂŒr die KrankheitshĂ€ufigkeit annimmt, wie dies beispielsweise bei der klassischen Regressionsanalyse der Fall ist, entscheidet sich der Forscher fĂŒr eine nichtparametrische Methode wie die Quantilregressionsanalyse.

Besondere Überlegungen

Nichtparametrische Statistiken haben aufgrund ihrer Benutzerfreundlichkeit an WertschĂ€tzung gewonnen. Da der Bedarf an Parametern verringert wird, werden die Daten besser auf eine grĂ¶ĂŸere Vielfalt von Tests anwendbar. Diese Art von Statistiken kann ohne den Mittelwert, den Stichprobenumfang, die Standardabweichung oder die SchĂ€tzung anderer verwandter Parameter verwendet werden, wenn keine dieser Informationen verfĂŒgbar sind.

Da die nichtparametrische Statistik weniger Annahmen ĂŒber die Stichprobendaten macht, ist ihre Anwendung breiter als die parametrische Statistik. In FĂ€llen, in denen parametrisches Testen besser geeignet ist, sind nichtparametrische Methoden weniger effizient. Dies liegt daran, dass nichtparametrische Statistiken im Gegensatz zu parametrischen Statistiken einige Informationen verwerfen, die in den Daten verfĂŒgbar sind.

Höhepunkte

  • Diese Art der Analyse ist hĂ€ufig am besten geeignet, wenn die Reihenfolge von etwas berĂŒcksichtigt wird, wobei die Ergebnisse wahrscheinlich gleich bleiben, selbst wenn sich die numerischen Daten Ă€ndern.

  • Nichtparametrische Statistiken sind einfach zu verwenden, bieten jedoch nicht die punktgenaue Genauigkeit anderer statistischer Modelle.