Investor's wiki

Statistiken

Statistiken

Was ist Statistik?

Statistik ist ein Zweig der angewandten Mathematik, der das Sammeln, Beschreiben, Analysieren und Ableiten von Schlussfolgerungen aus quantitativen Daten umfasst. Die mathematischen Theorien hinter der Statistik stützen sich stark auf Differential- und Integralrechnung, lineare Algebra und Wahrscheinlichkeitstheorie.

Statistiker, Menschen, die Statistik betreiben, beschäftigen sich insbesondere damit, aus dem Verhalten und anderen beobachtbaren Merkmalen kleiner Stichproben zuverlässige Schlüsse auf große Gruppen und allgemeine Ereignisse zu ziehen. Diese kleinen Proben repräsentieren einen Teil der großen Gruppe oder eine begrenzte Anzahl von Fällen eines allgemeinen Phänomens.

Statistik verstehen

Statistiken werden in praktisch allen wissenschaftlichen Disziplinen wie den Natur- und Sozialwissenschaften sowie in der Wirtschaft, den Geisteswissenschaften, der Regierung und der Fertigung eingesetzt. Statistik ist im Grunde ein Zweig der angewandten Mathematik, der sich aus der Anwendung mathematischer Werkzeuge wie Analysis und linearer Algebra zur Wahrscheinlichkeitstheorie entwickelt hat.

In der Praxis ist Statistik die Idee, dass wir etwas über die Eigenschaften großer Mengen von Objekten oder Ereignissen (einer Population ) erfahren können, indem wir die Eigenschaften einer kleineren Anzahl ähnlicher Objekte oder Ereignisse (einer Stichprobe ) untersuchen. Da es in vielen Fällen zu kostspielig, schwierig oder gar unmöglich ist, umfassende Daten über eine ganze Bevölkerung zu sammeln, beginnt die Statistik mit einer Stichprobe, die bequem oder kostengünstig beobachtet werden kann.

Bei der Analyse von Daten werden zwei Arten von statistischen Methoden verwendet: deskriptive Statistik und Inferenzstatistik. Statistiker messen und sammeln Daten über die Personen oder Elemente einer Stichprobe und analysieren diese Daten dann, um deskriptive Statistiken zu erstellen. Sie können dann diese beobachteten Merkmale der Stichprobendaten, die eigentlich als "Statistiken" bezeichnet werden, verwenden, um Rückschlüsse oder fundierte Vermutungen über die nicht gemessenen (oder nicht gemessenen) Merkmale der breiteren Bevölkerung, die als Parameter bekannt sind, anzustellen.

Statistiken reichen informell Jahrhunderte zurück. Eine frühe Korrespondenz zwischen den französischen Mathematikern Pierre de Fermat und Blaise Pascal aus dem Jahr 1654 wird oft als frühes Beispiel für statistische Wahrscheinlichkeitsanalyse angeführt.

Deskriptive und Inferenzstatistik

Die beiden Hauptbereiche der Statistik sind als beschreibende Statistik bekannt, die die Eigenschaften von Stichproben- und Populationsdaten beschreibt, und Inferenzstatistik, die diese Eigenschaften verwendet, um Hypothesen zu testen und Schlussfolgerungen zu ziehen. Deskriptive Statistiken umfassen Mittelwert (Durchschnitt), Varianz, Schiefe und Kurtosis. Inferenzstatistiken umfassen lineare Regressionsanalyse,. Varianzanalyse (ANOVA), Logit/Probit-Modelle und Nullhypothesentests.

Beschreibende Statistik

Die deskriptive Statistik konzentriert sich hauptsächlich auf die zentrale Tendenz, Variabilität und Verteilung von Stichprobendaten. Zentrale Tendenz bedeutet die Schätzung der Merkmale, eines typischen Elements einer Stichprobe oder Population, und umfasst deskriptive Statistiken wie Mittelwert,. Median und Modus. Variabilität bezieht sich auf eine Reihe von Statistiken, die zeigen, wie groß der Unterschied zwischen den Elementen einer Stichprobe oder Grundgesamtheit entlang der gemessenen Merkmale ist, und umfasst Metriken wie Bereich,. Varianz und Standardabweichung.

Die Verteilung bezieht sich auf die gesamte "Form" der Daten, die in einem Diagramm wie einem Histogramm oder einem Punktdiagramm dargestellt werden kann, und umfasst Eigenschaften wie die Wahrscheinlichkeitsverteilungsfunktion, Schiefe und Kurtosis. Deskriptive Statistik kann auch Unterschiede zwischen beobachteten Merkmalen der Elemente eines Datensatzes beschreiben. Deskriptive Statistiken helfen uns, die kollektiven Eigenschaften der Elemente einer Datenprobe zu verstehen und bilden die Grundlage für das Testen von Hypothesen und das Treffen von Vorhersagen mithilfe von Inferenzstatistiken.

Inferenzstatistik

Inferenzstatistiken sind Werkzeuge, die Statistiker verwenden, um Schlussfolgerungen über die Merkmale einer Grundgesamtheit zu ziehen, die aus den Merkmalen einer Stichprobe gezogen werden, und um zu entscheiden, wie sicher sie sich hinsichtlich der Zuverlässigkeit dieser Schlussfolgerungen sein können. Basierend auf dem Stichprobenumfang und der Verteilung können Statistiker die Wahrscheinlichkeit berechnen, dass Statistiken, die die zentrale Tendenz, Variabilität, Verteilung und Beziehungen zwischen Merkmalen innerhalb einer Datenstichprobe messen, ein genaues Bild der entsprechenden Parameter der gesamten Grundgesamtheit liefern, aus der die Stichprobe stammt ist gezeichnet.

Inferenzstatistiken werden verwendet, um Verallgemeinerungen über große Gruppen zu treffen, z. B. die Schätzung der durchschnittlichen Nachfrage nach einem Produkt durch Erhebung einer Stichprobe von Kaufgewohnheiten der Verbraucher oder um zu versuchen, zukünftige Ereignisse vorherzusagen, z. B. die Vorhersage der zukünftigen Rendite eines Wertpapiers oder einer Anlageklasse auf der Grundlage von kehrt in einem Probezeitraum zurück.

Regressionsanalyse ist eine weit verbreitete Technik der statistischen Inferenz, die verwendet wird, um die Stärke und Art der Beziehung (dh der Korrelation ) zwischen einer abhängigen Variablen und einer oder mehreren erklärenden (unabhängigen) Variablen zu bestimmen. Die Ausgabe eines Regressionsmodells wird häufig auf statistische Signifikanz analysiert,. was sich auf die Behauptung bezieht, dass ein Ergebnis von Ergebnissen, die durch Tests oder Experimente generiert wurden, wahrscheinlich nicht zufällig oder zufällig aufgetreten ist, sondern wahrscheinlich auf eine bestimmte Ursache zurückzuführen ist, die durch aufgeklärt wurde die Daten. Statistische Signifikanz ist wichtig für akademische Disziplinen oder Praktiker, die sich stark auf die Analyse von Daten und Forschung verlassen.

Statistische Daten verstehen

Die Wurzel der Statistik wird von Variablen bestimmt. Eine Variable ist ein zählbarer Datensatz, der ein Merkmal oder Attribut eines Gegenstandes kennzeichnet. Beispielsweise kann ein Auto Variablen wie Marke, Modell, Jahr, Kilometerstand, Farbe oder Zustand haben. Durch die Kombination der Variablen über einen Datensatz hinweg (dh die Farben aller Autos auf einem bestimmten Parkplatz) ermöglichen uns Statistiken, Trends und Ergebnisse besser zu verstehen.

Es gibt zwei Haupttypen von Variablen. Erstens sind qualitative Variablen spezifische Attribute, die oft nicht numerisch sind. Viele der im Autobeispiel angegebenen Beispiele sind qualitativ. Andere Beispiele für qualitative Variablen in der Statistik sind Geschlecht, Augenfarbe oder Geburtsort. Qualitative Daten werden am häufigsten verwendet, um zu bestimmen, welcher Prozentsatz eines Ergebnisses für eine bestimmte qualitative Variable auftritt, und die qualitative Analyse stützt sich häufig nicht auf Zahlen. Um beispielsweise festzustellen, wie viel Prozent der Frauen ein Unternehmen besitzen, werden qualitative Daten analysiert.

Die zweite Art von Variablen in der Statistik sind quantitative Variablen. Quantitative Variablen werden numerisch untersucht und haben nur dann Gewicht, wenn es sich um einen nicht-numerischen Deskriptor handelt. Ähnlich wie bei der quantitativen Analyse wurzeln diese Informationen in Zahlen. Im obigen Autobeispiel ist die gefahrene Kilometerleistung eine quantitative Variable. Die Zahl 60.000 hat jedoch keinen Wert, es sei denn, es wird verstanden, dass dies die Gesamtzahl der gefahrenen Meilen ist.

Quantitative Variablen können weiter in zwei Kategorien unterteilt werden. Erstens haben diskrete Variablen Beschränkungen in der Statistik und schließen daraus, dass es Lücken zwischen möglichen diskreten Variablenwerten gibt. Die Anzahl der in einem Fußballspiel erzielten Punkte ist eine diskrete Variable, da (1) es keine Dezimalstellen geben darf und (2) es für eine Mannschaft unmöglich ist, nur 1 Punkt zu erzielen.

Zweitens verwendet die Statistik auch kontinuierliche quantitative Variablen. Diese Werte verlaufen entlang einer Skala – während diskrete Werte Einschränkungen haben, werden kontinuierliche Variablen oft in Dezimalzahlen gemessen. Bei der Messung der Größe von Fußballspielern kann jeder Wert (innerhalb möglicher Grenzen) erhalten werden, und die Größen können bis auf 1/16 Zoll gemessen werden, wenn nicht darüber hinaus.

Statistiker können verschiedene Titel und Positionen innerhalb eines Unternehmens innehaben. Laut Glassdoor betrug die durchschnittliche Gesamtvergütung für einen Statistiker im Dezember 2021 98.034 US-Dollar. Eine ebenso analytische Rolle als Datenwissenschaftler brachte eine jährliche Vergütung von fast 119.000 US-Dollar ein.

Statistische Messebenen

Nach der Analyse von Variablen und Ergebnissen im Rahmen der Statistik ergeben sich mehrere Messebenen. Statistiken können die Ergebnisse auf diese verschiedene Weise quantifizieren:

  1. Nennwertmessung. Es gibt keinen numerischen oder quantitativen Wert, und Qualitäten werden nicht eingestuft. Stattdessen sind nominale Füllstandsmessungen einfach Bezeichnungen oder Kategorien, die anderen Variablen zugewiesen werden. Es ist am einfachsten, sich Nominalpegelmessungen als nicht-numerische Fakten über eine Variable vorzustellen. Beispiel: Der Name des 2020 gewählten Präsidenten war Joseph Robinette Biden, Jr.

  2. Ordinale Pegelmessung: Ergebnisse können in einer Reihenfolge angeordnet werden, jedoch haben alle Datenwerte denselben Wert oder dieselbe Gewichtung. Obwohl numerische, ordinale Pegelmessungen in der Statistik nicht gegeneinander subtrahiert werden können, da nur die Position des Datenpunkts zählt. Ordinalniveaus werden oft in nichtparametrische Statistiken integriert und mit der gesamten Variablengruppe verglichen. Beispiel: Der Amerikaner Fred Kerley war der zweitschnellste Mann bei den Olympischen Spielen 2020 in Tokio, basierend auf den 100-Meter-Sprintzeiten.

  3. Intervallpegelmessung: Ergebnisse können der Reihe nach angeordnet werden; jedoch können Unterschiede zwischen Datenwerten jetzt Bedeutung haben. Zwei verschiedene Datenpunkte werden oft verwendet, um den Zeitablauf oder sich ändernde Bedingungen innerhalb eines Datensatzes zu vergleichen. Oft gibt es keinen "Startpunkt" für den Bereich der Datenwerte, und Kalenderdaten oder Temperaturen haben möglicherweise keinen sinnvollen intrinsischen Nullwert. Beispiel: Die Inflation erreichte im Mai 2022 8,6 %. Zuletzt war die Inflation im Dezember 1981 so hoch.

  4. Ratio Level Measurement: Ergebnisse können in einer Reihenfolge angeordnet werden, und Unterschiede zwischen Datenwerten haben jetzt Bedeutung. Es gibt jedoch jetzt einen Ausgangspunkt oder "Nullwert", der verwendet werden kann, um einem statistischen Wert einen weiteren Wert zu verleihen. Das Verhältnis zwischen Datenwerten hat jetzt Bedeutung, einschließlich seiner Entfernung von Null. Beispiel: Die niedrigste gemessene meteorologische Temperatur betrug -128,6 Grad Fahrenheit in der Antarktis.

Statistische Stichprobentechniken

Um statistische Informationen zu sammeln, wäre es oft nicht möglich, Daten von jedem Datenpunkt innerhalb einer Population zu sammeln. Stattdessen stützt sich die Statistik auf verschiedene Stichprobentechniken, um eine repräsentative Teilmenge der Bevölkerung zu erstellen, die einfacher zu analysieren ist. In der Statistik gibt es mehrere Hauptarten der Stichprobenziehung.

  • Einfache Zufallsstichproben erfordern,. dass jedes Mitglied innerhalb der Population die gleiche Chance hat, für die Analyse ausgewählt zu werden. Als Grundlage für die Stichprobenziehung wird die gesamte Grundgesamtheit verwendet, wobei jeder beliebige Zufallsgenerator die Stichprobenelemente auswählen kann. Beispielsweise werden 100 Personen in einer Reihe aufgestellt und 10 zufällig ausgewählt.

  • Eine systematische Probenahme erfordert auch eine Zufallsstichprobe. Die Technik ist jedoch leicht modifiziert, um die Durchführung zu erleichtern. Eine einzelne Zufallszahl wird generiert und Personen werden dann in einem festgelegten regelmäßigen Intervall ausgewählt, bis die Stichprobengröße vollständig ist. Beispielsweise werden 100 Personen aufgereiht und nummeriert. Das 7. Individuum wird für die Probe ausgewählt, gefolgt von jedem weiteren 9. Individuum, bis 10 Probenelemente ausgewählt wurden.

  • Stratifizierte Probenahme erfordert mehr Kontrolle über Ihre Probe. Die Bevölkerung wird anhand ähnlicher Merkmale in Untergruppen eingeteilt. Dann berechnen Sie, wie viele Personen aus jeder Untergruppe die gesamte Bevölkerung repräsentieren würden. Beispielsweise werden 100 Personen nach Geschlecht und Rasse gruppiert. Dann wird eine Stichprobe aus jeder Untergruppe in dem Verhältnis genommen, wie repräsentativ diese Untergruppe für die Bevölkerung ist.

  • Cluster-Sampling-Aufrufe auch für Untergruppen. Jede Untergruppe sollte jedoch repräsentativ für die Bevölkerung sein. Anstatt Personen innerhalb einer Untergruppe zufällig auszuwählen, wird die gesamte Untergruppe zufällig ausgewählt.

Sie sind sich nicht sicher, welcher Major League Baseball-Spieler letztes Jahr den Most Valuable Player hätte gewinnen sollen? Statistiken, die oft verwendet werden, um den Wert zu bestimmen, werden oft zitiert, wenn die Auszeichnung für den besten Spieler verliehen wird. Statistiken können den Schlagdurchschnitt, die Anzahl der getroffenen Homeruns und gestohlene Bases beinhalten.

Beispiele für Statistiken

Statistik spielt eine herausragende Rolle in den Bereichen Finanzen, Investitionen, Wirtschaft und der Welt. Viele der Informationen, die Sie sehen, und der Daten, die Sie erhalten, stammen aus Statistiken, die in allen Facetten eines Unternehmens verwendet werden.

  • Beim Investieren umfassen die Statistiken das durchschnittliche Handelsvolumen, das 52-Wochen-Tief, das 52-Wochen-Hoch, Beta und die Korrelation zwischen Anlageklassen oder Wertpapieren.

  • In Wirtschaftswissenschaften umfassen die Statistiken BIP, Arbeitslosigkeit, Verbraucherpreise und Inflation sowie andere Wirtschaftswachstumskennzahlen

  • Im Marketing umfassen die Statistiken Konversionsraten, Klickraten, Suchmengen und Social-Media-Metriken.

  • In der Buchhaltung enthalten die Statistiken Liquiditäts-, Zahlungsfähigkeits- und Rentabilitätsmetriken im Zeitverlauf.

  • In Informationstechnologie umfassen die Statistiken Bandbreite, Netzwerkkapazitäten und Hardwarelogistik.

  • In der Personalabteilung umfassen die Statistiken die Mitarbeiterfluktuation, die Mitarbeiterzufriedenheit und die durchschnittliche Vergütung im Vergleich zum Markt.

Höhepunkte

  • Eine Reihe von Stichprobenverfahren kann verwendet werden, um statistische Daten zusammenzustellen, darunter einfache zufällige, systematische, geschichtete oder Cluster-Stichproben.

  • Statistiken können auf verschiedenen Ebenen kommuniziert werden, die von nicht-numerischen Deskriptoren (nominale Ebene) bis zu numerischen in Bezug auf einen Nullpunkt (Verhältnisebene) reichen.

  • Statistiken sind in fast jeder Abteilung jedes Unternehmens vorhanden und sind auch ein wesentlicher Bestandteil der Investition.

  • Statistik ist das Studium und die Bearbeitung von Daten, einschließlich Methoden zum Sammeln, Überprüfen, Analysieren und Ziehen von Schlussfolgerungen aus Daten.

  • Die beiden Hauptbereiche der Statistik sind die deskriptive und die inferentielle Statistik.

FAQ

Was ist der Unterschied zwischen deskriptiver und inferenzieller Statistik?

Deskriptive Statistiken werden verwendet, um die Merkmale einer Stichprobe oder eines Datensatzes zu beschreiben oder zusammenzufassen, z. B. den Mittelwert, die Standardabweichung oder die Häufigkeit einer Variablen. Im Gegensatz dazu verwendet die Inferenzstatistik eine beliebige Anzahl von Techniken, um Variablen in einem Datensatz miteinander in Beziehung zu setzen, beispielsweise unter Verwendung von Korrelations- oder Regressionsanalysen. Diese können dann verwendet werden, um Prognosen abzuschätzen oder auf Kausalitäten zu schließen.

Warum ist Statistik wichtig?

Statistiken liefern die Informationen, um aufzuklären, wie die Dinge funktionieren. Statistiken werden verwendet, um Forschung zu betreiben, Ergebnisse zu bewerten, kritisches Denken zu entwickeln und fundierte Entscheidungen zu treffen. Statistiken können verwendet werden, um fast jedes Studiengebiet zu untersuchen, um zu untersuchen, warum Dinge passieren, wann sie auftreten und ob ihr Wiederauftreten vorhersehbar ist.

Wer verwendet Statistiken?

Statistiken werden in einer Vielzahl von Anwendungen und Berufen eingesetzt. Jedes Mal, wenn Daten gesammelt und analysiert werden, werden Statistiken erstellt. Dies kann von Regierungsbehörden über akademische Forschung bis hin zur Analyse von Investitionen reichen.

Wie werden Statistiken in Wirtschaft und Finanzen verwendet?

Ökonomen sammeln und betrachten alle möglichen Daten, von Verbraucherausgaben über Baubeginne bis hin zu Inflation und BIP-Wachstum. Im Finanzbereich sammeln Analysten und Investoren Daten über Unternehmen, Branchen, Stimmungen und Marktdaten zu Preis und Volumen. Zusammen wird die Verwendung von Inferenzstatistiken in diesen Bereichen als Ökonometrie bezeichnet. Mehrere wichtige Finanzmodelle, von CAPM über die Modern Portfolio Theory (MPT) bis hin zum Black-Scholes- Optionspreismodell, beruhen auf statistischer Inferenz.