Warum werden immer Verteilungen mit Mittelwert 0 und Standardabweichung 1 verwendet?


14

Meine Statistiken wurden mir selbst beigebracht, aber viel Material, das ich gelesen habe, weist auf einen Datensatz mit einem Mittelwert von 0 und einer Standardabweichung von 1 hin.

Wenn das der Fall ist, dann:

  1. Warum ist Mittelwert 0 und SD 1 eine schöne Eigenschaft zu haben?

  2. Warum entspricht eine Zufallsvariable aus dieser Stichprobe 0,5? Die Chance, 0,001 zu ziehen, ist die gleiche wie 0,5, daher sollte dies eine flache Verteilung sein ...

  3. Wenn Leute über Z Scores sprechen, was meinen sie hier eigentlich?

Antworten:


10
  1. Zu Beginn ist die nützlichste Antwort wahrscheinlich, dass der Mittelwert von 0 und der sd von 1 mathematisch günstig sind. Wenn Sie die Wahrscheinlichkeiten für eine Verteilung mit einem Mittelwert von 0 und einer Standardabweichung von 1 berechnen können, können Sie sie mit einer sehr einfachen Gleichung für eine ähnliche Verteilung von Punktzahlen berechnen.

  2. Ich verfolge diese Frage nicht. Der Mittelwert von 0 und die Standardabweichung von 1 gelten normalerweise für die Standardnormalverteilung, die häufig als Glockenkurve bezeichnet wird. Der wahrscheinlichste Wert ist der Mittelwert und fällt mit zunehmender Entfernung ab. Wenn Sie eine wirklich flache Verteilung haben, ist kein Wert wahrscheinlicher als der andere. Ihre Frage ist hier schlecht formuliert. Haben Sie sich vielleicht Fragen über Münzwürfe gestellt? Nachschlagen der Binomialverteilung und des zentralen Grenzwertsatzes.

  3. "meine hier"? Wo? Die einfache Antwort für z-Scores ist, dass es sich um Ihre Punkte handelt, die so skaliert sind, als ob Ihr Mittelwert 0 und Ihre Standardabweichung 1 wären bedeuten. Die Gleichung berechnet die (Punktzahl - Mittelwert) / Standardabweichung. Die Gründe, aus denen Sie dies tun würden, sind sehr unterschiedlich, aber einer ist, dass Sie in Kursen zur Einführung in die Statistik Wahrscheinlichkeitstabellen für verschiedene Z-Scores haben (siehe Antwort 1).

Wenn Sie zuerst Z-Score nachgeschlagen hätten, selbst in Wikipedia, hätten Sie ziemlich gute Antworten bekommen.


Zu 2) Ich glaube, die Verwirrung ist das, was p (X = .01) bedeutet, wenn X eine kontinuierliche Zufallsvariable ist. Intuitiv scheint die Wahrscheinlichkeit überall Null zu sein, da es keine Chance gibt, dass X genau 0,01 ist. Der Fragesteller sollte die Definition einer Dichtefunktion im kontinuierlichen Fall überprüfen, die als Ableitung der kumulativen Dichtefunktion definiert ist.
Tristan

6

Zunächst geht es um die Standardnormalverteilung, eine Normalverteilung mit einem Mittelwert von 0 und einer Standardabweichung von 1. Die Abkürzung für eine Variable, die als Standardnormalverteilung verteilt wird, ist Z.

Hier sind meine Antworten auf Ihre Fragen.

(1) Ich denke, es gibt zwei Hauptgründe, warum Standardnormalverteilungen attraktiv sind. Erstens kann jede normalverteilte Variable konvertiert oder in eine Standardnormale umgewandelt werden, indem ihr Mittelwert von jeder Beobachtung subtrahiert wird, bevor jede Beobachtung durch die Standardabweichung dividiert wird. Dies wird als Z-Transformation oder als Erstellung von Z-Scores bezeichnet. Dies ist besonders in den Tagen vor Computern sehr praktisch.

(xich-x¯)σx=Z(75-65,6)10.2=0.9215
normalverteilten Variablen und daher ist diese Standardnormalverteilung sehr praktisch.

Der zweite Grund, warum die Standardnormalverteilung häufig verwendet wird, liegt in der Interpretation der Z-Scores. Jede "Beobachtung" in einer Z-transformierten Variablen gibt an, wie viele Standardabweichungen die ursprüngliche nicht transformierte Beobachtung vom Mittelwert war. Dies ist besonders praktisch für standardisierte Tests, bei denen die rohe oder absolute Leistung weniger wichtig ist als die relative Leistung.

(2) Ich folge dir hier nicht. Ich denke, Sie sind möglicherweise verwirrt darüber, was wir unter einer kumulativen Verteilungsfunktion verstehen. Beachten Sie, dass der erwartete Wert einer Standardnormalverteilung 0 ist und dieser Wert dem Wert von 0,5 für die zugehörige kumulative Verteilungsfunktion entspricht.

(xich-x¯)σx=Z(75-65,6)10.2=0.9215
Der Z-Score beträgt in diesem Fall 0,9215. Die Interpretation des Z-Scores ist, dass diese bestimmte Frau 0,9215 Standardabweichungen größer als die durchschnittliche Größe ist. Eine Person, die 55,4 Zoll groß war, hat einen Z-Score von 1 und würde 1 Standardabweichung unter der Durchschnittsgröße liegen.

1

Da Sie ausgezeichnete Erklärungen von Graham und John erhalten haben, beantworte ich nur Ihre letzte Frage:

Wenn Leute über Z Scores sprechen, was meinen sie hier eigentlich?

Der beste Weg, dies zu beantworten, besteht darin, über diese Frage nachzudenken: Die Noten in der Klasse CS 101 werden normalerweise mit verteilt μ = 80 und σ = 5. Was ist der Z-Score für die Note 65?

Also: (65-80) / 5 = -3

Sie können sagen, dass der Z-Score für die Note 65 -3 ist ; oder mit anderen Worten 3 Standardabweichung nach links.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.