Wikipedia hat eine Seite, auf der viele Wahrscheinlichkeitsverteilungen mit Links zu weiteren Details zu jeder Verteilung aufgelistet sind . Sie können die Liste durchsehen und den Links folgen, um ein besseres Gefühl für die Arten von Anwendungen zu bekommen, für die die verschiedenen Distributionen üblicherweise verwendet werden.
Denken Sie daran, dass diese Verteilungen verwendet werden, um die Realität zu modellieren, und wie Box sagte: "Alle Modelle sind falsch, einige Modelle sind nützlich".
Hier sind einige der gebräuchlichen Distributionen und einige der Gründe, warum sie nützlich sind:
Normal: Dies ist nützlich, um Mittelwerte und andere lineare Kombinationen (z. B. Regressionskoeffizienten) aufgrund der CLT zu betrachten. Wenn bekannt ist, dass etwas aufgrund von additiven Effekten vieler verschiedener kleiner Ursachen entsteht, kann dies eine vernünftige Verteilung sein: Beispielsweise sind viele biologische Maßnahmen das Ergebnis mehrerer Gene und mehrerer Umweltfaktoren und daher häufig ungefähr normal .
Gamma: Rechts verzerrt und nützlich für Dinge mit einem natürlichen Minimum von 0. Wird häufig für abgelaufene Zeiten und einige finanzielle Variablen verwendet.
Exponentiell: Sonderfall des Gamma. Es ist memoryless und lässt sich leicht skalieren.
Chi-Quadrat ( ): Sonderfall des Gamma. Entsteht als Summe der quadrierten Normalvariablen (wird also für Varianzen verwendet).χ2
Beta: Wird zwischen 0 und 1 definiert (kann aber auch zwischen anderen Werten umgewandelt werden) und eignet sich für Proportionen oder andere Größen, die zwischen 0 und 1 liegen müssen.
Binomial: Wie viele "Erfolge" aus einer bestimmten Anzahl unabhängiger Versuche mit derselben Wahrscheinlichkeit für "Erfolg".
Poisson: Häufig für Zählungen. Schöne Eigenschaften: Wenn die Anzahl der Ereignisse in einem Zeitraum oder Gebiet einem Poisson folgt, folgt die Anzahl der Ereignisse in der doppelten Zeit oder dem doppelten Gebiet immer noch dem Poisson (mit dem doppelten Mittelwert): Dies funktioniert zum Hinzufügen von Poisson oder zum Skalieren mit anderen Werten als 2.
Beachten Sie, dass, wenn Ereignisse im Zeitverlauf auftreten und die Zeit zwischen den Ereignissen einem Exponential folgt, die Zahl, die in einem Zeitraum auftritt, einem Poisson folgt.
Negatives Binomial: Zählt mit mindestens 0 (oder einem anderen Wert, je nach Version) und ohne Obergrenze. Konzeptionell ist es die Anzahl der "Misserfolge" vor k "Erfolgen". Das negative Binomial ist auch eine Mischung von Poisson-Variablen, deren Mittelwerte aus einer Gammaverteilung stammen.
Geometrisch: Sonderfall für negatives Binomial, bei dem es sich um die Anzahl der "Fehler" vor dem ersten "Erfolg" handelt. Wenn Sie eine Exponentialvariable abrunden, um sie diskret zu machen, ist das Ergebnis geometrisch.
EstimatedDistribution
Funktion beschrieben .