Das Papier chl zeigt auf einige wichtige Informationen - und zeigt damit, dass es sich nicht um eine allgemeine Regel handelt (auch nicht für kontinuierliche, glatte, "gut verhaltene" Variablen wie den Weibull). Obwohl dies oft ungefähr der Fall ist, ist dies häufig nicht der Fall.
Wo kommt Pearson her? Wie kam er zu dieser Annäherung?
Zum Glück sagt Pearson uns die Antwort ziemlich genau.
Die erste Verwendung des Begriffs "Versatz" in dem Sinne, dass wir ihn verwenden, scheint Pearson, 1895 [1] zu sein (sie erscheint direkt im Titel). In diesem Artikel wird anscheinend auch der Begriff Modus vorgestellt (Fußnote, S. 345):
Ich habe es für zweckmäßig befunden, für die Abszisse den Begriff Modus zu verwenden, der der Ordinate der Maximalfrequenz entspricht. Der "Mittelwert", der "Modus" und der "Median" haben alle unterschiedlichen Zeichen, die für den Statistiker wichtig sind.
Es scheint auch seine erste wirkliche Detaillierung seines Frequenzkurvensystems zu sein .
Bei der Erörterung der Schätzung des Formparameters in der Pearson- Typ-III- Verteilung (was wir jetzt als verschobenes - und möglicherweise gespiegeltes - Gamma bezeichnen) sagt er (S. 375):
Der Mittelwert, der Median und der Modus oder die Maximum-Ordinate sind mit bb , cc bzw. aa gekennzeichnet , und sobald die Kurven gezeichnet wurden, zeigte sich eine bemerkenswerte Beziehung zwischen der Position der drei Größen: der Median, so solange positiv war, wurde gesehen, dass * etwa ein Drittel vom Mittelwert zum Maximum des betrugp†
* dies entspricht dem Gamma mit einem Formparameter>1
† hier ist die absicht von "maximum" der wert der maximalen frequenz (der mode), wie am anfang des zitats deutlich wird, nicht das maximum der zufallsvariablen.x
Und tatsächlich, wenn wir das Verhältnis von (Mittelwert) zu (Mittelwert-Median) für die Gammaverteilung betrachten, beobachten wir Folgendes:
(Der blaue Teil markiert die Region, in der Pearson sagt, dass die Annäherung angemessen ist).
In der Tat, wenn wir uns einige andere Distributionen im Pearson-System ansehen - sagen wir zum Beispiel die Beta-Distributionen -, dann gilt ungefähr dasselbe Verhältnis, solange und nicht zu klein sind:αβ
(Die besondere Auswahl von Unterfamilien der Beta mit wurde getroffen, weil im Moment der Schiefe .) so, dass eine Erhöhung von für Konstante einer abnehmenden Momentenversetzung entspricht, interessanterweise für Werte von und wie , die Kurven sind fast konstant (Mittelwert) / (Mittelwert-Median), was darauf hindeutet, dass die Annäherung vernünftig ist, wenn ist groß genug, möglicherweise mit einem Minimum auf dem kleineren vonβ−−√−α−−√=kβ−−√−α−−√αβ−−√−α−−√αββ−−√+α−−√=cβ−−√+α−−√αund .)β
Das inverse Gamma ist auch im Pearson-System; es hat auch die Beziehung für große Werte des Formparameters (sagen wir ungefähr ):α>10
Es ist zu erwarten, dass Pearson auch mit der lognormalen Verteilung vertraut war. In diesem Fall sind der Modus, der Median und der Mittelwert jeweils und ; es wurde vor der Entwicklung seines Systems diskutiert und wird oft mit Galton in Verbindung gebracht.eμ−σ2,eμeμ+σ2/2
Betrachten wir noch einmal (Mittelwert) / (Mittelwert-Median). Wenn wir einen Faktor von aus Zähler und Nenner streichen, bleibt . In erster Ordnung (die genau sein wird , wenn klein ist), wird der Zähler zu und der Nenner , so zumindest für small sollte es auch für das lognormal gelten.eμeσ2/2−e−σ2eσ2/2−1σ232σ212σ2σ2
Es gibt eine ganze Reihe bekannter Distributionen - von denen einige Pearson bekannt waren -, für die es für einen weiten Bereich von Parameterwerten nahezu zutreffend ist. er bemerkte es mit der Gammaverteilung, hätte aber die Idee bestätigt, als er sich einige andere Verteilungen ansah, die er wahrscheinlich in Betracht ziehen würde.
[1]: Pearson, K. (1895),
"Beiträge zur mathematischen Evolutionstheorie, II: Abweichungen im homogenen Material",
Philosophical Transactions of the Royal Society, Reihe A, 186, 343-414
[ Nicht urheberrechtlich geschützt. Frei verfügbar hier ]