"Peakedness" einer verzerrten Wahrscheinlichkeitsdichtefunktion


11

Ich möchte die "Peakedness" und die "Schwere" des Schwanzes mehrerer Funktionen mit verzerrter Wahrscheinlichkeitsdichte beschreiben.

Die Merkmale, die ich beschreiben möchte, würden sie "Kurtosis" heißen? Ich habe nur das Wort "Kurtosis" gesehen, das für symmetrische Verteilungen verwendet wird.


15
In der Tat werden die Kurtosis-Maße typischerweise auf symmetrische Verteilungen angewendet. Sie können es auch für verzerrte berechnen, aber die Interpretation ändert sich, da dieser Wert variiert, wenn die Asymmetrie eingeführt wird. Tatsächlich sind diese beiden Konzepte schwer zu trennen. Kürzlich wurde in diesem Artikel ein schiefheitsinvariantes Maß für die Kurtosis vorgeschlagen .

Hohe Kurtosis ist mit Spitzenwerten und starkem Schwanz verbunden (sie wird auch als „Mangel an Schultern“ bezeichnet). In einem der Bände von Kendall und Stuart werden diese Themen ausführlich behandelt. Aber solche Interpretationen werden, wie Sie bemerken, im Allgemeinen in der Situation der Nahsymmetrie gegeben. In unsymmetrischen Fällen korreliert das standardisierte 4. Moment normalerweise stark mit dem Quadrat des standardisierten dritten Moments, sodass sie meistens ähnlich messen.
Glen_b -State Monica

In Anbetracht der besonderen Art und Weise, wie ich es in meinem früheren Kommentar formuliert habe, gilt dies sogar für symmetrische Verteilungen - das Quadrat des standardisierten dritten Moments der Stichprobe (Quadratmoment-Schiefe) korreliert sogar stark mit dem standardisierten vierten Moment der Stichprobe („Kurtosis“) sagen wir mal das normale.
Glen_b -Reinstate Monica

Antworten:


3

Wenn die Varianz als das zweite Moment definiert ist, die Schiefe als das dritte Moment μ 3 definiert ist und die Kurtosis als das vierte Moment μ 4 definiert ist , ist es möglich, die Eigenschaften eines weiten Bereichs symmetrischer und nicht symmetrischer Verteilungen zu beschreiben aus den Daten.μ2μ3μ4

Diese Technik wurde ursprünglich 1895 von Karl Pearson für die sogenannten Pearson-Verteilungen I bis VII beschrieben. Dies wurde von Egon S. Pearson (Datum ungewiss), wie er 1966 in Hahn und Shapiro veröffentlicht wurde, auf eine breite Palette symmetrischer, asymmetrischer und schwerer Schwanzverteilungen erweitert, darunter Uniform, Normal, Students-t, Lognormal, Exponential, Gamma, Beta, Beta J und Beta U. Aus der Tabelle von p. 197 von Hahn und Shapiro, und B 2 können verwendet werden, um Deskriptoren für Schiefe und Kurtosis zu erstellen als:B1B2

μ4=B2μ 2 2μ3=B1 μ23
μ4=B2 μ22

Wenn Sie nur einfache relative Deskriptoren wollten, ist die Schiefe durch Anwenden einer Konstanten μ2=1 und die Kurtosis istB2.B1B2

Wir haben versucht, dieses Diagramm hier zusammenzufassen, damit es programmiert werden kann, aber es ist besser, es in Hahn und Shapiro (S. 42-49,122-132,197) zu überprüfen. In gewissem Sinne schlagen wir ein wenig Reverse Engineering des Pearson-Diagramms vor, aber dies könnte eine Möglichkeit sein, zu quantifizieren, was Sie suchen.


3

Das Hauptproblem hier ist, was ist "Peakedness"? Ist es eine Krümmung am Peak (2. Ableitung?) Muss es zuerst standardisiert werden? (Sie würden es denken, aber es gibt einen Strom von Literatur, der mit Proschan, Ann. Math. Statist. Volume 36, Number 6 (1965), 1703-1706 beginnt und die Peakedness auf eine Weise definiert, die normal mit geringerer Varianz ist. " Höhepunkt "). Oder ist es eine Wahrscheinlichkeitskonzentration innerhalb einer Standardabweichung des Mittelwerts, wie sie in Balanda und Macgillivray impliziert ist (The American Statistician, 1988, Vol 42, 111-119)? Sobald Sie sich für eine Definition entschieden haben, sollte es trivial sein, sie anzuwenden. Aber ich würde fragen: "Warum kümmert es dich?" Von welcher Relevanz ist "Peakedness", wie auch immer definiert?

Übrigens misst die Pearson-Kurtosis nur die Schwänze und misst keine der oben genannten "Peakedness" -Definitionen. Sie können die Daten oder die Verteilung innerhalb einer Standardabweichung des Mittelwerts beliebig ändern (wobei die Einschränkung Mittelwert = 0 und Varianz = 1 beibehalten wird), die Kurtosis kann sich jedoch nur innerhalb eines maximalen Bereichs von 0,25 ändern (normalerweise viel weniger). Sie können also die Verwendung von Kurtosis zur Messung der Peakedness für jede Verteilung ausschließen, obwohl Kurtosis tatsächlich ein Maß für die Schwänze für jede Verteilung ist, unabhängig davon, ob die Verteilung symmetrisch, asymmetrisch, diskret, kontinuierlich, diskret / kontinuierlich oder empirisch ist. Kurtosis misst Schwänze für alle Verteilungen und praktisch nichts über Peak (wie auch immer definiert).


1

A possible very practical approach could be calculate the ratio of the survival function of the distribution Pr(X~>1α) against the normal one, showing it is quite far greater. Another approach can be calculating the ratios of percentiles w1=x99~x50~x75~x50~ of the distribution x~ under interest and dividing it against the normal one quantile values, w2=Φ99~Φ50~Φ75~Φ50~, τ=w1w2.


0

I am not sure I get your understanding of peakedness and heaviness. Kurtosis means "Excess" in German, so it describes the "head" or "peak" of a distribution, describing whether it is very wide or very narrow. Wikipedia states that the "peakedness" is actually described by the "kurtosis", whereas peakedness does not to appear to be a real word and you should use the term "Kurtosis".

So I think you might have gotten everything right, the head is the Kurtosis, The "heaviness" of the tail might be the Skewness":

Here is how you find it:

a3=Σi=1N(xix¯)3Nsx3

with s as the standard deviation for x.

The values indicate:

Negative Skew:

a3<0

Positive Skew:

a3>0

No Skew

a3=0

You can get a value for the kurtosis with:

a4=Σi=1N(xix¯)4Nsx4

The values indicate:

Platycurtic:

a4<3

Leptocurtic:

a4>3

Normal:

a4=3.0

Did that help?


3
I'm afraid this answer in its current form may be less than helpful due to errors in it. Skewness is a standard measure of asymmetry. It is not closely related to heaviness of tails: it is possible for the tails to be extremely heavy and the skewness to be zero (which is the case for any symmetric distribution, for instance). Please note, too, that it is impossible for a4 to be negative, so the second half of this answer makes little sense. (Perhaps you confused kurtosis with excess kurtosis?)
whuber

1
Thank you for clarifying. There might indeed be some errors in the formulas, I just copied them from the scripts they provide at uni. I oversaw the fact that a4 can't be negative.
Johannes Hofmeister

1
I looked up why my answer is wrong - it is a translational error, I apologize for that. My slides are all in German, mixing Kurtosis and Excess.
Johannes Hofmeister

@Peter As Peter Westfall keeps pointing out, your comment is incorrect: "peakedness" (of any mode), thought of vaguely as pointiness or height, has absolutely nothing to do with the tails of any distribution, nor is it measured by any finite combination of moments (such as the kurtosis). It may happen to be connected to heaviness of tails for a family of distributions, but that's a completely different matter.
whuber

-1

Kurtosis is definitely associated with the peakedness of the curve. I henceforth believe that you are really looking for kurtosis which does exist whether the distribution is symmetric or not. (user10525) has definitely said it right ! I hope your problem is resolved by now. Do share its outcome, all opinions are welcome.


1
I'm not sure how this constitutes a helpful answer beyond what was already written here. How about you expand more on kurtosis and peakedness of the curve?
Momo

Wanted to give clear cut clarification to the query. The discussion seemed to be confusing @Momo
Vani
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.