Robuste Schätzung der Kurtosis?


11

Ich verwende den üblichen Schätzer für Kurtosis, , aber ich bemerke, dass selbst kleine Ausreißer in meiner empirischen Verteilung , dh kleine Spitzen weit vom Zentrum entfernt, beeinflussen es enorm. Gibt es einen Kurtosis-Schätzer, der robuster ist?

K.^=μ^4σ^4

Antworten:


8

Es gibt einige. In diesem Link finden Sie einen ausführlichen Vergleich zu einer ungated Version des Papiers (richtige Referenz am Ende dieser Antwort).

Aufgrund der Einschränkungen des Problems beträgt die Aufschlüsselung des robustesten dieser Algorithmen (L / RMC) höchstens 12,5%. Ein Vorteil des L / RMC besteht darin, dass es auf Quantilen basiert und auch dann interpretierbar bleibt, wenn die zugrunde liegende Verteilung keine Momente aufweist. Ein weiterer Vorteil besteht darin, dass keine Symmetrie der Verteilung des nicht kontaminierten Teils der Daten zur Messung des Schwanzgewichts angenommen wird: Tatsächlich gibt der Algorithmus zwei Zahlen zurück: die RMC für das rechte Schwanzgewicht und die LMC für das linke Schwanzgewicht.

[0,1]]Konstruktionsbedingt: Keine Kontaminationsmenge kann beispielsweise dazu führen, dass der Algorithmus -1 zurückgibt!). In der Praxis stellt man fest, dass man etwa 5% der Probe durch sehr pathologische Ausreißer ersetzen kann, ohne dass die am stärksten betroffenen Schätzungen (es gibt immer zwei) zu stark von dem Wert abweichen, den sie für die nicht kontaminierte Probe hatten.

Das L / RMC ist ebenfalls weit verbreitet. Zum Beispiel können Sie eine R Implementierung finden hier . Wie in dem oben verlinkten Artikel erläutert, müssen Sie zur Berechnung des L / RMC den MC (den im Link implementierten Schätzer) für die linke und rechte Hälfte Ihrer Daten separat berechnen. Hier (links) rechts sind die Teilstichproben der Beobachtung (kleiner) größer als der Median Ihrer ursprünglichen Stichprobe.

  • Brys, Hubert, Struyf. (2006). Robuste Maße des Schwanzgewichts.

2
Sind diese alternativen Maße des Schwanzgewichts nicht eher robuste Schätzer der Kurtosis per say? Das kann es sein, was er wirklich will. aber es ist nicht genau das, wonach er gefragt hat. Konvergieren einige / alle dieser Schätzer bei großen Stichproben gegen Kurtosis?
Andrew

Zusammenfassung aus der Arbeit: Bei nicht kontaminierten Daten, die die Bedingungen für die konvexe Ordnung von Van Zwet erfüllen (unter denen das Maß der Kurtosis von Bedeutung ist), konvergieren sie zu einer monotonen Funktion der Kurtosis.
user603

1
Die Pearson-Kurtosis misst schlicht und einfach Ausreißer (seltene extreme Beobachtungen). Also, wonach suchst du stattdessen? Ein Maß für "Peakedness"? Erstens misst Pearson die Kurtosis überhaupt nicht. Zweitens müssen Sie zunächst definieren, was dies bedeutet, wenn Sie ein Maß für "Peakedness" wünschen. Wenn Sie es definieren können, können Sie es schätzen. Eine Möglichkeit ist die zweite Ableitung des PDF der standardisierten Daten, die am Peak ausgewertet wird. (Bitte). Ich bin sicher, dass es noch andere gibt.
Peter Westfall

1
Tatsächlich gebe ich drei mathematische Theoreme an, die Kurtosis mit den Schwänzen der Verteilung in Beziehung setzen, so dass diese nicht verfälscht werden können: (i) Für alle Verteilungen mit endlichem vierten Moment liegt Kurtosis zwischen E (Z ^ 4 * I (| Z |> 1) )) und E (Z ^ 4 * I (| Z |> 1)) +1. (ii) In der Unterklasse, für die die Dichte von Z ^ 2 stetig ist und auf (0,1) abnimmt, kann "+1" durch "+.5" ersetzt werden. (iii) Für jede Folge von Verteilungen mit Kurtosis -> unendlich, E (Z ^ 4 * I (| Z |> b)) / Kurtosis -> 1 für jede reale b. Es ist alles hier: ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Peter Westfall
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.