Unterschiede in der Kurtosis-Definition und deren Interpretation


10

Ich habe kürzlich festgestellt, dass es Unterschiede in den von SPSS und Stata bereitgestellten Kurtosis-Werten gibt.

Siehe http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm

Mein Verständnis ist, dass die Interpretation desselben daher unterschiedlich wäre.

Irgendwelche Ratschläge, wie man damit umgeht?


Ich wusste über die ersten beiden Formeln Bescheid und es ist ziemlich einfach, diese zu unterscheiden. Ich hatte diese dritte Formel nicht gesehen.
Peter Flom - Wiedereinsetzung von Monica

Antworten:


9

Die drei Formeln

Drei Formeln für die Kurtosis werden im Allgemeinen von verschiedenen Programmen verwendet. Ich werde alle drei Formeln ( , und ) und Programme , die sie verwenden. G 2 b 2g2G2b2

Die erste Formel und die typische Definition, die in vielen Lehrbüchern verwendet wird, lautet (dies ist die zweite Formel in dem von Ihnen angegebenen Link) wobei bezeichnet die Beispielmomente : mr

g2=m4m22
mr

mr=1n(xix¯)r

Manchmal wird dieser Formel ein Korrekturterm von -3 hinzugefügt, sodass eine Normalverteilung eine Kurtosis von 0 aufweist. Die Kurtosisformel mit einem Term von -3 wird als überschüssige Kurtosis bezeichnet (die erste Formel in dem von Ihnen angegebenen Link).

Die zweite Formel lautet (wird von SAS, SPSS und MS Excel verwendet; dies ist die dritte Formel in dem von Ihnen angegebenen Link).

G2=k4k22=n1(n2)(n3)[(n+1)g2+6]

Dabei ist die in der ersten Formel definierte Kurtosis.g2

Die dritte Formel lautet (von MINITAB und BMDP verwendet):

b2=m4s43=(n1n)2m4m223

wobei die unverzerrte Stichprobenvarianz ist :s2

s2=1n1(xix¯)2

In Rder Kurtosis kann mit der kurtosisFunktion aus dem e1071Paket berechnet werden (Link hier ). Die Option typebestimmt, welche der drei Formeln für die Berechnungen verwendet wird (1 = , 2 = , 3 = ).g23G2b2

Diese beiden Artikel diskutieren und vergleichen alle drei Formeln: erstens , zweitens .

Zusammenfassung der Unterschiede zwischen den Formeln

  1. Unter Verwendung von hat eine Normalverteilung einen Kurtosis-Wert von 3, während in den Formeln mit einem Korrekturterm -3 (dh und ) eine Normalverteilung eine überschüssige Kurtosis von 0 aufweist.g2G2b2
  2. G2 ist die einzige Formel, die unverzerrte Schätzungen für normale Stichproben liefert (dh die Erwartung von unter Normalität ist Null oder ).G2E(G2)=0
  3. Bei großen Stichproben ist der Unterschied zwischen den Formeln vernachlässigbar und die Auswahl spielt keine große Rolle.
  4. Für kleine Stichproben aus einer Normalverteilung lautet die Beziehung der drei Formeln in Bezug auf die mittleren quadratischen Fehler (MSE) : . Also hat das kleinste und das größte (obwohl nur unvoreingenommen ist). Dies liegt daran, dass die größte Varianz der drei Formeln aufweist: .mse(g2)<mse(b2)<mse(G2)g2G2G2G2Var(b2)<Var(g2)<Var(G2)
  5. Für kleine Stichproben aus nicht normalen Verteilungen lautet die Beziehung der drei Formeln in Bezug auf die Verzerrung: . In Bezug auf mittlere quadratische Fehler: . So hat die kleinsten mittleren quadratischen Fehler und die kleinste Vorspannung der drei Formeln. hat den größten mittleren quadratischen Fehler und die größte Abweichung.bias(G2)<bias(g2)<bias(b2)mse(G2)<mse(g2)<mse(b2)G2b2
  6. Für große Stichproben ( ) aus nicht normalen Verteilungenn>200 lautet die Beziehung der drei Formeln in Bezug auf die Verzerrung: . In Bezug auf mittlere quadratische Fehler: .bias(G2)<bias(g2)<bias(b2)mse(b2)<mse(g2)<mse(G2)

Siehe auch die Wikipedia-Seite und die MathWorld-Seite über Kurtosis.


Ich würde dies eine schöne, klare Interpretation der "üblichen Geschichte" nennen. Ich möchte hinzufügen, dass die Begriffe Leptokurtikum, Mesokurtikum, Platykurtikum nur Gepäck sind, das wir im 20. Jahrhundert zurücklassen sollten: Wir haben ein Maß, über das wir quantitativ nachdenken sollten. Im Ernst, die Interpretation, die ihren Höhepunkt im Vergleich zu einer flachen Spitze erreicht, wird der großen Variation möglicher Verteilungsformen nicht gerecht, selbst wenn diese alle symmetrisch sind. Schließlich beißt Voreingenommenheit in der Praxis nicht viel, es sei denn, Sie spielen mit unangemessen kleinen Samples, aber Varianz tut es wirklich!
Nick Cox

Könnten Sie bitte den zusammenfassenden Punkt 2 klarstellen? Offensichtlich ist eine Stichprobenstatistik, aber offensichtlich ist sie für keine andere als eine entartete Verteilung identisch Null. Vielleicht wollten Sie sagen, dass die Erwartung Null ist? (Übrigens, was ist " " in seiner Formel? vielleicht?)G2γ2g2
whuber

@whuber: Ja, es ist natürlich die Erwartung von , die Null ist. Das war ein Relikt aus einer früheren Antwort und sollte (jetzt geändert); Ich habe meine Antwort ziemlich stark bearbeitet. G2γ2g2
COOLSerdash

OK, sieht besser aus. Ich werde es positiv bewerten, hoffe aber, dass Sie diesen Satz "Für eine Normalverteilung " irgendwann entfernen . G2=0
whuber

7

Der fragliche Link spricht auch über SAS. Tatsächlich beschränkt sich nichts in dieser Frage, außer möglicherweise dem eigenen Fokus des Posters, auf die genannten Programme.

Ich denke, wir müssen hier ganz unterschiedliche Arten von Problemen herausfiltern, von denen einige illusorisch und einige echt sind.

  1. Einige Programme subtrahieren 3 und andere nicht, so dass das angegebene Kurtosis-Maß 3 für Gaußsche / normale Variablen ohne Subtraktion und 0 für Subtraktion beträgt. Ich habe Leute gesehen, die davon verwirrt waren, oft, wenn sich herausstellt, dass der Unterschied 2,999 und nicht genau 3 beträgt.

  2. Einige Programme verwenden Korrekturfaktoren, um sicherzustellen, dass die Kurtosis ohne Verzerrung geschätzt wird. Diese Korrekturfaktoren nähern sich 1, wenn die Stichprobengröße größer wird. Da die Kurtosis in kleinen Proben in keiner Weise gut geschätzt wird, sollte dies kein großes Problem darstellen.n

Es gibt also ein kleines Problem mit Formeln, wobei Nr. 1 viel größer ist als Nr. 2, aber beide geringfügig, wenn man es versteht. Der Rat ist eindeutig, die Dokumentation für das von Ihnen verwendete Programm zu lesen und, falls es keine Dokumentation gibt, die diese Art von Details erklärt, das Programm sofort abzubrechen. Ein Testfall, der so einfach wie eine Variable (1, 2) ist, ergibt jedoch eine Kurtosis von 1 oder 4, abhängig von # 1 allein (ohne Korrekturfaktor).

Die Frage stellt sich dann nach der Interpretation, aber dies ist eine viel offenere und umstrittenere Angelegenheit.

Bevor wir zum Hauptdiskussionsbereich kommen, besteht eine häufig gemeldete, aber wenig bekannte Schwierigkeit darin, dass Kurtosis-Schätzungen als Funktion der Stichprobengröße begrenzt sind. Ich schrieb eine Rezension in Cox, NJ 2010. Die Grenzen von Probenversatz und Kurtosis. Stata Journal 10 (3): 482 & ndash; 495. http://www.stata-journal.com/article.html?article=st0204

Zusammenfassung: Probenschiefe und Kurtosis werden durch Funktionen der Probengröße begrenzt. Die Grenzen oder Annäherungen an sie wurden in den letzten Jahrzehnten wiederholt wiederentdeckt, scheinen jedoch nur wenig bekannt zu sein. Die Grenzwerte verleihen der Schätzung eine Verzerrung und implizieren in extremen Fällen, dass keine Stichprobe ein genaues Zeugnis für ihre Elternverteilung ablegen kann. Die wichtigsten Ergebnisse werden in einem Tutorial-Review erläutert und es wird gezeigt, wie Stata und Mata verwendet werden können, um ihre Konsequenzen zu bestätigen und zu untersuchen.

Nun zu dem, was gemeinhin als Kern der Sache angesehen wird:

Viele Menschen übersetzen Kurtosis als Peakedness, andere betonen jedoch, dass sie häufig als Maß für das Schwanzgewicht dient. Tatsächlich könnten die beiden Interpretationen für einige Verteilungen eine vernünftige Formulierung sein. Es ist fast unvermeidlich, dass es keine einfache verbale Interpretation von Kurtosis gibt: Unsere Sprache ist nicht reich genug, um Summen der vierten Potenzen von Abweichungen vom Mittelwert und Summen der zweiten Potenzen derselben zu vergleichen.

In einem kleinen und oft übersehenen Klassiker machte Irving Kaplansky (1945a) auf vier Beispiele für Verteilungen mit unterschiedlichen Werten für Kurtosis und Verhalten aufmerksam, die nicht mit einigen Diskussionen über Kurtosis übereinstimmen.

Die Verteilungen sind alle symmetrisch mit Mittelwert 0 und Varianz 1 und haben Dichtefunktionen für die Variablen und ,xc=π

(1)   (1/3c)(9/4+x4)exp(x2)

(2)   (3/(c8))exp(x2/2)(1/6c)(9/4+x4)exp(x2)

(3)   (1/6c)(exp(x2/4)+4exp(x2))

(4)   (33/16c)(2+x2)exp(3x2/4)

Die Kurtosis (ohne Subtraktion) beträgt (1) 2,75 (2) 3,125 (3) 4,5 (4) 8/3 2,667: Vergleiche den Gaußschen oder Normalwert von 3. Die Dichte im Mittelwert beträgt (1) 0,423 (2) ) 0,387 (3) 0,470 (4) 0,366: Vergleiche den Gaußschen Wert von 0,399.

Es ist lehrreich, diese Dichten zu zeichnen. Stata-Benutzer können mein kaplanskyProgramm von SSC herunterladen . Die Verwendung einer logarithmischen Skala für die Dichte kann hilfreich sein.

Ohne die vollständigen Details preiszugeben, untergraben diese Beispiele jede einfache Geschichte, dass niedrige oder hohe Kurtosis eine klare Interpretation in Bezug auf Peakedness oder tatsächlich einen anderen einzelnen Kontrast hat.

Wenn der Name Irving Kaplansky eine Glocke läutet, liegt das wahrscheinlich daran, dass Sie seine Arbeit in der modernen Algebra kennen. Er (1917-2006) war ein kanadischer (später amerikanischer) Mathematiker und lehrte und forschte in Harvard, Chicago und Berkeley, während eines Kriegsjahres in der Applied Mathematics Group des National Defense Council der Columbia University. Kaplansky leistete wichtige Beiträge zur Gruppentheorie, zur Ringtheorie, zur Theorie der Operatoralgebren und zur Feldtheorie. Er war ein versierter Pianist und Texter und ein begeisterter und klarer Vertreter der Mathematik. Beachten Sie auch einige andere Beiträge zu Wahrscheinlichkeit und Statistik von Kaplansky (1943, 1945b) und Kaplansky und Riordan (1945).

Kaplansky, I. 1943. Eine Charakterisierung der Normalverteilung. Annals of Mathematical Statistics 14: 197-198.

Kaplansky, I. 1945a. Ein häufiger Fehler bei der Kurtosis. Journal, American Statistical Association 40: 259 nur.

Kaplansky, I. 1945b. Die asymptotische Verteilung von Läufen aufeinanderfolgender Elemente. Annals of Mathematical Statistics 16: 200-203.

Kaplansky, I. und Riordan, J. 1945. Multiple Matching und Läufe nach der symbolischen Methode. Annals of Mathematical Statistics 16: 272-277.


1
+1 Interessante Kommentare zu Kaplansky, mit dessen algebraischer Arbeit ich schon lange vertraut bin.
whuber

Nick, Ihr Kommentar "Tatsächlich könnten die beiden Interpretationen (Peakedness und Tailedness) für einige Distributionen eine vernünftige Formulierung sein." ist falsch und daher nicht hilfreich, einfach weil Kurtosis nichts über "Peakedness" aussagt. Können Sie im Ernst sogar definieren, was "Peakedness" bedeutet? Und ein Follow-up, wenn ich darf: In Anbetracht Ihrer Definition von "Peakedness" (vorausgesetzt, Sie können sich eines einfallen lassen), wie hängt es mathematisch mit Kurtosis zusammen?
Peter Westfall

@Peter Westfall Wenn wir uns einig sein können, dass Kurtosis das ist, was Kurtosis misst, dann ist mein Argument nur Kaplanskys Argument, das auf konkreten Kurven und numerischen Ergebnissen basiert, nicht auf verbalem Sparring, dh dass eine höhere Kurtosis manchmal mit höheren Spitzendichten einhergeht und umgekehrt untere Kurtosis. Ich bin überhaupt nicht an dem Begriff Peakedness interessiert, und wenn ich zur verbalen Vereinfachung verpflichtet bin, neige ich dazu zu behaupten, dass Kurtosis in der Praxis meistens eine Geschichte des Schwanzgewichts ist. Ich denke, die Formeln hier erledigen die ganze Arbeit und tragen das gesamte statistische Gewicht und finden verbale Polemiken weniger hilfreich.
Nick Cox

Darüber hinaus kann es keine einfache Charakterisierung der Kurtosis geben, außer bei vollständig symmetrischen Verteilungen. Ich glaube nicht, dass irgendjemand verpflichtet ist, Spitzenwerte zu definieren. Die Definition, die existiert, ist die der Kurtosis und die praktischen Fragen sind, wie man darüber nachdenkt und wie weit es von Nutzen ist.
Nick Cox

Die Aussage "einfach weil Kurtosis nichts über Peakedness aussagt" ist selbst unbegründet. Fehlende Referenzen würden sicherlich Ihre Arbeit in TAS enthalten, die für interessierte Personen zugänglich ist, um über Ihre eigene längere Diskussion nachzudenken.
Nick Cox
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.