Vorteil der Kernel-Dichteschätzung gegenüber der parametrischen Schätzung


10

Gibt es einen bestimmten Grund, warum Sie die Kernel-Dichteschätzung der parametrischen Schätzung vorziehen? Ich habe gelernt, die Verteilung an meine Daten anzupassen. Diese Frage kam zu mir.

Meine Datengröße ist mit 7500 Datenpunkten relativ groß. Auto Ansprüche. Mein Ziel ist es, es an eine Verteilung anzupassen (nichtparametrisch oder parametrisch). Verwenden Sie diese Option, um automatische Anspruchsdaten zu simulieren und den VaR oder TVaR zu berechnen.

Ich habe log verwendet, um die Daten so zu transformieren, dass sie relativ normal sind. Ich habe viele Verteilungen angepasst, einschließlich Normal, Lognormal, Gamma, T usw. Ich habe AIC und Loglikehood verwendet, um die beste Anpassung zu ermitteln. Aber keine dieser Anpassungen bestand den KS-Test (p-Wert extrem klein, mit e-10).

Deshalb habe ich gefragt, in welcher Situation ich zu KDE wechseln soll.


Es scheint mir, dass es ziemlich schwierig ist, große Datenmengen an die parametrische Verteilung anzupassen. Selbst wenn ich sehe, dass die Anpassung im Histogramm und im qqplot sehr gut ist, erhalte ich beim KS-Test immer noch einen sehr niedrigen p-Wert. Aber löst KDE dieses Problem wirklich? (Ich versuche es nie)
MegaChunk

@MegaChunk AFAIK Der p-Wert aus dem KS-Test ist nicht sehr informativ, da die Verteilung nie völlig normal ist. Wenn Sie also genügend Datenpunkte haben, wird die Nullhypothese fast immer verworfen.
d_ijk_stra

Antworten:


8

Die Antwortfrage lautet: "Warum modellieren Sie Ihre Daten als Stichprobe aus einer Verteilung?" Wenn Sie etwas über das Phänomen hinter Ihren Daten erfahren möchten, z. B. beim Verbessern einer wissenschaftlichen Theorie oder beim Testen einer wissenschaftlichen Hypothese, sagt Ihnen die Verwendung eines nicht parametrischen Kernelschätzers nicht viel mehr als die Daten selbst. Während ein parametrisiertes Modell viel klarer sagen kann (a) ob die Daten und das Modell übereinstimmen oder nicht und (b) was die wahrscheinlichen Werte der Parameter sind. Abhängig von Ihren Zielen bestimmt sich somit, welchen Ansatz Sie bevorzugen sollten.


6

Es könnte sein. Die Schätzung der Kerneldichte ist ein nichtparametrischer Ansatz. Für die parametrische Schätzung muss eine parametrische Verteilungsfamilie basierend auf einigen wenigen Parametern angenommen werden. Wenn Sie glauben, dass das Modell ungefähr korrekt ist, ist es vorteilhaft, eine parametrische Inferenz durchzuführen. Andererseits ist es möglich, dass die Daten zu keinem Familienmitglied passen. In diesem Fall ist es besser, die Kernel-Dichteschätzung zu verwenden, da dadurch eine Dichte erstellt wird, die angemessen zu den Daten passt. Es ist keine Annahme bezüglich parametrischer Familien erforderlich.

Diese Beschreibung kann aus Gründen der Klarheit leicht vereinfacht sein. Lassen Sie mich ein konkretes Beispiel geben, um dies konkret zu machen. Angenommen, die Parameterfamilie ist die Normalverteilung, die durch die beiden unbekannten Parameter Mittelwert und Varianz definiert wird. Jede Verteilung in der Familie ist symmetrisch und glockenförmig, wobei der Mittelwert dem Median und dem Modus entspricht. Jetzt scheint Ihre Stichprobe nicht symmetrisch zu sein und der Stichprobenmittelwert unterscheidet sich stark vom Stichprobenmedian. Dann haben Sie Beweise dafür, dass Ihre Annahme falsch ist. Sie müssen also entweder eine Transformation finden, die die Daten so konvertiert, dass sie in eine nette parametrische Familie (möglicherweise die normale) passen, oder eine alternative parametrische Familie finden. Wenn diese alternativen parametrischen Ansätze nicht zu funktionieren scheinen, ist der Kernel-Dichteansatz eine Alternative, die funktioniert. Es gibt einige Probleme (1) die Form des Kernels, (2) die Kernelbandbreite, die den Grad der Glätte bestimmt, und (3) möglicherweise eine größere Stichprobengröße als für eine parametrische Familie erforderlich. Ausgabe 1 hat sich in der Literatur als praktisch unwichtig erwiesen. Problem 2 ist wichtig. Problem 3 hängt davon ab, wie groß eine Probe ist, die Sie sich leisten können, um sie zu sammeln. Obwohl diese Probleme zusammen mit der impliziten Annahme bestehen, dass die Verteilung eine Dichte hat, sind diese Annahmen möglicherweise leichter zu akzeptieren als die restriktiven parametrischen Annahmen. Problem 3 hängt davon ab, wie groß eine Probe ist, die Sie sich leisten können, um sie zu sammeln. Obwohl diese Probleme zusammen mit der impliziten Annahme bestehen, dass die Verteilung eine Dichte hat, sind diese Annahmen möglicherweise leichter zu akzeptieren als die restriktiven parametrischen Annahmen. Problem 3 hängt davon ab, wie groß eine Probe ist, die Sie sich leisten können, um sie zu sammeln. Obwohl diese Probleme zusammen mit der impliziten Annahme bestehen, dass die Verteilung eine Dichte hat, sind diese Annahmen möglicherweise leichter zu akzeptieren als die restriktiven parametrischen Annahmen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.