In der Praxis wird eine Stichprobe von mindestens 100 Beobachtungen als Schätzer für ein Quantil von 1% verwendet. Ich habe gesehen, dass es "empirisches Perzentil" heißt.
Bekannte Vertriebsfamilie
Wenn Sie eine andere Schätzung wünschen UND eine Vorstellung von der Verteilung der Daten haben, empfehle ich Ihnen, sich die Mediane der Auftragsstatistik anzusehen. Beispielsweise verwendet dieses R-Paket sie für die Wahrscheinlichkeitsdiagramm-Korrelationskoeffizienten PPCC . Sie können herausfinden, wie sie es für einige Distributionen wie normal tun. Weitere Einzelheiten finden Sie in Vogels 1986 veröffentlichtem Artikel "Der Wahrscheinlichkeitsdiagramm-Korrelationskoeffiziententest für die Normal-, Lognormal- und Gumbel-Verteilungsstudie" hier in der Reihenfolge der statistischen Mediane für Normal- und Lognormalverteilungen.
Zum Beispiel definiert Gleichung 2 aus Vogels Arbeit die min (x) von 100 Beobachtungsstichproben aus der Standardnormalverteilung wie folgt:
wobei die Schätzung von der Median von CDF:
M.1= Φ- 1( F.Y.( min ( y) ) )
F.^Y.( min( y) ) = 1 - ( 1 / 2 )1 / 100= 0,0069
Wir erhalten den folgenden Wert: für die Standardnormalen, auf die Sie den Ort und die Skala anwenden können, um Ihre Schätzung des 1. Perzentils zu erhalten: .M.1= - 2,46μ - 2,46 σμ^- 2,46 σ^
Hier, wie dies mit min (x) bei Normalverteilung verglichen wird:
Das Diagramm oben ist die Verteilung des min (x) -Schätzers des 1. Perzentils, und das Diagramm unten ist eines, das ich mir ansehen wollte. Ich habe auch den folgenden Code eingefügt. Im Code wähle ich zufällig den Mittelwert und die Streuung der Normalverteilung aus und generiere dann eine Stichprobe mit Beobachtungen der Länge 100. Als nächstes finde ich min (x) und skaliere es dann unter Verwendung der wahren Parameter der Normalverteilung auf Standardnormal . Bei der M1-Methode berechne ich das Quantil anhand des geschätzten Mittelwerts und der geschätzten Varianz und skaliere es dann unter Verwendung der wahren Parameter wieder auf den Standard zurück. Auf diese Weise kann ich den Einfluss des Schätzfehlers auf Mittelwert und Standardabweichung in gewissem Maße berücksichtigen. Ich zeige auch das wahre Perzentil mit einer vertikalen Linie.
Sie können sehen, dass der M1-Schätzer viel enger als min (x) ist. Dies liegt daran, dass wir unser Wissen über den wahren Verteilungstyp , dh normal, nutzen. Wir kennen immer noch keine wahren Parameter, aber selbst die Kenntnis der Verteilungsfamilie hat unsere Schätzung enorm verbessert.
OCTAVE CODE
Sie können es hier online ausführen: https://octave-online.net/
N=100000
n=100
mus = randn(1,N);
sigmas = abs(randn(1,N));
r = randn(n,N).*repmat(sigmas,n,1)+repmat(mus,n,1);
muhats = mean(r);
sigmahats = std(r);
fhat = 1-(1/2)^(1/100)
M1 = norminv(fhat)
onepcthats = (M1*sigmahats + muhats - mus) ./ sigmas;
mins = min(r);
minonepcthats = (mins - mus) ./ sigmas;
onepct = norminv(0.01)
figure
subplot(2,1,1)
hist(minonepcthats,100)
title 'min(x)'
xlims = xlim;
ylims = ylim;
hold on
plot([onepct,onepct],ylims)
subplot(2,1,2)
hist(onepcthats,100)
title 'M1'
xlim(xlims)
hold on
plot([onepct,onepct],ylims)
Unbekannte Verbreitung
Wenn Sie nicht wissen, von welcher Verteilung die Daten stammen, gibt es einen anderen Ansatz, der in Anwendungen für finanzielle Risiken verwendet wird . Es gibt zwei Johnson-Distributionen SU und SL. Ersteres gilt für unbegrenzte Fälle wie Normal und Student t, und letzteres gilt für niedrigere Grenzen wie lognormal. Sie können die Johnson-Verteilung an Ihre Daten anpassen und dann mithilfe der geschätzten Parameter das erforderliche Quantil schätzen. Tuenter (2001) schlug ein Momentanpassungsverfahren vor, das von einigen in der Praxis angewendet wird.
Wird es besser sein als min (x)? Ich weiß es nicht genau, aber manchmal führt es in meiner Praxis zu besseren Ergebnissen, z. B. wenn Sie die Verteilung nicht kennen, aber wissen, dass sie niedriger ist.