Ich betrachte die Stichproben-Kurtosis einer ziemlich verzerrten Zufallsvariablen, und die Ergebnisse scheinen inkonsistent zu sein. Um das Problem einfach zu veranschaulichen, habe ich mir die Beispielkurtose eines logarithmisch normalen Wohnmobils angesehen. In R (was ich langsam lerne):
library(moments);
samp_size = 2048;
n_trial = 4096;
kvals <- rep(NA,1,n_trial); #preallocate
for (iii in 1:n_trial) {
kvals[iii] <- kurtosis(exp(rnorm(samp_size)));
}
print(summary(kvals));
Die Zusammenfassung, die ich bekomme, ist
Min. 1st Qu. Median Mean 3rd Qu. Max.
11.87 28.66 39.32 59.17 61.70 1302.00
Laut Wikipedia sollte die Kurtosis für dieses logarithmisch normale Wohnmobil bei 114 liegen. Die Kurtosis der Probe ist eindeutig voreingenommen.
Bei einigen Nachforschungen stellte ich fest, dass die Probenkurtose bei kleinen Probengrößen voreingenommen ist. Ich habe den 'G2'-Schätzer verwendet, wie er im e1071
Paket in CRAN bereitgestellt wird , und habe für diese Stichprobengröße sehr ähnliche Ergebnisse erhalten.
Die Frage : Welche der folgenden Aussagen charakterisieren, was los ist:
- Diese Implementierungen von Probe Kurtosis leiden unter numerischen Problemen , die durch korrigiert werden könnten , zB Terriberry Methode (in die gleichen Weise , dass Welford Methode bessere Ergebnisse als die naive Methode zur Stichprobenvarianz gibt).
- Ich habe die Populationskurtose falsch berechnet. (Autsch)
- Die Probenkurtose ist von Natur aus voreingenommen und kann bei so kleinen Probengrößen niemals behoben werden.
;
an den Enden Ihrer Aussagen. Sie haben richtig vorab zugewiesen, aber keine Notwendigkeit zu füllen NA
, kvals <- numeric(length = n_trial)
hätte genügt. Mit rep
benötigen Sie nur die Argumente 1 und 3 aus Ihrem Aufruf (zB rep(NA, 10)
). In der for
Schleifeneinstellung 1:n_trial
kann beim Programmieren gefährlich sein; besser ist seq_along(kvals)
oder seq_len(n_trial)
in diesem Fall. Wenn Sie das Drucken nicht erzwingen müssen, lassen Sie die print()
Runde fallen summary()
- Sie brauchen sie nur, wenn Sie nicht interaktiv mit R. HTH arbeiten.
print
. Die Argumente rep
waren sicherlich falsch.