Betrachten Sie Beobachtungen aus der Standard-Cauchy-Verteilung, die mit der Student-t-Verteilung mit 1 Freiheitsgrad identisch ist. Die Schwänze dieser Verteilung sind so schwer, dass sie keinen Mittelwert haben; Die Verteilung ist auf den Median zentriertn = 10000η= 0.
Eine Folge von ist für das Zentrum der Cauchy-Verteilung nicht konsistent. Grob gesagt, ist die Schwierigkeit , dass es sehr extreme Beobachtungen (positiv oder negativ) mit ausreichender Regelmäßigkeit auftritt , dass es keine Chance für ist zu Converge (Die sind nicht nur langsam zu konvergieren, sie nicht immer konvergieren. Die Verteilung von ist wieder Standard Cauchy [ Beweis ].)EINj= 1j∑ji=1XiXiAjη=0.AjAj
Im Gegensatz dazu wird bei jedem Schritt in einem fortgesetzten Abtastprozess ungefähr die Hälfte der Beobachtungen auf beiden Seiten von liegen so dass die Sequenz von konvergiertXiη,Hjη.
Dieser Mangel an Konvergenz von und Konvergenz von wird durch die folgende Simulation veranschaulicht.AjHj
set.seed(2019) # for reproducibility
n = 10000; x = rt(n, 1); j = 1:n
a = cumsum(x)/j
h = numeric(n)
for (i in 1:n) {
h[i] = median(x[1:i]) }
par(mfrow=c(1,2))
plot(j,a, type="l", ylim=c(-5,5), lwd=2,
main="Trace of Sample Mean")
abline(h=0, col="green2")
k = j[abs(x)>1000]
abline(v=k, col="red", lty="dotted")
plot(j,h, type="l", ylim=c(-5,5), lwd=2,
main="Trace of Sample Median")
abline(h=0, col="green2")
par(mfrow=c(1,1))
Hier ist eine Liste von Schritten, bei denen Sie können die Auswirkung einiger dieser extremen Beobachtungen auf die laufenden Durchschnitte im Diagramm links (an den vertikalen roten gepunkteten Linien) sehen.|Xi|>1000.
k = j[abs(x)>1000]
rbind(k, round(x[k]))
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
k 291 898 1293 1602 2547 5472 6079 9158
-5440 2502 5421 -2231 1635 -2644 -10194 -3137
Konsistenz in wichtig bei der Schätzung: In Probennahme aus einer Cauchy - Population, die Probe Mittelwert einer Probe von Beobachtungen ist nicht besser zum Abschätzen der Mitte als nur eine Beobachtung. Im Gegensatz dazu konvergiert der konsistente Stichprobenmedian gegen sodass größere Stichproben bessere Schätzungen liefern.n=10000ηη,