Ich muss einen 95% -KI auf dem Median und anderen Perzentilen finden. Ich weiß nicht, wie ich das angehen soll. Ich benutze hauptsächlich R als Programmierwerkzeug.
Ich muss einen 95% -KI auf dem Median und anderen Perzentilen finden. Ich weiß nicht, wie ich das angehen soll. Ich benutze hauptsächlich R als Programmierwerkzeug.
Antworten:
Hier ist eine Abbildung eines klassischen R-Datensatzes:
> x = faithful$waiting
> bootmed = apply(matrix(sample(x, rep=TRUE, 10^4*length(x)), nrow=10^4), 1, median)
> quantile(bootmed, c(.025, 0.975))
2.5% 97.5%
73.5 77
Dies ergibt ein Konfidenzintervall (73,5, 77) für den Median.
( Anmerkung: Korrigierte Version, dank John . Ich habe in der vorherigen Version verwendet , was zu Verwirrung geführt hat!)nrow
Ein anderer Ansatz basiert auf Quantilen der Binomialverteilung.
z.B:
> x=faithful$waiting
> sort(x)[qbinom(c(.025,.975), length(x), 0.5)]
[1] 73 77
Schauen Sie sich das Bootstrap Resampling an. Suchen Sie in der R-Hilfe nach der Startfunktion. Abhängig von Ihren Daten mit Resampling können Sie Konfidenzintervalle für nahezu alles abschätzen.
wilcox.test(..., conf.int=TRUE)
Funktion von R gegeben ist .
Und es gibt noch andere Ansätze: Einer basiert auf dem Wilcoxon-Rang-Summen-Test, der für eine Stichprobe mit Durchgangskorrektur angewendet wird. In R kann dies geliefert werden als:
wilcox.test(x,conf.level=0.95,alternative="two.sided",correct=TRUE)
Und da ist das CI von David Olive für den Median, das hier besprochen wird:
Das auf dem qbinom-Ansatz basierende Ergebnis ist für kleine Stichproben nicht korrekt. Angenommen, x hat 10 Komponenten. Dann ergibt qbinom (c (.025, .975), 10, .5) 2 und 8. Das resultierende Intervall behandelt Ordnungsstatistiken am unteren Ende nicht symmetrisch mit denen vom oberen Ende; Sie sollten entweder 2 und 9 oder 3 und 8 erhalten. Die richtige Antwort ist 2 und 9. Sie können in SAS gegen proc univariate prüfen. Fangen Sie hier ist Sie brauchen nicht mehr als .025 Wahrscheinlichkeit unten und oben; Das untere Quantil tut dies nicht, da es mindestens 0,025 bei oder darunter gibt. Sie werden im unteren Bereich gespeichert, weil die Anzahl, die 1 sein sollte, der Statistik zweiter Ordnung zugeordnet werden soll, wobei 0 gezählt wird, und so wird "Aus um eins" abgebrochen. Diese zufällige Stornierung findet nicht statt und daher erhalten Sie hier die falsche Antwort. Die Codesorte (x) [qbinom (c (.025, .975), Länge (x) ,. 5) + c (0,1)] funktioniert fast und .5 kann durch andere Quantilwerte ersetzt werden, um Konfidenzintervalle für andere Quantile zu erhalten, aber es ist nicht richtig, wenn es eine solche gibt, dass P [X <= a ] =. 025. Siehe zum Beispiel Higgins, Nonparametric Statisitcs.
library(boot)
dies bestätigt:> boot.ci (boot (x, funktion (x, i) median (x [i]), R = 1000)) Intervalle: Stufe Normal Basis 95% (74,42, 78,22) (75,00 , 78,49) Level Percentile BCa 95% (73,51, 77,00) (73,00, 77,00)