Das „notch“ Hilfedokument ( oder Originaltext ) von boxplot in ‚R‘ gibt die folgenden:
Wenn sich die Kerben zweier Diagramme nicht überschneiden, ist dies ein „starker Beweis“ dafür, dass sich die beiden Mediane unterscheiden (Chambers et al., 1983, S. 62). Die verwendeten Berechnungen finden Sie in boxplot.stats.
und die ' boxplot.stats ' gibt Folgendes an:
Die Kerben (falls angefordert) erstrecken sich auf +/- 1,58 IQR / sqrt (n). Dies scheint auf den gleichen Berechnungen zu beruhen wie die Formel mit 1,57 in Chambers et al. (1983, S. 62), angegeben in McGill et al. (1978, S. 16). Sie basieren auf der asymptotischen Normalität des Medians und ungefähr gleichen Stichprobengrößen für die beiden verglichenen Mediane und sollen gegenüber den zugrunde liegenden Verteilungen der Stichproben eher unempfindlich sein. Die Idee scheint zu sein, ein Konfidenzintervall von ungefähr 95% für die Differenz zwischen zwei Medianen anzugeben.
Jetzt bin ich besser mit der Verwendung der JMP-Version des Tukey-Kramer-Tests vertraut, um die Mittelwerte von Spalten zu vergleichen. Die Dokumentation für JMP enthält Folgendes :
Zeigt einen Test an, der für alle Unterschiede zwischen den Mitteln bemessen ist. Dies ist der Tukey- oder Tukey-Kramer-HSD-Test (ehrlich signifikanter Unterschied). (Tukey 1953, Kramer 1956). Dieser Test ist ein exakter Alpha-Level-Test, wenn die Stichprobengrößen gleich sind, und konservativ, wenn die Stichprobengrößen unterschiedlich sind (Hayter 1984).
Frage: Wie ist die Art der Verbindung zwischen den beiden Ansätzen? Gibt es eine Möglichkeit, eins in das andere zu verwandeln?
Es sieht so aus, als würde man nach einem ungefähren 95% CI für den Median suchen und feststellen, ob es eine Überlappung gibt; und der andere ist ein "exakter Alpha-Test" (meine Proben haben die gleiche Größe), um festzustellen, ob die Mediane von zwei Probensätzen in einem vernünftigen Bereich voneinander liegen.
Ich verweise auf Pakete, aber ich interessiere mich für die Mathematik hinter der Logik.