Ja, du kannst. Zumindest in ungefährem Sinne.
Ich skizziere, wie unten (und in der Tat gibt es eine Beziehung zu "Box-Überlappung", wie Sie vorschlagen) zusammen mit einigen Einschränkungen und Einschränkungen. Aber zuerst wollen wir ein paar Vorbereitungen für Hintergrund und Kontext diskutieren. (Ich denke, eine angemessene Antwort sollte sich hier nicht auf die Einzelheiten des Beispiels konzentrieren - obwohl dies vielleicht nebenbei erwähnt werden sollte -, sondern auf das zentrale Problem der Verwendung von Boxplots, um zu beurteilen, ob offensichtliche Unterschiede leicht als zufällige Variation erklärt werden können oder nicht .)
Wenn Sie Zugriff auf die Daten haben, können Sie gekerbte Boxplots zeichnen, die für diese Art des visuellen Vergleichs ausgelegt sind.
Es gibt eine Diskussion über gekerbt boxplot Berechnungen hier . Wenn sich die Kerbintervalle nicht überlappen, unterscheiden sich die beiden zu vergleichenden Gruppen bei 5% ungefähr. Die Berechnungen basieren auf normalen Berechnungen, sind jedoch ziemlich robust und funktionieren in einer Reihe von Verteilungen recht gut. (Wenn es als formaler Test behandelt wird, ist die Leistung im Normalfall nicht so hoch, aber es sollte für eine Vielzahl von mehr oder weniger "typischen" Fällen mit schwerem Schwanz ziemlich gut funktionieren.)
Wenn man bedenkt, wie gekerbte Boxplots funktionieren, kann man eine schnelle Faustregel erkennen, die funktioniert, wenn Sie nur eine Anzeige wie die in der Frage haben. Wenn die Stichprobengröße 10 beträgt und der Median nahe der Mitte der Box liegt, sind die Kerben in einem gekerbten Boxplot ungefähr so breit wie die Box, sodass sich die Kerbenenden und die Box ungefähr an derselben Stelle befinden.
n = 10
n = 10
n = 9n = 10
n = 10n = 10 , 10n = 9 , 9n = 8 , 8
nn- -- -√n = 40
Betrachten Sie Ihr Grundstück:
Beachten Sie, dass wir anhand des Erscheinungsbilds des Diagramms in der Frage erkennen können, dass die Stichprobengröße mindestens 5 betragen muss. Wenn sie kleiner als 5 wären, hätten die Boxplots mit einzelnen Stichproben deutliche Hinweise darauf, dass sie von einer niedrigeren Stichprobengröße stammen (z. B. Mediane als Totpunkt jeder Box oder der Whisker mit der Länge 0, wenn es einen Ausreißer gab).
Wenn sich die Kästchen (die die Quartile markieren) nicht überlappen und die Stichprobengröße mindestens 10 beträgt, sollten die beiden verglichenen Gruppen unterschiedliche Mediane bei 5% aufweisen (als einzelner paarweiser Vergleich betrachtet).
nn = 5
[Beachten Sie, dass dies die Anzahl der Vergleiche nicht berücksichtigt. Wenn Sie also mehrere Vergleiche durchführen, ist Ihr Gesamtfehler vom Typ I größer. Es ist eher für eine Sichtprüfung als für formelle Tests gedacht. Dennoch können die beteiligten Ideen an einen formaleren Ansatz angepasst werden, einschließlich der Anpassung für mehrere Vergleiche.]
Nachdem Sie angesprochen haben, ob Sie können , wäre es vernünftig zu überlegen, ob Sie sollten . Vielleicht nicht; Das Problem des potenziellen P-Hacking ist real, aber wenn Sie dies verwenden, um herauszufinden, ob Sie beispielsweise neue Daten zum Forschungsproblem sammeln möchten und alles, was Sie haben, ist ein Boxplot in einem Papier - sagen wir - es kann sein Sehr nützlich, um beurteilen zu können, ob mehr vorhanden ist, als durch Abweichungen aufgrund von Rauschen leicht zu erklären ist. Aber dieses Thema eingehend zu betrachten, würde wirklich eine andere Frage beantworten.