In meinem Bereich besteht die übliche Methode zum Zeichnen gepaarter Daten aus einer Reihe von dünn abfallenden Liniensegmenten, die mit dem Median und dem CI des Medians für die beiden Gruppen überlagert werden:
Diese Art von Plot wird jedoch viel schwieriger zu lesen, da die Anzahl der Datenpunkte sehr groß wird (in meinem Fall habe ich in der Größenordnung von 10000 Paaren):
Das Alpha zu reduzieren hilft ein bisschen, aber es ist immer noch nicht großartig. Auf der Suche nach einer Lösung bin ich auf dieses Papier gestoßen und habe beschlossen, ein "paralleles Liniendiagramm" zu implementieren. Auch hier funktioniert es sehr gut für eine kleine Anzahl von Datenpunkten:
Ich nehme an, ich könnte die Verteilungen für die beiden Gruppen separat anzeigen, z. B. mit Boxplots oder Violinen, und eine Linie mit Fehlerbalken oben mit den beiden Medianen / CIs zeichnen, aber diese Idee gefällt mir wirklich nicht, da sie nicht vermitteln würde die gepaarte Natur der Daten.
Ich bin auch nicht besonders begeistert von der Idee eines 2D-Streudiagramms: Ich würde eine kompaktere Darstellung bevorzugen, und im Idealfall eine, bei der die Werte für die beiden Gruppen entlang derselben Achse aufgetragen werden. Der Vollständigkeit halber sehen die Daten wie folgt als 2D-Streuung aus:
Kennt jemand eine bessere Möglichkeit, gepaarte Daten mit einer sehr großen Stichprobengröße darzustellen? Könnten Sie mich mit einigen Beispielen verknüpfen?
Bearbeiten
Tut mir leid, ich habe offensichtlich nicht gut genug erklärt, wonach ich suche. Ja, das 2D-Streudiagramm funktioniert, und es gibt viele Möglichkeiten, wie es verbessert werden kann, um die Punktedichte besser zu vermitteln. Ich könnte die Punkte gemäß einer Schätzung der Kerndichte farblich kennzeichnen und ein 2D-Histogramm erstellen Ich könnte Konturen auf die Punkte usw. usw. zeichnen.
Ich denke jedoch, dass dies ein Overkill für die Botschaft ist, die ich vermitteln möchte. Es ist mir nicht wirklich wichtig, die 2D-Dichte von Punkten an sich anzuzeigen - alles, was ich tun muss, ist zu zeigen, dass die Werte für "Balken" im Allgemeinen größer als die für "Punkte" sind, und zwar auf möglichst einfache und klare Weise und ohne die wesentliche gepaarte Natur der Daten zu verlieren. Idealerweise möchte ich die gepaarten Werte für die beiden Gruppen entlang derselben und nicht entlang orthogonaler Achsen darstellen, da dies den visuellen Vergleich erleichtert.
Vielleicht gibt es keine bessere Option als ein Streudiagramm, aber ich würde gerne wissen, ob es Alternativen gibt, die funktionieren könnten.
bar
auf der horizontalen unddot
der vertikalen Achse als Streudiagramm zu zeichnen?