Wie interpretiert und generiert man Bean-Plot-Diagramme? Hier ist ein Beispiel von Walkes et al. 2010 . Für welche Art von Daten ist es am nützlichsten?
(Quelle: biomedcentral.com )
Wie interpretiert und generiert man Bean-Plot-Diagramme? Hier ist ein Beispiel von Walkes et al. 2010 . Für welche Art von Daten ist es am nützlichsten?
(Quelle: biomedcentral.com )
Antworten:
Boxplots wurden wirklich für normale Daten oder zumindest für unimodale Daten entwickelt. Das Beanplot zeigt Ihnen die tatsächliche Dichtekurve, die informativer ist.
Die Form ist die Dichte, und die kurzen horizontalen Linien repräsentieren jeden Datenpunkt. Dies kombiniert das Beste aus einem Boxplot, einem Dichteplot und einem Teppichplot in einem und ist sehr gut lesbar.
Leider hat das von Ihnen ausgewählte Beispiel beschlossen, ein paar längere Linien hinzuzufügen, die das Diagramm (für mich) bis zur Unkenntlichkeit überladen. [snip]
BEARBEITEN: Nachdem Sie jetzt etwas mehr mit Beanplot gearbeitet haben, sind die längeren dicken Linien der Mittelwert (oder optional der Median) für jede Bean. Die längeren dünnen Linien sind die Daten mit einer Art "Stapelung", bei der breitere Linien mehr doppelte Werte anzeigen. (Sie können sie auch jittern, was ich bevorzuge, aber zumindest die "normale" Kategorie hat bereits eine angemessene Dichte an Punkten, die durch Jitter noch schlimmer werden könnten.)
Ich denke immer noch, dass das Beispiel, das Sie gewählt haben, ziemlich überladen ist, was möglicherweise durch Jittering anstelle von Stapeln behoben werden könnte.
Das Papier, das das R-Paket für die Erstellung von Bohnenplots beschreibt, ist eine gute Lektüre.
Ohne das ganze Papier gelesen zu haben, scheint es im Wesentlichen eine Variante des Boxplots zu sein. Als solches können Sie es dort verwenden, wo Sie sonst ein Boxplot verwendet hätten, z. B. um die univariaten Verteilungen mehrerer Gruppen zu vergleichen. Es zeigt eine Linie für jeden Punkt an und überlagert eine Schätzung der Kerneldichte. Wenn ich es mir anschaue, würde ich denken, dass es mit kleinen Datenmengen informativer sein könnte, aber mit mehr Daten zu voll. Es scheint mir auf den ersten Blick nicht sehr erderschütternd zu sein. Wenn Sie mehr wissen möchten, erläutern Sie Ihre Frage.