Ich frage mich, was dieses Bohnenplot-Analysediagramm bedeutet


11

Wie interpretiert und generiert man Bean-Plot-Diagramme? Hier ist ein Beispiel von Walkes et al. 2010 . Für welche Art von Daten ist es am nützlichsten?

Bohnengrundstück
(Quelle: biomedcentral.com )


3
"Ein Beanplot ist eine Alternative zum Boxplot zum visuellen Vergleich univariater Daten zwischen Gruppen. In einem Beanplot werden die einzelnen Beobachtungen als kleine Linien in einem eindimensionalen Streudiagramm dargestellt. Daneben ist die geschätzte Dichte der Verteilungen sichtbar und der Durchschnitt wird angezeigt. " Auszug von hier genommen .

Für diejenigen, die es nicht wissen: Dies ist ein naher Verwandter der Geigenhandlung (Vioplot).

Antworten:


12

Boxplots wurden wirklich für normale Daten oder zumindest für unimodale Daten entwickelt. Das Beanplot zeigt Ihnen die tatsächliche Dichtekurve, die informativer ist.

Die Form ist die Dichte, und die kurzen horizontalen Linien repräsentieren jeden Datenpunkt. Dies kombiniert das Beste aus einem Boxplot, einem Dichteplot und einem Teppichplot in einem und ist sehr gut lesbar.

Leider hat das von Ihnen ausgewählte Beispiel beschlossen, ein paar längere Linien hinzuzufügen, die das Diagramm (für mich) bis zur Unkenntlichkeit überladen. [snip]

BEARBEITEN: Nachdem Sie jetzt etwas mehr mit Beanplot gearbeitet haben, sind die längeren dicken Linien der Mittelwert (oder optional der Median) für jede Bean. Die längeren dünnen Linien sind die Daten mit einer Art "Stapelung", bei der breitere Linien mehr doppelte Werte anzeigen. (Sie können sie auch jittern, was ich bevorzuge, aber zumindest die "normale" Kategorie hat bereits eine angemessene Dichte an Punkten, die durch Jitter noch schlimmer werden könnten.)

Ich denke immer noch, dass das Beispiel, das Sie gewählt haben, ziemlich überladen ist, was möglicherweise durch Jittering anstelle von Stapeln behoben werden könnte.

Das Papier, das das R-Paket für die Erstellung von Bohnenplots beschreibt, ist eine gute Lektüre.


3
+1 - Lesen Sie jetzt den Bean-Plot-Artikel. Ich würde auch ein Arbeitspapier von Hadley Wickham vorschlagen, 40 Jahre Boxplots . Es geht durch eine Beschreibung einer Vielzahl von Parzellen mit mehr oder weniger den gleichen Zielen wie Bohnenparzellen.
Andy W

1

Ohne das ganze Papier gelesen zu haben, scheint es im Wesentlichen eine Variante des Boxplots zu sein. Als solches können Sie es dort verwenden, wo Sie sonst ein Boxplot verwendet hätten, z. B. um die univariaten Verteilungen mehrerer Gruppen zu vergleichen. Es zeigt eine Linie für jeden Punkt an und überlagert eine Schätzung der Kerneldichte. Wenn ich es mir anschaue, würde ich denken, dass es mit kleinen Datenmengen informativer sein könnte, aber mit mehr Daten zu voll. Es scheint mir auf den ersten Blick nicht sehr erderschütternd zu sein. Wenn Sie mehr wissen möchten, erläutern Sie Ihre Frage.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.