In meinem Forschungsgebiet besteht eine beliebte Art der Anzeige von Daten darin, ein Balkendiagramm mit "Lenkern" zu kombinieren. Beispielsweise,
Die "Lenker" wechseln je nach Autor zwischen Standardfehlern und Standardabweichungen. Typischerweise sind die Stichprobengrößen für jeden "Balken" ziemlich klein - ungefähr sechs.
Diese Handlungen scheinen in den Biowissenschaften besonders beliebt zu sein - Beispiele finden Sie in den ersten Veröffentlichungen von BMC Biology, Bd. 3 .
Wie würden Sie diese Daten präsentieren?
Warum ich diese Grundstücke nicht mag
Persönlich mag ich diese Handlungen nicht.
- Wenn die Stichprobengröße klein ist, können Sie die einzelnen Datenpunkte anzeigen.
- Ist es die SD oder die SE, die angezeigt wird? Niemand ist damit einverstanden, welche zu verwenden.
- Warum überhaupt Bars benutzen? Die Daten gehen (normalerweise) nicht von 0 aus, aber ein erster Durchgang in der Grafik legt nahe, dass dies der Fall ist.
- Die Grafiken geben keine Auskunft über den Bereich oder die Stichprobengröße der Daten.
R-Skript
Dies ist der R-Code, mit dem ich den Plot erstellt habe. Auf diese Weise können Sie (wenn Sie möchten) dieselben Daten verwenden.
#Generate the data
set.seed(1)
names = c("A1", "A2", "A3", "B1", "B2", "B3", "C1", "C2", "C3")
prevs = c(38, 37, 31, 31, 29, 26, 40, 32, 39)
n=6; se = numeric(length(prevs))
for(i in 1:length(prevs))
se[i] = sd(rnorm(n, prevs, 15))/n
#Basic plot
par(fin=c(6,6), pin=c(6,6), mai=c(0.8,1.0,0.0,0.125), cex.axis=0.8)
barplot(prevs,space=c(0,0,0,3,0,0, 3,0,0), names.arg=NULL, horiz=FALSE,
axes=FALSE, ylab="Percent", col=c(2,3,4), width=5, ylim=range(0,50))
#Add in the CIs
xx = c(2.5, 7.5, 12.5, 32.5, 37.5, 42.5, 62.5, 67.5, 72.5)
for (i in 1:length(prevs)) {
lines(rep(xx[i], 2), c(prevs[i], prevs[i]+se[i]))
lines(c(xx[i]+1/2, xx[i]-1/2), rep(prevs[i]+se[i], 2))
}
#Add the axis
axis(2, tick=TRUE, xaxp=c(0, 50, 5))
axis(1, at=xx+0.1, labels=names, font=1,
tck=0, tcl=0, las=1, padj=0, col=0, cex=0.1)