Das folgende Szenario wurde zur häufigst gestellten Frage im Trio von Ermittler (I), Prüfer / Herausgeber (R, nicht mit CRAN verwandt) und mir (M) als Handlungsersteller. Wir können davon ausgehen, dass es sich bei (R) um den typischen medizinischen Big Boss-Gutachter handelt, der nur weiß, dass jeder Plot einen Fehlerbalken aufweisen muss, andernfalls ist er falsch. Wenn ein statistischer Prüfer involviert ist, sind Probleme viel weniger kritisch.
Szenario
In einer typischen pharmakologischen Kreuzstudie werden zwei Arzneimittel A und B auf ihre Wirkung auf den Glucosespiegel getestet. Jeder Patient wird zweimal in zufälliger Reihenfolge und unter der Annahme einer Übertragung getestet. Der primäre Endpunkt ist der Unterschied zwischen Glukose (BA), und wir gehen davon aus, dass ein paarweiser t-Test ausreichend ist.
(I) möchte ein Diagramm, das die absoluten Glukosespiegel in beiden Fällen zeigt. Er befürchtet (R) den Wunsch nach Fehlerbalken und fragt nach Standardfehlern in Balkendiagrammen. Beginnen wir hier nicht mit dem Krieg der Balkendiagramme ._)
(I): Das kann nicht wahr sein. Die Balken überlappen sich und wir haben p = 0,03? Das habe ich in der Schule nicht gelernt.
(M): Wir haben hier ein gepaartes Design. Die angeforderten Fehlerbalken sind völlig irrelevant, was zählt, ist der SE / CI der gepaarten Differenzen, die in der Darstellung nicht gezeigt werden. Wenn ich eine Wahl hätte und es nicht zu viele Daten gäbe, würde ich die folgende Darstellung vorziehen
Hinzugefügt 1: Dies ist die parallele Koordinatendarstellung, die in mehreren Antworten erwähnt wurde
(M): Die Linien zeigen die Paarung, und die meisten Linien gehen nach oben, und das ist der richtige Eindruck, weil die Steigung zählt (ok, das ist kategorisch, aber trotzdem).
(I): Das Bild ist verwirrend. Niemand versteht es und es hat keine Fehlerbalken (R lauert).
(M): Wir könnten auch ein weiteres Diagramm hinzufügen, das das relevante Konfidenzintervall der Differenz zeigt. Der Abstand von der Nulllinie vermittelt einen Eindruck von der Effektgröße.
(I): Niemand tut es
(R): Und es verschwendet wertvolle Bäume
(M): (als guter Deutscher): Ja, Punkt auf den Bäumen wird genommen. Aber ich benutze dies trotzdem (und werde es nie veröffentlicht), wenn wir mehrere Behandlungen und mehrere Kontraste haben.
Irgendwelche Vorschläge ? Der R-Code ist unten angegeben, wenn Sie ein Diagramm erstellen möchten.
# Graphics for Crossover experiments
library(ggplot2)
library(plyr)
theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines")))
n = 20
effect = 5
set.seed(4711)
glu0 = rnorm(n,120,30)
glu1 = glu0 + rnorm(n,effect,7)
dt = data.frame(patient = rep(paste0("P",10:(9+n))),
treatment = rep(c("A","B"), each=n),glucose = c(glu0,glu1))
dt1 = ddply(dt,.(treatment), function(x){
data.frame(glucose = mean(x$glucose), se = sqrt(var(x$glucose)/nrow(x)) )})
tt = t.test(glucose~treatment,paired=TRUE,data=dt,conf.int=TRUE)
dt2 = data.frame(diff = -tt$estimate,low=-tt$conf.int[2], up=-tt$conf.int[1])
p = paste("p =",signif(tt$p.value,2))
png(height=300,width=300)
ggplot(dt1, aes(x=treatment, y=glucose, fill=treatment))+
geom_bar(stat="identity")+
geom_errorbar(aes(ymin=glucose-se, ymax=glucose+se),size=1., width=0.3)+
geom_text(aes(1.5,150),label=p,size=6)
ggplot(dt,aes(x=treatment,y=glucose, group=patient))+ylim(0,190)+
geom_line()+geom_point(size=4.5)+
geom_text(aes(1.5,60),label=p,size=6)
ggplot(dt2,aes(x="",y=diff))+
geom_errorbar(aes(ymin=low,ymax=up),size=1.5,width=0.2)+
geom_text(aes(1,-0.8),label=p,size=6)+
ylab("95% CI of difference glucose B-A")+ ylim(-10,10)+
theme(panel.border=element_blank(), panel.grid.major.x=element_blank(),
panel.grid.major.y=element_line(size=1,colour="grey88"))
dev.off()