Es lohnt sich, über den Zweck Ihrer Handlung klar zu sein. Im Allgemeinen gibt es zwei verschiedene Arten von Zielen: Sie können Diagramme für sich selbst erstellen, um die von Ihnen getroffenen Annahmen zu bewerten und den Datenanalyseprozess zu steuern, oder Sie können Diagramme erstellen, um anderen ein Ergebnis mitzuteilen. Diese sind nicht gleich; Beispielsweise können viele Betrachter / Leser Ihrer Handlung / Analyse statistisch nicht anspruchsvoll sein und sind möglicherweise nicht mit der Idee der beispielsweise gleichen Varianz und ihrer Rolle in einem T-Test vertraut. Sie möchten, dass Ihr Grundstück die wichtigen Informationen über Ihre Daten auch Verbrauchern wie diesen vermittelt. Sie vertrauen implizit darauf, dass Sie die Dinge richtig gemacht haben. Aus Ihrem Fragen-Setup geht hervor, dass Sie nach dem letzteren Typ suchen.
Realistisch gesehen ist das häufigste und am meisten akzeptierte Diagramm zur Übermittlung der Ergebnisse eines T-Tests 1 an andere (abgesehen davon, ob es tatsächlich am besten geeignet ist) ein Balkendiagramm mit Mitteln mit Standardfehlerbalken. Dies passt sehr gut zum t-Test, da ein t-Test zwei Mittelwerte anhand ihrer Standardfehler vergleicht. Wenn Sie zwei unabhängige Gruppen haben, erhalten Sie ein Bild, das selbst für statistisch nicht anspruchsvolle Personen intuitiv ist, und (datenwillige) Personen können "sofort erkennen, dass sie wahrscheinlich aus zwei verschiedenen Bevölkerungsgruppen stammen". Hier ist ein einfaches Beispiel unter Verwendung der Daten von @ Tim:
nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se = c(sd(nonsmokers)/sqrt(length(nonsmokers)),
sd(smokers)/sqrt(length(smokers)))
windows()
bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
box()
arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)
Allerdings verachten Datenvisualisierungsspezialisten diese Diagramme normalerweise. Sie werden oft als "Dynamitplots" verspottet (vgl. Warum Dynamitplots schlecht sind ). Insbesondere wenn Sie nur wenige Daten haben, wird häufig empfohlen, die Daten einfach selbst anzuzeigen . Wenn sich die Punkte überlappen, können Sie sie horizontal zittern lassen (ein wenig zufälliges Rauschen hinzufügen), damit sie sich nicht mehr überlappen. Da es bei einem T-Test im Wesentlichen um Mittelwerte und Standardfehler geht, ist es am besten, die Mittelwerte und Standardfehler auf ein solches Diagramm zu legen. Hier ist eine andere Version:
set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE,
xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)
Wenn Sie viele Daten haben, sind Boxplots möglicherweise die bessere Wahl, um einen schnellen Überblick über die Verteilungen zu erhalten, und Sie können dort auch die Mittelwerte und SEs überlagern.
data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see
Einfache Darstellungen der Daten und Boxplots sind so einfach, dass die meisten Menschen sie verstehen können, auch wenn sie statistisch nicht sehr versiert sind. Bedenken Sie jedoch, dass keines davon die Beurteilung der Gültigkeit eines T-Tests zum Vergleich Ihrer Gruppen erleichtert. Diese Ziele werden am besten durch verschiedene Arten von Handlungen erreicht.
1. Beachten Sie, dass diese Diskussion einen unabhängigen Stichproben-T-Test voraussetzt. Diese Diagramme könnten mit einem T-Test für abhängige Stichproben verwendet werden, könnten aber auch in diesem Zusammenhang irreführend sein (vgl. Ist die Verwendung von Fehlerbalken für Mittelwerte in einer Studie innerhalb der Probanden falsch? ).