Gibt es einen statistischen Test, um zwei Proben der Größe 1 und 3 zu vergleichen?


19

Für ein Ökologieprojekt fügte meine Laborgruppe Essig zu 4 Tanks hinzu, die gleiche Volumina Teichwasser enthielten, 1 Kontrolle ohne Elodea (eine Wasserpflanze) und 3 Behandlungen mit jeweils der gleichen Menge Elodea. Der Zweck der Zugabe des Essigs bestand darin, den pH-Wert zu senken. Die Hypothese war, dass die Tanks mit Elodea schneller auf ihren normalen pH-Wert zurückkehren würden. Dies war tatsächlich der Fall. Wir haben den pH-Wert jedes Tanks zwei Wochen lang täglich gemessen. Alle Tanks kehrten schließlich zu ihrem natürlichen pH-Wert zurück, aber die dafür benötigte Zeit war für die Tanks mit Elodea viel kürzer.

Als wir unserem Professor von unserem experimentellen Design erzählten, sagte er, dass es keinen statistischen Test gibt, der mit den Daten durchgeführt werden kann, um die Kontrolle mit der Behandlung zu vergleichen. Da es für die Kontrolle kein Replikat gab (wir haben nur einen Kontrolltank verwendet), können wir die Varianz nicht berechnen und daher die Stichprobenmittelwerte der Kontrolle und der Behandlung nicht vergleichen. Also meine Frage ist, ist das wahr? Ich verstehe auf jeden Fall, was er meint. Wenn Sie zum Beispiel die Größe eines Mannes und einer Frau angenommen haben, können Sie keine Schlussfolgerungen über deren jeweilige Population ziehen. Wir haben aber 3 Behandlungen durchgeführt und die Varianz war gering. Es erscheint vernünftig anzunehmen, dass die Varianz in der Kontrolle ähnlich ist.

Aktualisieren:

Vielen Dank für die hervorragende Antwort. Wir erhielten mehr Wasser und Elodea aus dem Feuchtgebiet und beschlossen, das Experiment erneut mit kleineren Tanks durchzuführen, diesmal jedoch mit 5 Kontrollen und 5 Behandlungen. Wir wollten dies mit unseren ursprünglichen Daten kombinieren, aber der Start-pH-Wert der Tanks war so unterschiedlich, dass es nicht sinnvoll erscheint, das neue Experiment als Stichprobe aus derselben Population wie das ursprüngliche Experiment zu betrachten.

Wir haben erwogen, verschiedene Mengen an Elodea zuzugeben und zu versuchen, die Geschwindigkeit der pH-Korrektur (gemessen als Zeitspanne, bis der pH-Wert wieder auf den ursprünglichen Wert zurückgekehrt ist) mit der Menge an Elodea in Beziehung zu setzen, entschieden jedoch, dass dies nicht erforderlich war. Unser Ziel ist es nur zu zeigen, dass der Elodea einen positiven Unterschied macht, und nicht, eine Art Vorhersagemodell dafür zu erstellen, wie der pH-Wert auf unterschiedliche Mengen an Elodea reagiert. Es wäre interessant, die optimale Menge an Elodea zu bestimmen, aber das ist wahrscheinlich nur die maximale Menge, die überleben kann. Der Versuch, eine Regressionskurve an die Daten anzupassen, wäre aufgrund der verschiedenen komplizierten Änderungen, die in der Community beim Hinzufügen einer großen Menge auftreten, nicht besonders aufschlussreich. Die Elodea stirbt, zerfällt, neue Organismen beginnen zu dominieren und so weiter.


4
Haben Sie jedem der 3 "Behandlungstanks" die gleiche Menge Elodea hinzugefügt?
gung - Wiedereinsetzung von Monica

2
Ja, wir haben jeder Behandlung die gleiche Menge Elodea hinzugefügt.
Simon Hunt

Antworten:


21

Beachten Sie Gungs Frage; es ist wichtig. Ich gehe davon aus, dass die Behandlung für jeden Tank in der Behandlungsgruppe gleich war.

Wenn Sie argumentieren können, dass die Varianz für die beiden Gruppen gleich ist (was Sie normalerweise ohnehin für einen T-Test mit zwei Stichproben annehmen würden), können Sie einen Test durchführen. Sie können diese Annahme einfach nicht überprüfen , egal wie schwer sie verletzt sein mag.

Die Bedenken, die in dieser Antwort auf eine verwandte Frage zum Ausdruck gebracht werden, sind für Ihre Situation noch relevanter, aber Sie können weniger dagegen tun.

[Sie fragen, ob es vernünftig ist anzunehmen, dass die Abweichungen gleich sind. Das können wir für Sie nicht beantworten, das müssten Sie Fachexperten (dh Ökologen) überzeugen, war eine vernünftige Annahme. Gibt es andere Studien, in denen solche Werte sowohl unter Behandlung als auch unter Kontrolle gemessen wurden? Andere, bei denen ähnliche Tests ( T-Tests oder Anova - ich wette, Sie können einen besseren Präzedenzfall finden) durchgeführt oder ähnliche Annahmen getroffen wurden? Irgendeine Form der allgemeinen Argumentation, die Sie anwenden können?]

x¯y¯σ2x¯-y¯μx-μyσ2(1/nx+1/ny)n

ny

(x¯-y¯)sx1/nx+1

sxtnx-1

σsxspny

Bearbeiten:

Hier ist eine simulierte Leistungskurve für diesen Test. Die Stichprobengröße bei der Null betrug 10000, bei den anderen Punkten 1000. Wie Sie sehen, beträgt die Ablehnungsrate bei der Null 0,05, und die Leistungskurve erfordert zwar einen großen Unterschied in den Bevölkerungsmitteln, um eine anständige Leistung zu haben, die richtige Form. Das heißt, dieser Test macht das, was er soll.

Leistungskurve

(Bearbeitung beenden)

Bei so kleinen Stichproben wird dies jedoch etwas empfindlich auf Verteilungsannahmen reagieren.

Wenn Sie bereit sind, andere Annahmen zu treffen oder die Gleichheit einer anderen Bevölkerungsmenge testen möchten, sind einige Tests möglicherweise noch möglich.

Es ist also nicht alles verloren ... aber wenn möglich, ist es im Allgemeinen besser, in beiden Gruppen zumindest eine gewisse Replikation zu haben.


1
Beachten Sie, dass Sie die angegebenen Formeln @Glen_b befolgen müssen. Sowohl Excel als auch Minitab berechnen dies nicht.
Radfahrer

10
(+1) Ein äquivalenter Ansatz (unter Verwendung derselben Formel) - und daher mehr Munition zur Rechtfertigung dieser Antwort - besteht darin, dass Sie ein Vorhersageintervall für einen zukünftigen Wert aus der Behandlungsgruppe berechnen können . Wenn der Kontrollwert nicht in dieses Vorhersageintervall fällt, gibt es signifikante Hinweise auf einen Unterschied zwischen den beiden Gruppen. Der Unterschied könnte eine Kombination aus einem Unterschied im Mittelwert oder einem Unterschied in den Varianzen sein, aber es gibt (wahrscheinlich) einen Unterschied.
Whuber

3
σ(x¯-12)sx1/nxt

2
@ Glen_b: Ich bin nicht sicher, ob sich dies im letzten November geändert hat, aber R 3.0 führt einen gepoolten T-Test durch, wenn eine der Stichprobengrößen eins ist, und gibt die gleiche Antwort wie eine Anova.
Aaron - Wiedereinsetzung von Monica

2
Für alle, die es in R ausprobieren möchten: t.test(x=c(4.5,4.8,4.6),y=5.2, var.equal=TRUE) - Es sieht so aus, als ob dies sowohl in R2.15.2 als auch in R3.0.0 funktioniert (die einzigen zwei Versionen, die ich zur Hand habe).
Glen_b
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.