Gepaart gegen ungepaarten T-Test


20

Angenommen, ich habe 20 Mäuse. Ich paare die Mäuse auf irgendeine Weise, so dass ich 10 Paare bekomme. Für den Zweck dieser Frage könnte es sich um eine zufällige Paarung handeln, ODER es könnte sich um eine sinnvolle Paarung handeln, beispielsweise um den Versuch, Mäuse aus demselben Wurf mit gleichem Geschlecht und ähnlichem Gewicht zu paaren, ODER es könnte sich um eine absichtlich dumme Paarung handeln versuchen, Mäuse mit Gewichten zu paaren, die so ungleich sind wie sie nur sein könnten. Ich benutze dann Zufallszahlen, um eine Maus in jedem Paar der Kontrollgruppe und die andere Maus der zu behandelnden Gruppe zuzuweisen. Ich mache jetzt das Experiment, indem ich nur die zu behandelnden Mäuse behandle, aber ansonsten den soeben getroffenen Vorkehrungen keinerlei Beachtung schenke.

Wenn man die Ergebnisse analysiert, kann man entweder ungepaarte T-Tests oder gepaarte T-Tests verwenden. Inwiefern unterscheiden sich die Antworten, wenn überhaupt? (Ich interessiere mich grundsätzlich für systematische Unterschiede bei statistischen Parametern, die geschätzt werden müssen.)

Der Grund, warum ich das frage, ist, dass ein Artikel, mit dem ich kürzlich zu tun hatte, von einem Biologen dafür kritisiert wurde, dass er einen gepaarten T-Test anstelle eines ungepaarten T-Tests verwendet. Natürlich war die Situation im eigentlichen Experiment nicht so extrem wie die Situation, die ich skizziert habe, und meiner Meinung nach gab es gute Gründe für das Pairing. Aber der Biologe stimmte nicht zu.

Es scheint mir nicht möglich zu sein, unter den von mir skizzierten Umständen die statistische Signifikanz zu verbessern (den p-Wert zu verringern), indem ein gepaarter t-Test anstelle eines ungepaarten Tests verwendet wird, selbst wenn eine Paarung nicht angebracht ist. Es könnte jedoch die statistische Signifikanz verschlechtern, wenn Mäuse schlecht gepaart wären. Ist das richtig?

Antworten:


23

Ich stimme den Aussagen von Frank und Peter zu, aber ich denke, es gibt eine einfache Formel, die den Kern des Problems auf den Punkt bringt und die sich für das OP möglicherweise lohnt, darüber nachzudenken.

Sei und zwei Zufallsvariablen, deren Korrelation unbekannt ist.YXY

SeiZ=XY

Was ist die Varianz von ?Z

Hier ist die einfache Formel: Was ist, wenn (dh und sind positiv korreliert)?Cov ( X , Y ) > 0 X Y

Var(Z)=Var(X)+Var(Y)2Cov(X,Y).
Cov(X,Y)>0XY

Dannt X i A Y i AVar(Z)<Var(X)+Var(Y). In diesem Fall hilft das Pairing, wenn das Pairing aufgrund einer positiven Korrelation erfolgt, z. B. wenn Sie sich vor und nach der Intervention mit demselben Thema beschäftigen, da die Differenz der unabhängigen Paare eine geringere Varianz aufweist als die Varianz, die Sie für den ungepaarten Fall erhalten. Die Methode reduzierte die Varianz. Der Test ist leistungsstärker. Dies kann mit zyklischen Daten dramatisch gezeigt werden. Ich habe ein Beispiel in einem Buch gesehen, in dem sie sehen wollten, ob die Temperatur in Washington DC höher ist als in New York City. So haben sie in beiden Städten etwa 2 Jahre lang die monatliche Durchschnittstemperatur gemessen. Natürlich gibt es im Laufe des Jahres aufgrund der vier Jahreszeiten einen großen Unterschied. Diese Abweichung ist zu groß, als dass ein ungepaarter t-Test einen Unterschied erkennen könnte. Durch das Pairing auf Basis desselben Monats im selben Jahr werden jedoch dieser saisonale Effekt und das Pairing eliminiertt Test zeigte deutlich, dass die Durchschnittstemperatur in DC tendenziell höher war als in New York. (Temperatur in NY in Monat ) und (Temperatur in DC in Monat ) sind positiv korreliert, da die Jahreszeiten in NY und DC gleich sind und die Städte nahe genug sind, dass sie häufig dieselben Wettersysteme haben, die sich auf die Temperatur auswirken . DC kann ein wenig wärmer sein, weil es weiter südlich ist.XiAYiA

Es ist zu beachten, dass die Varianz umso geringer ist, je größer die Kovarianz oder Korrelation ist.

Angenommen, ist negativ.Cov(X,Y)

Dann . Jetzt ist das Pairing schlechter als das Nicht-Pairing, da die Varianz tatsächlich erhöht wird!Var(Z)>Var(X)+Var(Y)

Wenn und nicht korreliert sind, spielt es wahrscheinlich keine Rolle, welche Methode Sie verwenden. Peters zufälliger Pairing-Fall ist wie dieser.YXY.


3
Michael, da "<" und ">" auf Webseiten besondere Bedeutungen haben, ist es wichtig, dass Sie Markup für sie in Gleichungen verwenden, um zu verhindern, dass große Teile Ihres Texts aus der Ansicht verschwinden (die Codes lauten "\ lt "und" \ gt "). Ich habe die beiden Gleichungen markiert, die dieses Problem für Sie verursacht haben. Bitte lesen Sie in Zukunft Ihre Posts direkt nach dem Posten, um sicherzustellen, dass die Nutzer sehen, was Sie erwartet haben. Wenn Probleme mit dem Markup auftreten, können Sie Ihre Posts für die Aufmerksamkeit des Moderators markieren. TEX
Whuber

@whuber Danke. Ich überprüfe im Allgemeinen während und nach dem Posten, weil ich feststelle, dass ich die Gleichungen sehr durcheinander bringe, besonders wenn ich sie abonniere. Das hier zu verpassen ist ungewöhnlich und wahrscheinlich passiert, weil es ein langer Posten war und ich einfach sorglos zu etwas anderem übergegangen bin, das ich wollte oder tun musste. Manchmal lenkt mich ein Anruf ab und ich vergesse zu überprüfen. In Bezug auf spezielle Symbole, die dazu führen, dass Text in einem Beitrag verschwindet, habe ich dies beobachtet. Ich denke, eine einfache Lösung besteht darin, sicherzustellen, dass Sie nach dem Symbol ein Leerzeichen einfügen. Ich denke, das hat in der Vergangenheit für mich funktioniert.
Michael R. Chernick

+1, wirklich auf den Punkt. Beachten Sie, dass , wenn & sind perfekt unkorreliert in Ihrer Probe , . Y Var ( Z ) = Var ( X ) + Var ( Y )XY.Var(Z)=Var(X)+Var(Y.)
gung - Reinstate Monica

@MichaelChernick Für den Fall, dass Cov (X, Y) <0 ist, habe ich eine Frage: Wenn mein Ziel darin besteht, E [X] -E [Y] aus meinem Experiment abzuleiten, dann habe ich AUCH BEI ICH eine gepaarte Studie durchgeführt Wenn ich meine Daten analysiere, kann ich immer noch VORHABEN, dass mein Versuchsergebnis eine Realisierung eines UNPAIRED randomisierten Versuchs ist. Kann ich das tun? Denn wenn Sie wirklich ein ungepaartes Zufallsexperiment durchgeführt haben, können Sie buchstäblich das gleiche Ergebnis erzielen. Dann kann ich einfach den Durchschnitt jeder Gruppe nehmen (das Paarungsmaterial ignorieren) und die Differenz der beiden Gruppenmittelwerte nehmen. Dies ist eine unvoreingenommene Schätzung von E [Z]. Zur Abweichung von meinem Schätzer benutze ich einfach ...
KevinKim

@MichaelChernick die Stichprobenvarianz von Gruppe X und Gruppe Y und
fasse

7

Es ist wahrscheinlich besser, das zugrunde liegende Datenmodell zu verstehen, als es zu koppeln. Wenn die Paarung durchgeführt wird, um mit unkontrollierter Heterogenität umzugehen, ist es normalerweise (außer in Zwillingsstudien) so, dass die Paarung diese Variabilitätsquelle nur teilweise kontrolliert und eine multiple Regression besser geeignet ist. Dies liegt daran, dass das Anpassen kontinuierlicher Variablen häufig zu einer Restvariabilität führt, da es nicht möglich ist, solche Variablen genau anzupassen.


2
Wenn wir alle Rückschritte machen sollten, warum betonen Bücher über experimentelles Design wie das von David Cox die Wichtigkeit der Paarung oder Gruppierung in biologischen Experimenten? Durch die Paarung wird die versteckte Annahme einer linearen Abhängigkeit vermieden, die mit einer Regression verbunden ist. Aber vielleicht gibt es noch andere Gründe: jemand ??
David Epstein

6

Die beiden Tests (gepaart und ungepaart) stellen unterschiedliche Fragen, sodass sie unterschiedliche Antworten erhalten können. Richtiges Pairing ist fast immer leistungsfähiger als ungepaart - genau darum geht es beim Pairing. Da Sie also sagen, dass die Kopplung korrekt ist, ist der p-Wert für Ihren gepaarten Test wahrscheinlich niedriger als für dieselben Daten, die nicht gepaart sind. Sie könnten natürlich beides tun und sich selbst davon überzeugen.

Daher ist die Antwort auf Ihr Dilemma inhaltlich und nicht statistisch. Ist Ihre Paarung richtig?

Könnten Sie durch zufälliges Pairing ein aussagekräftigeres Ergebnis erzielen als durch einen ungepaarten Test? Wir werden sehen:

set.seed(2910110192)
x <- rnorm(100, 10, 2)
y <- rnorm(100, 10, 2)
t.test(x, y)
t.test(x, y, paired = T)

Ja können Sie, obwohl hier der Unterschied sehr klein ist, das gepaarte hatte ein niedrigeres p. Ich habe diesen Code mehrmals ausgeführt. Es überrascht nicht, dass manchmal ein p niedriger ist, manchmal das andere, aber der Unterschied war in allen Fällen gering. Ich bin mir jedoch sicher, dass in einigen Situationen der Unterschied in den p-Werten groß sein kann.


Danke für die Antwort, aber meine Frage stellte systematische Unterschiede. Offensichtlich sehen x und y in einer langen Reihe von x und y gelegentlich so aus, als wären sie sehr gut gepaart und gelegentlich absichtlich schlecht gepaart. Sicherlich ist es eine statistische Frage, ob bei zufälliger Auswahl von x und y die Verteilung der p-Werte bei beiden Tests gleich ist. Ich nehme an, es sollte für jemanden, der mehr theoretische Statistiken kennt als ich, nicht zu schwierig sein, die beiden theoretischen Verteilungen von p-Werten tatsächlich zu berechnen. Ich vermute, dass sie gleich sind.
David Epstein

In dem konkreten Fall, in dem ich involviert war, lag der p-Wert für ungepaart bei 0,04 und für gepaart bei 0,001. Laut dem kritischen Biologen sollten wir .04 zitieren. Meiner Meinung nach weist die Verbesserung des p-Werts stark darauf hin, dass unsere Paarung gültig war. Ich behaupte, es gibt hier in der Statistik eine objektive Frage mit einer objektiven Antwort, und dass es nicht nur um ein gutes biologisches Urteil über die Gültigkeit der jeweiligen Paarung geht - letztere scheint die Meinung von Peter Flom und von zu sein der kritische Biologe.
David Epstein

1
Ich denke, die Statistik erzählt die Geschichte. Beide Ergebnisse sollten offengelegt werden, aber solange die Daten korrekt sind und die Korrelation erklärt werden kann, ist der gepaarte Test genauer, da er die Korrelation berücksichtigt.
Michael R. Chernick

5

Ich verstehe jetzt viel besser, was mich über gepaarte versus ungepaarte t-Tests und die damit verbundenen p-Werte beunruhigte. Das herauszufinden war eine interessante Reise und es gab viele Überraschungen auf dem Weg. Eine Überraschung ergab sich aus einer Untersuchung von Michaels Beitrag. Dies ist in Bezug auf praktische Ratschläge einwandfrei. Außerdem sagt er, was meiner Meinung nach praktisch alle Statistiker glauben, und er hat mehrere positive Stimmen, um dies zu untermauern. Theoretisch ist es jedoch nicht wörtlich richtig. Ich entdeckte dies, indem ich die Formeln für die p-Werte erarbeitete und dann sorgfältig überlegte, wie ich die Formeln verwenden sollte, um zu Gegenbeispielen zu gelangen. Ich bin gelernter Mathematiker, und das Gegenbeispiel ist das Gegenbeispiel eines Mathematikers. Es ist nicht etwas, was Sie in der praktischen Statistik stoßen würde, Die Art von Dingen, die ich herausfinden wollte, als ich meine ursprüngliche Frage stellte.

Hier ist der R-Code, der das Gegenbeispiel gibt:

vLength <- 10; meanDiff <-10^9; numSamples <- 3;
pv <- function(vLength,meanDiff) {
    X <- rnorm(vLength)
    Y <- X - meanDiff + rnorm(vLength,sd=0.0001)
    Paired <- t.test(X,Y,var.equal=T,paired=T)
    NotPaired <- t.test(X,Y,var.equal=T,paired=F)
    c(Paired$p.value,NotPaired$p.value,cov(X,Y))
}
ans <- replicate(numSamples,pv(vLength,meanDiff))

Beachten Sie die folgenden Merkmale: X und Y sind zwei 10-Tupel, deren Differenz sehr groß und nahezu konstant ist. Für viele signifikante Zahlen beträgt die Korrelation 1.000 .... Der p-Wert für den ungepaarten Test ist etwa 10 ^ 40-mal kleiner als der p-Wert für den gepaarten Test. Das widerspricht also Michaels Bericht, vorausgesetzt, man liest seinen Bericht buchstäblich im mathematischen Stil. Hier endet der Teil meiner Antwort, der sich auf Michaels Antwort bezieht.


Hier sind die Gedanken, die durch Peters Antwort angeregt werden. Während der Diskussion meiner ursprünglichen Frage vermutete ich in einem Kommentar, dass zwei bestimmte Verteilungen von p-Werten, die unterschiedlich klingen, tatsächlich gleich sind. Das kann ich jetzt beweisen. Was wichtiger ist, ist, dass der Beweis die fundamentale Natur eines p-Wertes aufdeckt, so fundamental, dass kein Text (auf den ich gestoßen bin) stört, um zu erklären. Vielleicht kennen alle professionellen Statistiker das Geheimnis, aber für mich schien die Definition des p-Werts immer seltsam und künstlich. Lassen Sie mich die Frage spezifizieren, bevor Sie das Geheimnis des Statistikers preisgeben.

n>1n2(n-1)n-1Freiheitsgrade. Diese beiden Verteilungen sind unterschiedlich. Wie um alles in der Welt können die zugehörigen Verteilungen der p-Werte also gleich sein? Erst nach langen Überlegungen wurde mir klar, dass diese offensichtliche Ablehnung meiner Vermutung zu einfach war.

f:(0,)(0,)[0,1]

p=tf(s)ds
f(-,)[0,)

[0,1]

n-1[0,1]2(n-1)[0,1][0,1]


Ich glaube nicht, dass der p-Wert irgendwelche mysteriösen Geheimnisse hat. Manche Menschen haben es schwer. Es ist die Wahrscheinlichkeit, einen Wert als äußerlich oder extremer zu beobachten, als tatsächlich beobachtet wurde, wenn die Nullhypothese WAHR ist. Ich denke, Sie hatten das Recht in einer Ihrer Formeln. Ich glaube, Sie haben angegeben, dass p-Werte gleichmäßig verteilt sind. Ja, ich stimme dem zu, wenn die Nullhypothese wahr ist. Denken Sie daran, dass bei Ihrem t-Test die Nullhypothese möglicherweise nicht wahr ist. Dann ist der p-Wert nicht einheitlich. Es sollte näher an 0 konzentriert sein.
Michael R. Chernick

Zweitens sprechen wir über zwei verschiedene Teststatistiken. Eine basiert auf Pairing und eine nicht in Ihrem Beispiel. Ob ich es in meiner Antwort erwähnt habe oder nicht, der ungepaarte t-Test hat eine zentrale t-Verteilung mit 2n-2 Freiheitsgraden, während die entsprechende t-Verteilung für den gepaarten t-Test n-1 Freiheitsgrade hat. Derjenige mit der größeren Anzahl von Freiheitsgraden ist also näher an der Standardnormalverteilung als der andere. Ist das wichtig, wenn Sie diese Tests auf reale Daten anwenden? Nein! Nicht, wenn n einigermaßen groß ist.
Michael R. Chernick

Als Randnotiz erfordert eine Einschränkung des gepaarten Tests die gleiche Stichprobengröße, die Sie haben sollten, wenn alle Daten gepaart werden können. Der ungepaarte Test ist jedoch bei ungleichen Stichprobengrößen gültig. Im Allgemeinen hat der ungepaarte Test also n + m-2 Freiheitsgrade.
Michael R. Chernick

Ihre Antwort ist lang und abstrakt und ich habe versucht, sie durchzuwaten, aber ich habe das Gegenbeispiel nicht verstanden. Ich sehe nur nicht, wo Sie die Nullhypothese und die realen Daten berücksichtigen. Der beobachtete p-Wert ist das Integral der geeigneten t-Verteilung für die Teststatistik bei gegebenen Daten. Sie vergleichen diese Zahlen für die beiden t-Verteilungen und den gleichen gemeinsamen Datensatz. Bedingt durch die beobachteten Daten spielen diese Gleichverteilungen keine Rolle. Es tut mir leid, aber ich sehe nicht, dass Ihre Antwort Ihre Frage wirklich beantwortet.
Michael R. Chernick

Michael: Konzentriere dich nur auf den R-Code, den ich gegeben habe. Die Ausführung dauert nur eine Sekunde. Die Nullhypothese ist, dass X und Y aus der gleichen Normalverteilung stammen, was in meinem Fall natürlich völlig falsch ist. In meinem Beispiel ist Cov (X, Y)> 0 und dennoch hat der ungepaarte Test eine größere Bedeutung als der gepaarte Test.
David Epstein

1

Ich würde eine andere Perspektive anbieten. Oft wird das Pairing durchgeführt, um die Verzerrung zu verringern. Angenommen, Sie interessieren sich dafür, ob Exposition E ein Risikofaktor für ein kontinuierliches Ergebnis ist. Y. Für jedes E + -Subjekt erhalten Sie ein alters- und geschlechtsangepasstes Subjekt, das E- ist. Jetzt können wir entweder einen gepaarten T-Test oder einen ungepaarten T-Test durchführen. Ich denke, wir sollten das Matching explizit berücksichtigen und einen gepaarten T-Test durchführen. Es ist grundsätzlicher, dass es das Design berücksichtigt. Ob das Matching in der Analyse berücksichtigt wird, ist eine Frage des Bias-Varianz-Kompromisses. Die Berücksichtigung von Übereinstimmungen in der Analyse bietet mehr Schutz vor Verzerrungen, kann jedoch die Varianz erhöhen. Die Durchführung eines ungepaarten T-Tests ist zwar effizienter, bietet jedoch keinen Schutz vor Verzerrungen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.