Kontrollvariablen in Experimenten verwenden?


9

Warum sollte man in einer Situation, in der die Zuordnung zur Behandlungsgruppe zufällig ist, eine beliebige Anzahl von Basiskovariaten kontrollieren wollen?

Mein Verständnis ist, dass eine zufällige Zuordnung der Behandlung die Behandlungsvariable streng exogen machen sollte, wodurch eine Kontrollgruppe entsteht, die angemessen als kontrafaktisch angesehen werden kann. Die einzige Ausnahme, an die ich denken kann, ist, wenn die Stichprobengröße klein ist und diese zufällige Zuordnung immer noch zu unausgeglichenen Gruppen führen kann.

Alle Gedanken werden sehr geschätzt. Vielen Dank!

Antworten:


6

Aus frequentistischer Sicht kann ein nicht angepasster Vergleich auf der Grundlage der Permutationsverteilung nach einer (richtig) randomisierten Studie immer gerechtfertigt sein. Eine ähnliche Begründung kann für eine Folgerung auf der Grundlage gemeinsamer parametrischer Verteilungen (z. B. der Verteilung oder der Verteilung) aufgrund ihrer Ähnlichkeit mit der Permutationsverteilung gegeben werden. Tatsächlich besteht bei der Anpassung an Kovariaten - wenn sie anhand von Post-hoc-Analysen ausgewählt werden - die Gefahr, dass der Fehler vom Typ I aufgeblasen wird. Es ist zu beachten, dass diese Rechtfertigung nichts mit dem Gleichgewichtsgrad in der beobachteten Probe oder mit der Größe der Probe zu tun hat (außer dass bei kleinen Proben die Permutationsverteilung diskreter ist und durch das weniger gut angenähert wirdF t F.tFtoder Verteilungen).F

Vielen Menschen ist jedoch bewusst, dass die Anpassung an Kovariaten die Genauigkeit des linearen Modells erhöhen kann. Insbesondere erhöht die Anpassung an Kovariaten die Genauigkeit des geschätzten Behandlungseffekts, wenn sie das Ergebnis vorhersagen und nicht mit der Behandlungsvariablen korrelieren (wie dies im Fall einer randomisierten Studie der Fall ist). Weniger bekannt ist jedoch, dass dies nicht automatisch auf nichtlineare Modelle übertragen wird. Zum Beispiel Robinson und Jewell [1] zeigen , dass bei der logistischen Regression, für Kovariaten Steuerung reduziert die Genauigkeit der Behandlungswirkung geschätzt, auch wenn sie über die Ergebnisse prädiktiver ist. Da jedoch der geschätzte Behandlungseffekt ist auch größer in dem angepassten Modell, Controlling für Kovariaten prädiktiv für das Ergebnis tut Steigerung der Effizienz beim Testen der Nullhypothese ohne Behandlungseffekt nach einer randomisierten Studie.

[1] LD Robinson und NP Jewell. Einige überraschende Ergebnisse zur kovariaten Anpassung in logistischen Regressionsmodellen. International Statistical Review , 58 (2): 227–40, 1991.


Hallo - interessante Antwort. Haben Sie Interesse an einem Offline-Gespräch darüber?
Rolando2

12

Wenn das Ergebnis von der Behandlung sowie anderen beobachtbaren Faktoren abhängt, verbessert die Kontrolle der letzteren häufig die Genauigkeit der Auswirkungsschätzung (dh der Standardfehler des Behandlungseffekts ist geringer). Wenn die Stichprobengröße klein ist, kann dies hilfreich sein.

Hier ist eine einfache Simulation, bei der der Standardfehler trotz zufälliger Behandlung um ein Drittel kleiner wird:

. set obs 100
obs was 0, now 100

. gen treat =mod(_n,2)

. gen x=rnormal()

. gen y = 2 + 3*treat + 1*x + rnormal()

. reg y treat

      Source |       SS       df       MS              Number of obs =     100
-------------+------------------------------           F(  1,    98) =  112.75
       Model |  209.354021     1  209.354021           Prob > F      =  0.0000
    Residual |  181.973854    98  1.85687606           R-squared     =  0.5350
-------------+------------------------------           Adj R-squared =  0.5302
       Total |  391.327875    99  3.95280682           Root MSE      =  1.3627

------------------------------------------------------------------------------
           y |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
       treat |   2.893814   .2725345    10.62   0.000     2.352978     3.43465
       _cons |   2.051611    .192711    10.65   0.000     1.669183     2.43404
------------------------------------------------------------------------------

. reg y treat x

      Source |       SS       df       MS              Number of obs =     100
-------------+------------------------------           F(  2,    97) =  180.50
       Model |  308.447668     2  154.223834           Prob > F      =  0.0000
    Residual |  82.8802074    97  .854435127           R-squared     =  0.7882
-------------+------------------------------           Adj R-squared =  0.7838
       Total |  391.327875    99  3.95280682           Root MSE      =  .92436

------------------------------------------------------------------------------
           y |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
       treat |   2.918349   .1848854    15.78   0.000     2.551403    3.285295
           x |   1.058636   .0983022    10.77   0.000     .8635335    1.253739
       _cons |   1.996209    .130825    15.26   0.000     1.736558     2.25586
------------------------------------------------------------------------------

1
+1 - Ein weiterer Grund ist die Identifizierung von Interaktionseffekten mit der Behandlung. Dies erfordert jedoch mehr als nur die "Kontrolle" anderer Faktoren wie des genannten OP.
Andy W

Vielen Dank! Wenn sich also eine oder mehrere Kovariaten auf das Ergebnis auswirken, das Sie messen möchten, verbessert die Aufnahme in Ihr Modell die Genauigkeit Ihrer Schätzung des zufällig zugewiesenen Behandlungseffekts, hat jedoch keinen wirklichen Einfluss auf Ihre Schätzung des Werts des Behandlungskoeffizient, richtig?
Robb

Ja, das ist richtig.
Dimitriy V. Masterov

Entschuldigung für Off-Topic-Ping: Es gibt einen Vorschlag für Meta, [randomisiertes Experiment] zu einem Synonym für das [zufällige Zuweisung] -Tag zu machen ( stats.meta.stackexchange.com/a/4651 ). Sie haben genug Ruf in diesem Tag, um hier für diesen Vorschlag zu stimmen: stats.stackexchange.com/tags/random-allocation/synonyms - es sind jetzt 4 Upvotes erforderlich, um durchzugehen. Wenn Sie mit dem Vorschlag nicht einverstanden sind, sollten Sie Meta kommentieren, um zu erklären, warum. Ich werde diesen Kommentar bald löschen. Prost.
Amöbe
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.