Eine zufällige Zuordnung ist wertvoll, da sie die Unabhängigkeit der Behandlung von potenziellen Ergebnissen gewährleistet. Auf diese Weise führt dies zu unvoreingenommenen Schätzungen des durchschnittlichen Behandlungseffekts. Andere Zuweisungsschemata können jedoch auch systematisch die Unabhängigkeit der Behandlung von potenziellen Ergebnissen sicherstellen. Warum brauchen wir also eine zufällige Zuordnung? Anders ausgedrückt, was ist der Vorteil einer zufälligen Zuweisung gegenüber nicht zufälligen Zuweisungsschemata, die auch zu einer unvoreingenommenen Folgerung führen?
Sei ein Vektor von Behandlungszuordnungen, in dem jedes Element 0 (Einheit, die nicht der Behandlung zugeordnet ist) oder 1 (Einheit, die der Behandlung zugeordnet ist) ist. In einem JASA-Artikel sagen Angrist, Imbens und Rubin (1996, 446-47) , dass die Behandlungszuordnung zufällig ist, wenn für alle \ mathbf {c} und \ mathbf {c'}, so dass \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} , wobei \ iota a ist Spaltenvektor mit allen Elementen gleich 1.
Mit Worten, die Behauptung ist, dass die Zuweisung zufällig ist, wenn ein Vektor von Zuweisungen, der Zuordnungen zur Behandlung enthält, genauso wahrscheinlich ist wie jeder andere Vektor, der Zuweisungen zur Behandlung enthält.
Um jedoch die Unabhängigkeit potenzieller Ergebnisse von der Behandlungszuweisung sicherzustellen, reicht es aus, sicherzustellen, dass jede Einheit in der Studie die gleiche Wahrscheinlichkeit für die Zuordnung zur Behandlung hat. Und das kann leicht auftreten, selbst wenn die meisten Behandlungszuweisungsvektoren keine Wahrscheinlichkeit haben, ausgewählt zu werden. Das heißt, es kann auch bei nicht zufälliger Zuweisung auftreten.
Hier ist ein Beispiel. Wir wollen ein Experiment mit vier Einheiten durchführen, in denen genau zwei behandelt werden. Es gibt sechs mögliche Zuweisungsvektoren:
- 1100
- 1010
- 1001
- 0110
- 0101
- 0011
wobei die erste Ziffer in jeder Nummer angibt, ob die erste Einheit behandelt wurde, die zweite Ziffer angibt, ob die zweite Einheit behandelt wurde, und so weiter.
Angenommen, wir führen ein Experiment durch, bei dem wir die Möglichkeit der Zuweisungsvektoren 3 und 4 ausschließen, bei dem jedoch jeder der anderen Vektoren die gleiche (25%) Chance hat, ausgewählt zu werden. Dieses Schema ist keine zufällige Zuordnung im Sinne von AIR. In Erwartung führt dies jedoch zu einer unvoreingenommenen Schätzung des durchschnittlichen Behandlungseffekts. Und das ist kein Zufall. Jedes Zuweisungsschema, das den Probanden die gleiche Wahrscheinlichkeit für die Zuordnung zur Behandlung gibt, ermöglicht eine unvoreingenommene Schätzung der ATE.
Also: Warum brauchen wir eine zufällige Zuordnung im Sinne von AIR? Mein Argument wurzelt in der Randomisierungsinferenz; Wenn man stattdessen in modellbasierter Inferenz denkt, scheint die AIR-Definition vertretbarer zu sein?