Was ist los mit (etwas) Pseudo-Randomisierung


23

Ich stieß auf eine Studie, in der Patienten, die alle über 50 Jahre alt waren, nach Geburtsjahren pseudo-randomisiert wurden. Wenn das Geburtsjahr eine gerade Zahl war, übliche Pflege, wenn eine ungerade Zahl, Intervention.

Es ist einfacher zu implementieren, es ist schwieriger zu untergraben (es ist einfach zu überprüfen, welche Behandlung ein Patient hätte erhalten sollen), es ist leicht zu merken (die Aufgabe dauerte mehrere Jahre). Trotzdem mag ich es nicht. Ich denke, eine richtige Randomisierung wäre besser gewesen. Aber ich kann nicht erklären warum.

Täusche ich mich, wenn ich das fühle, oder gibt es einen guten Grund, 'echte' Randomisierung zu bevorzugen?


1
Willkommen auf der Seite! Schön, dass Sie hier Ihren Beitrag sehen.
Andy W

Durch die obigen Antworten fühle ich mich besser, am Tag der Geburt zu "randomisieren"! Ungerader Tag zur Behandlung, gerader Tag zur Kontrolle ... Adalberto
AADF

6
@Adalberto Das geht an der Hauptsache vorbei, dass bei einem bestimmten, nicht randomisierten Verfahren zur Zuordnung von Probanden zu Gruppen nicht sichergestellt werden kann, dass es die wünschenswerten Eigenschaften aufweist, die ein randomisiertes Verfahren aufweist. Nehmen wir an, Sie verbringen Jahre Zeit mit einer solchen Studie, bevor ein Gutachter einen unerwarteten, aber starken Unterschied zwischen der Behandlung und dem Geburtsdatum feststellt. Da wir solche Verwirrungen nicht antizipieren können, umgehen wir das Problem durch zufällige Zuordnung.
Whuber

Antworten:


28

Sie haben Recht, skeptisch zu sein. Im Allgemeinen sollte man "echte" Randomisierung verwenden, da man normalerweise nicht alle Kenntnisse über relevante Faktoren (nicht beobachtbare Faktoren) hat. Wenn einer dieser nicht beobachtbaren Faktoren mit einem ungeraden oder einem geraden Alter korreliert, hängt dies auch damit zusammen, ob er behandelt wurde oder nicht. In diesem Fall können wir den Behandlungseffekt nicht identifizieren: Die beobachteten Effekte können auf die Behandlung oder auf die nicht beobachteten Faktoren zurückzuführen sein.

Dies ist kein Problem bei einer echten Randomisierung, bei der keine Abhängigkeit zwischen Behandlung und nicht beobachtbaren Faktoren zu erwarten ist (bei kleinen Stichproben kann dies natürlich der Fall sein).

Um eine Geschichte zu konstruieren, warum dieses Randomisierungsverfahren ein Problem sein könnte, nehmen wir an, dass die Studie nur Probanden umfasste, die zu Beginn des Vietnamkrieges 17/18 Jahre alt waren. Mit 17 gab es keine Chance, eingezogen zu werden (korrigieren Sie mich, wenn ich mich irre), während es diese Chance mit 18 gab. Vorausgesetzt, die Chance war nicht vernachlässigbar und die Kriegserfahrung verändert die Menschen, impliziert dies, dass diese beiden Gruppen Jahre später sind unterschiedlich, obwohl sie nur 1 Jahr auseinander sind. Vielleicht sieht die Behandlung (Droge) so aus, als würde sie nicht wirken, aber weil nur die Gruppe mit Vietnam-Veteranen sie erhalten hat, kann dies tatsächlich an der Tatsache liegen, dass sie bei Menschen mit PTBS (oder anderen damit zusammenhängenden Faktoren) nicht wirkt Veteran sein). Mit anderen Worten, Sie müssen beide Gruppen (Behandlung und Kontrolle) bis auf die Behandlung identisch sein, um den Behandlungseffekt zu identifizieren.

Wenn Sie also nicht ausschließen können, dass es keine unbeobachteten Unterschiede zwischen den Gruppen gibt (aber wie machen Sie das, wenn es nicht beachtet wird?), Ist echte Randomisierung vorzuziehen.


Vielen Dank. Nettes Beispiel. (Ich habe vergessen, es Pseudo-Randomisierung zu nennen, ich habe das in der Frage bearbeitet).
Jeremy Miles

2
(+1) Als ich die Frage las, war Vietnam das erste Beispiel, das mir sofort einfiel. Es war amüsant zu sehen, dass Sie den gleichen Kurs eingeschlagen hatten. Ich nehme an, es ist die naheliegendste Wahl angesichts des angegebenen Alters der Probanden, obwohl das Alter in den frühen bis mittleren 60er Jahren etwas näher liegt.
Kardinal

Entschuldigung für Off-Topic-Ping: Es gibt einen Vorschlag von Meta, [randomized-experiment] als Synonym für das Tag [random-allocation] zu verwenden ( stats.meta.stackexchange.com/a/4651 ). Sie haben genug Reputation in diesem Tag, um für diesen Vorschlag hier zu stimmen: stats.stackexchange.com/tags/random-allocation/synonyms - es werden jetzt 4 Upvotes benötigt, um durchzugehen. Wenn Sie mit dem Vorschlag nicht einverstanden sind, kommentieren Sie Meta, um zu erklären, warum. Ich werde diesen Kommentar bald löschen. Prost.
Amöbe sagt Reinstate Monica

18

Es ist eine gute Übung konträre Ansichten von Zeit zu Zeit aufrecht zu erhalten, so ich beginnen lassen , indem Sie ein paar Gründe , bieten sie für diese Form von Pseudo-Randomisierung. Grundsätzlich unterscheidet es sich kaum von jeder anderen Form der systematischen Probenahme, z. B. bei der Entnahme von Proben von Umweltmedien an Feldpunkten oder bei der Probenahme aller anderen Bäume in einem Obstgarten, weshalb diese Probenahme möglicherweise vergleichbare Vorteile bietet .

Die Analogie hier ist perfekt: Das Alter wurde von Jahr zu Jahr "gerastert", beginnend mit dem Ursprung Null, und die Zuordnung zu den Gruppen wechselte sich entlang dieses (eindimensionalen) Rasters ab. Einige Vorteile dieses Ansatzes sind die Gewährleistung einer breiten, gleichmäßigen Verteilung der Probe über das Feld oder den Obstgarten (oder in diesem Fall über das Alter), wodurch Einflüsse auf den Ort (oder die Zeit) ausgeglichen werden. Dies kann besonders nützlich sein, wenn die Theorie nahelegt, dass der Ort der vorherrschende Faktor bei der Variation der Reaktion ist. Darüber hinaus werden die Daten bis auf wirklich winzige Stichproben so analysiert, als obEs handelte sich um eine einfache Zufallsstichprobe, die relativ wenig Fehler einführt. Darüber hinaus ist eine gewisse Randomisierung möglich: Im Feld können wir den Ursprung und die Ausrichtung des Gitters zufällig auswählen. Im vorliegenden Fall können wir zumindest randomisieren, ob es sich bei den geraden Jahren um Kontrollpersonen oder Behandlungspersonen handelt.

Ein weiterer Vorteil der Rasterabtastung ist die Erkennung lokalisierter Abweichungen. In der Praxis wären dies "Taschen" ungewöhnlicher Reaktionen. Statistisch können wir sie als Manifestationen räumlicher Korrelation betrachten. Wenn in der gegenwärtigen Situation die Wahrscheinlichkeit besteht, dass in einem relativ engen Altersbereich ungewöhnliche Reaktionen auftreten, ist das Gitterdesign eine ausgezeichnete Wahl, da ein rein randomisiertes Design zufällig große Alterslücken innerhalb einer der Gruppen aufweisen kann. (Ein besseres Konzept könnte jedoch darin bestehen, eine Schichtung vorzunehmen: Verwenden Sie die Altersgleichheit, um zwei analytische Schichten zu bilden , und teilen Sie die Patienten dann unabhängig voneinander in Kontroll- und Behandlungsgruppen ein.)

9mit für das Experiment wichtigen Faktoren in Verbindung gebracht werden. Dies macht die Besorgnis in der Frage weniger als hypothetisch: Es ist real. An dieser Stelle stellen die vorherigen Antworten in diesem Thread die zusätzlichen Gedanken dar, die ich gerne machen würde. Daher werde ich anhalten und Sie einladen, sie erneut zu lesen.


(+1) Insbesondere für das aufgestellte Gegenargument.
Kardinal

13

Ich bin damit einverstanden, dass Ihr Beispiel ziemlich harmlos ist, aber ...

Wenn die beteiligten Agenten (entweder die Person, die die Intervention ausführt, oder die Personen, die die Intervention erhalten) Kenntnis von dem Zuweisungsschema erhalten, können sie davon Gebrauch machen. Eine solche Selbstauswahl sollte ziemlich offensichtlich sein, warum sie bei den meisten experimentellen Entwürfen problematisch ist.

Ein Beispiel, das mir in der Kriminologie bekannt ist, sieht so aus. Das Experiment sollte die abschreckende Wirkung einer Nacht im Gefängnis nach einem häuslichen Streit testen und den Täter lediglich auffordern, für die Nacht abzureisen. Die Beamten erhielten eine Broschüre mit Blättern, und die Farbe des aktuellen Blatts oben sollte angeben, wie der Täter behandelt wurde. in dem besonderen Vorfall sollte erhalten.

Was am Ende passierte, war, dass die Beamten das Studiendesign absichtlich missachteten und ein Blatt wählten, das auf persönlichen Vorlieben beruhte, was dem Täter angetan werden sollte. Es ist nicht ungewöhnlich zu vermuten, dass in Ihrem Beispiel zumindest ein ähnliches jahrelanges Fudging möglich ist.


Nettes Beispiel, danke, aber ein Teil der Argumentation war, dass das Fudern viel schwieriger war - sie konnten nicht behaupten, dass das Blatt (sagen wir) gelb war, weil ich das Geburtsdatum überprüfen und sehen kann, ob sie richtig zugeordnet wurden.
Jeremy Miles

3
Ich stimme @JeremyMiles zu, es ist jedoch nur ein weiterer Grund für doppelblinde randomisierte Studien. Es ist lediglich ein beabsichtigtes Argument gegen die Pseudo-Randomisierung - dass es einfacher ist, die beabsichtigte Behandlung zu umgehen als die tatsächliche Randomisierung. (Mein Beispiel ist eigentlich kein Beispiel für Pseudo-Randomisierung, aber es veranschaulicht den Punkt kurz und bündig.)
Andy W

Nun, das hängt davon ab, wie die (wahre) Randomisierung durchgeführt wurde - die an der Studie beteiligten Personen haben dies teilweise getan, um Probleme mit der Subversion zu vermeiden. Wenn Sie die tatsächliche Randomisierung verwenden, müssen Sie gute Aufzeichnungen führen, um sicherzustellen, dass die Person, die die Randomisierung bestimmt, mit der Person, die die Behandlung durchführt, kommuniziert und die Person, die die Behandlung durchführt, das Richtige tut. Wenn sie in Ihrem Beispiel die Hausnummer (etwa) verwendet hätten, hätten die Beamten es möglicherweise schwerer gehabt, zu untergraben, obwohl dies nicht zufällig war.
Jeremy Miles

1
Entschuldigung für Off-Topic-Ping: Es gibt einen Vorschlag von Meta, [randomized-experiment] als Synonym für das Tag [random-allocation] zu verwenden ( stats.meta.stackexchange.com/a/4651 ). Sie haben genug Reputation in diesem Tag, um für diesen Vorschlag hier zu stimmen: stats.stackexchange.com/tags/random-allocation/synonyms - es werden jetzt 4 Upvotes benötigt, um durchzugehen. Wenn Sie mit dem Vorschlag nicht einverstanden sind, kommentieren Sie Meta, um zu erklären, warum. Ich werde diesen Kommentar bald löschen. Prost.
Amöbe sagt Reinstate Monica

0

Eine vollständige Randomisierung auf der Grundlage der zufälligen Verteilung ist nicht vorhersehbar. In Ihrem Fall ist bekannt, ob ein Fall vor der Bestätigung der Berechtigung der Intervention oder der Kontrolle zugeordnet wird.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.