Wie "steuern" Sie einen Faktor / eine Variable?


19

Meines Erachtens kann "Kontrolle" in der Statistik zwei Bedeutungen haben.

  1. Kontrollgruppe: In einem Experiment wird das Mitglied der Kontrollgruppe nicht behandelt. Bsp .: Placebo vs Droge: Sie geben Drogen an eine Gruppe und nicht an die andere (Kontrolle), was auch als "kontrolliertes Experiment" bezeichnet wird.

  2. Steuerung für eine Variable: Methode zum Herausfiltern des Effekts einer bestimmten unabhängigen Variablen. Einige der anderen Namen, die diesen Techniken gegeben werden, sind "Bilanzieren", "Konstanthalten", "Kontrollieren für", einige Variablen. Zum Beispiel: In einer Fußballstudie (wie oder nicht wie) möchten Sie möglicherweise die Auswirkung des Geschlechts herausfiltern, da wir der Meinung sind, dass das Geschlecht Voreingenommenheit hervorruft, d. H., Männer mögen es möglicherweise mehr als Frauen.

Meine Frage bezieht sich also auf Punkt (2). Zwei Fragen:

Wie "kontrollieren" Sie "/" berücksichtigen "Variablen im Allgemeinen? Welche Techniken werden verwendet? (In Bezug auf die Regression, ANOVA-Framework).

Ist im obigen Beispiel die zufällige Auswahl von Mann und Frau eine Kontrolle? Das heißt, ist "Zufälligkeit" eine der Techniken zur Steuerung anderer Effekte?


3
In Bezug auf Regression und ANOVA bedeutet das Steuern einer Variablen normalerweise, dass die Variable in das Modell aufgenommen wurde.
Glen

Wie Glen sagt, ist die Aufnahme in das Modell der richtige Weg. Die Randomisierung wird jedoch verwendet, um eine Verzerrung durch Effekte zu verhindern, die nicht im Modell enthalten sind. Sobald ein Design erstellt wurde, wird häufig ein Gegengewicht zwischen den Personen hergestellt, um sicherzustellen, dass in jeder Behandlung etwa die gleiche Anzahl von Personen jedes Geschlechts vorkommt. Das Problem, sich ausschließlich auf Randomisierung und Gegengewicht zu verlassen, besteht darin, dass sie diese Verzerrung in Varianz umwandeln und es daher schwieriger ist, zu beobachten, welche Ihrer Faktoren aktiv sind.
neverKnowsBest

Antworten:


16

Controlling bedeutet, wie bereits gesagt, in der Regel, eine Variable in eine Regression einzubeziehen (wie von @EMS ausgeführt, garantiert dies keinen Erfolg, er verlinkt darauf ). Es gibt bereits einige häufig gestellte Fragen und Antworten zu diesem Thema, wie zum Beispiel:

Die akzeptierten Antworten auf diese Fragen sind alle sehr gute Behandlungen der Frage, die Sie innerhalb eines Beobachtungsrahmens (ich würde sagen Korrelationsrahmen) stellen. Weitere solche Fragen finden Sie hier .

Wenn Sie Ihre Frage jedoch speziell innerhalb eines experimentellen oder ANOVA-Frameworks stellen, können weitere Überlegungen zu diesem Thema angestellt werden.

Innerhalb eines experimentellen Rahmens steuern Sie für eine Variable, indem Sie Einzelpersonen (oder andere Beobachtungseinheiten) auf die verschiedenen experimentellen Bedingungen randomisieren. Die zugrunde liegende Annahme ist, dass als Konsequenz der einzige Unterschied zwischen den Bedingungen die experimentelle Behandlung ist. Bei korrekter Randomisierung (dh, jeder Mensch hat die gleiche Chance, sich in jedem Zustand zu befinden) ist dies eine vernünftige Annahme. Darüber hinaus können Sie nur durch Randomisierung kausale Schlussfolgerungen aus Ihrer Beobachtung ziehen, da nur so sichergestellt werden kann, dass keine anderen Faktoren für Ihre Ergebnisse verantwortlich sind.

Es kann jedoch auch erforderlich sein, Variablen innerhalb eines experimentellen Rahmens zu steuern, und zwar dann, wenn ein weiterer bekannter Faktor vorliegt, der diese abhängige Variable ebenfalls beeinflusst. Um die statistische Aussagekraft zu verbessern, kann es eine gute Idee sein, diese Variable zu kontrollieren. Das übliche statistische Verfahren hierfür ist die Analyse der Kovarianz (ANCOVA), bei der grundsätzlich auch nur die Variable zum Modell hinzugefügt wird.

Jetzt kommt der springende Punkt : Damit ANCOVA vernünftig ist, ist es absolut entscheidend, dass die Zuordnung zu den Gruppen zufällig ist und dass die Kovariate, für die es gesteuert wird, nicht mit der Gruppierungsvariablen korreliert.
Dies wird leider oft ignoriert, was zu nicht interpretierbaren Ergebnissen führt. Eine wirklich lesbare Einführung in genau dieses Thema (dh wann man ANCOVA benutzt oder nicht) gibt Miller & Chapman (2001) :

Trotz zahlreicher technischer Behandlungen an vielen Orten bleibt die Analyse der Kovarianz (ANCOVA) ein weithin missbrauchter Ansatz zur Bewältigung substanzieller Gruppenunterschiede bei potenziellen Kovariaten, insbesondere in der psychopathologischen Forschung. Veröffentlichte Artikel kommen zu unbegründeten Schlussfolgerungen, und einige statistische Texte vernachlässigen das Thema. Das Problem mit ANCOVA in solchen Fällen wird besprochen. In vielen Fällen gibt es kein Mittel, um das oberflächlich ansprechende Ziel zu erreichen, reale Gruppendifferenzen einer potenziellen Kovariate zu "korrigieren" oder "zu kontrollieren". In der Hoffnung, den Missbrauch von ANCOVA einzudämmen und eine angemessene Verwendung zu fördern, wird eine nichttechnische Diskussion angeboten, in der eine in Lehrbüchern und anderen allgemeinen Präsentationen selten artikulierte inhaltliche Verwechslung hervorgehoben wird, um die bereits verfügbaren mathematischen Kritiken zu ergänzen.


Miller, GA & Chapman, JP (2001). Missverständnisanalyse der Kovarianz. Journal of Abnormal Psychology , 110 (1), 40–48. doi: 10.1037 / 0021-843X.110.1.40


Um den Punkt auf dieser Frage zu betonen (der sehr oft wiederholt wird), ist es gut zu bedenken, dass die bloße Einbeziehung einer Variablen in ein Modell nicht garantiert wird, um ihre Wirkung zu "kontrollieren", selbst unter extrem strengen Annahmen über das Wesen der Variablen monoton bezogen auf die abhängige Variable. Siehe den Artikel, der in meinem anderen Kommentar verlinkt ist.
17.

1
@EMS Guter Punkt. Ich habe einen Warnhinweis und Ihren Link zum Textanfang hinzugefügt. Fühlen Sie sich frei, meinen Text zu bearbeiten, wenn Sie glauben, dass es mehr gibt, um hinzuzufügen.
Henrik

0

Um eine Variable zu kontrollieren, können Sie zwei Gruppen in Bezug auf ein relevantes Merkmal ausgleichen und dann den Unterschied in Bezug auf das von Ihnen untersuchte Problem vergleichen. Ich kann das nur mit einem Beispiel erklären, nicht formal, die B-Schule ist Jahre her, also da.

Wenn du sagen würdest:

Brasilien ist reicher als die Schweiz, weil Brasilien ein Nationaleinkommen von 3524 Milliarden US-Dollar und die Schweiz nur 551 Milliarden US-Dollar hat

Sie wären absolut korrekt, aber jeder über 12 mit einem vorübergehenden Wissen über die Welt würde vermuten, dass auch mit dieser Aussage etwas nicht stimmt.

Es wäre besser, die Bevölkerung der Schweiz auf die von Brasilien anzuheben und dann das Einkommen erneut zu vergleichen. Wenn die Bevölkerung in der Schweiz so groß wäre wie in Brasilien, würden sie folgendes Einkommen haben:

(210 Millionen / 8,5 Millionen) * 551 Milliarden Dollar = 13612 Milliarden Dollar

Damit sind sie mit 3524 Milliarden Dollar etwa viermal so reich wie Brasilien.

Und ja, Sie können auch den Pro-Kopf-Ansatz wählen, bei dem Sie die durchschnittlichen Einkommen vergleichen. Mit dem obigen Ansatz können Sie dies jedoch mehrmals anwenden.


1
Sie scheinen eher eine Form der Normalisierung als "Kontrolle" in dem Sinne zu beschreiben, wie es in der Frage gemeint ist.
Whuber

Eigentlich denke ich, das sind die gleichen. Wenn Sie nicht der Meinung sind, können Sie den Unterschied zwischen den beiden
erläutern

Ich glaube nicht, dass ich zu den anderen Antworten, die bereits in diesem Thread erscheinen, etwas hinzufügen muss.
whuber
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.