Ich frage mich, wie eine instrumentelle Variable die Auswahlverzerrung bei der Regression angeht.
Hier ist das Beispiel, an dem ich kaue: In Mostly Harmless Econometrics diskutieren die Autoren eine IV-Regression in Bezug auf Militärdienst und Einkommen im späteren Leben. Die Frage ist: "Steigert oder verringert der Militärdienst die zukünftigen Einnahmen?" Sie untersuchen diese Frage im Kontext des Vietnamkrieges. Ich verstehe, dass der Militärdienst nicht zufällig zugewiesen werden kann und dass dies ein Problem für kausale Schlussfolgerungen ist.
Um dieses Problem anzugehen, verwendet der Forscher den Entwurf der Berechtigung (wie in "Ihre Entwurfsnummer heißt") als Instrument für den tatsächlichen Militärdienst. Das macht Sinn: Der Vietnam-Entwurf hat zufällig junge amerikanische Männer dem Militär zugewiesen (theoretisch - ob die Wehrpflichtigen tatsächlich meine Frage berührt haben). Unsere andere IV-Bedingung scheint solide zu sein: Entwurfsberechtigung und tatsächlicher Militärdienst sind stark positiv korreliert.
Hier ist meine Frage. Es scheint, als würden Sie sich selbst auswählen: Vielleicht können reichere Kinder aus dem Dienst in Vietnam aussteigen, selbst wenn ihre Entwurfsnummern genannt werden. (Wenn das nicht wirklich der Fall war, tun wir es für meine Frage so). Wenn diese Selbstauswahl eine systemische Verzerrung in unserer Stichprobe erzeugt, wie geht unsere instrumentelle Variable mit dieser Verzerrung um? Müssen wir unseren Rückschlussbereich auf "die Arten von Menschen beschränken, die dem Entwurf nicht entkommen konnten"? Oder rettet die IV irgendwie diesen Teil unserer Schlussfolgerung? Wenn jemand erklären könnte, wie das funktioniert, wäre ich sehr dankbar.