Ich habe eine allgemeine methodologische Frage. Möglicherweise wurde es bereits beantwortet, aber ich kann den entsprechenden Thread nicht finden. Ich werde Hinweise auf mögliche Duplikate schätzen.
( Hier ist eine ausgezeichnete, aber ohne Antwort. Dies ist auch im Geist ähnlich, selbst mit einer Antwort, aber letztere ist aus meiner Sicht zu spezifisch. Dies ist auch nah, entdeckt nach dem Posten der Frage.)
Das Thema ist, wie eine gültige statistische Inferenz durchgeführt werden kann, wenn das Modell, das vor dem Anzeigen der Daten formuliert wurde, den Datenerzeugungsprozess nicht angemessen beschreibt . Die Frage ist sehr allgemein, aber ich werde ein bestimmtes Beispiel anbieten, um den Punkt zu veranschaulichen. Ich erwarte jedoch, dass sich die Antworten eher auf die allgemeine methodologische Frage konzentrieren als auf die Details des jeweiligen Beispiels.
Betrachten Sie ein konkretes Beispiel: In einer Zeitreiheneinstellung ich davon aus, dass der Datengenerierungsprozess mit . Ich möchte die Hypothese des Gegenstandes testen, dass . Ich habe dies in Bezug auf Modell gegossen , um ein funktionsfähiges statistisches Gegenstück zu meiner Subjekthypothese zu erhalten, und dies ist So weit, ist es gut. Wenn ich jedoch die Daten beobachte, stelle ich fest, dass das Modell die Daten nicht angemessen beschreibt. Nehmen wir an, es gibt einen linearen Trend, so dass der wahre Datenerzeugungsprozess y_t = \ gamma_0 + \ gamma_1 x_t + \ gamma_2 t + v_t \ tag {2} mit v_t \ sim iiN (0, \ sigma_v ^ 2) ist. ut∼i. ich. N(0,σ 2 u )dy
Wie kann ich eine gültige statistische Schlussfolgerung zu meiner Subjekthypothese ?
Wenn ich das ursprüngliche Modell verwende, werden seine Annahmen verletzt und der Schätzer von hat nicht die nette Verteilung, die er sonst hätte. Daher kann ich die Hypothese nicht mit dem Test testen . t
Wenn ich, nachdem ich die Daten gesehen habe, von Modell zu wechsle und meine statistische Hypothese von zu , sind die Modellannahmen erfüllt und ich sich einen gut erzogenen Schätzer für und können Sie ohne Schwierigkeiten mit dem Test . Der Wechsel von zu( 2 ) H 0 : β 1 = 1 H ' 0 : γ 1 = 1 γ 1 H ' 0 t ( 1 ) ( 2 )
wird durch den Datensatz informiert, an dem ich die Hypothese testen möchte. Dies macht die Schätzerverteilung (und damit auch die Inferenz) von der Änderung des zugrunde liegenden Modells abhängig, die auf die beobachteten Daten zurückzuführen ist. Die Einführung einer solchen Konditionierung ist eindeutig nicht zufriedenstellend.
Gibt es einen guten Ausweg? (Wenn nicht häufig, dann vielleicht eine Bayes'sche Alternative?)