Ich habe die vielen hervorragenden Diskussionen auf der Website über die Interpretation von Konfidenzintervallen und Vorhersageintervallen gelesen, aber ein Konzept ist immer noch etwas rätselhaft:
Betrachten Sie das OLS-Framework und wir haben das angepasste Modell . Wir erhalten ein und werden gebeten, die Antwort vorherzusagen. Wir berechnen und geben als Bonus ein Vorhersageintervall von 95% um unsere Vorhersage an. A la Ermitteln einer Formel für Vorhersagegrenzen in einem linearen Modell . Nennen wir dieses Vorhersageintervall PI.
Welche der folgenden Aussagen (oder keine) ist die richtige Interpretation von PI?
- FürInsbesondere liegt mit einer Wahrscheinlichkeit von 95% innerhalb von PI.
- Wenn wir eine große Anzahl von s erhalten, deckt diese Prozedur zum Berechnen von PIs die tatsächlichen Antworten in 95% der Fälle ab.
Aus @ gungs Formulierung im linearen Regressionsvorhersageintervall geht hervor , dass ersteres zutrifft (obwohl ich sehr wohl falsch interpretieren könnte). Interpretation 1 erscheint mir in dem Sinne, dass wir Bayes'sche Schlussfolgerungen aus der frequentistischen Analyse ziehen, nicht intuitiv Wenn es richtig ist, ist es, weil wir die Realisierung einer Zufallsvariablen im Vergleich zur Schätzung eines Parameters vorhersagen ?
(Edit) Bonus Frage: Angenommen , wir wussten , was die wahre ist, dh der Prozess die Daten zu erzeugen, dann würden wir eine bestimmte Vorhersage in Bezug auf Lage , reden über Wahrscheinlichkeiten, da wir gerade bei der Suche ε ?
Mein letzter Versuch: Wir können ein Vorhersageintervall (unter Verwendung des Wortes sehr locker) in zwei Teile "begrifflich zerlegen": (A) ein Konfidenzintervall um die vorhergesagte mittlere Antwort und (B) eine Sammlung von Intervallen, die nur quantil sind Bereiche des Fehlerbegriffs. (B) Wir können probabilistische Aussagen treffen, vorausgesetzt wir kennen den wahren prognostizierten Mittelwert, aber insgesamt können wir Vorhersageintervalle nur als frequentistische CIs um prognostizierte Werte behandeln. Ist das etwas richtig?