Wie berechnet man die diskrete Intervallabdeckung?
Was ich kann:
Wenn ich ein kontinuierliches Modell hätte, könnte ich für jeden meiner vorhergesagten Werte ein 95% -Konfidenzintervall definieren und dann sehen, wie oft die tatsächlichen Werte innerhalb des Konfidenzintervalls liegen. Ich könnte feststellen, dass mein Konfidenzintervall von 95% in nur 88% der Fälle die tatsächlichen Werte abdeckte.
Was ich nicht kann:
Wie mache ich das für ein diskretes Modell wie Poisson oder Gamma-Poisson? Was ich für dieses Modell habe, ist wie folgt: Ich nehme eine einzelne Beobachtung (von über 100.000, die ich generieren möchte :)
Beobachtung #: (willkürlich)
Voraussichtlicher Wert: 1,5
Voraussichtliche Wahrscheinlichkeit von 0: .223
Voraussichtliche Wahrscheinlichkeit von 1: .335
Voraussichtliche Wahrscheinlichkeit von 2: .251
Voraussichtliche Wahrscheinlichkeit von 3: .126
Voraussichtliche Wahrscheinlichkeit 4: .048
Voraussichtliche Wahrscheinlichkeit von 5: .014 [und 5 oder mehr ist .019]
...(etc)
Voraussichtliche Wahrscheinlichkeit von 100 (oder einer ansonsten unrealistischen Zahl): .000
Istwert (eine Ganzzahl wie "4")
Beachten Sie, dass, obwohl ich oben Poisson-Werte angegeben habe, ein vorhergesagter Wert von 1,5 im tatsächlichen Modell unterschiedliche vorhergesagte Wahrscheinlichkeiten von 0,1, ... 100 über Beobachtungen hinweg haben kann.
Ich bin verwirrt von der Diskretion der Werte. Eine "5" liegt offensichtlich außerhalb des 95% -Intervalls, da es bei 5 und darüber nur 0,019 gibt, was weniger als 0,025 ist. Aber es wird viele 4er geben - einzeln sind sie innerhalb, aber wie bewerte ich gemeinsam die Anzahl der 4er angemessener?
Warum kümmert es mich?
Die Modelle, die ich betrachte, wurden dafür kritisiert, dass sie auf aggregierter Ebene genau sind, aber schlechte individuelle Vorhersagen liefern. Ich möchte sehen, wie viel schlechter die schlechten individuellen Vorhersagen sind als die vom Modell vorhergesagten inhärent breiten Konfidenzintervalle. Ich erwarte eine schlechtere empirische Abdeckung (z. B. 88% der Werte liegen innerhalb des 95% -Konfidenzintervalls), hoffe aber nur ein bisschen schlechter.