Problem
Ich schreibe eine R-Funktion, die eine Bayes'sche Analyse durchführt, um eine posteriore Dichte bei einem informierten Prior und Daten zu schätzen. Ich möchte, dass die Funktion eine Warnung sendet, wenn der Benutzer den vorherigen überdenken muss.
In dieser Frage möchte ich lernen, wie man einen Prior bewertet. Frühere Fragen befassten sich mit der Mechanik der Angabe informierter Prioritäten ( hier und hier ).
In den folgenden Fällen muss der Prior möglicherweise neu bewertet werden:
- Die Daten stellen einen Extremfall dar, der bei der Angabe des Prior nicht berücksichtigt wurde
- Fehler in Daten (z. B. wenn Daten in Einheiten von g angegeben sind, wenn der Prior in kg angegeben ist)
- Aufgrund eines Fehlers im Code wurde aus einer Reihe verfügbarer Prioritäten der falsche Prior ausgewählt
Im ersten Fall sind die Prioritäten normalerweise noch so diffus, dass die Daten sie im Allgemeinen überwältigen, es sei denn, die Datenwerte liegen in einem nicht unterstützten Bereich (z. B. <0 für logN oder Gamma). Die anderen Fälle sind Fehler oder Irrtümer.
Fragen
- Gibt es Probleme hinsichtlich der Gültigkeit der Verwendung von Daten zur Bewertung eines Prior?
- Ist ein bestimmter Test für dieses Problem am besten geeignet?
Beispiele
Hier sind zwei Datensätze, die schlecht mit einem übereinstimmen, da sie aus Populationen mit entweder (rot) oder (blau) stammen.
Die blauen Daten könnten eine gültige Kombination aus Prior und Daten sein, während die roten Daten eine vorherige Verteilung erfordern würden, die für negative Werte unterstützt wird.
set.seed(1)
x<- seq(0.01,15,by=0.1)
plot(x, dlnorm(x), type = 'l', xlim = c(-15,15),xlab='',ylab='')
points(rnorm(50,0,5),jitter(rep(0,50),factor =0.2), cex = 0.3, col = 'red')
points(rnorm(50,8,0.5),jitter(rep(0,50),factor =0.4), cex = 0.3, col = 'blue')