Kevin Murphys Buch behandelt ein klassisches hierarchisches Bayes'sches Problem (ursprünglich diskutiert in Johnson and Albert, 1999, p24
):
Angenommen, wir versuchen, die Krebsrate in Städten zu schätzen . In jeder Stadt untersuchen wir eine Anzahl von Personen und messen die Anzahl der Personen mit Krebs , wobei die wahre Krebsrate in der Stadt ist.N i x i ∼ Bin ( N i , θ i ) θ i
Wir möchten die 's schätzen und gleichzeitig den Städten ermöglichen, statistische Stärke von datenreichen Städten zu leihen.
Zu diesem modelliert er so, dass alle Städte denselben Prior haben, sodass die endgültigen Modelle wie folgt aussehen:
wobei .
Der entscheidende Teil dieses Modells ist natürlich (ich zitiere), "dass wir aus den Daten ableiten , denn wenn wir es nur auf eine Konstante klemmen, wird das bedingt unabhängig sein und dort wird kein Informationsfluss zwischen ihnen sein ".θ i
Ich versuche dies in PyMC zu modellieren , aber soweit ich verstehe, brauche ich einen Prior für und (ich glaube, das ist oben). Was wäre ein guter Vorgänger für dieses Modell?b p ( η )
Falls es hilft, lautet der Code, wie ich ihn jetzt habe:
bins = dict()
ps = dict()
for i in range(N_cities):
ps[i] = pm.Beta("p_{}".format(i), alpha=a, beta=b)
bins[i] = pm.Binomial('bin_{}'.format(i), p=ps[i],n=N_trials[i], value=N_yes[i], observed=True)
mcmc = pm.MCMC([bins, ps])
wo ich glaube ich brauche einen Prior für a
und b
. Wie soll ich eine auswählen?