Welche früheren Verteilungen könnten / sollten für die Varianz in einem hierarchischen Bayesisan-Modell verwendet werden, wenn die mittlere Varianz von Interesse ist?


16

In seiner viel zitierten Arbeit Prior-Verteilungen für Varianzparameter in hierarchischen Modellen (916 Zitate in Google Scholar) Gelman schlägt vor, dass gute, nicht informative Vorverteilungen für die Varianz in einem hierarchischen Bayes'schen Modell die Gleichverteilung und die Halb-t-Verteilung sind. Wenn ich die Dinge richtig verstehe, funktioniert dies gut, wenn der Standortparameter (z. B. der Mittelwert) von großem Interesse ist. Manchmal ist der Varianzparameter jedoch von großem Interesse, beispielsweise bei der Analyse menschlicher Antwortdaten von Zeitsteuerungsaufgaben ist die zeitliche Variabilität häufig das Maß des Interesses. In diesen Fällen ist mir nicht klar, wie die Variabilität hierarchisch mit zum Beispiel einheitlichen Verteilungen modelliert werden kann, da ich nach der Analyse die Glaubwürdigkeit der mittleren Varianz sowohl auf Teilnehmer- als auch auf Gruppenebene erhalten möchte.

Meine Frage lautet dann: Welche Verteilungen werden beim Aufbau eines hierarchischen Bayes'schen Modells empfohlen, wenn die Varianz der Daten im Vordergrund steht?

Ich weiß, dass die Gammaverteilung reparametrisiert werden kann, um durch Mittelwert und SD spezifiziert zu werden. Das folgende hierarchische Modell stammt beispielsweise aus Kruschkes Buch Doing Bayesian Data Analysis . Aber Gelman beschreibt einige Probleme mit der Gammaverteilung in seinem Artikel und ich wäre dankbar für Vorschläge von Alternativen, vorzugsweise Alternativen, die nicht zu schwierig sind, um in BUGS / JAGS zu arbeiten.

Bildbeschreibung hier eingeben

Antworten:


2

Ich bin nicht einverstanden mit der Art und Weise, wie Sie Gelman hinsichtlich der Wahl des Gamma-Parameters für die Skala interpretieren. Die Grundlage der hierarchischen Modellierung besteht darin, einzelne Parameter durch eine Struktur mit unbekannten Parametern (typischerweise Mittelwert und Varianz) auf einen gemeinsamen Parameter zu beziehen. In diesem Sinne erscheint mir die Verwendung einer Gamma-Verteilung für die individuelle Varianz (oder lognormal für den schwereren Schwanz), die auf die mittlere Varianz und ihre Streuung konditioniert ist (zumindest im Hinblick auf Gelman-Argumente), gültig.

Die Kritiker von Gelman über den Parameter Gamma für Skalierung äußern sich darüber, dass der Gamma-Wert verwendet wird, um die Jeffreys zu approximieren, indem Extremwerte für seinen Parameter festgelegt werden. Das Problem ist, dass der hintere Teil je nachdem, wie extrem diese Werte sind (was ziemlich willkürlich ist), sehr unterschiedlich sein kann. Diese Beobachtung macht die Verwendung dieses Prior ungültig, zumindest wenn wir keine Informationen haben, die im Prior festgelegt werden könnten. In der Diskussion sehe ich, dass das Gamma oder Inverse-Gamma niemals in Bezug auf den Mittelwert und die Abweichung von früheren Informationen oder von einer hierarchischen Struktur kalibriert wird. Die Empfehlung bezieht sich also auf einen Kontext, der sich von Ihrem Kontext unterscheidet. Wenn ich Ihren Zweck gut verstehe,


0

Kurz umreißt Gelman Probleme bei der Verwendung von Gamma-Verteilungen als vage (er verwendet das Wort nicht- informative ) Prioritäten für die Varianz. Im Gegenteil, Ihr Problem (und das Beispiel von Kruschke) scheint sich auf den Fall zu beziehen, in dem etwas Wissen über die Varianz existiert. Beachten Sie auch, dass das Bild der Verteilung der Varianz nicht flach ist.τich

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.