Angenommen, ich werde einige Proben aus einer Binomialverteilung erhalten. Eine Möglichkeit, meine Vorkenntnisse zu modellieren, ist eine Beta-Distribution mit den Parametern und . Soweit ich weiß, ist dies gleichbedeutend damit, in Versuchen "Köpfe" mal gesehen zu haben . Daher ist es eine gute Abkürzung, um die vollständige Bayes'sche Folgerung durchzuführen, als meinen neuen Mittelwert für die Wahrscheinlichkeit von "Köpfen" zu verwenden, nachdem ich Köpfe in Versuchen gesehen habe .β α α + β h + α hn
Angenommen, ich habe mehr als zwei Zustände, sodass ich einige Stichproben aus einer multinomialen Verteilung erhalten werde. Angenommen, ich möchte eine Dirichlet-Verteilung mit dem Parameter als Prior verwenden. Wieder als Verknüpfung kann ich dies als Vorwissen der Veranstaltung behandeln ‚s Wahrscheinlichkeit als äquivalent zu sein , und wenn ich Zeuge Ereignis mal in Versuchen mein hintern für wird .i α i ihnih+αi
Im Binomialfall stellt sich heraus, dass das Vorwissen über "Köpfe", die in Versuchen mal auftreten, gleichbedeutend ist mit "Schwänzen", die in Versuchen Zeiten auftreten . Logischerweise glaube ich nicht, dass ich die Wahrscheinlichkeit von "Köpfen" besser kennen kann als von "Schwänzen". Dies wird jedoch mit mehr als zwei Ergebnissen interessanter. Wenn ich einen 6-seitigen Würfel gesagt habe, kann ich mir vorstellen, dass mein Vorwissen über Seite "1" 10 Einsen in 50 Versuchen und mein Vorwissen über Seite "2" 15 Zweien in 100 Versuchen entspricht.α + β β α + β
Nach all dieser Einführung ist meine Frage, wie ich solch asymmetrisches Vorwissen im multinomialen Fall richtig modellieren kann. Es scheint, als ob ich, wenn ich nicht aufpasse, leicht unlogische Ergebnisse erzielen kann, da die Gesamtwahrscheinlichkeit / -wahrscheinlichkeit nicht auf 1 summiert. Gibt es eine Möglichkeit, die Dirichlet-Verknüpfung weiterhin zu verwenden, oder muss ich dies insgesamt opfern und einige verwenden? andere vorherige Verteilung vollständig?
Bitte verzeihen Sie jegliche Verwirrung, die durch mögliche Missbräuche in der obigen Notation oder Terminologie verursacht wird.
If I have say a 6-sided die, I can imagine my prior knowledge of side "1" being equivalent to 10 ones in 50 trials and my prior knowledge of side "2" as being equivalent to 15 twos in 100 trials.
Gibt es einen besonderen Grund, warum Sie Ihre "äquivalenten Stichprobengrößen" für " " und " " (nämlich und ) nicht durch Verwendung des am wenigsten gemeinsamen Vielfachen vereinheitlichen möchten ? In diesem Fall ist und . 2 50 100 α 1 = 20 / 100 α 2 = 15 / 100