In diesem Fall gilt jede hintere Wahrscheinlichkeit
Dies ist eine interessante Frage, die in das Gebiet der Wahrscheinlichkeitsgrundlagen gelangt. Hier gibt es einige mögliche Ansätze, aber aus Gründen, auf die ich bald näher eingehen werde, ist der von mir bevorzugte Ansatz, eine breitere Definition der bedingten Wahrscheinlichkeit zu geben, die analog zu ihrer Definition beim Umgang mit kontinuierlichen Zufallsvariablen ist. (Details dieser Methode sind unten gezeigt.) In diesem speziellen Fall führt dies zu der Schlussfolgerung, dass der Bayesianer jeden hinteren Glauben an , und dies ergibt einen kohärenten Satz von Überzeugungen (ungeachtet dessen, dass sie ein Ereignis beobachtet haben, an das sie glauben Wahrscheinlichkeit Null haben).X
Der Vorteil dieses Ansatzes besteht darin, dass er eine genau definierte posteriore Verteilung ergibt und es den Bayesianern ermöglicht, ihre Überzeugungen unter der Bedingung zu aktualisieren, dass ein Ereignis beobachtet wird, dessen Auftreten mit der Wahrscheinlichkeit Null festgelegt wurde. Der hintere Teil wird im Wesentlichen willkürlich aktualisiert (jede hintere Wahrscheinlichkeit ist gleichermaßen kohärent), aber diese Flexibilität ist angesichts der aufgetretenen Ereignisse nicht überraschend. In diesem Fall könnten verschiedene Bayesianer mit denselben früheren Überzeugungen zu unterschiedlichen Schlussfolgerungen kommen, da sie alle ein Ereignis mit einer Wahrscheinlichkeit von null a priori beobachtet haben .
Bedingte Wahrscheinlichkeit für kontinuierliche Zufallsvariablen: Wenn es sich um kontinuierliche Zufallsvariablen handelt, wird die bedingte Wahrscheinlichkeitsfunktion durch die Radon-Nikodym-Ableitung definiert und erfordert im Wesentlichen nur, dass die Funktion das Gesetz der gemeinsamen Wahrscheinlichkeit erfüllt. Wenn und kontinuierliche Zufallsvariablen (anstelle von diskreten Ereignissen) in einem Wahrscheinlichkeitsraum wären, würden wir die bedingte Wahrscheinlichkeitsfunktion als jede nicht negativ messbare definieren Funktion, die die Integralgleichung erfüllt:XE(Ω,G,P)p(x|e)
p(x)=∫Ep(x|e) dP(e)for all x∈X∈G.
Da auch über das Radon-Nikodym-Derivat definiert wird, bedeutet dies implizit, dass jede nicht negative messbare Funktion sein kann, die die Integralgleichung erfüllt:p(x)p(x|e)
P(X∈A)=∫A∫Ep(x|e) dP(e) dxfor all A∈G.
Dies ergibt eine nicht eindeutige Lösung für die bedingte Wahrscheinlichkeitsfunktion, obwohl in der Praxis jede Lösung "fast sicher" äquivalent ist (dh sie unterscheiden sich nur bei einer Reihe von Ergebnissen mit der Wahrscheinlichkeit Null), so dass es kein Problem mit der Nicht-Eindeutigkeit gibt .
Definieren der bedingten Wahrscheinlichkeit für diskrete Ereignisse: Die Standarddefinition für die bedingte Wahrscheinlichkeit für diskrete Ereignisse ist die bekannte Verhältnisformel, wobei der Nenner die Wahrscheinlichkeit des konditionierenden Ereignisses ist. In dem Fall, in dem das Konditionierungsereignis eine Wahrscheinlichkeit von Null hat, ist dieses Objekt offensichtlich undefiniert. Die naheliegende Lösung besteht darin, die Definition analog zu der im kontinuierlichen Fall verwendeten Methode zu erweitern. Das heißt, wir definieren das bedingte Wahrscheinlichkeitspaar und als jedes Wertepaar zwischen Null und Eins, das die Gleichung erfüllt:P(X|E)P(X|E¯)
P(X)=P(X|E)×P(E)+P(X|E¯)×(1−P(E)).
In dem in der Frage angegebenen Fall haben wir die vorherige Annahme und die Stichprobenverteilung , was zu . Das Einsetzen dieser Werte in die obige Gleichung ergibt:P(X)=1P(E|X)=0P(E)=0
1=P(X|E)×0+P(X|E¯)×1.
Wir können sehen, dass diese Gleichung erfüllt ist, indem wir und eine beliebige . Somit kann die (hintere) bedingte Wahrscheinlichkeit kohärent ein beliebiger Wert zwischen Null und Eins sein. Wenn wir sagen, dass dies "kohärent" ist, meinen wir einfach, dass die hintere Wahrscheinlichkeit nicht mit den anderen im Problem festgelegten Wahrscheinlichkeiten (dh den vorherigen und den Stichprobenwahrscheinlichkeiten) unvereinbar ist.P(X|E¯)=10⩽P(X|E)⩽1P(X|E)
Warum dieser Ansatz am sinnvollsten ist: Es ist durchaus möglich, dass eine Bayes'sche Analyse die Beobachtung eines diskreten Ereignisses beinhaltet, für das in der vorherigen Verteilung eine Wahrscheinlichkeit von Null festgelegt wurde. Zum Beispiel legen wir in einem Standardmodell des Münzwurfs eine Bernoulli-Verteilung für das Ergebnis von Kopf / Zahl fest, aber es ist möglich, dass die Münze an ihrem Rand zur Ruhe kommt (also weder Kopf noch Zahl). Das Gehirn sollte in diesem Fall nicht explodieren, und daher obliegt es der Bayes'schen Argumentation, in diesem Fall eine genau definierte Vorgehensweise zu haben.
Der Hauptvorteil des von mir skizzierten Ansatzes besteht darin, dass er immer zu mindestens einem zulässigen Wert für die hintere Wahrscheinlichkeit führt (dh die hintere Wahrscheinlichkeit ist genau definiert ). Die hintere Wahrscheinlichkeit ist nicht eindeutig definiert, aber das ist ein natürlicher Ableger der Tatsache, dass es mehrere Werte gibt, die mit der Stichprobenbeobachtung mit Nullwahrscheinlichkeit gleichermaßen kohärent sind. Dieser Ansatz bedeutet, dass der Bayesianer frei ist, eine hintere Wahrscheinlichkeit festzulegen, und dies ist genauso kohärent wie jeder andere. (Denken Sie daran, dass wir, wenn wir hier "kohärent" sagen, von Kohärenz mit einer vorherigen Überzeugung sprechen, die eine Nullwahrscheinlichkeit für ein diskretes Ereignis festlegt, das tatsächlich stattgefunden hat. Die Kohärenz damit ist also keine hohe Messlatte!)
Dieser Ansatz hat einen weiteren großen Vorteil : Er ermöglicht es dem Bayesianer, seine Überzeugungen als Reaktion auf die Beobachtung eines Ereignisses zu aktualisieren, bei dem unter dem Vorgänger keine Stichprobenwahrscheinlichkeit bestand, und insbesondere kann der Bayesianer nun seine Überzeugungen überarbeiten damit sie diesem Ereignis keine Wahrscheinlichkeit mehr von Null zuschreiben . In dem Beispiel, das Sie geben, hatte der Bayesianer zuvor die Überzeugung, dass fast sicher wahr ist. Kaufen Sie dann ein Ereignis mit einer Stichprobenwahrscheinlichkeit von Null, das von diesem Ereignis abhängig ist. Jetzt kann der Bayesianer seine Überzeugung auf eine hintere Wahrscheinlichkeit für aktualisieren , die keine ist (und somit eine entsprechende hintere Wahrscheinlichkeit fürXX ˉ X.X¯das ist nicht Null). Im Wesentlichen kann der Bayesianer jetzt sagen: "Oh Scheiße! Das war ein dummer Prior! Lassen Sie mich meinen Glauben an dieses Ereignis so aktualisieren, dass es mit ziemlicher Sicherheit nicht mehr auftritt!" Darüber hinaus handelt es sich nicht um eine Ad-hoc- Änderung, sondern um eine legitime "kohärente" Aktualisierung nach dem Bayes-Theorem.