Dies ist ein häufiges Problem bei der Berechnung von Wahrscheinlichkeiten für alle Arten von Modellen. Die üblichen Aufgaben bestehen darin, Protokolle zu bearbeiten und einen gemeinsamen Skalierungsfaktor zu verwenden, der die Werte in einen vernünftigeren Bereich bringt.
In diesem Fall würde ich vorschlagen:
Schritt 1: Wählen Sie eine ziemlich "typischen" , . Teilen Sie die Formel für Zähler und Nenner des allgemeinen Terms durch den Zähler für , um etwas zu erhalten, bei dem die Wahrscheinlichkeit eines Unterlaufs viel geringer ist.θθ0θ=θ0
Schritt 2: Arbeiten Sie an der Protokollskala. Dies bedeutet, dass der Zähler eine Exp der Summen der Unterschiede der Protokolle ist und der Nenner eine Summe der Exp der Summen der Unterschiede der Protokolle.
NB: Wenn eines Ihrer Ps 0 oder 1 ist, ziehen Sie diese separat heraus und führen Sie keine Protokolle dieser Begriffe. Sie sind einfach zu bewerten!
[Allgemeiner ausgedrückt kann diese Skalierung und das Arbeiten auf der Protokollskala so gesehen werden, dass sie eine Reihe von Protokollwahrscheinlichkeiten und dies tut: . Eine naheliegende Wahl für besteht darin, den größten Term 0 zu machen, wodurch wir : . Beachten Sie, dass Sie bei einem Zähler und einem Nenner für beide dasselbe , das dann abgebrochen wird. Oben entspricht dies der mit der höchsten Log-Wahrscheinlichkeit.]lilog(∑ieli)=c+log(∑ieli−c)clog(∑ieli)=maxi(li)+log(∑ieli−maxi(li))cθ0
Die üblichen Begriffe im Zähler sind tendenziell moderater, und daher sind in vielen Situationen sowohl der Zähler als auch der Nenner relativ vernünftig.
Wenn der Nenner verschiedene Größen enthält, addieren Sie die kleineren, bevor Sie die größeren addieren.
Wenn nur wenige Begriffe stark dominieren, sollten Sie Ihre Aufmerksamkeit darauf richten, die Berechnung für diese relativ genau durchzuführen.