Betrachten Sie einen Trainingsdatensatz , ein durch parametrisiertes Wahrscheinlichkeitsmodell und ein vorheriges P (\ theta) . Für einen neuen Datenpunkt x ^ * können wir P (x ^ *) berechnen mit:
- ein vollständig bayesianischer Ansatz: die posteriore Vorhersageverteilung
- die Wahrscheinlichkeit, die durch die maximale a posteriori- Schätzung parametrisiert wird : , wobei
Ist der vollständig bayesianische Ansatz immer "besser" als der MAP-Ansatz? Genauer gesagt, ist der MAP-Ansatz eine Annäherung an den Bayes'schen Ansatz in dem Sinne, dass wir hoffen, dass eine gute Annäherung an ?