Ein Naive Bayes-Prädiktor macht seine Vorhersagen mit dieser Formel:
wobei ein normalisierender Faktor ist. Dies erfordert das Abschätzen der Parameter aus den Daten. Wenn wir dies mit Glättung tun, erhalten wir die SchätzungP ( X i = x i | Y = y ) k
wo gibt es mögliche Werte für . Mir geht es gut damit. Für den Prior haben wir jedoch
wo gibt es Beispiele in der Datenmenge. Warum glätten wir nicht auch den Prior? Oder besser gesagt, sie glätten wir die vor? Wenn ja, welchen Glättungsparameter wählen wir? Es scheint ein wenig albern, auch zu wählen , da wir eine andere Berechnung durchführen. Gibt es einen Konsens? Oder spielt es keine Rolle zu viel?