Ich habe über die Bayes'sche Spam-Filterung gelesen und glaube, ich verstehe die Theorie, aber ich verstehe einfach nicht, warum dieser Ansatz erforderlich ist, um die Wahrscheinlichkeit zu berechnen, dass eine Nachricht Spam ist, da sie ein bestimmtes Wort enthält.
Wenn wir eine Reihe von Nachrichten haben, die vom Benutzer bereits als "Spam" oder "Schinken" klassifiziert wurden, und eine neue Nachricht (die das ausgewählte Wort enthält) erhalten, die wir klassifizieren möchten, müssen wir die Zahl sicherlich nur teilen von Spam-Nachrichten, die das Wort enthalten, nach der Gesamtzahl der Nachrichten, die das Wort enthalten ... Warum alle Gleichungen?