Ich versuche, einen Ansatz zur Erkennung von Betrugsanzeigen auf meiner Website zu finden. Ich denke, das Problem hat viel mit der Erkennung von Spam-E-Mails zu tun (für die ein naiver Bayes-Klassifikator eine häufige Lösung ist), da viele der Signale, die auf einen Betrug hinweisen, im Text der Anzeige zu finden sind.
Es gibt jedoch bestimmte andere Informationen, die gute Betrugsindikatoren sein können, aber ich bin mir nicht sicher, ob / wie ein Bayes-Klassifikator sie verwenden könnte, da es sich eher um numerische Werte handelt (wobei Werte an den Extremen des Bereichs verdächtig sind) als einfache Binärwerte, die dem Vorhandensein oder Fehlen eines Wortes im Text entsprechen.
Beispielsweise ist bei vielen Betrugsanzeigen der Preis des Artikels sehr niedrig eingestellt (um viele Aufrufe zu erzielen). Daher möchte ich, dass ein niedrigerer als der normale Preis ein starker Indikator dafür ist, dass es sich bei der Anzeige möglicherweise um einen Betrug handelt.
Passt Bayes immer noch gut zu meiner Anforderung? Wenn nicht, können Sie dann einen anderen Ansatz empfehlen?