Es wird viel Spam durch den Filter auf dem Mailserver geleitet, den ich mit dem relativ einfachen Trick ausführe, mit wenigen Zeilen (unglaublich offensichtlichen) Gewichtsverlusts oder anderem Betrugstext oben zu beginnen, gefolgt von einem größeren Text aus der Programmierdokumentation - oder, was am schlimmsten ist, Text, der aus Stack Exchange stammt . Bestenfalls betrachtet Spamassassin dies als BAYES_50, und es kommt vor, dass der Rest der Nachrichten sorgfältig genug aufgebaut ist, dass sie keine anderen Auslöser treffen. (Zum Beispiel sind die Überschriften minimal und korrekt.) Oft stimmen die enthaltenen Auszüge eng genug mit meinen berechtigten Interessen überein, sodass die Nachricht insgesamt als BAYES_00 bewertet wird, da die sehr spammigen Token nur von saftigen Nuggets zur Lösung von Sysadmin-Problemen überwältigt werden.
Der obere Teil ist so offensichtlich Spam (und in der Tat sehr ähnlich zu zuvor empfangenen und als Spam-Nachrichten geschulten Nachrichten), dass ich irgendwie erstaunt bin, dass er durchkommt - aber klar ist es. Es scheint ein separater Durchgang zu sein, der die besten 25 (oder so) Zeilen der Nachricht erzielte und wog, dass das Problem schwer gelöst werden würde. Gibt es eine Möglichkeit, dies zu tun?
Mehrere Leute haben vorgeschlagen, benutzerdefinierte reguläre Ausdrücke zu schreiben. Ich möchte nicht darauf eingehen, da dies ein ständiger Verlustkampf ist. Es ist das, was die Leute getan haben, bevor die Bayes'sche Spam-Sortierung weit verbreitet war, und es war im Allgemeinen schrecklich. Kein Mensch kann mithalten . Es ist nicht viel effektiver als nur die Löschtaste für jede Spam-Nachricht zu drücken, und viel mehr Arbeit meinerseits.
Die Bayes'sche Spam-Filterung funktioniert. Es funktioniert sogar bei diesem Spam, wenn ich den Teil " über der Falte " aufspalte und nur diesen Teil analysiere, wobei der Köder / die Spreu entfernt ist. Die Frage ist: Wie kann ich Spamassassin dazu bringen?