Wie filtere ich Nachrichten mit animiertem Emoji im Betreff von Google Mail?


27

Ich habe meinen Spam-Ordner durchsucht (was ich selten tue, da Google Mail selten falsche Positive enthält) und mir ist etwas Interessantes aufgefallen:

Beispielliste von Spam-Nachrichten

Etwa die Hälfte der Nachrichten enthält mindestens ein animiertes Emoji im Betreff.

Keiner meiner Freunde würde diesen Mist gebrauchen. Keine gültige Firma, mit der ich Geschäfte machen würde, würde das jemals tun.

Wie kann ich einen Filter erstellen, um Nachrichten mit animiertem Emoji im Betreff möglicherweise automatisch zu löschen?

Unter Verwendung von Jamesmstones Hinweis unten habe ich eine Suche mit subject:=?UTF-8?und subject:"=?UTF-8?"und mehreren anderen Permutationen versucht, aber keine funktionierte.

Hier ist ein Beispielsatz mit Überschriften von einem dieser dampfenden Stapel:

Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <VivaLoan@mythirdxyz.xyz>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
        by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
        for <[redacted]@gmail.com>;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
       spf=pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) smtp.mailfrom=VivaLoan@mythirdxyz.xyz;
       dkim=pass header.i=@mythirdxyz.xyz;
       dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz; 
 i=@mythirdxyz.xyz; q=dns/txt; s=default; t=1453691229; 
 bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version : 
 Content-Type : Content-Transfer-Encoding : To : From : Subject : Date : 
 Message-ID : From : Subject : Date; 
 b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
 NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
 wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <VivaLoan@mythirdxyz.xyz>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <A112ED51-1674-4902-BF73-F2EBCBA42CAF@mythirdxyz.xyz>

3
Ich frage mich, ob sie goomoji...
Jamesmstone

@ Jamesmstone: Ich erwarte, dass sie sind.
Ale

Antworten:


9

Kurze Antwort

Erstellen Sie ein Skript mit der Methode GmailMessage :: getRawContent () von Google Apps Script, um die Nachrichten zu verarbeiten, anstatt Google Mail-Filter zu verwenden, die von der Google Mail-Suchfunktion abhängen, um nach den codierten Emojis in den ursprünglichen Nachrichten zu suchen .

Verwandte Fragen

Im Folgenden finden Sie Links zu Antworten auf ähnliche Fragen auf dieser Website, einschließlich Skripts, die die angegebene Methode verwenden.


2
Es ist erwähnenswert, dass ein Skript eine Nachricht nicht vollständig löschen kann. Das Beste, was es tun kann, ist, sie in den Papierkorb oder in einen Spam-Ordner zu verschieben. Und wenn solche Nachrichten bereits als Spam versendet werden, hat das Skript nur geringen Nutzen.

@Minestrone: Tatsächlich ist es möglich, eine Nachricht mithilfe eines Skripts vollständig zu löschen. Es sollte die Google Mail-API verwenden. Siehe developers.google.com/gmail/api/v1/reference/users/messages/… . Informationen zur Verwendung der Google Mail-API in Google Apps Script finden Sie unter developers.google.com/apps-script/guides/services/advanced .
Rubén

1
Ich bin nicht so sehr daran interessiert, die Nachricht tatsächlich zu löschen, sondern vielmehr daran, einen Weg zu finden, sie zu filtern. Vielleicht möchte ich ihnen einfach ein Etikett hinzufügen.
Ale

@Ale. Das habe ich angenommen, also habe ich die Verwendung der GMAIL-API im Hauptteil der Antwort nicht erwähnt. Andererseits habe ich zum Glück keine E-Mail mit Emojis im Betreff erhalten.
Rubén

4

Zu diesem Zweck habe ich ein Google Apps-Skript erstellt.

Es ist auf Github: https://github.com/spamzero/spamzero

Hiermit können Sie alle möglichen erweiterten Regeln erstellen, die Sie mit Ihrem Spam-Nachrichtenordner abgleichen können, sodass Nachrichten, die definitiv Spam sind, automatisch bereinigt werden.


1
Ihre Antwort ist besser, wenn Sie eine kurze Beschreibung des Skripts beifügen, in der hervorgehoben wird, wie Nachrichten mit animierten Emojis im Betreff behandelt werden können.
Rubén

4
Ich bin mit @ Rubén einverstanden, je mehr Informationen desto besser. Da es den Lesern ermöglicht, die Lebensfähigkeit von Antworten zu überprüfen, ohne zu viele Reifen zu überspringen.
Michelfrancis Bustillos

Danke für dieses Skript! Manchmal sind die hilfreichsten Lösungen diejenigen, die die täglichen Belästigungen wie animierten Spam reduzieren. Ich würde empfehlen, diesen Link für den Google Apps-Skript-Schnellstart in die Github-README- Datei aufzunehmen, damit Benutzer, die keine Erfahrung mit der Verwendung von Skripts haben, wissen, wie die Google Mail-API aktiviert und Protokolle angezeigt werden.
Dan

1

Dies ist nicht ganz das, wonach Sie fragen (Herausfiltern der Emojis selbst und nicht der Nachrichten mit Emojis), aber möglicherweise finden Sie einige der Inhalte nützlich, um einen besseren Nachrichtenfilter zu erstellen.

Es gibt jetzt ein Open-Source-User-Skript für Greasemonkey / Tampermonkey / Violentmonkey, um diese irritierenden visuellen Kakerlaken zu beseitigen (nur die Zeichen, nicht die Nachrichten selbst):

Google Mail-Betreffzeile Emoji Roach Motel

Wenn Sie sich den Quellcode dieses Skripts ansehen, werden Sie feststellen, dass es zwei allgemeine Arten von Emoji-Kakerlaken gibt, die Sie in E-Mails von missbräuchlichen Vermarktern finden (heutzutage leider auch von eBay und Amazon):

  • Auf HTML- Bildern basierende Kakerlaken (einschließlich der schrecklich animierten), auch bekannt als Goomoji

  • Unicode-Kakerlaken: Es gibt immer noch viele Emoji (und andere Unicode-Sequenzen, die Bilder erzeugen), die Spammer und andere frühere Vermarkter in E-Mail-Betreffzeilen verwenden und die von Google Mail nicht in HTML-Bilder konvertiert werden. In einigen Browsern werden diese fett und farbig dargestellt, was fast so schlecht ist wie Animationen. Browser könnten diese auch animieren, aber ich weiß nicht, ob dies der Fall ist. Diese Unicode-Sequenzen werden vom Browser als Unicode-Text angezeigt, sodass das genaue Erscheinungsbild (Farbe oder nicht, animiert oder nicht, ...) davon abhängt, welches Textwiedergabesystem der Browser verwendet. Das Erscheinungsbild eines bestimmten Unicode-Emoji hängt auch von den Unicode-Variationsselektoren und Emoji-Modifikatoren abdie in der Unicode-Codepunktsequenz in der Nähe angezeigt werden. Im Gegensatz zum bildbasierten Emoji-Spam können diese Sequenzen als Unicode-Text aus dem Browser in andere Apps kopiert und eingefügt werden.

Für den letzteren Typ enthält das Userscript einen regulären Ausdruck, mit dem die Unicode-Sequenzen erfasst werden, die von Marketingfachleuten möglicherweise missbraucht werden. Die Regex sieht in ES6 Javascript so aus (das UserScript übersetzt dies mit dem erstaunlichen ES6 Regex Transpiler in eine weithin unterstützte Regex vor ES6 ):

var re = /(\p{Emoji_Modifier_Base}\p{Emoji_Modifier}?|\p{Emoji_Presentation}|\p{Emoji}\uFE0F|[\u{2100}-\u{2BFF}\u{E000}-\u{F8FF}\u{1D000}-\u{1F5FF}\u{1F650}-\u{1FA6F}\u{F0000}-\u{FFFFF}\u{100000}-\u{10FFFF}])\s*/gu

// which includes the Unicode Emoji pattern from
//   https://github.com/tc39/proposal-regexp-unicode-property-escapes
// plus also these blocks frequently used for spammy emojis
// (see https://en.wikipedia.org/wiki/Unicode_block ):
//   U+2100..U+2BFF     Arrows, Dingbats, Box Drawing, ...
//   U+E000..U+F8FF     Private Use Area (gmail generates them for some emoji)
//   U+1D000..U+1F5FF   Musical Symbols, Playing Cards (sigh), Pictographs, ...
//   U+1F650..U+1FA6F   Ornamental Dingbats, Transport and Map symbols, ...
//   U+F0000..U+FFFFF   Supplementary Private Use Area-A
//   U+100000..U+10FFFF Supplementary Private Use Area-B
// plus any space AFTER the discovered emoji spam
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.