Entfernen Sie doppelte Nachrichten aus Maildir


10

Ich habe eine Reihe doppelter Nachrichten im Maildir meines IMAP-Servers. Was ist der beste Weg, um sie zu entfernen?

Einige relevante Punkte:

  • Shared Message-ID ist normalerweise eine ausreichend gute Definition für Duplikate. Ein winziges Skript, das alle bis auf eine der doppelten Nachrichten entfernt, würde funktionieren.
  • Manchmal ist es notwendig, Duplikate zu finden, die auf gemeinsam genutzten Nachrichtentexten basieren. Was ist eine vernünftige Definition von hier geteilt? Bitweises Äquivalent? Was ist mit seltsamen Unterschieden beim Zeilenumbruch, Escapezeichen und Zeichenkodieren?
  • Manchmal gibt es einen bedeutenden Unterschied zwischen "doppelten" Nachrichten. Was ist der beste Weg, um die Unterschiede in Sätzen von "doppelten" Nachrichten zu überprüfen? Diffs?

Antworten:



3

Für generische Dateien unter Linux verwende ich fdupes-Utils, um doppelte Dateien zu entfernen. Ich fand, dass es auch für Maildir-Nachrichten funktioniert.


1
fdupes scheint nur für exakte Duplikate zu funktionieren, während das OP (implizit) nach komplexeren Duplikationsmustern fragt. Eine Nachricht, die aufgrund .forwardoder aus irgendeinem Grund zweimal zugestellt wird, hat leicht unterschiedliche Überschriften. Während die Nachricht selbst ein Duplikat ist, sind die beiden Dateien, die die beiden Kopien enthalten, möglicherweise nicht vorhanden.
Tripleee

0

Gnome's Evolution [ein grafischer Mail-Benutzeragent] verfügt über eine integrierte Funktion zum Entfernen doppelter Mail. Wie auf dieser Hilfeseite erläutert , läuft es auf Folgendes hinaus:

  1. Wählen Sie die verdächtigen Nachrichten (oder nur alle Nachrichten) aus.
  2. Gehen Sie zum Menü Nachrichten und wählen Sie Doppelte Nachrichten entfernen .

Voilà.

PS Evolution kann lokal (MailDir, MH, Mbox) oder über IMAP auf Ihre Nachrichten zugreifen.


0

Das Beste, was ich heute gefunden habe, ist Kevin Deldyckes Maildir-Deduplikat .

  • Der X-MIMETrackHeader wird standardmäßig ignoriert und die Header mit dem verglichenSHA224 Digests .
  • Duplikate werden automatisch gelöscht, ohne dass eine Bestätigung angefordert wird. Es gibt jedoch einen Trockenlaufmodus, in dem in der Vorschau angezeigt wird, welche Duplikate gelöscht werden.

Ich wette, jemand könnte aus Rick Sanders ' delIMAPdups.pl , einem Teil seiner IMAP-Tools , etwas Besonderes machen .


maildir-deduplicate ist an einen neuen Ort umgezogen, also habe ich den Link aktualisiert. Ihre Informationen sind jedoch nicht mehr aktuell.
Adam Spiers

Ich habe dies aktualisiert, damit es keine irreführenden veralteten Informationen mehr gibt.
Adam Spiers
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.