Ich habe über 10000 Bilder, von denen etwa 2000 in anderen Formaten (wie JPEG, PNG, GIF) dupliziert wurden. Beide Zahlen nehmen täglich zu. Ich muss diese Duplikate löschen und dafür muss ich zuerst wissen, wie ich sie finde.
Mein erster Gedanke war, ein Bild Pixel zu überprüfen und andere Bilder zu finden, die die gleichen farbigen Pixel in den gleichen Koordinaten haben. Diese Option funktioniert jedoch nicht immer. Angenommen, ich suche nach einem Duplikat. Als durchsuchbares Objekt wähle ich eine 8-Bit-PNG-Datei. Es werden alle Duplikate dieses Bildes gefunden, aber nur das 8-Bit-PNG, manchmal 8-Bit-GIF und selten JPEG (wegen der algorithmischen Bilder, nehme ich an?).
Mein zweiter Gedanke war, alle diese Bilder zu duplizieren und sie in einer strengen zweifarbigen Palette (sagen wir schwarzweiß) neu einzufärben und den gleichen Scan wie oben angegeben durchzuführen. Wiederum ist das JPEG-Bild dem PNG- oder GIF-Format nicht zu 100% ähnlich (der gleiche Grund wie oben?).
Der dritte Gedanke war, den Prozentsatz zu verringern, um wie viel das Bild vertraut sein muss, und zu erhöhen, um wie viel die Farben variieren können, was zu einer unerwünschten Bildentfernung führt ...
Irgendwelche Gedanken?