Ich muss eine große Anzahl von PDF-Dateien für den optischen Inhalt vergleichen. Da die PDF-Dateien auf verschiedenen Plattformen und mit verschiedenen Versionen der Software erstellt wurden, gibt es strukturelle Unterschiede. Beispielsweise:
- Das Aufteilen von Text kann unterschiedlich sein
- Die Schreibreihenfolge kann unterschiedlich sein
- Die Position kann einige Pixel unterschiedlich sein
Es sollte den Inhalt wie ein menschliches Volk vergleichen und nicht die interne Struktur. Ich möchte einen Test auf Regressionen zwischen verschiedenen Versionen des von uns verwendeten PDF-Generators durchführen.