Ist es möglich herauszufinden, welche Komprimierungsalgorithmen für Bilder in einem PDF-Dokument verwendet wurden?
Ist es möglich herauszufinden, welche Komprimierungsalgorithmen für Bilder in einem PDF-Dokument verwendet wurden?
Antworten:
Sie können pdfimages -list $file
auf Unix / Linux-Systemen verwenden, unter Windows können Sie möglicherweise Poppler installieren, um Zugriff auf das Tool zu erhalten (siehe https://en.wikipedia.org/wiki/Pdfimages ). Beachten Sie, dass dies eine Befehlszeilenanwendung ohne grafische Benutzeroberfläche ist. Die Ausgabe wird so aussehen
page num type width height color comp bpc enc interp object ID x-ppi y-ppi size ratio
--------------------------------------------------------------------------------------------
1 0 image 1240 1753 gray 1 8 image no 8 0 150 150 301K 14%
2 1 image 1240 1753 gray 1 8 image no 22 0 150 150 281K 13%
3 2 image 1240 1753 gray 1 8 image no 36 0 150 150 336K 16%
Wo die enc
Spalte den Codierungsalgorithmus angibt, werden die möglichen Werte in der Manpage fürpdfimages
aufgelistet .
Art von.
Wenn Sie ein PDF in einem Texteditor öffnen, finden Sie für jedes Bild eine Zeile wie diese:
<</Subtype/Image/Length 7986/Filter/FlateDecode/BitsPerComponent 8/ColorSpace 34 0 R/Width 368/Height 110/Type/XObject>>stream
...
Dieses Bild verwendet den FlateDecode-Filter, "einen häufig verwendeten Filter, der auf dem zlib / deflate-Algorithmus basiert (auch bekannt als gzip, aber nicht zip)".
<</Subtype/Image/Length 892/Filter/DCTDecode/BitsPerComponent 8/ColorSpace 34 0 R/Width 44/Height 23/Type/XObject>>stream
...
Dieses Bild verwendet den DCTDecode-Filter, "einen verlustbehafteten Filter basierend auf dem JPEG-Standard".
Filterdefinitionen stammen von der Wikipedia-Seite Portable Document Format , auf der eine Liste aller unterstützten Filter aufgeführt ist.
Es kann jedoch schwierig sein, in einem Texteditor herauszufinden, welches Bild welches ist - die Objekte treten nicht unbedingt in Lesereihenfolge auf. Hier kann es hilfreich sein, das PDF in einzelne Seiten zu unterteilen.
Ich denke, Enfocus Pitstop Pro , ein Acrobat-Plugin, kann Ihnen diese Informationen (zusammen mit Abmessungen, Position, DPI usw.) in seinem Objektinspektor geben, aber ich habe sie nicht mehr und kann anscheinend keine Erwähnung dieser spezifischen finden Attribut in ihrem Handbuch.