Überprüfen Sie die im PDF-Dokument verwendete Bildkomprimierung.


7

Ist es möglich herauszufinden, welche Komprimierungsalgorithmen für Bilder in einem PDF-Dokument verwendet wurden?


Wenn dies kostenpflichtige Software umfasst, verwenden Sie Acrobat Pro mit einem Objektinspektor.
usr2564301

Antworten:


7

Sie können pdfimages -list $fileauf Unix / Linux-Systemen verwenden, unter Windows können Sie möglicherweise Poppler installieren, um Zugriff auf das Tool zu erhalten (siehe https://en.wikipedia.org/wiki/Pdfimages ). Beachten Sie, dass dies eine Befehlszeilenanwendung ohne grafische Benutzeroberfläche ist. Die Ausgabe wird so aussehen

page   num  type   width height color comp bpc  enc interp  object ID x-ppi y-ppi size ratio
--------------------------------------------------------------------------------------------
   1     0 image    1240  1753  gray    1   8  image  no         8  0   150   150  301K  14%
   2     1 image    1240  1753  gray    1   8  image  no        22  0   150   150  281K  13%
   3     2 image    1240  1753  gray    1   8  image  no        36  0   150   150  336K  16%

Wo die encSpalte den Codierungsalgorithmus angibt, werden die möglichen Werte in der Manpage fürpdfimages aufgelistet .


1
Hinweis xpdf Webseite scheint Windows- und Mac-Binärdateien zu haben
Yorik

Übrigens war ich verwirrt, weil die Version von pdfimages, die ich hatte, nicht die Option "-list" enthielt. aus dem Projekt dreht wurde 2011 gegabelt zurück, so dass Sie pdfimages von Poppler, nicht Glyph & Cog des xpdf gehen wollen
Kavalkade

5

Art von.

Wenn Sie ein PDF in einem Texteditor öffnen, finden Sie für jedes Bild eine Zeile wie diese:

<</Subtype/Image/Length 7986/Filter/FlateDecode/BitsPerComponent 8/ColorSpace 34 0 R/Width 368/Height 110/Type/XObject>>stream
...

Dieses Bild verwendet den FlateDecode-Filter, "einen häufig verwendeten Filter, der auf dem zlib / deflate-Algorithmus basiert (auch bekannt als gzip, aber nicht zip)".

<</Subtype/Image/Length 892/Filter/DCTDecode/BitsPerComponent 8/ColorSpace 34 0 R/Width 44/Height 23/Type/XObject>>stream
...

Dieses Bild verwendet den DCTDecode-Filter, "einen verlustbehafteten Filter basierend auf dem JPEG-Standard".

Filterdefinitionen stammen von der Wikipedia-Seite Portable Document Format , auf der eine Liste aller unterstützten Filter aufgeführt ist.

Es kann jedoch schwierig sein, in einem Texteditor herauszufinden, welches Bild welches ist - die Objekte treten nicht unbedingt in Lesereihenfolge auf. Hier kann es hilfreich sein, das PDF in einzelne Seiten zu unterteilen.

Ich denke, Enfocus Pitstop Pro , ein Acrobat-Plugin, kann Ihnen diese Informationen (zusammen mit Abmessungen, Position, DPI usw.) in seinem Objektinspektor geben, aber ich habe sie nicht mehr und kann anscheinend keine Erwähnung dieser spezifischen finden Attribut in ihrem Handbuch.


1
Acrobat hat auch eine Vielzahl vordefinierter Preflight-Berichte. Nicht sicher, ob sie in der kostenlosen Version (?) Verfügbar sind
Horatio

Beachten Sie, dass PNG auch den DEFLATE-Komprimierungsalgorithmus verwendet (zlib ist eine Implementierung von DEFLATE). Sie können sich das erste Beispiel also in vielerlei Hinsicht wie ein PNG-Bild vorstellen, z. B. wie gut es komprimiert wird.
Thomasrutter

@horatio: Sie sind nicht. Auch die kostenlose Version heißt heutzutage "Adobe Reader" und nicht "Adobe Acrobat Reader".
e100

Ich dachte, es wäre Acrobat X oder AcrobatZ oder so :)
Horatio

1
Es war schon immer verwirrend. Es ist derzeit Adobe Reader X, Adobe Acrobat X und Adobe Acrobat X Pro. Was mich wirklich nervt, ist, wenn Leute auf "Adobe" verweisen, wenn sie eine einzelne App meinen.
e100
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.