Zusamenfassend:
Um zu wissen, ob es bereits komprimiert ist:
strings your.pdf | grep /Filter
Verwenden Sie QPDF , um eine PDF-Datei zu ( dekomprimieren)
qpdf --stream-data=compress your.pdf compressed.pdf
qpdf --stream-data=uncompress compressed.pdf uncompressed.pdf
Erläuterung:
Das Schlüsselwort "Filter" in einer PDF-Datei ist ein Indikator für die verwendete Komprimierungsmethode. Einige von ihnen sind:
CCITT G3 / G4 - wird für monochrome Bilder verwendet
JPEG - ein verlustbehafteter Algorithmus, der für Bilder verwendet wird
JPEG2000 - eine modernere Alternative zu JPEG, das auch zum Komprimieren von Bildern verwendet wird
Flate - wird zum Komprimieren von Text sowie von Bildern verwendet
JBIG2 - eine Alternative zu CCITT-Komprimierung für monochrome Bilder
LZW - wird sowohl zum Komprimieren von Text als auch von Bildern verwendet, wird jedoch durch Flate
RLE ersetzt - wird für monochrome Bilder verwendet
ZIP - wird für Graustufen- oder Farbbilder verwendet
(von hier kopiert ).
Angesichts der komplexen PDF-Dateistruktur wird jedoch ein Teil (oder "Stream") der PDF-Datei meistens bereits auf irgendeine Weise komprimiert (und beim Greifen / Filtern angezeigt), während dies bei einem anderen Teil nicht der Fall ist Es gibt keine JA / NEIN-Antwort auf die Frage, ob das PDF komprimiert ist.
ein Weg , dies zu überwinden wäre, die hinzuzufügen -c
Option zu grep, die die Anzahl der Vorkommen gibt, so dass man sehen konnte , relativ , wie gut es zusammengedrückt wird. Wenn zum Beispiel weniger als 10 zurückgegeben werden, ist es ziemlich unkomprimiert.strings
"large
.pdf" | grep -c /Filter
Eine weitere Eigenschaft in Bezug auf die Größe von PDFs ist, ob sie für den schnellen Zugriff optimiert wurden, wobei "optimierte" PDFs größer sind, um aus Wikipedia zu zitieren :
Es gibt zwei Layouts für die PDF-Dateien: nicht linear (nicht "optimiert") und linear ("optimiert"). Nicht lineare PDF-Dateien belegen weniger Speicherplatz als ihre linearen Gegenstücke, obwohl der Zugriff auf sie langsamer ist, da Teile der Daten, die zum Zusammenstellen von Seiten des Dokuments erforderlich sind, über die gesamte PDF-Datei verteilt sind. Lineare PDF-Dateien (auch als "optimierte" oder "weboptimierte" PDF-Dateien bezeichnet) sind so konstruiert, dass sie in einem Webbrowser-Plug-in gelesen werden können, ohne auf den Download der gesamten Datei zu warten, da sie in einer Datei auf die Festplatte geschrieben werden lineare (wie in der Seitenreihenfolge) Mode. PDF-Dateien können mit Adobe Acrobat oder QPDF optimiert werden.
Mit können Sie prüfen, ob das PDF optimiert ist pdfinfo your.pdf
.
file
. Es sollte zeigen, ob die Datei komprimiert ist oder nicht.