Welche Einstellungen müssen beim Erstellen von 7zip-Dateien verwendet werden, um beim Komprimieren von PDF-Dateien eine maximale Komprimierung zu erzielen?


15

Welche Einstellungen müssen beim Erstellen von 7zip-Dateien verwendet werden, um eine maximale Komprimierung zu erzielen? Ich komprimiere PDF-Dokumente mit gescannten Bildern. Ich denke über die Verwendung von LZMA2 nach, weiß aber nicht, was in Wörterbuchgröße, Wortgröße usw. eingestellt werden soll. Wären LZMA oder PPMd bessere Optionen?

Ich muss einige Dateien (~ 200MiB) über das Internet übertragen und die Upload-Geschwindigkeiten sind hier sehr langsam, daher möchte ich die Daten so weit wie möglich komprimieren. Die verbrauchte CPU-Zeit ist nicht sehr wichtig.

BEARBEITEN

Folgendes habe ich nach dem Testen verschiedener Komprimierungsmethoden erhalten:

Die unkomprimierte Größe betrug: 25,462,686B

Mein Prozessor ist Intel Core 2 Due T8100 und ich habe 4 GB RAM.

Die beste Komprimierung war mit PeaZip unter Verwendung des PAQ8O-Algorithmus. Die resultierende Dateigröße betrug 19.994.325 Byte. Die verwendeten Einstellungen waren Komprimierungsstufe: Maximum. Leider lag die Komprimierungsgeschwindigkeit bei etwa 5 KB / s, sodass die Datenkomprimierung länger als eine Stunde dauerte.

Als nächstes kam der experimentelle PAQ9O-Kompressor. Damit habe ich in ca. 3 Minuten Komprimierung 20.132.660B erreicht. Leider ist das Programm nur eine Befehlszeile, und nicht viele andere Programme verwenden diesen Komprimierungsalgorithmus. Mit den von mir verwendeten Einstellungen (a -9 -c) werden auch etwa 1,5 GB RAM verwendet.

Danach war 7-Zip 9.15 Beta (2010-06-20) mit LZMA2. Damit habe ich in ca. 3 Minuten 20.518.802B erreicht. Die verwendeten Einstellungen waren Wortgröße 273, Wörterbuchgröße 64 MB und ich habe 2 Threads für die Komprimierung verwendet.

Nun zurück zu meiner ursprünglichen Frage: In meinem Fall führte die Größe des Vollblocks zu keinen erkennbaren Ergebnissen. Das Erhöhen der Wortgröße führte zu einigen Ergebnissen. Der Unterschied zwischen der höchsten und der kleinsten Wortgröße betrug 115.260B. Ich glaube, dass solche Einsparungen die Anstrengungen rechtfertigen, die erforderlich sind, um zwei notwendige Klicks zu machen und die Wortgröße zu ändern.

Ich habe versucht, andere Komprimierungsalgorithmen zu verwenden, die von 7zip und PeaZip unterstützt werden, und sie erzeugen Dateien mit einer Größe von 19,8 MB bis 21,5 MB.

Letztendlich bin ich zu dem Schluss gekommen, dass beim Komprimieren von PDF-Dokumenten, die hauptsächlich Bilder enthalten, der Aufwand für die Verwendung exotischer Komprimierungsalgorithmen nicht gerechtfertigt ist. Die Komprimierung mit LZMA2 in 7zip führte in kürzester Zeit zu akzeptablen Ergebnissen.


Was ist anders an der Verwendung von PeaZip? Es ist nur ein GUI-Wrapper um 7zip und viele andere Tools
Cole Johnson

@Cole "Cole9" Johnson Nun, der Unterschied ist, dass ich in meinem Fall einige "andere" Tools von PeaZip verwendet habe, die zu diesem Zeitpunkt noch keine GUI hatten. Wenn ich mich richtig erinnere, bot nur PeaZip den PAQ8O-Algorithmus mit einer grafischen Benutzeroberfläche an.
AndrejaKo

Antworten:


8

Der Inhalt der PDF-Dateien (Text & Bilder) ist wahrscheinlich bereits komprimiert - daher ist es nicht viel wert, wenn Sie versuchen, sie erneut zu komprimieren.


3
Nun, nein. Ich habe ein wenig getestet und 24 MB PDF-Dateien mit den Standardeinstellungen komprimiert. Ergebnis war eine 19 MiB-Datei. In meinem Fall spielen diese 5 MiB in meinem Fall eine Rolle.
AndrejaKo

1
Sieht so aus, als hättest du recht. Ich konnte keine wesentlich besseren Ergebnisse als die 7zip-Standardeinstellungen erzielen, egal was ich tat. Ich bin immer noch davon überzeugt, dass eine gewisse Komprimierung besser ist als keine.
AndrejaKo

3
Wenn Sie so viel Speicherplatz sparen könnten, könnten Sie wahrscheinlich die PDF-Dateien selbst bearbeiten, um fast den gesamten Speicherplatz ohne 7-Zip zu sparen. Eine Reise durch das PDF-Optimierungsprogramm von Acrobat kann Wunder wirken.
Afrazier

Siehe die Antwort von usr - die in PDF (zlib) verwendete Komprimierung kann zurückgesetzt werden, um sie weiter zu komprimieren (und bei der Rekonstruktion erneut angewendet werden). Dies führt häufig zu einer Größenreduzierung von ~ 50%
schnaader

@schnaader: Das ist wirklich interessant. Ich habe Tools wie Acrobats PDF Optimizer und MuPDF gesehen und verwendet, um die PDFs zu ändern, während sie sichtbar bleiben. Es ist jedoch auch sehr wertvoll, sie verlustfrei so zu transformieren, und sie können mit großem Vorteil verwendet werden.
20.

7

Versuchen Sie es mit precomp - zuerst werden die bereits komprimierten Daten in Ihren PDF- Dateien dekomprimiert. Dann kann 7z seine Magie auf unkomprimierte Daten anwenden.

Probieren Sie auch nanozip aus, das sich als sehr effektiv und dennoch sehr effizient erwiesen hat (400 kb / s bei Komprimierungsraten von PAQ-Algorithmen).


2

7za a -t7z -mx-9 -mfb = 258 -mpass = 15 Dateiname.7z Unterverzeichnis

Passen Sie das erste Wort nach Bedarf für den Namen Ihrer ausführbaren Befehlszeile an und passen Sie die Teile nach "-mpass = 15" an, um Ihren Dateinamen und die darin enthaltenen Informationen anzupassen.

Diese Antwort ist nicht spezifisch für PDF-Dokumente.
Dies verwendet LZMA, nicht PPM. Ich habe mich von PPM ferngehalten, weil es zu viele Varianten gibt, die nicht mit anderen Varianten kompatibel sind. LZMA scheint stabiler zu sein, wobei die Kompatibilität allgemeiner unterstützt wird. Ich habe mich also gerade deshalb von PPM ferngehalten, weil ich der Meinung war, dass "der Aufwand für die Verwendung exotischer Komprimierungsalgorithmen nicht gerechtfertigt ist".


2
LZMA2 ist deutlich besser als LZMA, ist jedoch nur für den (effektiven) Einsatz auf 64-Bit-Systemen geeignet.
OMY

-3

Die lzma-Komprimierung ist die beste, da Sie eine sfx-Datei oder ein msi-Paket mit einer hohen Komprimierungsrate erstellen können. In Ihrem Fall komprimieren Sie keine große Datei, daher ist der Unterschied recht gering, insbesondere wenn die Datei komprimiert wurde, z. B .: mp3 oder png

try win arc es ist kostenlos und gibt ein gret Compression Ratio

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.