Wie man eine wirklich große HTML-Datei in Windows in PDF konvertiert [geschlossen]


7

Wir haben einige wirklich große HTML-Dateien (60-100 MB), die wir nicht zuverlässig in PDF konvertieren können.

Adobe Acrobat 9 stürzt ab - erreicht die 2-GB-Grenze für Anwendungen.

Open Office konvertiert, entfernt jedoch einige der Anker ().

ActivePDF Webgrabber stürzt ab.

Ist die Verwendung einer 64-Bit-Situation eine Option für diese Art von Dingen?

Ich sehe eine Reihe von Optionen, aber können sie besser als Adobe Acrobat 9 selbst sein?


Ziemlich gute Frage. Ich bin überrascht, dass dies geschlossen wurde.
Filip

Antworten:


5

Haben Sie wkhtmltopdf ausprobiert ? Es ist ein Befehlszeilenprogramm, das sehr einfach zu bedienen ist: wkhtmltopdf:

Installieren Sie wkhtmltopdf.
Gehen Sie zu Start -> Ausführen -> cmd

cd %Program Files%\wkhtmltopdf                     [press enter]
wkhtmltopdf.exe http://www.google.com google.pdf   [press enter]

Viola. google.com in google.pdf gespeichert.

Wenn ich mich richtig erinnere, funktioniert es ziemlich gut mit seiner PDF-Komprimierung


1
Funktioniert wirklich realistisch. Ich habe jedoch einige Fehler festgestellt (da der WebKit-Browser intern verwendet wird), wobei Tabellenüberschriften auf jeder PDF-Seite wiederholt wurden und Tabelleninhalte überschrieben wurden.
Filip

2

Die einzige Möglichkeit, dieses Problem zu lösen, bestand darin, HTML-Teile in PDF zu konvertieren und sie dann in Adobe Acrobat 9 zusammenzuführen.

Vielen Dank für Ihre Vorschläge. Wirklich interessantes Lernen über all diese netten Werkzeuge, die es gibt.



1

Sie können den PDF-Ersteller von FoxIt ausprobieren . Es ist nur 30 $ und sie haben eine Testversion, so dass Sie sehen können, ob es den Job machen wird. Ihr Leser ist meiner Meinung nach viel besser als der von Adobe, daher würde ich mir vorstellen, dass ihr Autor auf derselben Engine basiert.

Andere kostenlose Optionen, die Sie ausprobieren können, sind pdfcreator oder pdfill .


Danke, ich habe es versucht und nach 20 Stunden hat es den Job vom IE gemacht. Es wurden jedoch keine Links oder benannten Ziele erstellt, sodass dies kein Problem ist.
PeterStrange

1

Abhängig vom Anwendungsfall und wenn Sie den HTML-Code sogar in einem Viewer anzeigen könnten, könnten Sie an PrimoPDF denken . "Print-to-PDF" -Technologien sind möglicherweise nicht unbedingt ideal, können jedoch die Größenbelastung verringern.


PrimoPDF scheint für HTML mit etwa 3000 Seiten fehlzuschlagen.
Filip


1

Kennen Sie jemanden mit einem Mac? Wenn ja, lassen Sie sie es mit Vorschau öffnen und als PDF drucken.


1

Warum sind die HTML-Dateien so groß - sind sie Dateien, die Sie von Dritten erhalten, oder werden sie von etwas in Ihrer Organisation generiert? Könnten Sie ein Skript schreiben, um die HTML-Dateien in Abschnitte aufzuteilen? Haben sie Links zu Bildern? Könnte Ihr Skript die Qualität der Bilder verringern, um die Dateigröße zu verringern?


Es ist nur ein großes Dokument. Ich könnte es aufteilen, aber dann wäre die Verknüpfung ein Problem. Keine nennenswerten Bilder. :(
PeterStrange

Schreiben Sie ein Skript, um den HTML-Code mit Python und ReportLab selbst in PDF zu konvertieren?
David Hicks

1

Ich habe mit PDF995 ziemlich lange Webseiten als PDF gedruckt . Sicher nicht so groß wie du redest, aber es hat bei mir sehr reibungslos funktioniert.


1

Ich weiß, dass dies etwas ketzerisch sein könnte. Könnten Sie: Kopieren Sie es und fügen Sie es in Word ein. Verwenden Sie dann Word, um das HTML-Dokument zu erstellen. Verwenden Sie dann erneut Word, um das Dokument als PDF zu speichern. Nur eine Out-of-the-Box-Idee.


No Go. Offenbar zu groß für Word!
PeterStrange

1

Wenn Sie dieses Problem haben, versuchen Sie, HTMLTidy zu verwenden, um den HTML-Code zu bereinigen. Das hat die Größe um ein Vielfaches verringert und die Arbeit erleichtert!

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.