Ich habe eine Reihe von Dateien im DOC- Format, die in das PDF- Format konvertiert werden müssen. Ich benutze Ubuntu Linux.
Ich habe eine Reihe von Dateien im DOC- Format, die in das PDF- Format konvertiert werden müssen. Ich benutze Ubuntu Linux.
Antworten:
Alternative 1)
sudo apt-get install cups-pdf
Navigieren Sie dann zu System> Administration> Drucken, erstellen Sie einen neuen Drucker, legen Sie ihn als PDF-Dateidrucker fest und benennen Sie ihn als "pdf".
Dann renne:
oowriter -pt pdf your_word_file.doc
Jetzt finden Sie Ihre .pdf-Datei in ~ / PDF.
Alternative 2)
sudo apt-get install wv tetex-extra ghostscript
wvPDF test.doc test.pdf
Wenn das Paket tetex-extra in Ihrer Distribution nicht verfügbar ist, versuchen Sie es mit texlive-base plus texlive-latex-base:
sudo apt-get install wv texlive-base texlive-latex-base ghostscript
wvPDF test.doc test.pdf
oowriter -pt pdf your_word_file.doc
, ist der Drucker angegeben? Auf meinem Computer wird versucht, auf einem tatsächlichen Drucker anstelle eines PDF-Druckers zu drucken.
lowriter
lowriter --convert-to pdf your_word_file.doc
und standardmäßig wird im aktuellen Verzeichnis ausgegeben.
wvPDF
nicht in Lubuntu gefunden, wv
Version 1.2.9-4.2
ist installiert
Sie können verwenden:
oowriter -convert-to pdf:writer_pdf_Export doc_file.doc
oowriter
), lautet der Befehl swriter -convert-to pdf:writer_pdf_Export x.doc
.
writer -convert-to pdf:writer_pdf_Export file.docx
lowriter
anstelle von (oo | s |) writer verwenden. Dann arbeitete er mit den gleichen Argumenten wie oben: lowriter -convert-to pdf:writer_pdf_Export file.docx
. Die .pdfs werden im aktuellen Verzeichnis erstellt.
Wenn Sie X ausführen, können Sie dies über Open Office tun. Denken Sie daran, dass Open Office einige nette Makroskripte enthält, damit Sie es automatisieren können . Ähnliches können Sie mit AbiWord (AbiWord --to = pdf) tun.
Wenn Sie kein X haben, gibt es ein Anti-Wort, das nur den Text extrahiert - keine Formatierungen oder Grafiken. Es gibt auch wvWare, mit dem ich Bilder aus Doc-Dateien massenweise extrahiere, aber ich habe noch nie versucht, damit Doc-Dateien in PDFS zu konvertieren.
Oh und .docx-Dateien benötigen möglicherweise etwas anderes, aber da es sich nur um gezippte XML-Dateien handelt, sollte es nicht allzu schwierig sein, mit ihnen etwas Nützliches zu tun. Zum Extrahieren von Bildern in großen Mengen entpacken Sie sie einfach und kopieren das Bilderverzeichnis, aber ich habe sie unter Linux nie konvertieren müssen.
Beim Drucken in PDF gehen viele Dokumentmetadaten verloren (Titel, Urheberschaft, der Überschriftenbaum, der für die Navigation verwendet wird usw.).
Installiere unoconv , konvertiere mit:unoconv -fpdf file1.doc file2.doc…
unoconv --output output.pdf myHtmlPage.html
Ich würde versuchen, für Linux zu verwenden
$ /opt/openoffice.org3.1/program/python DocumentConverter.py test.odt test.pdf
Für Windows:
"C:\Program Files\OpenOffice.org 3.1\program\python" DocumentConverter.py test.odt test.pdf
Für PyODConverter muss OpenOffice.org als Dienst ausgeführt werden und den Port 8100 überwachen (standardmäßig). Der einfachste Weg, OpenOffice.org als Dienst zu starten, ist über die Befehlszeile:
"C:\Program Files\OpenOffice.org 3.1\program\soffice" -accept="socket,port=8100;urp;"
Open Office ist ein guter Weg, aber die Konvertierungstreue stimmt nicht immer.
Wenn Sie eine 100% Linux-Lösung suchen, ist dies der beste Weg. Wenn es Ihnen jedoch nichts ausmacht, eine einzelne Windows-Box zu verwenden und ein wenig Code zu schreiben, der mit Ihrem Linux-System kompatibel ist, lesen Sie diesen Beitrag .
Ich habe diesen Beitrag geschrieben, daher gelten die üblichen Haftungsausschlüsse.
Gemacht und gemacht
dopdf
in dem virtuellen Windowsdopdf
als Standarddrucker während der Installation.*.doc
im virtuellen Büro und drucken Sie es auf dem dopdf
virtuellen Drucker.*.pdf
Datei wird im My Documents
Ordner des virtuellen Windows angezeigt