PDF to Text Konverter [geschlossen]


9

Ich suche nach einer "Ein-Klick" -Methode, mit der ich JEDES PDF in einfachen Text konvertieren kann. Ideal unter OSX oder Linux.

Im Idealfall würde die Lösung OCR-Funktionalität enthalten, dies muss jedoch nicht unbedingt der Fall sein.

Die oberste Priorität ist etwas, das JEDE Datei OHNE Konfiguration aufnehmen kann.

Antworten:


23

Es gibt xpdf, das die pdftotextBinärdatei enthält.

Pdftotext konvertiert PDF-Dateien (Portable Document Format) in einfachen Text.

Unter Linux ist ein Installationsprogramm verfügbar. Es scheint, dass es auch im poppler-utilsPaket kommt. Unter OS X können Sie es mit Homebrew installieren (zuerst installieren) und dann verwenden

brew install homebrew/x11/xpdf

Dadurch werden die Quelldateien heruntergeladen und für OS X kompiliert. Danach verwenden Sie sie einfach wie folgt:

pdftotext your_pdf_file.pdf

Dadurch wird eine Nur-Text-Datei generiert. Es gibt auch einige Optionen. man pdftotextWeitere Informationen finden Sie hier.

Eine Alternative ist Poppler in OSX:

brew install poppler

in Debian und Freunden

apt-get install poppler-utils

Ab heute ist der Befehlbrew install homebrew/x11/xpdf
Diego Vieira

1
@DiegoVieira Danke. Das nächste Mal können Sie gerne eine Bearbeitung vorschlagen!
Slhck

Ein Vorteil bei der Verwendung von Poppler anstelle von xpdf / pdftotext?
Gonzalo Bahamondez

brew install Caskroom/cask/pdftotext
Hugo

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.