Meines Erachtens ist der beste Weg, diese Aufgabe zu erfüllen, nicht die Verwendung eines Programms mit grafischer Benutzeroberfläche, sondern die Verwendung einer Sammlung von Bash-Skripten (wie in einer Unix / Linux-Umgebung). Wenn Sie also über grundlegende Programmierkenntnisse verfügen, sind Sie in der Lage, dies zu tun viel mehr Dinge zu tun, die ein GUI-Programm für Sie bereitstellen kann.
Sie können zuerst eine minimale Unix-ähnliche Befehlszeile installieren, die Sie verwenden können
Ich bevorzuge Cygwin, da es eine riesige Menge an Software-Paketen enthält.
Wenn Sie ein Bild aus einem PDF extrahieren möchten, installieren Sie auch pdfimages pdfimages ist ein Open-Source-Befehlszeilenprogramm zum Extrahieren von Bildern aus PDF-Dateien. Es ist als Teil von poppler-utils und xpdf-utils frei verfügbar und standardmäßig in vielen Linux-Distributionen enthalten.
$ pdfimages file.pdf foo
Diese Verwendung erzeugt eine Reihe nummerierter Bilder mit dem Präfix "foo".
Verwenden Sie tatsächlich $ mkdir temp $ mkdir temp / jpg
um einen temporären Ordner namens jpg in einem temporären Verzeichnis zu erstellen
$ pdfimages -j file.pdf temp/jpg/foo
Nehmen wir an, Sie haben jetzt mehrere fooXXXX.jpg-Bilder im temporären Ordner.
In deinem Fall hattest du schon mal fooXXXX.jpg Bilder.
Sie können jetzt eine PDF-Datei mit convert (eine Befehlszeile von ImageMagick) erstellen.
Laden Sie ImageMagick http://www.imagemagick.org/ herunter oder installieren Sie es mit Cygwin Package Manager
Schauen Sie sich die Dokumentation zu convert an (geben Sie "ImageMagick convert" in Ihre bevorzugte Suchmaschine ein)
Sie müssen also schreiben, um Ihre Bilder in eine PDF-Datei zu konvertieren
$ convert -compress jpeg temp/*.jpg my_output_file.pdf
Das ist alles ... ;-) aber diese Lösung kann erweitert werden ...
Stellen wir uns vor, die gescannten Bilder stammen aus einem Buch ... 1 Datei besteht aus 2 Seiten Ihres Buches ...
Wenn Sie also 10 Dateien haben ... Ihr Buch hatte 20 Seiten ... und Sie möchten, dass Ihr PDF auch 20 Seiten hat.
Sie müssen also das in einer Datei enthaltene Bild teilen, um 2 Dateien für jede Seite zu erstellen.
Angenommen, Ihre Datei ist temp / foo0001.jpg. Sie haben 2 Dateien temp2 / foo0001a.jpg (linke Seite) und temp2 / foo0001b.jpg (rechte Seite).
Erstellen Sie das Verzeichnis "temp2" (wo Ihre aufgeschlitzten Dateien abgelegt werden)
$ mkdir temp2
$ mkdir temp2/jpg
Erstellen Sie eine Datei mit dem Namen split_jpg_minw.sh mit einem Texteditor (Emacs, VI oder wenn Sie eine Windows-Anwendung bevorzugen, können Sie Notepad oder Notepad ++ verwenden).
minimal_width=1500
minimal_width_ignore=10
rm temp2/jpg/*.jpg
for f in temp/jpg/*.jpg
do
f2=$(basename $f)
read -r width height <<< $( convert $f -format "%w %h" info:)
width2=$(( ${width} / 2 ))
height2=${height}
if [ $width -gt $minimal_width ]; then
echo "split $f ${width}x${height} to 2 files ${width2}x${height2}"
convert $f -crop ${width2}x${height2}+0+0 +repage temp2/jpg/${f2%%.*}a.jpg
convert $f -crop ${width2}x${height2}+$width2+0 +repage temp2/jpg/${f2%%.*}b.jpg
else
if [ $width -gt $minimal_width_ignore ]; then # ignore if with < 10px
echo "copy $f ${width}x${height} (don't split because width<$minimal_width)"
cp $f temp2/jpg/$f2
else
echo "ignore $f ${width}x${height} width=$width<minimal_width_ignore=$minimal_width_ignore"
fi
fi
do
width = 1500px ist das Limit zum Teilen einer Datei (oder nicht)
- Eine Datei mit einer Breite über 1500px wird geteilt
- Eine Datei mit einer Breite unter 1500px wird nicht geteilt
Machen Sie dieses Skript ausführbar
$ chmod +x split_jpg_minw.sh
(Sie können die Tabulatortaste verwenden, um den Namen der Datei automatisch zu vervollständigen.)
Führen Sie das Skript aus
$ ./split_jpg_minw.sh
Die aufgeteilten Dateien befinden sich im Ordner temp2 / jpg
Generieren Sie die neue "geteilte" Datei.
$ convert -compress jpeg temp2/*.jpg my_output_file_splitted.pdf
Sie können Ihrer Kette viel mehr Optionen hinzufügen, um PDF-Dateien mithilfe von Bash-Skripten zu erstellen.
Es gibt keine Grenzen ... Sie müssen nur Skripten lernen (aber einige Codebeispiele sind manchmal viel nützlicher als Bücher)
Sie können beispielsweise Filter auf Ihre Bilder anwenden, bevor Sie die PDF-Datei generieren (um beispielsweise Moiré-Muster zu entfernen oder Rauschen zu reduzieren), indem Sie Befehlszeilentools wie G'MIC verwenden