Open Source bevorzugt, aber nicht notwendig.
Ich habe Adobe Acrobat 8 und mag die OCR-Funktion, mit der im Wesentlichen eine unsichtbare Ebene mit OCR-Text auf ein gescanntes Dokument gelegt werden kann. Auf dem Bildschirm wird also das gescannte Originaldokument angezeigt, das Ergebnis kann jedoch durchsucht werden.
Was ich suche, ist eine Möglichkeit, diesen Prozess zu automatisieren. Ich habe derzeit einige Skripte, die wir zum Verarbeiten und Archivieren gescannter Dateien verwenden, und suche nach etwas, das ich direkt in diesen Stapelprozess einbinden kann, um OCR auf ähnliche Weise wie mit Acrobat durchzuführen.
Alle Vorschläge willkommen, danke!