Ich habe mehrere tausend Seiten gescannter Buchseiten. Jede Seite wird einzeln als JPG gespeichert. Die Schrift ist klar, aber die Schriftarten variieren und die Seiten enthalten Bilder und Illustrationen.
Ich muss eine Liste aller Wörter in jeder JPG-Datei erstellen. Gibt es ein Befehlszeilentool zum Scannen eines Bildes, in dem die angezeigten Wörter aufgelistet sind? Es muss nicht perfekt gescannt werden, sondern nur eine Schätzung.