Als «ocr» getaggte Fragen

Bei der optischen Zeichenerkennung (OCR) werden Textbilder in Text konvertiert, der von Textverarbeitungsprogrammen usw. bearbeitet werden kann.

2
OCR in Word 2013
Word 2013 kann PDF-Dokumente naiv öffnen und bearbeiten (großes Plus meiner Meinung nach). Gibt es eine Möglichkeit, es auch mit OCR zu erledigen? Auf einem PDF, das hauptsächlich Bilder enthielt, wurden sogar die Teile, die reiner Text waren, als Bilder gespeichert. Gibt es eine Möglichkeit, dies zu korrigieren?


0
Wie komprimiere ich Tesseract-codierte PDFs, während ich eingebetteten Text aus OCR behalte?
Ich habe mit der Verwendung von Tesseract für die Texterkennung von PDFs experimentiert und es war meistens erfolgreich, insbesondere mit deutschen Fraktur-Texten (dem alten gotischen Druck), die Tools wie Adobe Acrobat nicht richtig erkennen können. Das Problem ist, dass die Ausgabedateien von Tesseract ziemlich groß sind und ich sie nach …

2
Kopieren Sie die PDF-Textebene in eine andere PDF-Datei
Angenommen, Sie haben 2 "gescannte" PDF-Dateien. Groß, aber ohne Textebene. Kleiner (mit Bildern von geringerer Qualität), aber mit korrekter Textebene. Beide Dateien enthalten gleiche Bilder, die sich nur durch ihre Komprimierung unterscheiden. Ziel ist es, die gleiche Textebene in das 1. PDF einzubetten . "Just OCR 1st file" ist keine …

0
OCR durch Einstellen der Schriftart
Ich habe einige Bilder mit Schriftarten wie Lucida Handwriting. Da diese kursiv sind, erkennt meine OCR-Software sie nicht richtig. Gibt es eine Möglichkeit, die Software wissen zu lassen, dass die Schriften in Bildern Lucida Handwriting ähneln? Wenn wir wissen, dass die Software Buchstaben aus der angegebenen Schriftkategorie verwendet, um Bilder …


3
Installieren Sie tesseract ocr 3 unter OSX
Ich versuche, Tesseract OCR unter OSX 10.6 zu installieren ... Ich habe es geschafft, Leptonic (durch Herunterladen von src und Installieren mit ./configure; make; sudo make install) scheinbar ohne Probleme zu installieren - aber ich weiß nicht, wie ich es überprüfen soll. Ich habe auch Tesseract OCR 3 (von Google …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.