Wie extrahiere ich Text aus einer PDF-Datei, die nicht mit einem Index erstellt wurde? Es ist alles Text, aber ich kann nichts suchen oder auswählen. Ich verwende Kubuntu und Okular hat diese Funktion nicht.
Heute habe ich von unserem Lieferanten ein PDF erhalten, das mehrere gedruckte und gescannte Seiten mit Signaturen usw. enthielt. Ich habe es in Acrobat Reader DC geöffnet. Zu meiner Überraschung konnte der Text aus den offensichtlich gescannten Bildern ausgewählt und als Text kopiert werden. Siehe den Screenshot: Offensichtlich steckt etwas …
Dies wurde vor einem Jahr hier diskutiert: Stapel-OCR für viele PDF-Dateien (noch nicht OCR-fähig)? Gibt es eine Möglichkeit zum Stapeln von OCR-PDFs, die noch nicht OCR-fähig sind? Ich denke, dies ist der aktuelle Stand der Dinge, die sich mit zwei Problemen befassen: Stapel-OCR-PDFs Windows Acrobat - Dies ist die direkteste …
Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Super User. Geschlossen vor 4 Jahren . Ich habe ein PDF eines gescannten Buches. Ich suche nach einer kostenlosen Software, die OCR …
Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Super User. Geschlossen vor 4 Jahren . Oftmals stoße ich auf Bitmaps, die nur Textabsätze enthalten, und suchte nach einer Möglichkeit, die …
Evernote führt OCR für die Bilder durch, die Sie dort gespeichert haben. Gibt es eine Möglichkeit, das Volltextäquivalent für ein Bild in Evernote abzurufen, oder dient die Texterkennung nur zum Suchen?
Ich suche seit einiger Zeit bei Google, kann aber keine Antwort auf meine Frage finden. Ich habe unerwünschte OCR-Ebenen in einem Dokument, das ich kürzlich mit Adobe Acrobat gescannt habe. Es wurde nicht richtig OCRed und ich möchte einige Informationen redigieren, aber die OCR sorgt dafür, dass die gewünschten Informationen …
Ich war am vergangenen Wochenende bei meinen Großeltern. Meine Großmutter zog dieses riesige Buch (~ 1400 Seiten) ihrer Familiengeschichte heraus, das bis etwa 1630 zurückreicht. Ich bin ein riesiger Nerd und dachte, es wäre klug, alle Informationen in einer Datenbank zu speichern und im Internet verfügbar zu machen. Ich kann …
Dieses PDF wurde von Abbyy Finereader 10 erstellt: http://ebooks.zeitr.org/from_abbyy.pdf Sie können den ersten Satz kopieren und einfügen und erhalten dieses (sehr gute) Textergebnis: Der »Bund Deutscher Gymnastik-Vertrie« wurde am 20. November 1955 anläßlich einer Zusammenkunft der Leiterinnen und Leiter der privaten deutschen Gymnastik-Ausbildungsstätten. Nach einiger Verarbeitung mit Ghostscript 9.02 (64-Bit-Windows) …
Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Super User. Geschlossen vor 5 Jahren . Ich verwende die Google Desktop-Suche (ich bin unter Vista) und nicht alle meine PDF-Dateien werden …
Ich habe SimpleOCR verwendet , das eine schöne Benutzeroberfläche zum Korrigieren von Fehlern hat. Leider macht es viele Fehler! (und leidet unter anderen Fehlern und Einschränkungen) Auf der anderen Seite ist Tesseract genauer, hat aber überhaupt keine grafische Benutzeroberfläche. Meine Frage ist, gibt es ein kostenloses OCR-Programm für Windows, das …
Wie können Sie mit Microsoft Office Word 2010 (Beta) einen Scan und eine Zeichenerkennung starten? Ich kann anscheinend keine Option finden, um das Dokument in meinem Scanner direkt in ein 2010 Word-Dokument zu scannen. Ich habe die Installationseinstellungen für Office 2010 (Beta) überprüft und die OCR- Elemente sind installiert.
Die OCR-Verarbeitung braucht Zeit. Die Verwendung mehrerer CPU-Kerne würde die Verarbeitung beschleunigen. Acrobat 10 war keine Multithread-Anwendung . Wie wäre es mit Acrobat 11? Verwendet 11 standardmäßig OCR mit mehreren CPU-Kernen (falls verfügbar)? Wenn nicht, gibt es Problemumgehungen, z. B. Skripte, mit denen Acrobat 11 OCR mit mehreren CPU-Kernen ausführen …
Ich habe versucht, OCR auf mehreren gescannten Blättern mit Zahlen wie diesem Bild auszuführen (alle mit demselben Hintergrund, nur Ziffern): Aber alle Versuche sind gescheitert! Ich habe Offline-OCRs ausprobiert: gocr, tesseract und einige Online-OCRs; aber alles ist total gescheitert! Was sollte ich tun?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.