Installieren Sie tesseract ocr 3 unter OSX


0

Ich versuche, Tesseract OCR unter OSX 10.6 zu installieren ...

Ich habe es geschafft, Leptonic (durch Herunterladen von src und Installieren mit ./configure; make; sudo make install) scheinbar ohne Probleme zu installieren - aber ich weiß nicht, wie ich es überprüfen soll.

Ich habe auch Tesseract OCR 3 (von Google Code mit ./runautoconf; ./configure; make; sudo make install) scheinbar ohne Probleme installiert - aber ich weiß auch nicht, wie ich das überprüfen soll.

Wenn ich renne tesseract input.jpg .bekomme ich eine Fehlermeldung ...

 bash-3.2$ tesseract ~/Desktop/DCIM/101_FUJI/DSCF1043.JPG . 
 Tesseract Open Source OCR Engine with Leptonica
 Error in pixReadStreamJpeg: function not present
 Error in pixReadStream: jpeg: no pix returned
 Error in pixRead: pix not read 
 Error in fopenReadStream: file not found 
 Error in pixRead: image file not found
 Image file ######
 Exif cannot be read! 

Ähnliche Fehler, wenn ich TIFF-Datei als Eingabe verwende.

Ich glaube, ich brauche einige Bibliotheken - Anweisungen für Ubuntu sagen, um libjpeg12-dev usw. zu installieren ...

Hat jemand Details, wie man Tesseract unter OSX installiert?

Antworten:


2

Installieren Sie macports: Download- und Installationsanweisungen finden Sie unter http://www.macports.org/ .

Aktualisieren Sie den Ports-Baum: sudo port selfupdate

Installieren Sie tesseract: sudo port install tesseract

Für den Tesseract-Port scheint es keine Variante zu geben, die JPEG unterstützt. Daher müssten Sie einen Grafikkonverter und ein Bildanpassungspaket (Helligkeit, Kontrast und Schärfe) installieren: sudo port install imagemagick

Konvertieren Sie Ihr JPEG in das TIFF-Format und führen Sie OCR mit tesseract aus: convert input.jpg input.tiff ; tesseract input.tiff ocr-text-ouput -l eng ; rm input.tiff

Der resultierende Text sollte in der Datei ocr-text-ouput.txt enthalten sein.

ps Sie können das Bild ein wenig anpassen, um eine potenziell bessere OCR-Erfahrung mit Konvertierungsoptionen wie diesen zu erzielen: convert -sharpen 1 -brightness-contrast 3X30 input.jpg input.tiff


Ich musste 'tesseract-eng' installieren, um Segmentierungsfehler 11
Ian

2

Ich verwende Homebrew unter OSX 10.7 und es war so einfach wie das Ausführen dieser beiden Befehle:

brew install leptonica
brew install tesseract

Dies installierte Leptonica 1.68 und Tesseract 3.01 mit ihren Abhängigkeiten


0

Eine Befehlslösung für mich arbeiten:

sudo brew install tesseract

Dadurch werden tesseract und alle Abhängigkeiten installiert. sudo notwendig für einige zwecke, wie jpeg paket verknüpfung.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.