Ich bin kürzlich auf Tesseract und OpenCV gestoßen . Es sieht so aus, als ob Tesseract eine vollwertige OCR-Engine ist und OpenCV als Framework zum Erstellen einer OCR-Anwendung / eines OCR-Dienstes verwendet werden kann.
Ich habe versucht, Tesseract für einige meiner Bilder zu verwenden, und die Genauigkeit scheint anständig zu sein. Später stieß ich auf ein sehr einfaches Tutorial zur Verwendung von OpenCV zur Durchführung von OCR mit Python und war beeindruckt. In wenigen Minuten war ich mit dem Training des Systems fertig und seine Genauigkeit war gut. Dieser Ansatz bedeutet natürlich, dass ich mein System mithilfe eines großen Trainingssatzes umfassend trainieren muss.
Meine spezifischen Fragen sind folgende:
- Wie wählt man zwischen Tesseract und OpenCV, um eine benutzerdefinierte OCR-App zu erstellen?
- Für Tesseract stehen Trainingsdatensätze für verschiedene Sprachen zur Verfügung. Hat OpenCV etwas Ähnliches, damit ich nicht von Grund auf neu anfangen muss, um OCR zu erreichen?
- Welches ist besser für eine kommerzielle Anwendung?
Irgendwelche Vorschläge?
OCR accuracy tests
und Sie finden einige Diagramme. Und wenn es um mobile Apps geht, verwenden die meisten von ihnen Tesseract. Wenn Sie sich jedoch die Mühe machen, einige davon herunterzuladen, werden Sie feststellen, dass die Ergebnisse etwas anders sind als die Versprechen. Normalerweise erstellen sie eine Videodemo in einer sorgfältig kontrollierten Umgebung und veröffentlichen sie auf Youtube. In freier Wildbahn erhalten Sie jedoch lustige Ergebnisse, wenn Sie eine Seite / ein Rezept / eine Karte / was auch immer scannen.