Bild in Text konvertieren


8

Ich habe ein gescanntes Bilddokument von der Bank erhalten und möchte es in ein normales Textdokument mit Bildern in Ubuntu konvertieren.

Gibt es ein Werkzeug dafür?

Antworten:


15

Es gibt eine Reihe von OCR- Readern für Linux, die von Bild zu Text konvertieren können. Sehen Sie sich die folgenden Optionen an:

Alle oben genannten Elemente mit Ausnahme von ocropus sind im Ubuntu-Repository in einem gleichnamigen Paket enthalten.

Verschiedene Reader unterstützen unterschiedliche Bildformate, sodass Ihre Optionen möglicherweise durch das Dateiformat Ihres Dokuments eingeschränkt sind. Alternativ können Sie das Konvertierungswerkzeug von ImageMagick verwenden, um das Format zu ändern, wenn Sie einen bestimmten OCR-Reader verwenden möchten.

Angepasst von meiner Antwort hier .


0

Sie müssen zuerst "tesseract-ocr" auf Ihrem Linux-Computer installieren.

sudo apt-get install tesseract-ocr

Sie können es manuell über die CLI tun oder ich habe PHP-Code für das gleiche gemacht, Sie können es verwenden, wenn Sie wollen.

Hinweis: Um diesen Code ausführen zu können, sollte der Befehl exec in der php.ini aktiviert sein

<?php
//IMAGE TO TXT Conversion
    $input_file = $_REQUEST['input_file'];
    $out = explode(".",$input_file);

    $output_file = $out[0]."_".$out[1];
    $output_file_name  =    $output_file.".txt";

    echo "<br />----IMAGE To TXT conversion Started-----</br />";
    echo  exec('tesseract '.$input_file.' '.$output_file);
    echo "<br />----TXT conversion Done-----</br />";

    echo "<br /><b>Please Check----->".$output_file.".txt</b><br />";
    echo "Click <a target='_blank' href='".$output_file_name."'>Here </a>to view it<br />"; 
?>

Legen Sie diesen Code in den Stammordner und greifen Sie über den Browser darauf zu.

z.B :

http://yourserver.com?input_file=1.png

Hinweis: Die 1.png- Datei sollte in Ihrem aktuellen Verzeichnis vorhanden sein.

Ich habe keine Rechte zum Hochladen von Bildern. Ich habe dieses Bild als Referenz verwendet: http://plone.org/documentation/kb-old/copy_of_ocr-in-plone-using-tesseract-ocr/phototest.gif/image_preview

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.