Ich habe einige eBooks / Papiere gesehen, die anscheinend von ihren Papierversionen gescannt wurden, aber der Text in den eBooks / Papieren kann erstaunlicherweise herauskopiert werden. Ich nehme an, dass die direkt gescannten Versionen von einer optischen Zeichenerkennungssoftware verarbeitet wurden.
Ich würde gerne wissen, welche Software für die optische Zeichenerkennung empfohlen wird. Vor allem die, die entweder für Ubuntu oder kostenlos sind? Wenn die für Windows weitaus besser sind, lassen Sie es mich bitte auch wissen.
Ich interessiere mich besonders für diese OCRs, die eine gescannte PDF-Datei als Eingabe akzeptieren und trotzdem eine andere PDF-Datei als Ausgabe erzeugen können, die der eingegebenen entspricht, deren Text jedoch kopierbar ist.
Danke und Grüße!
Bitte beschränken Sie eine Software pro Antwort