So generieren Sie Trainingsdaten für OCR


7

Ich versuche, ein optisches Zeichenerkennungssystem zum Erkennen des Kennzeichens (indonesisches Kennzeichen) aufzubauen. Leider ist kein Trainingssatz verfügbar, aber ich habe die Schriftart gefunden. Ich versuche, die Trainingsdaten zu generieren, indem ich das Bild des Kennzeichens mit Kerneln zusammenfalte (etwas wie Gaußsche Unschärfe, Box-Unschärfe) mit Python, aber es ähnelt nicht echten Daten, hier ist die Schriftart wie folgt: Geben Sie hier die Bildbeschreibung ein

und ich möchte einen individuellen Brief generieren, der so aussieht:

plat kendaraan

Haben Sie eine Idee, wie Sie Trainingsdaten wie im obigen Bild generieren können? Vielen Dank


Was ist mit dem Erstellen eines Datensatzes? Wofür wird Ihr System verwendet? Können Sie unbeschriftete Daten leicht erhalten?
Martin Thoma

Es ist schwierig, einen Datensatz zu erhalten, selbst wenn der Datensatz nicht beschriftet ist. Der Datensatz sollte ein beschnittenes Bild des Autokennzeichen-Lizenzschreibens sein. Das System wird zum Lesen der Kennzeichen verwendet
Kiki Rizki Arpiandi,

Ich benutzte ein tiefes Faltungs-Neuronales Netzwerk zum Klassifizieren von Ziffern, eine Strichbreitentransformation zum Erkennen des Textes und eine k-Mittel-Clustering-Textsegmentierung
Kiki Rizki Arpiandi

Antworten:


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.