Ich war am vergangenen Wochenende bei meinen Großeltern. Meine Großmutter zog dieses riesige Buch (~ 1400 Seiten) ihrer Familiengeschichte heraus, das bis etwa 1630 zurückreicht. Ich bin ein riesiger Nerd und dachte, es wäre klug, alle Informationen in einer Datenbank zu speichern und im Internet verfügbar zu machen. Ich kann mit der gesamten Webprogrammierung und den regulären Ausdrücken umgehen und was nicht, aber was ich nicht weiß, ist der beste Weg, um den Text vom Buch zum Computer zu bringen.
Ich weiß, dass eine Art OCR notwendig sein wird. Nach den wenigen Recherchen, die ich durchgeführt habe, scheinen meine Optionen wie folgt zu sein:
- Nehmen Sie mit einer Kamera ein Bild von jeder Seite auf und verarbeiten Sie die Bilder mit der OCR-Software
- Verwenden Sie einen Scanner, um jede Seite zu scannen, und verarbeiten Sie sie dann mit der OCR-Software
- verwendet eine Art von Handgerät, wie diese .
Hat jemand Ideen, wie man dieses Problem am besten angehen kann? Ich möchte das Buch nicht zerstören, da es meines Wissens nicht ersetzt werden kann. Dies ist wahrscheinlich das einzige Mal, dass ich jemals ein großes Buch scannen werde. Ich glaube also nicht, dass ich mehr als 250 US-Dollar für Geräte ausgeben möchte. Ich habe nichts gegen manuellen Aufwand (mir ist klar, dass dies höchstwahrscheinlich Monate dauern wird), aber ich würde gerne die effizienteste Methode finden, die möglich ist.
Anmerkung zum Buch: Es ist erst ungefähr 20 Jahre alt, also in ziemlich gutem Zustand. Es ist monochrom und die Seiten haben noch nicht begonnen, gelb zu werden. Da es jedoch so groß ist, mache ich mir Sorgen über mögliche Schatten, wenn der Text in die Nähe der Bindung gelangt.