Wie kann man Indexing Service und MODI dazu bringen, Volltext über OCR zu erzeugen?


74

Ich habe den Indexdienst so konfiguriert, dass meine Dateien indiziert werden. Dazu gehören auch gescannte Bilder, die als hochauflösende TIFF- Dateien gespeichert sind. Ich habe auch MS Office 2003+ installiert und MS Office Document Imaging (MODI) korrekt konfiguriert, damit ich OCR für meine Bilder durchführen und sogar den OCR -Text in TIFFs einbetten kann .

Der Indizierungsdienst kann die TIFF- Indizes indizieren und finden , die manuell per OCR erstellt und mit Textdaten erneut gespeichert wurden (mithilfe des MS Document Imaging-Tools).

Es stellt sich heraus, dass Data Execution Prevention (DEP), das mit Windows XP SP2 bereitgestellt wird, MODI für bösartig hält und sich weigert, es seine Magie wirken zu lassen. Ich habe es geschafft, es zum Laufen zu bringen, indem ich DEP vollständig ausgeschaltet habe, aber ich fand diese Lösung unelegant.

Gibt es eine bessere Lösung, damit dies funktioniert, ohne DEP zu deaktivieren?


Ich habe das Gleiche versucht und einige der gleichen Einschränkungen getroffen. Außerdem fand ich MODI einfach zu langsam, um große Mengen von Bildern zu indizieren.
Leon Bambrick

3
Es gibt einen Hotfix , der dieses Problem zu beheben scheint.
Greg Hurlman

2
Ich kenne Ihre Umgebung nicht, aber anstatt mich auf eine gemischte Magie zu verlassen, die an vielen Gelenken brechen kann, sollten Sie sich für eine kleine App mit Tesseract OCR + Lucene entscheiden.
Tuncay Göncüoğlu

1
@ TuncayGöncüoğlu: Ja, ich bin längst von Modi und Indexing Service gewechselt. Ich behalte diese sehr alte Frage nur für historische Zwecke.
Ishmaeel

Antworten:


2

Deaktivieren Sie DEP für bestimmte Anwendungen.

Deaktivieren von DEP für bestimmte Anwendungen

  1. Klicken Sie auf Ihrem Windows-Computer auf die Schaltfläche Start und wählen Sie Computer> Systemeigenschaften> Erweiterte Systemeinstellungen.
  2. Wählen Sie im Dialogfeld Systemeigenschaften die Option Einstellungen.
  3. Wählen Sie die Registerkarte Data Execution Prevention.
  4. Wählen Sie DEP für alle Programme und Dienste außer den von mir ausgewählten aus.

Klicken Sie auf Hinzufügen und verwenden Sie die Suchfunktion, um zu der ausführbaren Programmdatei zu navigieren, die Sie ausschließen möchten, z. B. excel.exe oder word.exe.

Abhängig von Ihrer Windows-Version müssen Sie möglicherweise auf das Dialogfeld Systemeigenschaften zugreifen, indem Sie im Windows Explorer mit der rechten Maustaste auf Diesen PC oder Computer klicken.

  1. Klicken Sie im Windows Explorer mit der rechten Maustaste und wählen Sie Eigenschaften> Erweiterte Systemeinstellungen> Systemeigenschaften.
  2. Wählen Sie Erweitert> Leistung> Verhinderung der Datenausführung.
  3. Wählen Sie DEP für alle Programme und Dienste außer den von mir ausgewählten aus.
  4. Klicken Sie auf Hinzufügen und verwenden Sie die Suchfunktion, um zu der ausführbaren Programmdatei zu navigieren, die Sie ausschließen möchten.

Ausschließen:

C:\Program Files\Common Files\Microsoft Shared\MODI\11.0\MSPOCRDC.EXE  
C:\Program Files\Common Files\Microsoft Shared\MODI\11.0\MSPSCAN.EXE  
C:\Program Files\Common Files\Microsoft Shared\MODI\11.0\MSPVIEW.EXE

Zusätzliche Informationen, die nicht Teil der Antwort sind:

Informationen zum Abrufen und Installieren von MODI unter den neuesten Windows-Versionen finden Sie unter:
" Microsoft Office Document Imaging - Office 2010 bis Office 2016 "

Verweise:

" Programme von DEP ausschließen (Data Execution Prevention) "

" Fehler beim Scannen von Microsoft Office-Dokumenten "

MODI ist Teil von (kostenlos) " Microsoft SharePoint Designer 2007 ".


Vielen Dank, dass Sie sich die Zeit genommen haben, diese Anweisungen zusammenzustellen. Ich erinnere mich, dass ich damals nicht genau bestimmen konnte, was von DEP ausgeschlossen werden sollte. Ich akzeptiere die Antwort nur ungern, da ich keine Möglichkeit mehr habe, die Lösung zu überprüfen, aber ich habe sie positiv bewertet.
Ishmaeel

Vielen Dank. Vielleicht ist es richtig, wenn es ein Dutzend UpVotes bekommt. Die Links sagen, dass es für mehrere Personen funktioniert hat. Mein Ziel war es, die unbeantwortete Fragenwarteschlange zu bereinigen.
Rob
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.