Befehlszeilentool zum Durchsuchen von docx-Dateien


9

Gibt es ein Befehlszeilentool zum Durchsuchen einer docx-Datei per Text? Ich habe es versucht grep, aber es funktioniert nicht mit docx, obwohl es gut mit txt- und xml-Dateien funktioniert. Ich könnte das docx zuerst in txt konvertieren, aber ich würde ein Tool bevorzugen, das direkt mit docx-Dateien arbeitet. Ich brauche das Tool, um unter Cygwin zu arbeiten.

OP-Bearbeitung: Später fand ich heraus, dass der einfachste Weg, um das grep zu erreichen, darin besteht, diese docx in txt zu konvertieren und sie dann zu grep.



Ich habe den DOS-Teil losgeworden, da das hier nicht zum Thema gehört
Michael Mrozek

Antworten:


3

Ich kenne mehrere Indizierungswerkzeuge, die Word-Dokumente unterstützen. Mit solchen Tools können Sie Dokumente indizieren und dann effizient nach Wörtern im Index suchen. Sie erlauben keine Volltextsuche.


1

DOCx ist komprimiert und kein Textformat. Was Sie also brauchen, ist zuerst ein Konverter . Danach können Sie den findBefehl für die konvertierten Dateien verwenden.


Oder Sie können ein Suchwerkzeug verwenden, das komprimierte Dateien lesen kann. In deinem letzten Satz hast du wohl gemeint grep?
Gilles 'SO - hör auf böse zu sein'

@ Gilles - Sehen Sie sich den Originaltitel der Frage an, bevor Michael sie bearbeitet hat. Dies schien eine Frage zu DOS zu sein (und ich habe sie als nicht thematisch gekennzeichnet).
Nils

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.