Antworten:
Die Lösung nutzt odt2txt
. Dieser Befehl wird nun von zwei verschiedenen Paketen bereitgestellt, nämlich einem odt2txt
, mit dem Sie installieren können
sudo apt-get install odt2txt
und durch das Paket unoconv
(das auch Befehlszeilenkonvertierungen zwischen mehr libreoffice-Formaten bietet), das von installiert wird
sudo apt-get install unoconv
Wenn Sie die beiden haben, können Sie mit dem alternativen Mechanismus zwischen ihnen wechseln :
sudo update-alternatives --config odt2txt
Wenn Sie das odt2txt
vom Paket bereitgestellte verwenden, verwenden odt2txt
Sie einfach
odt2txt file.odt
Wenn Sie das unoconv
mitgelieferte Paket verwenden, müssen Sie verwenden
odt2txt --stdout file.odt
Pipe sie, less
um eine weniger ähnliche Erfahrung zu haben ( odt2txt file.odt | less
)
Beachten Sie --stdout
, dass das von Unoconv bereitgestellte Paket das Ergebnis in eine aufgerufene Datei schreibt , wenn Sie die Option nicht verwenden file.txt
.
Das von der Distribution vorgeschlagene Paket scheint das aus dem odt2txt
Paket zu sein (es hat im alternativen System eine höhere Standardpriorität). Sicher hat es weniger Abhängigkeiten.
unoconv
Wie ich festgestellt habe, besteht das Problem darin , dass eine ältere Version von Libre Office installiert werden soll, wenn eine neuere installiert ist. Deshalb bleib bei sudo apt install odt2txt
.
update-alternatives
, danke.
Sie können Text ohne spezielles Hilfsprogramm durchsuchen. ODT-Datei ist ein umbenanntes Zip-Archiv. Entpacken Sie es und Sie werden mehrere Dateien sehen. Eine davon content.xml
enthält den gesamten Text und ist more
oder less
lesbar.
odt2txt file.odt
Der Quellcode und die Compilebale Working Zip können hier heruntergeladen werden:
https://github.com/dstosberg/odt2txt/
oder installiert von
sudo apt-get install odt2txt
Sie können nicht cat
oder less
oder more
eine ODT-Datei, weil es eine Binärdatei ist. Tatsächlich handelt es sich - wie bereits erwähnt - um ein umbenanntes ZIP-Archiv, sodass Sie die content.xml
Datei extrahieren müssen. Dies bedeutet jedoch, dass es sich um ein XML-Dokument handelt. Sie müssen es also als solches verarbeiten, um die Informationen daraus zu extrahieren.
odt2txt
Paket installiert und es verhält sich so, wie es sollte.