Ich habe zwei ODT-Dokumente, die sehr nahe beieinander liegen. Ich möchte sie vergleichen, um festzustellen, wie ähnlich sie sind.
Das Beste wäre, einen Ähnlichkeitsprozentsatz zu haben , wenn dies nicht möglich ist. Eine Alternative wäre, zumindest eine Art Diff zu haben .
Ich verwende Ubuntu Lucid .
Lösung:
Früher habe ich odt2txt
die Dateien in Text konvertiert und dann wdiff -i --statistics one.txt two.txt
ein Diff zusammen mit Statistiken verwendet, die mir den Prozentsatz der gebräuchlichen Wörter (Ähnlichkeit) angaben.