Excel-Dateien können mithilfe von:
$ libreoffice --convert-to csv --headless --outdir dir file.xlsx
Alles scheint gut zu funktionieren. Die Codierung ist jedoch auf etwas Wonky eingestellt. Anstelle eines UTF-8-MDash (-), den ich erhalte, wenn ich manuell von LibreOffice Calc ein "Speichern unter" durchführe, erhalte ich ein \ 227 ( ). Wenn ich eine Datei in der CSV verwende, erhalte ich "Nicht-ISO-Extended-ASCII-Text mit sehr langen Zeilen". Also zwei Fragen:
- Was um alles in der Welt passiert hier?
- Wie kann ich libreoffice anweisen, auf UTF-8 zu konvertieren?
Die spezifische Datei, die ich konvertieren möchte, ist hier .