Ich habe viele zip-Dateien, in denen es Kodierungsfehler für die deutschen Umlaute (äüöÄÜÖß) gibt. Sie erscheinen sowohl in der Datei filename.zip als auch in den enthaltenen Verzeichnissen und Dateien wie folgt:
- Fünf = Fu╠ênf
- Räuber = Ra╠êuber
- Überfall
und so weiter. Normalerweise verwende ich Linux, aber aufgrund dieser Probleme habe ich auch eine Windows7-VM ausprobiert, aber dies führt zu dem gleichen Kodierungsfehler. Unter Linux habe ich mit convmv und detox rumgespielt, aber ohne Erfolg.
Wenn ich benutze
- convmv -f iso-8859-1 -t utf8 --replace --notest -r *
Ich bekomme "Skipping, schon UTF-8".
Irgendwelche Gedanken dazu?
find -type f -print0 |xargs -r -n1 -0 convmv -f WINDOWS-1252 -t UTF-8 --notest
Dateien ab dem aktuellen Verzeichnis und führt convmv für jede Datei separat aus. Dateiname wird als nullterminierte Liste angegeben.