Ich habe eine .srt-Datei, die als Kauderwelsch angezeigt wird, wenn ich sie in gEdit in Ubuntu öffne. Also möchte ich es in utf8 konvertieren, um es lesen zu können.
Wenn ich versuche herauszufinden, was die Codierung gibt:
file -i x.srt
x.srt: text/plain; charset=unknown-8bit
Bei einem anderen Versuch fand ich:
find . -type f -print | xargs file
./x.srt: Non-ISO extended-ASCII text, with CRLF line terminators
Auch ich habe versucht, enca:
enca x.srt
enca: Cannot determine (or understand) your language preferences.
Please use `-L language', or `-L none' if your language is not supported
(only a few multibyte encodings can be recognized then).
Run `enca --list languages' to get a list of supported languages.
und
enca -L Persian x.srt
enca: Cannot determine (or understand) your language preferences.
Please use `-L language', or `-L none' if your language is not supported
(only a few multibyte encodings can be recognized then).
Run `enca --list languages' to get a list of supported languages.
Ich frage mich also, wie ich die Codierung kennen und schließlich in ein verwendbares Format konvertieren kann.
other
.
head -n 20 x.srt | od -tx1
) posten ?
iconv -f iso-8859-1 -t utf-8 < file.txt > out.txt