Ich habe eine Reihe von arabischen, englischen und russischen Dateien, die in utf-8 codiert sind. Beim Versuch, diese Dateien mit einem Perl-Skript zu verarbeiten, wird folgende Fehlermeldung angezeigt:
Malformed UTF-8 character (fatal)
Beim manuellen Überprüfen des Inhalts dieser Dateien fand ich einige seltsame Zeichen in ihnen. Jetzt suche ich nach einer Möglichkeit, diese Zeichen automatisch aus den Dateien zu entfernen.
Gibt es sowieso etwas zu tun?