Dateinamen im rar-Archiv verstümmelt, möglicherweise doppelt utf8-codiert? Kann nicht herausfinden, wie man umkehrt


1

Ich versuche, den Upload-Ordner einer WordPress-Installation wiederherzustellen. Der Ordner hat eine Kombination aus FTP- oder SFTP-Übertragung durchlaufen und wurde von rar komprimiert. (Ich kenne den genauen Ablauf nicht, er wurde nicht von mir gemacht). Jetzt sind sie im Archiv verstümmelt.

Zum Beispiel die folgende Datei

gerendás.jpg

benannt

gerendăľs.jpg

im Archiv.

Ich kann den genauen Prozess nicht herausfinden, der stattgefunden hat. Irgendwie denke ich, dass es mehrfach utf8 verschlüsselt wurde. Das, was ich am ehesten reproduzieren konnte, war

~ $ convmv --nosmart -f "iso-8859-2" -t "utf8" gerendás.txt
Starting a dry run without changes...
mv "./gerendás.txt" "./gerendĂĄs.txt"
No changes to your files done. Use --notest to finally rename the files.

Das heißt, das erste Zeichen ist die Großbuchstabenversion von ă. Mir fehlen hier die Ideen.

Was könnte dies verursacht haben und wie kann ich es rückgängig machen?


Die erste Annahme wäre ein beschädigtes Archiv oder beschädigte Übertragungen. Wenn Sie eine Reihe von .jpgs haben, haben Sie zuerst überprüft, ob alle Bilder korrekt angezeigt werden? Haben Sie zuerst gefragt, welche Methode (& program) zum Komprimieren verwendet wurde, und versucht, mit genau demselben Programm zu dekomprimieren? Wurden Prüfsummen oder MD5s erstellt oder können diese jetzt erstellt werden, um die Übertragung des Archivs zu überprüfen?
Psycogeek

1
Ja, der Inhalt der Dateien ist intakt, die JPEGs werden perfekt angezeigt. Es werden nur die Dateinamen und nur die Zeichen mit Akzent verstümmelt. Ich kann nicht versuchen, mit dem Originalprogramm zu dekomprimieren, das wahrscheinlich winrar ist, da ich momentan nur Zugriff auf Linux habe. Ich habe versucht, sowohl unrar als auch p7zip.
Proto-n

Auch die kuriosen Charaktere scheinen konsistent zu sein. Jede Instanz von 'ăľ' war ursprünglich ein 'á'. Das verschafft mir natürlich die Möglichkeit, das Mapping herauszufinden und ein einfaches Ersetzen vorzunehmen, aber das möchte ich nach Möglichkeit vermeiden.
Proto-n

1
Wie untersuchen Sie den Inhalt des Archivs? Wenn das Archiv einen UTF-8-Dateinamen enthält, Sie ihn jedoch in einer älteren Codierung betrachten, erhalten Sie genau das Ergebnis.
Tripleee
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.