Ich habe Probleme beim Lesen aus einer Datei, beim Verarbeiten ihrer Zeichenfolge und beim Speichern in einer UTF-8-Datei.
Hier ist der Code:
try:
filehandle = open(filename,"r")
except:
print("Could not open file " + filename)
quit()
text = filehandle.read()
filehandle.close()
Ich verarbeite dann den variablen Text.
Und dann
try:
writer = open(output,"w")
except:
print("Could not open file " + output)
quit()
#data = text.decode("iso 8859-15")
#writer.write(data.encode("UTF-8"))
writer.write(text)
writer.close()
Dies gibt die Datei perfekt aus, aber laut meinem Editor in ISO 8859-15. Da derselbe Editor die Eingabedatei (im variablen Dateinamen) als UTF-8 erkennt, weiß ich nicht, warum dies passiert ist. Soweit meine Forschung gezeigt hat, sollten die kommentierten Zeilen das Problem lösen. Wenn ich diese Zeilen verwende, enthält die resultierende Datei jedoch hauptsächlich Kauderwelsch in Sonderzeichen, Wörter mit Tilde, da der Text spanisch ist. Ich würde mich über jede Hilfe sehr freuen, da ich ratlos bin ...