Als «utf-8» getaggte Fragen

UTF-8 ist eine Zeichencodierung, die jeden Unicode-Codepunkt unter Verwendung einer Bytefolge von ein bis vier Bytes beschreibt. Es ist abwärtskompatibel mit ASCII und unterstützt weiterhin die Darstellung aller Unicode-Codepunkte.

14
Unicode (UTF-8) Lesen und Schreiben in Dateien in Python
Ich habe einige Gehirnfehler beim Verstehen des Lesens und Schreibens von Text in eine Datei (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n", "Capit \ xc3 \ xa1n") print ss, ss8 print >> open('f1','w'), ss8 >>> …
328 python  unicode  utf-8  io 

24
Erkennen Sie die Codierung und machen Sie alles UTF-8
Ich lese viele Texte aus verschiedenen RSS-Feeds vor und füge sie in meine Datenbank ein. Natürlich werden in den Feeds verschiedene Zeichencodierungen verwendet, z. B. UTF-8 und ISO 8859-1. Leider gibt es manchmal Probleme mit der Kodierung der Texte. Beispiel: Das "ß" in "Fußball" sollte in meiner Datenbank so aussehen: …

5
UTF-8: Allgemein? Behälter? Unicode?
Ich versuche herauszufinden, welche Sortierung ich für verschiedene Datentypen verwenden soll. 100% des Inhalts, den ich speichern werde, sind vom Benutzer eingereicht. Nach meinem Verständnis sollte ich UTF-8 General CI (ohne Berücksichtigung der Groß- und Kleinschreibung) anstelle von UTF-8 Binary verwenden. Ich kann jedoch keine klare Unterscheidung zwischen UTF-8 General …
279 mysql  utf-8  collation 



2
URL dekodiert UTF-8 in Python
Ich habe viel Zeit damit verbracht, Neuling in Python zu sein. Wie könnte ich jemals eine solche URL entschlüsseln: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 zu diesem in Python 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) gibt etwas sehr Hässliches zurück. Immer noch keine Lösung, jede Hilfe wird geschätzt.


11
UTF-8 Byte [] zu String
Nehmen wir an, ich habe gerade a verwendet BufferedInputStream, um die Bytes einer UTF-8-codierten Textdatei in ein Byte-Array zu lesen. Ich weiß, dass ich die folgende Routine verwenden kann, um die Bytes in eine Zeichenfolge zu konvertieren. Gibt es jedoch eine effizientere / intelligentere Methode, als nur die Bytes zu …
243 java  utf-8 

17
"Falscher Zeichenfolgenwert" beim Versuch, UTF-8 über JDBC in MySQL einzufügen?
So wird meine Verbindung hergestellt: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); Beim Versuch, einer Zeile eine Zeile hinzuzufügen, wird folgende Fehlermeldung angezeigt: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Ich füge Tausende von Datensätzen ein und erhalte immer diesen Fehler, wenn der Text …
228 mysql  jdbc  utf-8  utf8mb4 

16
Muss ich '&' wirklich als '& amp;' codieren?
Ich verwende ein ' &' Symbol mit HTML5 und UTF-8 in meiner Site <title>. Google zeigt das kaufmännische Und auf seinen SERPs an, ebenso wie alle Browser in ihren Titeln. http://validator.w3.org gibt mir Folgendes : & hat keine Zeichenreferenz gestartet. (& hätte wahrscheinlich als entkommen sollen &.) Muss ich das …


4
Schreiben Sie in eine UTF-8-Datei in Python
Ich bin wirklich verwirrt mit dem codecs.open function. Wenn ich es tue: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Es gibt mir den Fehler UnicodeDecodeError: Der Codec 'ascii' kann das Byte 0xef an Position 0 nicht dekodieren: Ordnungszahl nicht im Bereich (128) Wenn ich mache: file = open("temp", "w") file.write(codecs.BOM_UTF8) …

12
PHP DOMDocument loadHTML codiert UTF-8 nicht richtig
Ich versuche, HTML mit DOMDocument zu analysieren, aber wenn ich das tue, verliere ich plötzlich meine Codierung (zumindest erscheint es mir so). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Das Ergebnis dieses Codes ist, dass ich …

9
So konvertieren Sie einen String in Python in utf-8
Ich habe einen Browser, der utf-8-Zeichen an meinen Python-Server sendet, aber wenn ich ihn aus der Abfragezeichenfolge abrufe, ist die von Python zurückgegebene Codierung ASCII. Wie kann ich die einfache Zeichenfolge in utf-8 konvertieren? HINWEIS: Die vom Web übergebene Zeichenfolge ist bereits UTF-8-codiert. Ich möchte Python lediglich dazu bringen, sie …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.