UTF-8 ist eine Zeichencodierung, die jeden Unicode-Codepunkt unter Verwendung einer Bytefolge von ein bis vier Bytes beschreibt. Es ist abwärtskompatibel mit ASCII und unterstützt weiterhin die Darstellung aller Unicode-Codepunkte.
Ich habe einige Gehirnfehler beim Verstehen des Lesens und Schreibens von Text in eine Datei (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n", "Capit \ xc3 \ xa1n") print ss, ss8 print >> open('f1','w'), ss8 >>> …
Ich lese viele Texte aus verschiedenen RSS-Feeds vor und füge sie in meine Datenbank ein. Natürlich werden in den Feeds verschiedene Zeichencodierungen verwendet, z. B. UTF-8 und ISO 8859-1. Leider gibt es manchmal Probleme mit der Kodierung der Texte. Beispiel: Das "ß" in "Fußball" sollte in meiner Datenbank so aussehen: …
Ich versuche herauszufinden, welche Sortierung ich für verschiedene Datentypen verwenden soll. 100% des Inhalts, den ich speichern werde, sind vom Benutzer eingereicht. Nach meinem Verständnis sollte ich UTF-8 General CI (ohne Berücksichtigung der Groß- und Kleinschreibung) anstelle von UTF-8 Binary verwenden. Ich kann jedoch keine klare Unterscheidung zwischen UTF-8 General …
Ich muss UTF-8 in meinen Ressourceneigenschaften mit Java verwenden ResourceBundle. Wenn ich den Text direkt in die Eigenschaftendatei eingebe, wird er als Mojibake angezeigt. Meine App läuft auf Google App Engine. Kann mir jemand ein Beispiel geben? Ich kann diese Arbeit nicht bekommen.
Ich habe viel Zeit damit verbracht, Neuling in Python zu sein. Wie könnte ich jemals eine solche URL entschlüsseln: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 zu diesem in Python 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) gibt etwas sehr Hässliches zurück. Immer noch keine Lösung, jede Hilfe wird geschätzt.
Out-File scheint die Stückliste bei Verwendung von UTF-8 zu erzwingen: $MyFile = Get-Content $MyPath $MyFile | Out-File -Encoding "UTF8" $MyPath Wie kann ich mit PowerShell eine Datei in UTF-8 ohne Stückliste schreiben?
Nehmen wir an, ich habe gerade a verwendet BufferedInputStream, um die Bytes einer UTF-8-codierten Textdatei in ein Byte-Array zu lesen. Ich weiß, dass ich die folgende Routine verwenden kann, um die Bytes in eine Zeichenfolge zu konvertieren. Gibt es jedoch eine effizientere / intelligentere Methode, als nur die Bytes zu …
So wird meine Verbindung hergestellt: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); Beim Versuch, einer Zeile eine Zeile hinzuzufügen, wird folgende Fehlermeldung angezeigt: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Ich füge Tausende von Datensätzen ein und erhalte immer diesen Fehler, wenn der Text …
Ich verwende ein ' &' Symbol mit HTML5 und UTF-8 in meiner Site <title>. Google zeigt das kaufmännische Und auf seinen SERPs an, ebenso wie alle Browser in ihren Titeln. http://validator.w3.org gibt mir Folgendes : & hat keine Zeichenreferenz gestartet. (& hätte wahrscheinlich als entkommen sollen &amp;.) Muss ich das …
Ich habe eine Legacy-App, die sich gerade schlecht benimmt, aus welchem Grund auch immer ich nicht sicher bin. Es generiert eine Reihe von HTML-Code, der von ActivePDF in PDF-Berichte umgewandelt wird. Der Prozess funktioniert folgendermaßen: Ziehen Sie eine HTML-Vorlage aus einer Datenbank mit darin zu ersetzenden Token (z. B. "~ …
Ich bin wirklich verwirrt mit dem codecs.open function. Wenn ich es tue: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Es gibt mir den Fehler UnicodeDecodeError: Der Codec 'ascii' kann das Byte 0xef an Position 0 nicht dekodieren: Ordnungszahl nicht im Bereich (128) Wenn ich mache: file = open("temp", "w") file.write(codecs.BOM_UTF8) …
Ich versuche, HTML mit DOMDocument zu analysieren, aber wenn ich das tue, verliere ich plötzlich meine Codierung (zumindest erscheint es mir so). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Das Ergebnis dieses Codes ist, dass ich …
Ich habe einen Browser, der utf-8-Zeichen an meinen Python-Server sendet, aber wenn ich ihn aus der Abfragezeichenfolge abrufe, ist die von Python zurückgegebene Codierung ASCII. Wie kann ich die einfache Zeichenfolge in utf-8 konvertieren? HINWEIS: Die vom Web übergebene Zeichenfolge ist bereits UTF-8-codiert. Ich möchte Python lediglich dazu bringen, sie …
Ich habe diese sehr einfache Sache, die nur einige Sachen im CSV-Format ausgibt, aber es muss UTF-8 sein. Ich öffne diese Datei in TextEdit oder TextMate oder Dreamweaver und sie zeigt UTF-8-Zeichen richtig an, aber wenn ich sie in Excel öffne, macht sie stattdessen diese dumme Sache. Folgendes habe ich …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.