Programmierung utf-8

14

Unicode (UTF-8) Lesen und Schreiben in Dateien in Python

Ich habe einige Gehirnfehler beim Verstehen des Lesens und Schreibens von Text in eine Datei (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n", "Capit \ xc3 \ xa1n") print ss, ss8 print >> open('f1','w'), ss8 >>> …

328 python unicode utf-8 io

24

Erkennen Sie die Codierung und machen Sie alles UTF-8

Ich lese viele Texte aus verschiedenen RSS-Feeds vor und füge sie in meine Datenbank ein. Natürlich werden in den Feeds verschiedene Zeichencodierungen verwendet, z. B. UTF-8 und ISO 8859-1. Leider gibt es manchmal Probleme mit der Kodierung der Texte. Beispiel: Das "ß" in "Fußball" sollte in meiner Datenbank so aussehen: …

304 php encoding utf-8 character-encoding

5

UTF-8: Allgemein? Behälter? Unicode?

Ich versuche herauszufinden, welche Sortierung ich für verschiedene Datentypen verwenden soll. 100% des Inhalts, den ich speichern werde, sind vom Benutzer eingereicht. Nach meinem Verständnis sollte ich UTF-8 General CI (ohne Berücksichtigung der Groß- und Kleinschreibung) anstelle von UTF-8 Binary verwenden. Ich kann jedoch keine klare Unterscheidung zwischen UTF-8 General …

279 mysql utf-8 collation

11

Wie überprüfe ich, ob eine Zeichenfolge Unicode oder ASCII ist?

Was muss ich in Python tun, um herauszufinden, welche Codierung eine Zeichenfolge hat?

271 python unicode encoding utf-8

16

Verwendung von UTF-8 in Ressourceneigenschaften mit ResourceBundle

Ich muss UTF-8 in meinen Ressourceneigenschaften mit Java verwenden ResourceBundle. Wenn ich den Text direkt in die Eigenschaftendatei eingebe, wird er als Mojibake angezeigt. Meine App läuft auf Google App Engine. Kann mir jemand ein Beispiel geben? Ich kann diese Arbeit nicht bekommen.

259 java google-app-engine utf-8 internationalization resourcebundle

2

URL dekodiert UTF-8 in Python

Ich habe viel Zeit damit verbracht, Neuling in Python zu sein. Wie könnte ich jemals eine solche URL entschlüsseln: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 zu diesem in Python 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) gibt etwas sehr Hässliches zurück. Immer noch keine Lösung, jede Hilfe wird geschätzt.

245 python encoding utf-8 urldecode

14

Verwenden von PowerShell zum Schreiben einer Datei in UTF-8 ohne Stückliste

Out-File scheint die Stückliste bei Verwendung von UTF-8 zu erzwingen: $MyFile = Get-Content $MyPath $MyFile | Out-File -Encoding "UTF8" $MyPath Wie kann ich mit PowerShell eine Datei in UTF-8 ohne Stückliste schreiben?

245 encoding powershell utf-8 byte-order-mark

11

UTF-8 Byte [] zu String

Nehmen wir an, ich habe gerade a verwendet BufferedInputStream, um die Bytes einer UTF-8-codierten Textdatei in ein Byte-Array zu lesen. Ich weiß, dass ich die folgende Routine verwenden kann, um die Bytes in eine Zeichenfolge zu konvertieren. Gibt es jedoch eine effizientere / intelligentere Methode, als nur die Bytes zu …

243 java utf-8

17

"Falscher Zeichenfolgenwert" beim Versuch, UTF-8 über JDBC in MySQL einzufügen?

So wird meine Verbindung hergestellt: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); Beim Versuch, einer Zeile eine Zeile hinzuzufügen, wird folgende Fehlermeldung angezeigt: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Ich füge Tausende von Datensätzen ein und erhalte immer diesen Fehler, wenn der Text …

228 mysql jdbc utf-8 utf8mb4

16

Muss ich '&' wirklich als '& amp;' codieren?

Ich verwende ein ' &' Symbol mit HTML5 und UTF-8 in meiner Site <title>. Google zeigt das kaufmännische Und auf seinen SERPs an, ebenso wie alle Browser in ihren Titeln. http://validator.w3.org gibt mir Folgendes : & hat keine Zeichenreferenz gestartet. (& hätte wahrscheinlich als entkommen sollen &amp;.) Muss ich das …

207 validation html utf-8 character-encoding

8

Probleme mit der HTML-Codierung - Das Zeichen "Â" wird anstelle von "& nbsp;" angezeigt.

Ich habe eine Legacy-App, die sich gerade schlecht benimmt, aus welchem Grund auch immer ich nicht sicher bin. Es generiert eine Reihe von HTML-Code, der von ActivePDF in PDF-Berichte umgewandelt wird. Der Prozess funktioniert folgendermaßen: Ziehen Sie eine HTML-Vorlage aus einer Datenbank mit darin zu ersetzenden Token (z. B. "~ …

203 html vb.net encoding utf-8 iso-8859-1

4

Schreiben Sie in eine UTF-8-Datei in Python

Ich bin wirklich verwirrt mit dem codecs.open function. Wenn ich es tue: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Es gibt mir den Fehler UnicodeDecodeError: Der Codec 'ascii' kann das Byte 0xef an Position 0 nicht dekodieren: Ordnungszahl nicht im Bereich (128) Wenn ich mache: file = open("temp", "w") file.write(codecs.BOM_UTF8) …

202 python utf-8 byte-order-mark

12

PHP DOMDocument loadHTML codiert UTF-8 nicht richtig

Ich versuche, HTML mit DOMDocument zu analysieren, aber wenn ich das tue, verliere ich plötzlich meine Codierung (zumindest erscheint es mir so). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Das Ergebnis dieses Codes ist, dass ich …

194 php utf-8 character-encoding

9

So konvertieren Sie einen String in Python in utf-8

Ich habe einen Browser, der utf-8-Zeichen an meinen Python-Server sendet, aber wenn ich ihn aus der Abfragezeichenfolge abrufe, ist die von Python zurückgegebene Codierung ASCII. Wie kann ich die einfache Zeichenfolge in utf-8 konvertieren? HINWEIS: Die vom Web übergebene Zeichenfolge ist bereits UTF-8-codiert. Ich möchte Python lediglich dazu bringen, sie …

192 python python-2.7 unicode utf-8

30

Wie kann ich eine UTF-8-CSV in PHP ausgeben, die Excel richtig liest?

Ich habe diese sehr einfache Sache, die nur einige Sachen im CSV-Format ausgibt, aber es muss UTF-8 sein. Ich öffne diese Datei in TextEdit oder TextMate oder Dreamweaver und sie zeigt UTF-8-Zeichen richtig an, aber wenn ich sie in Excel öffne, macht sie stattdessen diese dumme Sache. Folgendes habe ich …

191 php csv utf-8 byte-order-mark

Als «utf-8» getaggte Fragen