Als «utf-8» getaggte Fragen

UTF-8 ist eine Zeichencodierung, die jeden Unicode-Codepunkt unter Verwendung einer Bytefolge von ein bis vier Bytes beschreibt. Es ist abwärtskompatibel mit ASCII und unterstützt weiterhin die Darstellung aller Unicode-Codepunkte.


13
Java entspricht der encodeURIComponent von JavaScript, die identische Ausgaben erzeugt?
Ich habe mit verschiedenen Teilen von Java-Code experimentiert, um etwas zu finden, das eine Zeichenfolge mit Anführungszeichen, Leerzeichen und "exotischen" Unicode-Zeichen codiert und eine Ausgabe erzeugt, die mit der Funktion encodeURIComponent von JavaScript identisch ist. Mein Folterteststring lautet: "A" B ± " Wenn ich in Firebug die folgende JavaScript-Anweisung eingebe: …

5
Wirklich gute, schlechte UTF-8-Beispieltestdaten [geschlossen]
Geschlossen. Diese Frage entspricht nicht den Richtlinien für Stapelüberlauf . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Stack - Überlauf. Geschlossen vor 3 Jahren . Verbessere diese Frage Wir haben also das XSS-Spickzettel , um unsere XSS-Filterung …
88 unicode  utf-8 

6
Verwendung von 'use utf8;' gibt mir 'Breites Zeichen im Druck'
Wenn ich das folgende Perl-Programm ausführe: perl -e 'use utf8; print "鸡\n";' Ich bekomme diese Warnung: Wide character in print at -e line 1. Wenn ich dieses Perl-Programm ausführe: perl -e 'print "鸡\n";' Ich bekomme keine Warnung. Ich dachte, es use utf8sei erforderlich, UTF-8-Zeichen in einem Perl-Skript zu verwenden. Warum …
86 perl  unicode  utf-8 



6
JSON-Zeichencodierung - Wird UTF-8 von Browsern gut unterstützt oder sollte ich numerische Escape-Sequenzen verwenden?
Ich schreibe einen Webservice, der json verwendet, um seine Ressourcen darzustellen, und ich bin ein bisschen festgefahren, wie ich den json am besten codieren kann. Beim Lesen des json rfc ( http://www.ietf.org/rfc/rfc4627.txt ) ist klar, dass die bevorzugte Codierung utf-8 ist. Der RFC beschreibt aber auch einen Mechanismus zum Entkommen …

1
WebClient.DownloadString führt aufgrund von Codierungsproblemen zu verstümmelten Zeichen, aber der Browser ist in Ordnung
Der folgende Code: var text = (new WebClient()).DownloadString("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&start=0&max_results=20")); führt zu einer Variablen text, die unter anderem die Zeichenfolge enthält "$ κ $ -Minkowski-Raum, Skalarfeld und das Problem der Lorentz-Invarianz" Wenn ich jedoch diese URL in Firefox besuche, erhalte ich $ κ $ -Minkowski-Raum, Skalarfeld und das Problem der Lorentz-Invarianz das …

3
So entfernen Sie Nicht-UTF-8-Zeichen aus der Textdatei
Ich habe eine Reihe von arabischen, englischen und russischen Dateien, die in utf-8 codiert sind. Beim Versuch, diese Dateien mit einem Perl-Skript zu verarbeiten, wird folgende Fehlermeldung angezeigt: Malformed UTF-8 character (fatal) Beim manuellen Überprüfen des Inhalts dieser Dateien fand ich einige seltsame Zeichen in ihnen. Jetzt suche ich nach …


5
Wie verwende ich die UTF-8-Kollatierung in der SQL Server-Datenbank?
Ich habe eine Datenbank von MySQL auf SQL Server (Politik) migriert, die ursprüngliche MySQL-Datenbank mit UTF8. Jetzt habe ich /dba/7346/sql-server-2005-2008-utf-8-collation-charset gelesen, dass SQL Server 2008 utf8 nicht unterstützt. Ist das ein Witz? Der SQL Server hostet mehrere Datenbanken, die größtenteils lateinisch codiert sind. Da die migrierte Datenbank für das Web-Publishing …
83 sql-server  utf-8 


7
So schreiben Sie UTF-8 in eine CSV-Datei
Ich versuche, aus einem PyQt4 eine Textdatei im CSV-Format zu erstellen QTableWidget. Ich möchte den Text mit einer UTF-8-Codierung schreiben, da er Sonderzeichen enthält. Ich benutze folgenden Code: import codecs ... myfile = codecs.open(filename, 'w','utf-8') ... f = result.table.item(i,c).text() myfile.write(f+";") Es funktioniert so lange, bis die Zelle ein Sonderzeichen enthält. …
82 python  csv  encoding  utf-8 

6
Wie viele Zeichen können mit Unicode zugeordnet werden?
Ich bitte um die Anzahl aller möglichen gültigen Kombinationen in Unicode mit Erklärung. Ich weiß, dass ein Zeichen als 1,2,3 oder 4 Bytes codiert werden kann. Ich verstehe auch nicht, warum Fortsetzungsbytes Einschränkungen haben, obwohl das Startbyte dieses Zeichens löscht, wie lange es sein sollte.
82 unicode  utf-8  utf 

3
Wie sende ich UTF-8 E-Mails?
Wenn ich die E-Mail versende, werden in der E-Mail keine anderen Zeichen als Englisch angezeigt. Es zeigt sich wie folgt: ä½ ™ ç ”Ÿä» ä » Kann eigentlich wissen, was das verursacht? Selbst wenn ich versucht habe, dem Skript Inhaltstyp und Zeichensatz hinzuzufügen, wird dieser immer noch angezeigt. ich benutzte …
82 php  email  utf-8 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.