Als «unicode» getaggte Fragen

Unicode ist ein Standard für die Codierung, Darstellung und Handhabung von Text mit der Absicht, alle Zeichen zu unterstützen, die für geschriebenen Text erforderlich sind, einschließlich aller Schriftsysteme, technischen Symbole und Satzzeichen.

6
Java FileReader-Codierungsproblem
Ich habe versucht, mit java.io.FileReader einige Textdateien zu lesen und in eine Zeichenfolge zu konvertieren, aber ich habe festgestellt, dass das Ergebnis falsch codiert und überhaupt nicht lesbar ist. Hier ist meine Umgebung: Windows 2003, Betriebssystemcodierung: CP1252 Java 5.0 Meine Dateien sind UTF-8-codiert oder CP1252-codiert, und einige von ihnen (UTF-8-codierte …
130 java  file  unicode  encoding 


7
Worum geht es bei normalisiertem UTF-8?
Das ICU-Projekt (das jetzt auch eine PHP-Bibliothek enthält) enthält die Klassen, die zur Normalisierung von UTF-8-Zeichenfolgen erforderlich sind, um den Vergleich von Werten bei der Suche zu erleichtern. Ich versuche jedoch herauszufinden, was dies für Anwendungen bedeutet . In welchen Fällen möchte ich beispielsweise "Kanonische Äquivalenz" anstelle von "Kompatibilitätsäquivalenz" oder …

8
Was ist der HTML-Zeichencode 8203?
Was bedeutet der Zeichencode (HTML) ​? Ich fand es in einem meiner jQuery-Skripte und fragte mich, was es war. Vielen Dank. Bearbeiten: Hier ist das Skript, in dem es war (es wurde am Ende hinzugefügt und in Firebug gefunden) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() { …


3
Unicode-Äquivalente für \ w und \ b in regulären Java-Ausdrücken?
Viele moderne Regex-Implementierungen interpretieren die \wKurzform der Zeichenklasse als "einen beliebigen Buchstaben, eine Ziffer oder eine verbindende Interpunktion" (normalerweise: Unterstrich). Auf diese Weise, ein regulärer Ausdruck wie \w+Streichhölzer Wörter wie hello, élève, GOÄ_432oder gefräßig. Java leider nicht. In Java \wist beschränkt auf [A-Za-z0-9_]. Dies macht es unter anderem schwierig, Wörter …


10
Wie kann verhindert werden, dass Unicode-Zeichen in HTML aus JavaScript als Emoji in HTML gerendert werden?
Ich finde Unicode für Sonderzeichen aus der Suche von FileFormat.Info . Einige Zeichen werden als klassische Schwarz-Weiß-Glyphen dargestellt, z. B. ⚠ (Warnzeichen \u26A0oder ⚠). Diese sind vorzuziehen, da ich CSS-Stile (z. B. Farbe) auf sie anwenden kann. Andere rendern als neuere Cartoony-Emoji, wie z. B. ⌛ (Sanduhr \u231Boder ⌛). Diese …
119 javascript  html  css  unicode  emoji 


13
Erstellen eines Unicode-Zeichens aus seiner Nummer
Ich möchte ein Unicode-Zeichen in Java anzeigen. Wenn ich das mache, funktioniert es einwandfrei: String symbol = "\u2202"; Symbol ist gleich "∂". Das ist, was ich will. Das Problem ist, dass ich die Unicode-Nummer kenne und daraus das Unicode-Symbol erstellen muss. Ich habe (für mich) das Offensichtliche versucht: int c …

6
Wie kann ich UTF-8 von Perl ausgeben?
Ich versuche, ein Perl-Skript mit dem Pragma "utf8" zu schreiben, und erhalte unerwartete Ergebnisse. Ich verwende Mac OS X 10.5 (Leopard) und bearbeite mit TextMate. Alle meine Einstellungen für meinen Editor und mein Betriebssystem sind standardmäßig auf das Schreiben von Dateien im utf-8-Format eingestellt. Wenn ich jedoch Folgendes in eine …
110 perl  unicode  utf-8 



5
Was ist der richtige Weg, um Unicode-Zeichen per URL zu codieren?
Ich kenne das nicht standardmäßige% uxxxx-Schema, aber das scheint keine kluge Wahl zu sein, da das Schema vom W3C abgelehnt wurde. Einige interessante Beispiele: Der Herzcharakter. Wenn ich dies in meinen Browser eingebe: http://www.google.com/search?q=♥ Dann kopiere und füge es ein, ich sehe diese URL http://www.google.com/search?q=%E2%99%A5 Das lässt es so aussehen, …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.