Programmierung unicode

6

Ich habe versucht, mit java.io.FileReader einige Textdateien zu lesen und in eine Zeichenfolge zu konvertieren, aber ich habe festgestellt, dass das Ergebnis falsch codiert und überhaupt nicht lesbar ist. Hier ist meine Umgebung: Windows 2003, Betriebssystemcodierung: CP1252 Java 5.0 Meine Dateien sind UTF-8-codiert oder CP1252-codiert, und einige von ihnen (UTF-8-codierte …

130 java file unicode encoding

12

Konvertieren von Symbolen, Akzentbuchstaben in englisches Alphabet

Das Problem ist, dass, wie Sie wissen, das Unicode-Diagramm Tausende von Zeichen enthält und ich alle ähnlichen Zeichen in die Buchstaben des englischen Alphabets konvertieren möchte. Zum Beispiel hier ein paar Konvertierungen: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy --> the Family ... und ich habe gesehen, dass es mehr …

129 java unicode special-characters diacritics

7

Worum geht es bei normalisiertem UTF-8?

Das ICU-Projekt (das jetzt auch eine PHP-Bibliothek enthält) enthält die Klassen, die zur Normalisierung von UTF-8-Zeichenfolgen erforderlich sind, um den Vergleich von Werten bei der Suche zu erleichtern. Ich versuche jedoch herauszufinden, was dies für Anwendungen bedeutet . In welchen Fällen möchte ich beispielsweise "Kanonische Äquivalenz" anstelle von "Kompatibilitätsäquivalenz" oder …

129 php c unicode unicode-normalization

8

Was ist der HTML-Zeichencode 8203?

Was bedeutet der Zeichencode (HTML) &#8203;? Ich fand es in einem meiner jQuery-Skripte und fragte mich, was es war. Vielen Dank. Bearbeiten: Hier ist das Skript, in dem es war (es wurde am Ende hinzugefügt und in Firebug gefunden) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() { …

127 html unicode character-codes

5

Was wäre der Unicode-Charakter für eine große Kugel in der Mitte des Charakters?

Ich möchte so etwas wie 0x2022 8226 BULLET • Aber größer. Ich kann sie nicht einmal unter http://www.ssec.wisc.edu/~tomw/java/unicode.html finden Wonach soll ich suchen? Punkte? Kugeln?

127 unicode

3

Unicode-Äquivalente für \ w und \ b in regulären Java-Ausdrücken?

Viele moderne Regex-Implementierungen interpretieren die \wKurzform der Zeichenklasse als "einen beliebigen Buchstaben, eine Ziffer oder eine verbindende Interpunktion" (normalerweise: Unterstrich). Auf diese Weise, ein regulärer Ausdruck wie \w+Streichhölzer Wörter wie hello, élève, GOÄ_432oder gefräßig. Java leider nicht. In Java \wist beschränkt auf [A-Za-z0-9_]. Dies macht es unter anderem schwierig, Wörter …

126 java regex unicode character-properties

7

Python - Der Codec 'ascii' kann kein Byte dekodieren

Ich bin wirklich verwirrt. Ich habe versucht zu codieren, aber der Fehler sagte can't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128) Ich weiß, wie ich den Fehler mit dem …

119 python python-2.7 unicode python-2.x python-unicode

10

Wie kann verhindert werden, dass Unicode-Zeichen in HTML aus JavaScript als Emoji in HTML gerendert werden?

Ich finde Unicode für Sonderzeichen aus der Suche von FileFormat.Info . Einige Zeichen werden als klassische Schwarz-Weiß-Glyphen dargestellt, z. B. ⚠ (Warnzeichen \u26A0oder &#x26a0;). Diese sind vorzuziehen, da ich CSS-Stile (z. B. Farbe) auf sie anwenden kann. Andere rendern als neuere Cartoony-Emoji, wie z. B. ⌛ (Sanduhr \u231Boder &#x231b;). Diese …

119 javascript html css unicode emoji

4

CSS: Wie füge ich Leerzeichen vor dem Inhalt des Elements hinzu?

Keiner der folgenden Codes funktioniert: p:before { content: " "; } p:before { content: "&nbsp;"; } Wie füge ich Leerzeichen vor dem Inhalt des Elements hinzu? Hinweis: Ich muss den Rand links und den Rand links für die semantische Verwendung einfärben und den Raum als farblosen Rand verwenden. :) :)

118 css unicode space css-content

13

Erstellen eines Unicode-Zeichens aus seiner Nummer

Ich möchte ein Unicode-Zeichen in Java anzeigen. Wenn ich das mache, funktioniert es einwandfrei: String symbol = "\u2202"; Symbol ist gleich "∂". Das ist, was ich will. Das Problem ist, dass ich die Unicode-Nummer kenne und daraus das Unicode-Symbol erstellen muss. Ich habe (für mich) das Offensichtliche versucht: int c …

114 java string unicode character

6

Wie kann ich UTF-8 von Perl ausgeben?

Ich versuche, ein Perl-Skript mit dem Pragma "utf8" zu schreiben, und erhalte unerwartete Ergebnisse. Ich verwende Mac OS X 10.5 (Leopard) und bearbeite mit TextMate. Alle meine Einstellungen für meinen Editor und mein Betriebssystem sind standardmäßig auf das Schreiben von Dateien im utf-8-Format eingestellt. Wenn ich jedoch Folgendes in eine …

110 perl unicode utf-8

3

Wie funktioniert die UTF-8-Codierung mit variabler Breite?

Der Unicode-Standard enthält genügend Codepunkte, sodass Sie 4 Bytes benötigen, um alle zu speichern. Das macht die UTF-32-Codierung. Die UTF-8-Codierung drückt diese jedoch irgendwie in viel kleinere Räume, indem sie eine sogenannte "Codierung mit variabler Breite" verwendet. Tatsächlich gelingt es ihm, die ersten 127 Zeichen von US-ASCII in nur einem …

110 unicode utf-8 character-encoding multibyte

3

Was sind die am häufigsten verwendeten Nicht-BMP-Unicode-Zeichen? [geschlossen]

Geschlossen . Diese Frage muss fokussierter sein . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so, dass sie sich nur auf ein Problem konzentriert, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 6 Jahren . Verbessere diese Frage Welche Unicode-Zeichen, Codepunkte und Bereiche …

108 unicode cjk codepoint surrogate-pairs astral-plane

5

Was ist der richtige Weg, um Unicode-Zeichen per URL zu codieren?

Ich kenne das nicht standardmäßige% uxxxx-Schema, aber das scheint keine kluge Wahl zu sein, da das Schema vom W3C abgelehnt wurde. Einige interessante Beispiele: Der Herzcharakter. Wenn ich dies in meinen Browser eingebe: http://www.google.com/search?q=♥ Dann kopiere und füge es ein, ich sehe diese URL http://www.google.com/search?q=%E2%99%A5 Das lässt es so aussehen, …

107 unicode utf-8 character-encoding urlencode web-standards

9

Unicode-Verarbeitung in C ++

Was ist die beste Vorgehensweise bei der Unicode-Verarbeitung in C ++?

107 c++ unicode

Als «unicode» getaggte Fragen