Unicode ist ein Standard für die Codierung, Darstellung und Handhabung von Text mit der Absicht, alle Zeichen zu unterstützen, die für geschriebenen Text erforderlich sind, einschließlich aller Schriftsysteme, technischen Symbole und Satzzeichen.
Ich habe versucht, mit java.io.FileReader einige Textdateien zu lesen und in eine Zeichenfolge zu konvertieren, aber ich habe festgestellt, dass das Ergebnis falsch codiert und überhaupt nicht lesbar ist. Hier ist meine Umgebung: Windows 2003, Betriebssystemcodierung: CP1252 Java 5.0 Meine Dateien sind UTF-8-codiert oder CP1252-codiert, und einige von ihnen (UTF-8-codierte …
Das Problem ist, dass, wie Sie wissen, das Unicode-Diagramm Tausende von Zeichen enthält und ich alle ähnlichen Zeichen in die Buchstaben des englischen Alphabets konvertieren möchte. Zum Beispiel hier ein paar Konvertierungen: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy --> the Family ... und ich habe gesehen, dass es mehr …
Das ICU-Projekt (das jetzt auch eine PHP-Bibliothek enthält) enthält die Klassen, die zur Normalisierung von UTF-8-Zeichenfolgen erforderlich sind, um den Vergleich von Werten bei der Suche zu erleichtern. Ich versuche jedoch herauszufinden, was dies für Anwendungen bedeutet . In welchen Fällen möchte ich beispielsweise "Kanonische Äquivalenz" anstelle von "Kompatibilitätsäquivalenz" oder …
Was bedeutet der Zeichencode (HTML) &#8203;? Ich fand es in einem meiner jQuery-Skripte und fragte mich, was es war. Vielen Dank. Bearbeiten: Hier ist das Skript, in dem es war (es wurde am Ende hinzugefügt und in Firebug gefunden) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() { …
Ich möchte so etwas wie 0x2022 8226 BULLET • Aber größer. Ich kann sie nicht einmal unter http://www.ssec.wisc.edu/~tomw/java/unicode.html finden Wonach soll ich suchen? Punkte? Kugeln?
Viele moderne Regex-Implementierungen interpretieren die \wKurzform der Zeichenklasse als "einen beliebigen Buchstaben, eine Ziffer oder eine verbindende Interpunktion" (normalerweise: Unterstrich). Auf diese Weise, ein regulärer Ausdruck wie \w+Streichhölzer Wörter wie hello, élève, GOÄ_432oder gefräßig. Java leider nicht. In Java \wist beschränkt auf [A-Za-z0-9_]. Dies macht es unter anderem schwierig, Wörter …
Ich bin wirklich verwirrt. Ich habe versucht zu codieren, aber der Fehler sagte can't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128) Ich weiß, wie ich den Fehler mit dem …
Ich finde Unicode für Sonderzeichen aus der Suche von FileFormat.Info . Einige Zeichen werden als klassische Schwarz-Weiß-Glyphen dargestellt, z. B. ⚠ (Warnzeichen \u26A0oder &#x26a0;). Diese sind vorzuziehen, da ich CSS-Stile (z. B. Farbe) auf sie anwenden kann. Andere rendern als neuere Cartoony-Emoji, wie z. B. ⌛ (Sanduhr \u231Boder &#x231b;). Diese …
Keiner der folgenden Codes funktioniert: p:before { content: " "; } p:before { content: "&nbsp;"; } Wie füge ich Leerzeichen vor dem Inhalt des Elements hinzu? Hinweis: Ich muss den Rand links und den Rand links für die semantische Verwendung einfärben und den Raum als farblosen Rand verwenden. :) :)
Ich möchte ein Unicode-Zeichen in Java anzeigen. Wenn ich das mache, funktioniert es einwandfrei: String symbol = "\u2202"; Symbol ist gleich "∂". Das ist, was ich will. Das Problem ist, dass ich die Unicode-Nummer kenne und daraus das Unicode-Symbol erstellen muss. Ich habe (für mich) das Offensichtliche versucht: int c …
Ich versuche, ein Perl-Skript mit dem Pragma "utf8" zu schreiben, und erhalte unerwartete Ergebnisse. Ich verwende Mac OS X 10.5 (Leopard) und bearbeite mit TextMate. Alle meine Einstellungen für meinen Editor und mein Betriebssystem sind standardmäßig auf das Schreiben von Dateien im utf-8-Format eingestellt. Wenn ich jedoch Folgendes in eine …
Der Unicode-Standard enthält genügend Codepunkte, sodass Sie 4 Bytes benötigen, um alle zu speichern. Das macht die UTF-32-Codierung. Die UTF-8-Codierung drückt diese jedoch irgendwie in viel kleinere Räume, indem sie eine sogenannte "Codierung mit variabler Breite" verwendet. Tatsächlich gelingt es ihm, die ersten 127 Zeichen von US-ASCII in nur einem …
Geschlossen . Diese Frage muss fokussierter sein . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so, dass sie sich nur auf ein Problem konzentriert, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 6 Jahren . Verbessere diese Frage Welche Unicode-Zeichen, Codepunkte und Bereiche …
Ich kenne das nicht standardmäßige% uxxxx-Schema, aber das scheint keine kluge Wahl zu sein, da das Schema vom W3C abgelehnt wurde. Einige interessante Beispiele: Der Herzcharakter. Wenn ich dies in meinen Browser eingebe: http://www.google.com/search?q=♥ Dann kopiere und füge es ein, ich sehe diese URL http://www.google.com/search?q=%E2%99%A5 Das lässt es so aussehen, …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.