Als «unicode» getaggte Fragen

Unicode soll ein universeller Zeichensatz sein, der alle für geschriebenen Text erforderlichen Zeichen beschreibt und alle Schriftsysteme, technischen Symbole und Satzzeichen enthält.

20
Sollte UTF-16 als schädlich angesehen werden?
Ich werde fragen, was wahrscheinlich eine ziemlich kontroverse Frage ist: "Sollte eine der beliebtesten Kodierungen, UTF-16, als schädlich angesehen werden?" Warum stelle ich diese Frage? Wie vielen Programmierern ist bekannt, dass UTF-16 tatsächlich eine Kodierung mit variabler Länge ist? Damit meine ich, dass es Codepunkte gibt, die als Ersatzpaare dargestellt …
432 unicode 

5
Wäre UTF-8 in der Lage, die Aufnahme einer riesigen Fremdsprache mit Millionen neuer Zeichen zu unterstützen?
Falls eine Alien-Invasion stattfand und wir gezwungen waren, ihre Sprachen in allen unseren vorhandenen Computersystemen zu unterstützen, wurde UTF-8 so entwickelt, dass die möglicherweise große Anzahl von Zeichen berücksichtigt werden kann? (Natürlich wissen wir nicht, ob Ausländer tatsächlich Sprachen haben, ob oder wie sie kommunizieren, aber bitte stellen Sie sich …
86 unicode  utf-8 


8
Warum gibt es mehrere Unicode-Codierungen?
Ich dachte, Unicode wurde entwickelt, um das Problem der vielen unterschiedlichen Codierungen zu umgehen, da bei den meisten früheren Versuchen (ASCII usw.) nur ein kleiner Adressraum (8 Bit) zur Verfügung stand. Warum gibt es dann so viele Unicode-Codierungen? Sogar mehrere Versionen des (im Wesentlichen) gleichen, wie UTF-8, UTF-16 usw.


2
Unicode-Lizenz
In den Unicode- Nutzungsbedingungen ist festgelegt, dass jede Software, die ihre Datendateien verwendet (oder eine Änderung davon), die Unicode-Lizenzreferenzen tragen muss. Mir scheint, dass die meisten Unicode-Bibliotheken über Funktionen verfügen, mit denen überprüft werden kann, ob ein Zeichen eine Ziffer, ein Buchstabe, ein Symbol usw. ist, und daher eine Änderung …




5
Welche Probleme führen dazu, dass japanische Codierungen anstelle von Unicode verwendet werden?
Bei der Arbeit stoße ich auf viele japanische Textdateien in Shift-JIS und anderen Codierungen. Es verursacht viele Mojibake- Probleme (nicht lesbare Zeichen) für alle Computerbenutzer. Unicode sollte dieses Problem lösen, indem ein einziger Zeichensatz für alle Sprachen definiert wurde. Die UTF-8-Serialisierung wird für die Verwendung im Internet empfohlen. Warum wechselt …



3
Ist es möglich, eine verallgemeinerte String-Umkehrfunktion zu schreiben, die für alle Lokalisierungen und String-Typen funktioniert?
Ich habe mir gerade die Präsentation von Jon Skeet (mit Tony the Pony) von Dev-Days angesehen. Obwohl "write a string reverse function" die Kodierung von Interview 101 ist - ich bin mir nicht sicher, ob es tatsächlich möglich ist, eine allgemeine Funktion zum Umkehren von Zeichenfolgen zu schreiben, die sicherlich …

2
Ist UTF-16 eine feste Breite oder eine variable Breite? Warum hat UTF-8 kein Problem mit der Bytereihenfolge?
Ist UTF-16 eine feste Breite oder eine variable Breite? Ich habe unterschiedliche Ergebnisse aus verschiedenen Quellen erhalten: Von http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 speichert Unicode-Zeichen in 16-Bit-Blöcken. Aus http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16-Bit-Unicode-Transformationsformat) ist eine Zeichencodierung für Unicode, mit der 1.112.064 [1] Zahlen (als Codepunkte bezeichnet) im Unicode-Codebereich von 0 bis 0x10FFFF codiert …

3
Ein Unicode-Sentinel-Wert, den ich verwenden kann?
Ich entwerfe ein Dateiformat und möchte es richtig machen. Da es sich um ein Binärformat handelt, sollte das erste Byte (oder die ersten Bytes) der Datei keine gültigen Textzeichen bilden (genau wie im PNG-Dateikopf 1 ). Auf diese Weise können Tools, die das Format nicht erkennen, anhand der ersten Bytes …
14 unicode 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.