Unicode soll ein universeller Zeichensatz sein, der alle für geschriebenen Text erforderlichen Zeichen beschreibt und alle Schriftsysteme, technischen Symbole und Satzzeichen enthält.
Ich werde fragen, was wahrscheinlich eine ziemlich kontroverse Frage ist: "Sollte eine der beliebtesten Kodierungen, UTF-16, als schädlich angesehen werden?" Warum stelle ich diese Frage? Wie vielen Programmierern ist bekannt, dass UTF-16 tatsächlich eine Kodierung mit variabler Länge ist? Damit meine ich, dass es Codepunkte gibt, die als Ersatzpaare dargestellt …
Falls eine Alien-Invasion stattfand und wir gezwungen waren, ihre Sprachen in allen unseren vorhandenen Computersystemen zu unterstützen, wurde UTF-8 so entwickelt, dass die möglicherweise große Anzahl von Zeichen berücksichtigt werden kann? (Natürlich wissen wir nicht, ob Ausländer tatsächlich Sprachen haben, ob oder wie sie kommunizieren, aber bitte stellen Sie sich …
Ich habe kürzlich versucht, einen Ranking-Algorithmus, AllegSkill, in Python 3 zu implementieren. So sieht die Mathematik aus: Nicht wirklich. Das habe ich dann geschrieben: t = (µw-µl)/c # those are used in e = ε/c # multiple places. σw_new = (σw**2 * (1 - (σw**2)/(c**2)*Wwin(t, e)) + γ**2)**.5 Ich dachte …
Ich dachte, Unicode wurde entwickelt, um das Problem der vielen unterschiedlichen Codierungen zu umgehen, da bei den meisten früheren Versuchen (ASCII usw.) nur ein kleiner Adressraum (8 Bit) zur Verfügung stand. Warum gibt es dann so viele Unicode-Codierungen? Sogar mehrere Versionen des (im Wesentlichen) gleichen, wie UTF-8, UTF-16 usw.
Unsere Branchen-Software ermöglicht es dem Benutzer, bestimmte Daten als CSV zu speichern . Da in der Natur viele verschiedene Formate (alle als "CSV" bezeichnet) verwendet werden, müssen wir uns entscheiden, wie das "Standardformat" aussehen soll. In Bezug auf Linien- / Feldtrennzeichen und Flucht gibt es einen Standard, den wir verwenden …
In den Unicode- Nutzungsbedingungen ist festgelegt, dass jede Software, die ihre Datendateien verwendet (oder eine Änderung davon), die Unicode-Lizenzreferenzen tragen muss. Mir scheint, dass die meisten Unicode-Bibliotheken über Funktionen verfügen, mit denen überprüft werden kann, ob ein Zeichen eine Ziffer, ein Buchstabe, ein Symbol usw. ist, und daher eine Änderung …
Ich lerne T-SQL. Aus den Beispielen, die ich gesehen habe, kann ich zum Einfügen von Text in eine varchar()Zelle nur die einzufügende Zeichenfolge schreiben, aber für nvarchar()Zellen wird in jedem Beispiel den Zeichenfolgen der Buchstabe N vorangestellt. Ich habe die folgende Abfrage für eine Tabelle mit nvarchar()Zeilen versucht, und sie …
Ein Tier von mir schaut sich so viele Softwareprojekte an, die Berge von Code für die Unterstützung von Zeichensätzen haben. Verstehen Sie mich nicht falsch, ich bin alle für die Kompatibilität, und ich bin froh, dass Sie mit Texteditoren Dateien in mehreren Zeichensätzen öffnen und speichern können. Was mich ärgert, …
Ich könnte mir vorstellen, dass der Grund dafür schnell war, der Array-ähnliche Zugriff auf die Zeichen am Index, aber einige Zeichen passen nicht in 16 Bit, also würde es nicht funktionieren ... Wenn Sie also trotzdem spezielle Fälle behandeln müssen, warum nicht einfach UTF-8 verwenden?
Bei der Arbeit stoße ich auf viele japanische Textdateien in Shift-JIS und anderen Codierungen. Es verursacht viele Mojibake- Probleme (nicht lesbare Zeichen) für alle Computerbenutzer. Unicode sollte dieses Problem lösen, indem ein einziger Zeichensatz für alle Sprachen definiert wurde. Die UTF-8-Serialisierung wird für die Verwendung im Internet empfohlen. Warum wechselt …
Jeder weiß, dass PHP Probleme mit Unicode hat. Version 6 wird aufgrund von Unicode-Implementierungsschwierigkeiten effektiv aufgegeben. Aber ich frage mich, ob jemand die genauen Gründe kennt ? Architektur- / Designprobleme, Leistungsprobleme, Community-Probleme (ich wette nicht), etwas anderes?
Ich habe mir gerade die Präsentation von Jon Skeet (mit Tony the Pony) von Dev-Days angesehen. Obwohl "write a string reverse function" die Kodierung von Interview 101 ist - ich bin mir nicht sicher, ob es tatsächlich möglich ist, eine allgemeine Funktion zum Umkehren von Zeichenfolgen zu schreiben, die sicherlich …
Ist UTF-16 eine feste Breite oder eine variable Breite? Ich habe unterschiedliche Ergebnisse aus verschiedenen Quellen erhalten: Von http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 speichert Unicode-Zeichen in 16-Bit-Blöcken. Aus http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16-Bit-Unicode-Transformationsformat) ist eine Zeichencodierung für Unicode, mit der 1.112.064 [1] Zahlen (als Codepunkte bezeichnet) im Unicode-Codebereich von 0 bis 0x10FFFF codiert …
Ich entwerfe ein Dateiformat und möchte es richtig machen. Da es sich um ein Binärformat handelt, sollte das erste Byte (oder die ersten Bytes) der Datei keine gültigen Textzeichen bilden (genau wie im PNG-Dateikopf 1 ). Auf diese Weise können Tools, die das Format nicht erkennen, anhand der ersten Bytes …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.