Als «character-encoding» getaggte Fragen

2
Wie erkenne ich die Kodierung einer Datei?
Auf meinem Dateisystem (Windows 7) habe ich einige Textdateien (dies sind SQL-Skriptdateien, falls dies wichtig ist). Beim Öffnen mit Notepad ++ wird im Menü "Codierung" angegeben, dass einige von ihnen eine Codierung von "UCS-2 Little Endian" und einige von "UTF-8 ohne Stückliste" aufweisen. Was ist der Unterschied hier? Sie scheinen …

5
Was ist der Vorteil der Wahl der ASCII-Codierung gegenüber UTF-8?
Alle Zeichen in ASCII können mit UTF-8 ohne Speichererweiterung codiert werden (beides erfordert ein Byte Speicherplatz). UTF-8 bietet den zusätzlichen Vorteil der Zeichenunterstützung über "ASCII-Zeichen" hinaus. Wenn dies der Fall ist, warum wählen wir dann jemals eine ASCII-Codierung anstelle von UTF-8? Gibt es einen Anwendungsfall, in dem wir ASCII anstelle …




7
Wird der Wagenrücklauf als veraltet angesehen?
Ich habe eine Open-Source-Bibliothek geschrieben, die strukturierte Daten analysiert, aber die Wagenrücklauferkennung absichtlich ausgelassen hat, weil ich den Punkt nicht verstehe. Es erhöht die Komplexität und den Overhead bei geringem / keinem Nutzen. Zu meiner Überraschung reichte ein Benutzer einen Fehler ein, bei dem der Parser nicht funktionierte, und ich …

5
Welche Probleme führen dazu, dass japanische Codierungen anstelle von Unicode verwendet werden?
Bei der Arbeit stoße ich auf viele japanische Textdateien in Shift-JIS und anderen Codierungen. Es verursacht viele Mojibake- Probleme (nicht lesbare Zeichen) für alle Computerbenutzer. Unicode sollte dieses Problem lösen, indem ein einziger Zeichensatz für alle Sprachen definiert wurde. Die UTF-8-Serialisierung wird für die Verwendung im Internet empfohlen. Warum wechselt …


2
Ist UTF-16 eine feste Breite oder eine variable Breite? Warum hat UTF-8 kein Problem mit der Bytereihenfolge?
Ist UTF-16 eine feste Breite oder eine variable Breite? Ich habe unterschiedliche Ergebnisse aus verschiedenen Quellen erhalten: Von http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 speichert Unicode-Zeichen in 16-Bit-Blöcken. Aus http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16-Bit-Unicode-Transformationsformat) ist eine Zeichencodierung für Unicode, mit der 1.112.064 [1] Zahlen (als Codepunkte bezeichnet) im Unicode-Codebereich von 0 bis 0x10FFFF codiert …

3
Sollte mein Quellcode in UTF-8 sein?
Ich habe das Gefühl, dass Sie oft nicht wirklich auswählen, in welchem ​​Format Ihr Code vorliegt. Ich meine, die meisten meiner Tools in der Vergangenheit haben sich für mich entschieden. Oder ich habe nicht wirklich darüber nachgedacht. Ich habe neulich TextPad unter Windows verwendet und als ich eine Datei speicherte, …

2
Wie relevant ist UTF-7 beim Parsen von E-Mails?
Ich habe kürzlich eingehende E-Mails für eine Anwendung implementiert und Junge, habe ich die Tore der Hölle geöffnet? Seitdem kommt jeden zweiten Tag eine E-Mail an, die dazu führt, dass die App auf andere Weise fehlschlägt. Eines dieser Dinge sind E-Mails, die als UTF-7 codiert sind. Die meisten E-Mails kommen …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.