Softwareentwicklung character-encoding

2

Wie erkenne ich die Kodierung einer Datei?

Auf meinem Dateisystem (Windows 7) habe ich einige Textdateien (dies sind SQL-Skriptdateien, falls dies wichtig ist). Beim Öffnen mit Notepad ++ wird im Menü "Codierung" angegeben, dass einige von ihnen eine Codierung von "UCS-2 Little Endian" und einige von "UTF-8 ohne Stückliste" aufweisen. Was ist der Unterschied hier? Sie scheinen …

115 file-systems character-encoding utf-8 notepad++

5

Was ist der Vorteil der Wahl der ASCII-Codierung gegenüber UTF-8?

Alle Zeichen in ASCII können mit UTF-8 ohne Speichererweiterung codiert werden (beides erfordert ein Byte Speicherplatz). UTF-8 bietet den zusätzlichen Vorteil der Zeichenunterstützung über "ASCII-Zeichen" hinaus. Wenn dies der Fall ist, warum wählen wir dann jemals eine ASCII-Codierung anstelle von UTF-8? Gibt es einen Anwendungsfall, in dem wir ASCII anstelle …

91 character-encoding utf-8 ascii

2

Warum enden so viele gehashte und verschlüsselte Zeichenfolgen in einem Gleichheitszeichen?

Ich arbeite in C # und MSSQL und wie zu erwarten, speichere ich meine Passwörter gesalzen und gehasht. Wenn ich mir den in einer nvarchar-Spalte gespeicherten Hash ansehe (zum Beispiel den out the box aspnet-Mitgliedschaftsanbieter). Ich war schon immer neugierig, warum die generierten Salt- und Hash-Werte immer mit ein oder …

64 hashing character-encoding

3

Warum müssen wir in Microsoft SQL Server N vor Zeichenfolgen setzen?

Ich lerne T-SQL. Aus den Beispielen, die ich gesehen habe, kann ich zum Einfügen von Text in eine varchar()Zelle nur die einzufügende Zeichenfolge schreiben, aber für nvarchar()Zellen wird in jedem Beispiel den Zeichenfolgen der Buchstabe N vorangestellt. Ich habe die folgende Abfrage für eine Tabelle mit nvarchar()Zeilen versucht, und sie …

34 sql sql-server character-encoding unicode

8

Sollten Zeichenkodierungen außer UTF-8 (und möglicherweise UTF-16 / UTF-32) veraltet sein?

Ein Tier von mir schaut sich so viele Softwareprojekte an, die Berge von Code für die Unterstützung von Zeichensätzen haben. Verstehen Sie mich nicht falsch, ich bin alle für die Kompatibilität, und ich bin froh, dass Sie mit Texteditoren Dateien in mehreren Zeichensätzen öffnen und speichern können. Was mich ärgert, …

31 unicode utf-8 character-encoding

7

Wird der Wagenrücklauf als veraltet angesehen?

Ich habe eine Open-Source-Bibliothek geschrieben, die strukturierte Daten analysiert, aber die Wagenrücklauferkennung absichtlich ausgelassen hat, weil ich den Punkt nicht verstehe. Es erhöht die Komplexität und den Overhead bei geringem / keinem Nutzen. Zu meiner Überraschung reichte ein Benutzer einen Fehler ein, bei dem der Parser nicht funktionierte, und ich …

26 mac osx character-encoding software-obsolescence

5

Welche Probleme führen dazu, dass japanische Codierungen anstelle von Unicode verwendet werden?

Bei der Arbeit stoße ich auf viele japanische Textdateien in Shift-JIS und anderen Codierungen. Es verursacht viele Mojibake- Probleme (nicht lesbare Zeichen) für alle Computerbenutzer. Unicode sollte dieses Problem lösen, indem ein einziger Zeichensatz für alle Sprachen definiert wurde. Die UTF-8-Serialisierung wird für die Verwendung im Internet empfohlen. Warum wechselt …

24 legacy unicode character-encoding

4

Warum verschwendet UTF-8 mehrere Bits in seiner Codierung

Laut Wikipedia-Artikel hat UTF-8 das folgende Format: Erster Code Letzter Code Bytes Byte 1 Byte 2 Byte 3 Byte 4 point point Verwendet U + 0000 U + 007F 1 0xxxxxxx U + 0080 U + 07FF 2 110xxxxx 10xxxxxx U + 0800 U + FFFF 3 1110xxxx 10xxxxxx 10xxxxxx …

16 character-encoding utf-8 text-encoding

2

Ist UTF-16 eine feste Breite oder eine variable Breite? Warum hat UTF-8 kein Problem mit der Bytereihenfolge?

Ist UTF-16 eine feste Breite oder eine variable Breite? Ich habe unterschiedliche Ergebnisse aus verschiedenen Quellen erhalten: Von http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 speichert Unicode-Zeichen in 16-Bit-Blöcken. Aus http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16-Bit-Unicode-Transformationsformat) ist eine Zeichencodierung für Unicode, mit der 1.112.064 [1] Zahlen (als Codepunkte bezeichnet) im Unicode-Codebereich von 0 bis 0x10FFFF codiert …

16 unicode character-encoding utf-8

3

Sollte mein Quellcode in UTF-8 sein?

Ich habe das Gefühl, dass Sie oft nicht wirklich auswählen, in welchem Format Ihr Code vorliegt. Ich meine, die meisten meiner Tools in der Vergangenheit haben sich für mich entschieden. Oder ich habe nicht wirklich darüber nachgedacht. Ich habe neulich TextPad unter Windows verwendet und als ich eine Datei speicherte, …

10 coding-standards source-code character-encoding utf-8

2

Wie relevant ist UTF-7 beim Parsen von E-Mails?

Ich habe kürzlich eingehende E-Mails für eine Anwendung implementiert und Junge, habe ich die Tore der Hölle geöffnet? Seitdem kommt jeden zweiten Tag eine E-Mail an, die dazu führt, dass die App auf andere Weise fehlschlägt. Eines dieser Dinge sind E-Mails, die als UTF-7 codiert sind. Die meisten E-Mails kommen …

8 ruby character-encoding text-encoding

Als «character-encoding» getaggte Fragen