Als «unicode» getaggte Fragen

Unicode ist ein Computer-Industriestandard für die konsistente Codierung, Darstellung und Verarbeitung von Text, der in den meisten Schreibsystemen der Welt ausgedrückt wird.



2
Wie kann ich die Standardcodierung von VIM auf UTF-8 einstellen?
Ich möchte zu einem Open-Source-Projekt beitragen, das übersetzte Zeichenfolgen bereitstellt. Eine ihrer Anforderungen ist, dass Mitwirkende UTF-8 als Kodierung für die PO-Dateien verwenden müssen. Ich verwende VIM 7.3 unter Linux. Wie kann ich sicher sein, dass die VIM-Codierung auf UTF-8 eingestellt ist, damit ich die PO-Datei richtig bearbeiten und speichern …

2
Warum schrumpft printf den Umlaut?
Wenn ich das folgende einfache Skript ausführe: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Es druckt: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz Das heißt, Text mit Umlauten (z. B. ü) wird um ein Zeichen pro Umlaut "verkleinert". …
54 bash  unicode  printf 

6
Filterung ungültiger utf8
Ich habe eine Textdatei mit unbekannter oder gemischter Codierung. Ich möchte die Zeilen sehen, die eine Byte-Sequenz enthalten, die nicht für UTF-8 gültig ist (indem ich die Textdatei in ein Programm weitergebe). Entsprechend möchte ich die Zeilen herausfiltern, die für UTF-8 gültig sind. Mit anderen Worten, ich suche .grep [notutf8] …





5
Mein Arch Linux Server wurde aktualisiert und jetzt bekomme ich tmux: brauche das UTF-8-Gebietsschema (LC_CTYPE), habe aber ANSI_X3.4-1968
Ich habe kürzlich meinen Arch Linux-Server aktualisiert und während dieses Vorgangs wurde tmux aktualisiert. Ich habe verwendet, tmuxwährend das Upgrade ausgeführt wurde, und habe es anschließend verwendet, aber alle während derselben SSH-Sitzung. Wenn ich jetzt jedoch versuche, einen tmuxBefehl auszuführen, erhalte ich den folgenden Fehler: tmux: need UTF-8 locale (LC_CTYPE) …


3
Warum sagt sort, dass ɛ = e ist?
ɛ("Latin epsilon") ist ein Buchstabe, der in bestimmten afrikanischen Sprachen verwendet wird und normalerweise den Vokalton im englischen "Bett" darstellt. In Unicode wird es als U + 025B codiert, ganz anders als im Alltag e. Wenn ich aber sortfolgendes: eb ed ɛa ɛc es scheint, dass sortberücksichtigt ɛund egleichwertig: ɛa …
25 sort  locale  unicode 




Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.