Unicode ist ein Computer-Industriestandard für die konsistente Codierung, Darstellung und Verarbeitung von Text, der in den meisten Schreibsystemen der Welt ausgedrückt wird.
Ich bin gerade auf einen Screenshot eines Terminals gestoßen: Gibt es eine Liste aller Zeichen, die in einer Bash-Eingabeaufforderung verwendet werden können, oder kann mir jemand das Zeichen für den Stern und den rechten Pfeil geben?
Ich habe eine Datei in UTF-8-Codierung mit Stückliste und möchte die Stückliste entfernen. Gibt es Linux-Befehlszeilentools, um die Stückliste aus der Datei zu entfernen? $ file test.xml test.xml: XML 1.0 document, UTF-8 Unicode (with BOM) text, with very long lines
Ich möchte zu einem Open-Source-Projekt beitragen, das übersetzte Zeichenfolgen bereitstellt. Eine ihrer Anforderungen ist, dass Mitwirkende UTF-8 als Kodierung für die PO-Dateien verwenden müssen. Ich verwende VIM 7.3 unter Linux. Wie kann ich sicher sein, dass die VIM-Codierung auf UTF-8 eingestellt ist, damit ich die PO-Datei richtig bearbeiten und speichern …
Wenn ich das folgende einfache Skript ausführe: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Es druckt: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz Das heißt, Text mit Umlauten (z. B. ü) wird um ein Zeichen pro Umlaut "verkleinert". …
Ich habe eine Textdatei mit unbekannter oder gemischter Codierung. Ich möchte die Zeilen sehen, die eine Byte-Sequenz enthalten, die nicht für UTF-8 gültig ist (indem ich die Textdatei in ein Programm weitergebe). Entsprechend möchte ich die Zeilen herausfiltern, die für UTF-8 gültig sind. Mit anderen Worten, ich suche .grep [notutf8] …
Ich habe mir diese Antwort beim Stackoverflow angesehen und festgestellt, dass meine Schriften nicht das gesamte UTF-8-Unicode-Spektrum abdecken (da ich viele Quadrate erhalte). Kennt jemand eine Schriftart, die den gesamten Beitrag abdeckt?
Der einfache Code hier funktioniert erwartungsgemäß auf meinem Computer, wenn er mit bashfolgendem Befehl gestartet wird : function ⏰(){ date } ⏰ Könnte es ein Problem für andere geben, die das benutzen, oder ist es universell? Ich frage mich, weil ich so etwas noch nie in einem anderen Quellcode gesehen …
Ich versuche, einige Zeichen aus der Datei zu entfernen (UTF-8). Ich benutze trfür diesen Zweck: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Die Datei enthält einige fremde Zeichen (wie "Латвийская" oder "àé"). trscheint sie nicht zu verstehen: es behandelt sie als Nicht-Alpha und entfernt sie auch. Ich habe versucht, einige meiner …
Zum Beispiel: sed 's/\u0091//g' file1 Im Moment muss ich tun hexdump, um die Hex-Zahl zu bekommen und sedwie folgt zu setzen: $ echo -ne '\u9991' | hexdump -C 00000000 e9 a6 91 |...| 00000003 Und dann: $ sed 's/\xe9\xa6\x91//g' file1
Ich habe kürzlich meinen Arch Linux-Server aktualisiert und während dieses Vorgangs wurde tmux aktualisiert. Ich habe verwendet, tmuxwährend das Upgrade ausgeführt wurde, und habe es anschließend verwendet, aber alle während derselben SSH-Sitzung. Wenn ich jetzt jedoch versuche, einen tmuxBefehl auszuführen, erhalte ich den folgenden Fehler: tmux: need UTF-8 locale (LC_CTYPE) …
Ich verwende den folgenden Befehl, um den Zeichensatzbereich für den Hexadezimalcode 0900 (anstelle von अ) bis 097F (anstelle von व) zu ermitteln. Wie kann ich hexadezimalen Code anstelle von अ und व verwenden? bzcat archive.bz2 | grep -v '<[अ-व]*\s' | tr '[:punct:][:blank:][:digit:]' '\n' | uniq | grep -o '^[अ-व]*$' | …
ɛ("Latin epsilon") ist ein Buchstabe, der in bestimmten afrikanischen Sprachen verwendet wird und normalerweise den Vokalton im englischen "Bett" darstellt. In Unicode wird es als U + 025B codiert, ganz anders als im Alltag e. Wenn ich aber sortfolgendes: eb ed ɛa ɛc es scheint, dass sortberücksichtigt ɛund egleichwertig: ɛa …
Ich habe eine Liste von Unicode-Codepunkten, aber ich kenne keine "einfache" Möglichkeit, diese Hex-Werte in die tatsächlichen Zeichen zu konvertieren, die sie darstellen ... Ich habe gehört, dass zsh hat echo -e '\u0965', aber ich benutze Bash 4.1. Gibt es etwas so Einfaches wie die zsh-Methode für Bash?
In Unicode haben einige Zeichenkombinationen mehr als eine Darstellung. Beispielsweise kann das Zeichen ä dargestellt werden als "ä", das ist der Codepunkt U + 00E4 (zwei Bytes c3 a4bei UTF-8-Codierung) oder as "ä", das sind die beiden Codepunkte U + 0061 U + 0308 (drei Bytes 61 cc 88in UTF-8). …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.