Als «unicode» getaggte Fragen

Unicode ist ein Standard für die Codierung, Darstellung und Handhabung von Text mit der Absicht, alle Zeichen zu unterstützen, die für geschriebenen Text erforderlich sind, einschließlich aller Schriftsysteme, technischen Symbole und Satzzeichen.



6
SyntaxError: Nicht-ASCII-Zeichen '\ xa3' in der Datei, wenn die Funktion '£' zurückgibt.
Angenommen, ich habe eine Funktion: def NewFunction(): return '£' Ich möchte einige Dinge mit einem Nummernzeichen davor drucken und es wird ein Fehler ausgegeben, wenn ich versuche, dieses Programm auszuführen. Diese Fehlermeldung wird angezeigt: SyntaxError: Non-ASCII character '\xa3' in file 'blah' but no encoding declared; see http://www.python.org/peps/pep-0263.html for details Kann …

21
Wie bekomme ich String-Objekte anstelle von Unicode von JSON?
Ich verwende Python 2 , um JSON aus ASCII-codierten Textdateien zu analysieren . Beim Laden dieser Dateien mit entweder jsonoder simplejsonwerden alle meine Zeichenfolgenwerte in Unicode-Objekte anstelle von Zeichenfolgenobjekten umgewandelt. Das Problem ist, ich muss die Daten mit einigen Bibliotheken verwenden, die nur Zeichenfolgenobjekte akzeptieren. Ich kann die Bibliotheken weder …


4
Warum druckt dieser rückwärts geschriebene Code "Hallo Welt!"
Hier ist ein Code, den ich im Internet gefunden habe: class M‮{public static void main(String[]a‭){System.out.print(new char[] {'H','e','l','l','o',' ','W','o','r','l','d','!'});}} Dieser Code wird Hello World!auf dem Bildschirm gedruckt . Sie können es hier laufen sehen . Ich kann deutlich public static void maingeschrieben sehen, aber es ist rückwärts. Wie funktioniert dieser Code? …

9
UnicodeDecodeError, ungültiges Fortsetzungsbyte
Warum schlägt der folgende Punkt fehl? und warum gelingt es mit "latin-1" codec? o = "a test of \xe9 char" #I want this to remain a string as this is what I am receiving v = o.decode("utf-8") Ergebnisse in: Traceback (most recent call last): File "<stdin>", line 1, in <module> …
257 python  unicode  decode 

7
Ersetzen Sie Nicht-ASCII-Zeichen durch ein Leerzeichen
Ich muss alle Nicht-ASCII-Zeichen (\ x00- \ x7F) durch ein Leerzeichen ersetzen. Ich bin überrascht, dass dies in Python nicht ganz einfach ist, es sei denn, ich vermisse etwas. Die folgende Funktion entfernt einfach alle Nicht-ASCII-Zeichen: def remove_non_ascii_1(text): return ''.join(i for i in text if ord(i)<128) Und dieses ersetzt Nicht-ASCII-Zeichen …

13
Python: \ xa0 aus String entfernen?
Ich verwende derzeit Beautiful Soup, um eine HTML-Datei zu analysieren und aufzurufen get_text(), aber es scheint, als würde mir eine Menge \ xa0 Unicode übrig bleiben, die Leerzeichen darstellen. Gibt es eine effiziente Möglichkeit, alle in Python 2.7 zu entfernen und in Leerzeichen umzuwandeln? Ich denke, die allgemeinere Frage wäre, …
239 python  parsing  unicode 

12
Wie viele Bytes benötigt ein Unicode-Zeichen?
Ich bin ein bisschen verwirrt über Codierungen. Soweit ich weiß, haben alte ASCII-Zeichen ein Byte pro Zeichen benötigt. Wie viele Bytes benötigt ein Unicode-Zeichen? Ich gehe davon aus, dass ein Unicode-Zeichen jedes mögliche Zeichen aus einer beliebigen Sprache enthalten kann - bin ich richtig? Wie viele Bytes benötigt es pro …

5
Wie kann ich die Codierung einer Datei mit vim ändern?
Ich bin es gewohnt, mit vim die Zeilenenden einer Datei zu ändern: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators Ist es möglich, mit einem ähnlichen Verfahren die Unicode-Codierung einer Datei zu …
235 vim  unicode 

8
Unicode-Text in eine Textdatei schreiben?
Ich ziehe Daten aus einem Google-Dokument, verarbeite sie und schreibe sie in eine Datei (die ich schließlich in eine Wordpress-Seite einfügen werde). Es hat einige Nicht-ASCII-Symbole. Wie kann ich diese sicher in Symbole konvertieren, die in HTML-Quellen verwendet werden können? Momentan konvertiere ich alles auf dem Weg nach Unicode, füge …


18
Wie wird ein 4-stelliges Unicode-Zeichen in Bash wiedergegeben?
Ich möchte meiner Shell-Eingabeaufforderung den Unicode-Totenkopf hinzufügen (insbesondere den 'SKULL AND CROSSBONES' (U + 2620)), aber ich kann die magische Beschwörung nicht herausfinden, um das Echo dazu zu bringen, sie oder andere zu spucken. 4-stelliges Unicode-Zeichen. Zweistellige sind einfach. Zum Beispiel echo -e "\ x55" ,. Zusätzlich zu den folgenden …

11
JavaScript + Unicode-Regexe
Wie kann ich Unicode-fähige reguläre Ausdrücke in JavaScript verwenden? Zum Beispiel sollte es etwas Ähnliches geben, \wdas mit jedem Codepunkt in der Kategorie Buchstaben oder Markierungen (nicht nur mit den ASCII-Buchstaben) übereinstimmen kann und hoffentlich Filter wie [[P *]] für Interpunktion usw. enthält.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.