Als «unicode» getaggte Fragen

Unicode ist ein Standard für die Codierung, Darstellung und Handhabung von Text mit der Absicht, alle Zeichen zu unterstützen, die für geschriebenen Text erforderlich sind, einschließlich aller Schriftsysteme, technischen Symbole und Satzzeichen.

UnicodeDecodeError: Der Codec 'ascii' kann das Byte 0xef an Position 1 nicht dekodieren

Ich habe einige Probleme beim Versuch, eine Zeichenfolge in UTF-8 zu codieren. Ich habe zahlreiche Dinge ausprobiert, einschließlich der Verwendung von string.encode('utf-8')und unicode(string), aber ich erhalte den Fehler: UnicodeDecodeError: Der Codec 'ascii' kann das Byte 0xef an Position 1 nicht dekodieren: Ordnungszahl nicht im Bereich (128) Das ist meine Zeichenfolge: …

106 python unicode utf-8

Wie kann ich eine kultursensitive "Start-with" -Operation von der Mitte eines Strings aus durchführen?

Ich habe eine Verpflichtung , die relativ dunkel ist, aber es fühlt sich an wie es sollte möglich sein , die BCL verwenden. Für den Kontext analysiere ich eine Datums- / Zeitzeichenfolge in Noda Time . Ich behalte einen logischen Cursor für meine Position innerhalb der Eingabezeichenfolge. Während die vollständige …

106 .net string unicode

Wie kann ich die Unicode-Codepunkte eines Java-Strings durchlaufen?

Ich weiß also Bescheid String#codePointAt(int), aber es wird durch den charVersatz indiziert , nicht durch den Codepunktversatz. Ich denke darüber nach, etwas zu versuchen wie: Verwenden Sie String#charAt(int), um die charan einem Index zu erhalten Testen, ob der charim Bereich der hohen Surrogate liegt Wenn ja, verwenden Sie String#codePointAt(int), um …

105 java string unicode

Verwenden Sie awk, um die Byte-Reihenfolge zu entfernen

Wie würde ein awkSkript (vermutlich ein Einzeiler) zum Entfernen einer Stückliste aussehen? Spezifikation: drucke jede Zeile nach der ersten ( NR > 1) für die erste Zeile: Wenn es mit #FE #FFoder beginnt #FF #FE, entfernen Sie diese und drucken Sie den Rest

105 unicode awk byte-order-mark

Wie kann der Python-Interpreter Nicht-ASCII-Zeichen in Zeichenfolgenoperationen korrekt verarbeiten?

Ich habe eine Zeichenfolge, die so aussieht: 6Â 918Â 417Â 712 Die eindeutige Methode zum Trimmen dieser Zeichenfolge (wie ich Python verstehe) besteht einfach darin, zu sagen, dass sich die Zeichenfolge in einer Variablen namens sbefindet. Wir erhalten: s.replace('Â ', '') Das sollte den Trick machen. Aber natürlich beschwert es …

104 python unicode

Python Unicode-Codierungsfehler

Ich lese und analysiere eine Amazon XML-Datei und während die XML-Datei ein 'anzeigt, erhalte ich beim Versuch, sie zu drucken, die folgende Fehlermeldung: 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) Nach dem, was ich bisher online gelesen habe, ist der Fehler darauf zurückzuführen, dass …

104 python unicode ascii encode

Zeichenfolgenlänge in Bytes in JavaScript

In meinem JavaScript-Code muss ich eine Nachricht an den Server in diesem Format verfassen: <size in bytes>CRLF <data>CRLF Beispiel: 3 foo Die Daten können Unicode-Zeichen enthalten. Ich muss sie als UTF-8 senden. Ich suche nach der browserübergreifendsten Methode, um die Länge der Zeichenfolge in Byte in JavaScript zu berechnen. Ich …

104 javascript unicode

Wie füge ich ein Unicode-Zeichen in XAML ein?

Ich versuche das zu tun: <TextBlock Text="{Binding Path=Text, Converter={StaticResource stringFormatConverter}, ConverterParameter='&\u2014{0}'}" /> Um ein - vor dem Text erscheinen zu lassen. Es funktioniert nicht. Was soll ich hier machen?

104 wpf xaml unicode binding

Lesen von Zeichen aus einer Datei in Python

In einer Textdatei gibt es eine Zeichenfolge "Ich mag das nicht". Wenn ich es jedoch in eine Zeichenfolge einlese, wird es zu "Ich mag \ xe2 \ x80 \ x98t nicht so". Ich verstehe, dass \ u2018 die Unicode-Darstellung von "'" ist. ich benutze f1 = open (file1, "r") text …

102 python unicode encoding ascii

Warum betrachtet Apache Commons '१२३' als numerisch?

Gemäß der Dokumentation von Apache Commons Lang für StringUtils.isNumeric()ist der String '१२३' numerisch. Da ich glaubte, dass dies ein Fehler in der Dokumentation sein könnte, führte ich Tests durch, um die Aussage zu überprüfen. Ich fand , dass nach Apache Commons es ist numerisch. Warum ist dieser String numerisch? Was …

101 java unicode number-systems apache-commons-lang3

Gibt es Fallstricke, die unicode_literals in Python 2.6 verwenden?

Wir haben unsere Codebasis bereits unter Python 2.6 zum Laufen gebracht. Um sich auf Python 3.0 vorzubereiten, haben wir Folgendes hinzugefügt: aus __future__ importiere unicode_literals in unsere .pyDateien (wie wir sie ändern). Ich frage mich, ob jemand anderes dies getan hat und auf nicht offensichtliche Fallstricke gestoßen ist (möglicherweise nachdem …

101 python unicode python-2.6 unicode-literals

Python str vs Unicode-Typen

Bei der Arbeit mit Python 2.7 frage ich mich, welchen wirklichen Vorteil die Verwendung des Typs unicodeanstelle von hat str, da beide anscheinend Unicode-Zeichenfolgen enthalten können. Gibt es einen besonderen Grund, außer Unicode-Codes in unicodeStrings mit dem Escape- Zeichen setzen zu können \?: Ausführen eines Moduls mit: # -*- coding: …

101 python string unicode

Wie verwende ich griechische Symbole in ggplot2?

Meine Kategorien müssen mit griechischen Buchstaben benannt werden. Ich benutze ggplot2, und es funktioniert wunderbar mit den Daten. Leider kann ich nicht herausfinden, wie diese griechischen Symbole auf der x-Achse (an den Häkchen) platziert und auch in der Legende angezeigt werden. Gibt es eine Möglichkeit, dies zu tun? UPDATE: Ich …

101 r graphics unicode utf-8 ggplot2

Wie kann ich Nicht-ASCII-Zeichen entfernen, aber mit Python Punkte und Leerzeichen lassen?

Ich arbeite mit einer TXT-Datei. Ich möchte eine Zeichenfolge des Textes aus der Datei ohne Nicht-ASCII-Zeichen. Ich möchte jedoch Leerzeichen und Punkte lassen. Zur Zeit ziehe ich diese auch aus. Hier ist der Code: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return char def …

100 python text unicode filter ascii

UnicodeDecodeError beim Umleiten in eine Datei

Ich führe dieses Snippet zweimal im Ubuntu-Terminal aus (Codierung auf utf-8 eingestellt), einmal mit ./test.pyund dann mit ./test.py >out.txt: uni = u"\u001A\u0BC3\u1451\U0001D10C" print uni Ohne Umleitung wird Müll gedruckt. Bei Umleitung erhalte ich einen UnicodeDecodeError. Kann jemand erklären, warum ich den Fehler nur im zweiten Fall erhalte, oder noch besser …

100 python unicode

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.

Licensed under cc by-sa 3.0 with attribution required.