Unicode ist ein Standard für die Codierung, Darstellung und Handhabung von Text mit der Absicht, alle Zeichen zu unterstützen, die für geschriebenen Text erforderlich sind, einschließlich aller Schriftsysteme, technischen Symbole und Satzzeichen.
Ich habe einige Probleme beim Versuch, eine Zeichenfolge in UTF-8 zu codieren. Ich habe zahlreiche Dinge ausprobiert, einschließlich der Verwendung von string.encode('utf-8')und unicode(string), aber ich erhalte den Fehler: UnicodeDecodeError: Der Codec 'ascii' kann das Byte 0xef an Position 1 nicht dekodieren: Ordnungszahl nicht im Bereich (128) Das ist meine Zeichenfolge: …
Ich habe eine Verpflichtung , die relativ dunkel ist, aber es fühlt sich an wie es sollte möglich sein , die BCL verwenden. Für den Kontext analysiere ich eine Datums- / Zeitzeichenfolge in Noda Time . Ich behalte einen logischen Cursor für meine Position innerhalb der Eingabezeichenfolge. Während die vollständige …
Ich weiß also Bescheid String#codePointAt(int), aber es wird durch den charVersatz indiziert , nicht durch den Codepunktversatz. Ich denke darüber nach, etwas zu versuchen wie: Verwenden Sie String#charAt(int), um die charan einem Index zu erhalten Testen, ob der charim Bereich der hohen Surrogate liegt Wenn ja, verwenden Sie String#codePointAt(int), um …
Wie würde ein awkSkript (vermutlich ein Einzeiler) zum Entfernen einer Stückliste aussehen? Spezifikation: drucke jede Zeile nach der ersten ( NR > 1) für die erste Zeile: Wenn es mit #FE #FFoder beginnt #FF #FE, entfernen Sie diese und drucken Sie den Rest
Ich habe eine Zeichenfolge, die so aussieht: 6Â 918Â 417Â 712 Die eindeutige Methode zum Trimmen dieser Zeichenfolge (wie ich Python verstehe) besteht einfach darin, zu sagen, dass sich die Zeichenfolge in einer Variablen namens sbefindet. Wir erhalten: s.replace('Â ', '') Das sollte den Trick machen. Aber natürlich beschwert es …
Ich lese und analysiere eine Amazon XML-Datei und während die XML-Datei ein 'anzeigt, erhalte ich beim Versuch, sie zu drucken, die folgende Fehlermeldung: 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) Nach dem, was ich bisher online gelesen habe, ist der Fehler darauf zurückzuführen, dass …
In meinem JavaScript-Code muss ich eine Nachricht an den Server in diesem Format verfassen: <size in bytes>CRLF <data>CRLF Beispiel: 3 foo Die Daten können Unicode-Zeichen enthalten. Ich muss sie als UTF-8 senden. Ich suche nach der browserübergreifendsten Methode, um die Länge der Zeichenfolge in Byte in JavaScript zu berechnen. Ich …
Ich versuche das zu tun: <TextBlock Text="{Binding Path=Text, Converter={StaticResource stringFormatConverter}, ConverterParameter='&\u2014{0}'}" /> Um ein - vor dem Text erscheinen zu lassen. Es funktioniert nicht. Was soll ich hier machen?
In einer Textdatei gibt es eine Zeichenfolge "Ich mag das nicht". Wenn ich es jedoch in eine Zeichenfolge einlese, wird es zu "Ich mag \ xe2 \ x80 \ x98t nicht so". Ich verstehe, dass \ u2018 die Unicode-Darstellung von "'" ist. ich benutze f1 = open (file1, "r") text …
Gemäß der Dokumentation von Apache Commons Lang für StringUtils.isNumeric()ist der String '१२३' numerisch. Da ich glaubte, dass dies ein Fehler in der Dokumentation sein könnte, führte ich Tests durch, um die Aussage zu überprüfen. Ich fand , dass nach Apache Commons es ist numerisch. Warum ist dieser String numerisch? Was …
Wir haben unsere Codebasis bereits unter Python 2.6 zum Laufen gebracht. Um sich auf Python 3.0 vorzubereiten, haben wir Folgendes hinzugefügt: aus __future__ importiere unicode_literals in unsere .pyDateien (wie wir sie ändern). Ich frage mich, ob jemand anderes dies getan hat und auf nicht offensichtliche Fallstricke gestoßen ist (möglicherweise nachdem …
Bei der Arbeit mit Python 2.7 frage ich mich, welchen wirklichen Vorteil die Verwendung des Typs unicodeanstelle von hat str, da beide anscheinend Unicode-Zeichenfolgen enthalten können. Gibt es einen besonderen Grund, außer Unicode-Codes in unicodeStrings mit dem Escape- Zeichen setzen zu können \?: Ausführen eines Moduls mit: # -*- coding: …
Meine Kategorien müssen mit griechischen Buchstaben benannt werden. Ich benutze ggplot2, und es funktioniert wunderbar mit den Daten. Leider kann ich nicht herausfinden, wie diese griechischen Symbole auf der x-Achse (an den Häkchen) platziert und auch in der Legende angezeigt werden. Gibt es eine Möglichkeit, dies zu tun? UPDATE: Ich …
Ich arbeite mit einer TXT-Datei. Ich möchte eine Zeichenfolge des Textes aus der Datei ohne Nicht-ASCII-Zeichen. Ich möchte jedoch Leerzeichen und Punkte lassen. Zur Zeit ziehe ich diese auch aus. Hier ist der Code: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return char def …
Ich führe dieses Snippet zweimal im Ubuntu-Terminal aus (Codierung auf utf-8 eingestellt), einmal mit ./test.pyund dann mit ./test.py >out.txt: uni = u"\u001A\u0BC3\u1451\U0001D10C" print uni Ohne Umleitung wird Müll gedruckt. Bei Umleitung erhalte ich einen UnicodeDecodeError. Kann jemand erklären, warum ich den Fehler nur im zweiten Fall erhalte, oder noch besser …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.