Unicode ist ein Standard für die Codierung, Darstellung und Handhabung von Text mit der Absicht, alle Zeichen zu unterstützen, die für geschriebenen Text erforderlich sind, einschließlich aller Schriftsysteme, technischen Symbole und Satzzeichen.
Ich benutze Python 2.6.5. Mein Code erfordert die Verwendung des Zeichens "mehr als oder gleich". Hier kommt's: >>> s = u'\u2265' >>> print s >>> ≥ >>> print "{0}".format(s) Traceback (most recent call last): File "<input>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode character u'\u2265' in position 0: …
Ich erhalte eine Fehlermeldung mit folgendem Muster: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) u'\ufeff'Ich bin mir nicht sicher, was es ist. Es zeigt sich, wenn ich Web Scraping mache. Wie kann ich Abhilfe schaffen? Die .replace()String-Methode funktioniert nicht.
Ich habe die Dokumentation gelesen StringBuffer, insbesondere für die reverse () -Methode. Diese Dokumentation erwähnt etwas über Ersatzpaare . Was ist in diesem Zusammenhang ein Ersatzpaar? Und was sind niedrige und hohe Ersatzzeichen?
На этот вопрос есть ответы на Stapelüberlauf на русском : Как из Python вывести на Windows-консоль строку в Юникоде? Wenn ich versuche, eine Unicode-Zeichenfolge in einer Windows-Konsole zu drucken, wird eine UnicodeEncodeError: 'charmap' codec can't encode character ....Fehlermeldung angezeigt. Ich gehe davon aus, dass die Windows-Konsole keine Nur-Unicode-Zeichen akzeptiert. Was …
Der Versuch, die Feinheiten des modernen Unicode zu verstehen, schmerzt meinen Kopf. Insbesondere die Unterscheidung zwischen Codepunkten, Zeichen, Glyphen und Graphemen - Konzepte, die im einfachsten Fall beim Umgang mit englischem Text mit ASCII-Zeichen eine Eins-zu-Eins-Beziehung zueinander haben - bereitet mir Probleme. Als ich sah, wie diese Begriffe in Dokumenten …
Dieser Code: string a = "abc"; string b = "A𠈓C"; Console.WriteLine("Length a = {0}", a.Length); Console.WriteLine("Length b = {0}", b.Length); Ausgänge: Length a = 3 Length b = 4 Warum? Das einzige, was ich mir vorstellen kann, ist, dass das chinesische Schriftzeichen 2 Bytes lang ist und dass die .LengthMethode …
На этот вопрос есть ответы на Stack Overflow на русском : по кодировкам utf-8 выдает результат по-разном Dies wird sicherlich leicht sein, aber es nervt mich wirklich. Ich habe ein Skript, das eine Webseite einliest und Beautiful Soup verwendet , um sie zu analysieren. Aus der Suppe extrahiere ich alle …
Ich verfolge eine virtuelle PC-Maschinendatei (* .vmc) in git und nach einer Änderung identifizierte git die Datei als binär und würde sie für mich nicht unterscheiden. Ich habe festgestellt, dass die Datei in UTF-16 codiert wurde. Kann man Git beibringen, zu erkennen, dass es sich bei dieser Datei um Text …
Aus der Python 2.6-Shell: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> Ich habe erwartet, dass nach der print-Anweisung entweder Kauderwelsch oder ein Fehler auftritt, da das Zeichen "é" nicht Teil von ASCII ist und ich keine Codierung angegeben habe. Ich glaube, ich verstehe nicht, was …
Unterschied zwischen UTF-8 und UTF-16? Warum brauchen wir diese? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();
Ich versuche ein Python-Paket namens bidi zu verwenden. In einem Modul in diesem Paket (algorithm.py) gibt es einige Zeilen, die mir Fehler geben, obwohl es Teil des Pakets ist. Hier sind die Zeilen: # utf-8 ? we need unicode if isinstance(unicode_or_str, unicode): text = unicode_or_str decoded = False else: text …
Würden Sie 2010 URLs mit UTF-8-Zeichen in einem großen Webportal bereitstellen? Unicode-Zeichen sind gemäß RFC für URLs verboten (siehe hier ). Sie müssten prozentual codiert sein, um standardkonform zu sein. Mein Hauptpunkt ist jedoch, die nicht codierten Zeichen nur für gut aussehende URLs bereitzustellen, sodass die prozentuale Codierung nicht funktioniert. …
Ich muss ein Omega (Ω) in meine HTML-Seite einfügen. Ich verwende dazu den HTML-Code, damit ich &#937;Ω schreiben und erhalten kann. Das ist alles in Ordnung und gut, wenn ich es in ein HTML-Element einfüge. Wenn ich jedoch versuche, es in mein JS var Omega = &#937;einzufügen, analysiert es diesen …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.