Die Zeichenkodierung bezieht sich auf die Art und Weise, wie Zeichen als eine Reihe von Bytes dargestellt werden. Die Zeichenkodierung für das Web ist im Kodierungsstandard definiert.
Ich muss eine große Anzahl klassischer ASP-Seiten pflegen, von denen viele tabellarische Daten ohne Sortierfunktionen enthalten. Unabhängig von der Reihenfolge, in der der ursprüngliche Entwickler die Datenbankabfrage verwendet hat, bleibt die Reihenfolge bestehen. Ich möchte einige dieser Seiten grundlegend sortieren, und ich mache alles clientseitig mit Javascript. Ich habe bereits …
In Java habe ich einen String und möchte ihn als Byte-Array codieren (in UTF8 oder einer anderen Codierung). Alternativ habe ich ein Byte-Array (in einer bekannten Codierung) und möchte es in einen Java-String konvertieren. Wie mache ich diese Konvertierungen?
Ich ziehe Daten aus einem Google-Dokument, verarbeite sie und schreibe sie in eine Datei (die ich schließlich in eine Wordpress-Seite einfügen werde). Es hat einige Nicht-ASCII-Symbole. Wie kann ich diese sicher in Symbole konvertieren, die in HTML-Quellen verwendet werden können? Momentan konvertiere ich alles auf dem Weg nach Unicode, füge …
Ich möchte meiner Shell-Eingabeaufforderung den Unicode-Totenkopf hinzufügen (insbesondere den 'SKULL AND CROSSBONES' (U + 2620)), aber ich kann die magische Beschwörung nicht herausfinden, um das Echo dazu zu bringen, sie oder andere zu spucken. 4-stelliges Unicode-Zeichen. Zweistellige sind einfach. Zum Beispiel echo -e "\ x55" ,. Zusätzlich zu den folgenden …
Was war die ursprüngliche historische Verwendung des vertikalen Tabulatorzeichens ( \vin der C-Sprache ASCII 11)? Hatte es jemals eine Taste auf einer Tastatur? Wie hat es jemand generiert? Gibt es heute noch eine Sprache oder ein System, in dem das vertikale Tabulatorzeichen etwas Interessantes und Nützliches bewirkt?
Hier ist mein Code, for line in open('u.item'): #read each line Wenn ich diesen Code ausführe, wird der folgende Fehler ausgegeben: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte Ich habe versucht, dies zu lösen und einen zusätzlichen Parameter in open () hinzuzufügen. Der Code …
Zeichensatzprobleme sind für sich genommen verwirrend und kompliziert, aber darüber hinaus müssen Sie sich die genauen Namen Ihrer Zeichensätze merken. Ist es "utf8"? Oder "utf-8"? Oder vielleicht "UTF-8"? Wenn Sie im Internet nach Codebeispielen suchen, sehen Sie alle oben genannten Punkte. Warum nicht einfach Konstanten benennen und verwenden Charset.UTF8?
Ich verwende ein ' &' Symbol mit HTML5 und UTF-8 in meiner Site <title>. Google zeigt das kaufmännische Und auf seinen SERPs an, ebenso wie alle Browser in ihren Titeln. http://validator.w3.org gibt mir Folgendes : & hat keine Zeichenreferenz gestartet. (& hätte wahrscheinlich als entkommen sollen &amp;.) Muss ich das …
Ich versuche, HTML mit DOMDocument zu analysieren, aber wenn ich das tue, verliere ich plötzlich meine Codierung (zumindest erscheint es mir so). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Das Ergebnis dieses Codes ist, dass ich …
Ich war mir nie sicher, ob ich den Unterschied zwischen str / unicode decode und encode verstehe. Ich weiß, dass dies str().decode()der Fall ist, wenn Sie eine Byte-Zeichenfolge haben, von der Sie wissen, dass sie eine bestimmte Zeichencodierung hat. Wenn dieser Codierungsname gegeben ist, wird eine Unicode-Zeichenfolge zurückgegeben. Ich weiß, …
Mein Code kratzt nur eine Webseite und konvertiert sie dann in Unicode. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Aber ich bekomme ein UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position …
Ich habe diese Anweisung als die allererste Zeile zahlreicher CSS-Dateien gesehen, die mir übergeben wurden: @charset "UTF-8"; Was macht es und ist diese Regel notwendig? Wenn ich dieses Meta-Tag in mein "head" -Element einbinde, muss es dann nicht mehr auch in meinen CSS-Dateien vorhanden sein? <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Ich bin verwirrt über die Textcodierung und den Zeichensatz. Aus vielen Gründen muss ich in meiner bevorstehenden Arbeit Nicht-Unicode- und Nicht-UTF8-Inhalte lernen. Ich finde das Wort "Zeichensatz" in E-Mail-Headern wie in "ISO-2022-JP", aber es gibt keine solche Codierung in Texteditoren. (Ich habe mich in den verschiedenen Texteditoren umgesehen.) Was ist …
Ich habe eine Anwendung, die sich mit Kunden aus der ganzen Welt befasst, und natürlich möchte ich, dass alles, was in meine Datenbanken gelangt, UTF-8-codiert wird. Das Hauptproblem für mich ist, dass ich nicht weiß, wie die Quelle einer Zeichenfolge codiert werden soll - es könnte aus einem Textfeld stammen …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.