Programmierung character-encoding

17

Gibt es einen verkehrten Caret-Charakter?

Ich muss eine große Anzahl klassischer ASP-Seiten pflegen, von denen viele tabellarische Daten ohne Sortierfunktionen enthalten. Unabhängig von der Reihenfolge, in der der ursprüngliche Entwickler die Datenbankabfrage verwendet hat, bleibt die Reihenfolge bestehen. Ich möchte einige dieser Seiten grundlegend sortieren, und ich mache alles clientseitig mit Javascript. Ich habe bereits …

265 html sorting user-interface character-encoding character

13

So konvertieren Sie Strings in und von UTF8-Byte-Arrays in Java

In Java habe ich einen String und möchte ihn als Byte-Array codieren (in UTF8 oder einer anderen Codierung). Alternativ habe ich ein Byte-Array (in einer bekannten Codierung) und möchte es in einen Java-String konvertieren. Wie mache ich diese Konvertierungen?

239 java string encoding character-encoding

8

Unicode-Text in eine Textdatei schreiben?

Ich ziehe Daten aus einem Google-Dokument, verarbeite sie und schreibe sie in eine Datei (die ich schließlich in eine Wordpress-Seite einfügen werde). Es hat einige Nicht-ASCII-Symbole. Wie kann ich diese sicher in Symbole konvertieren, die in HTML-Quellen verwendet werden können? Momentan konvertiere ich alles auf dem Weg nach Unicode, füge …

225 python unicode character-encoding python-2.x

18

Wie wird ein 4-stelliges Unicode-Zeichen in Bash wiedergegeben?

Ich möchte meiner Shell-Eingabeaufforderung den Unicode-Totenkopf hinzufügen (insbesondere den 'SKULL AND CROSSBONES' (U + 2620)), aber ich kann die magische Beschwörung nicht herausfinden, um das Echo dazu zu bringen, sie oder andere zu spucken. 4-stelliges Unicode-Zeichen. Zweistellige sind einfach. Zum Beispiel echo -e "\ x55" ,. Zusätzlich zu den folgenden …

224 bash shell unicode character-encoding

10

Was ist das ANSI-Format?

Was ist das ANSI-Codierungsformat? Ist es ein Systemstandardformat? Inwiefern unterscheidet es sich von ASCII?

216 character-encoding ascii ansi codepages

10

Was ist eine vertikale Registerkarte?

Was war die ursprüngliche historische Verwendung des vertikalen Tabulatorzeichens ( \vin der C-Sprache ASCII 11)? Hatte es jemals eine Taste auf einer Tastatur? Wie hat es jemand generiert? Gibt es heute noch eine Sprache oder ein System, in dem das vertikale Tabulatorzeichen etwas Interessantes und Nützliches bewirkt?

215 character-encoding ascii special-characters character

10

"For line in ..." führt zu UnicodeDecodeError: Der Codec 'utf-8' kann kein Byte dekodieren

Hier ist mein Code, for line in open('u.item'): #read each line Wenn ich diesen Code ausführe, wird der folgende Fehler ausgegeben: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte Ich habe versucht, dies zu lösen und einen zusätzlichen Parameter in open () hinzuzufügen. Der Code …

214 python python-3.x character-encoding

6

Warum sind Zeichensatznamen keine Konstanten?

Zeichensatzprobleme sind für sich genommen verwirrend und kompliziert, aber darüber hinaus müssen Sie sich die genauen Namen Ihrer Zeichensätze merken. Ist es "utf8"? Oder "utf-8"? Oder vielleicht "UTF-8"? Wenn Sie im Internet nach Codebeispielen suchen, sehen Sie alle oben genannten Punkte. Warum nicht einfach Konstanten benennen und verwenden Charset.UTF8?

211 java character-encoding

16

Muss ich '&' wirklich als '& amp;' codieren?

Ich verwende ein ' &' Symbol mit HTML5 und UTF-8 in meiner Site <title>. Google zeigt das kaufmännische Und auf seinen SERPs an, ebenso wie alle Browser in ihren Titeln. http://validator.w3.org gibt mir Folgendes : & hat keine Zeichenreferenz gestartet. (& hätte wahrscheinlich als entkommen sollen &amp;.) Muss ich das …

207 validation html utf-8 character-encoding

12

PHP DOMDocument loadHTML codiert UTF-8 nicht richtig

Ich versuche, HTML mit DOMDocument zu analysieren, aber wenn ich das tue, verliere ich plötzlich meine Codierung (zumindest erscheint es mir so). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Das Ergebnis dieses Codes ist, dass ich …

194 php utf-8 character-encoding

6

Was ist der Unterschied zwischen Codieren / Decodieren?

Ich war mir nie sicher, ob ich den Unterschied zwischen str / unicode decode und encode verstehe. Ich weiß, dass dies str().decode()der Fall ist, wenn Sie eine Byte-Zeichenfolge haben, von der Sie wissen, dass sie eine bestimmte Zeichencodierung hat. Wenn dieser Codierungsname gegeben ist, wird eine Unicode-Zeichenfolge zurückgegeben. Ich weiß, …

180 python string unicode character-encoding python-2.x

11

Konvertieren Sie Unicode ohne Fehler in Python in ASCII

Mein Code kratzt nur eine Webseite und konvertiert sie dann in Unicode. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Aber ich bekomme ein UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position …

177 python unicode utf-8 character-encoding ascii

4

Warum @charset "UTF-8" angeben? in Ihrer CSS-Datei?

Ich habe diese Anweisung als die allererste Zeile zahlreicher CSS-Dateien gesehen, die mir übergeben wurden: @charset "UTF-8"; Was macht es und ist diese Regel notwendig? Wenn ich dieses Meta-Tag in mein "head" -Element einbinde, muss es dann nicht mehr auch in meinen CSS-Dateien vorhanden sein? <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

173 css character-encoding

11

Was ist der Unterschied zwischen Codierung und Zeichensatz?

Ich bin verwirrt über die Textcodierung und den Zeichensatz. Aus vielen Gründen muss ich in meiner bevorstehenden Arbeit Nicht-Unicode- und Nicht-UTF8-Inhalte lernen. Ich finde das Wort "Zeichensatz" in E-Mail-Headern wie in "ISO-2022-JP", aber es gibt keine solche Codierung in Texteditoren. (Ich habe mich in den verschiedenen Texteditoren umgesehen.) Was ist …

151 encoding character-encoding

11

PHP: Konvertieren Sie eine beliebige Zeichenfolge in UTF-8, ohne den ursprünglichen Zeichensatz zu kennen, oder versuchen Sie es zumindest

Ich habe eine Anwendung, die sich mit Kunden aus der ganzen Welt befasst, und natürlich möchte ich, dass alles, was in meine Datenbanken gelangt, UTF-8-codiert wird. Das Hauptproblem für mich ist, dass ich nicht weiß, wie die Quelle einer Zeichenfolge codiert werden soll - es könnte aus einem Textfeld stammen …

146 php utf-8 character-encoding

Als «character-encoding» getaggte Fragen