Als «character-encoding» getaggte Fragen

Die Zeichenkodierung bezieht sich auf die Art und Weise, wie Zeichen als eine Reihe von Bytes dargestellt werden. Die Zeichenkodierung für das Web ist im Kodierungsstandard definiert.

6
Ist ASCII-Code 7-Bit oder 8-Bit?
Mein Lehrer sagte mir, dass ASCII ein 8-Bit-Zeichencodierungsschema ist. Es ist jedoch nur für 0-127-Codes definiert, was bedeutet, dass es in 7-Bit-Codes eingepasst werden kann. Kann man also nicht behaupten, dass das ASCII-Bit tatsächlich 7-Bit-Code ist? Und was wollen wir überhaupt sagen, wenn wir sagen, dass ASCII überhaupt 8-Bit-Code ist?

7
So erraten Sie zuverlässig die Codierung zwischen MacRoman, CP1252, Latin1, UTF-8 und ASCII
Bei der Arbeit scheint es, als würde keine Woche ohne eine kodierungsbedingte Verbindung, ein Unglück oder eine Katastrophe vergehen. Das Problem ist normalerweise auf Programmierer zurückzuführen, die glauben, eine Textdatei zuverlässig verarbeiten zu können, ohne die Codierung anzugeben. Aber du kannst nicht. Daher wurde beschlossen, Dateien künftig zu verbieten, jemals …

10
Wie viele Zeichen kann UTF-8 codieren?
Wenn UTF-8 8 Bit umfasst, bedeutet dies nicht, dass nur maximal 256 verschiedene Zeichen vorhanden sein können? Die ersten 128 Codepunkte sind dieselben wie in ASCII. Aber es heißt, dass UTF-8 bis zu Millionen von Zeichen unterstützen kann? Wie funktioniert das?



2
Wie viele Bits oder Bytes enthält ein Zeichen? [geschlossen]
Es ist schwer zu sagen, was hier gefragt wird. Diese Frage ist mehrdeutig, vage, unvollständig, zu weit gefasst oder rhetorisch und kann in ihrer gegenwärtigen Form nicht angemessen beantwortet werden. Wenn Sie Hilfe zur Klärung dieser Frage benötigen, damit sie wieder geöffnet werden kann, besuchen Sie die Hilfe . Geschlossen …

9
Lesen einer UTF8-CSV-Datei mit Python
Ich versuche, eine CSV-Datei mit Akzentzeichen mit Python zu lesen (nur französische und / oder spanische Zeichen). Basierend auf der Python 2.5-Dokumentation für den csvreader ( http://docs.python.org/library/csv.html ) habe ich den folgenden Code zum Lesen der CSV-Datei entwickelt, da der csvreader nur ASCII unterstützt. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py …

3
JsonParseException: Unzulässiges Zeichen ohne Anführungszeichen ((STRG-CHAR, Code 10)
Ich versuche, org.apache.httpcomponentseine Rest-API zu verwenden, die Daten im JSON-Format an die API sendet. Ich bekomme diese Ausnahme: Auslöser: com.fasterxml.jackson.core.JsonParseException: Unzulässiges Zeichen ohne Anführungszeichen ((STRG-CHAR, Code 10)): muss mit einem Backslash maskiert werden, um in die Zeichenfolge aufgenommen zu werden. Der Grund dafür ist, dass ctrl-charin der JSON-Zeichenfolge enthalten ist. …

6
Wie finde ich den Standardzeichensatz / die Standardcodierung in Java?
Die offensichtliche Antwort ist zu verwenden, Charset.defaultCharset()aber wir haben kürzlich herausgefunden, dass dies möglicherweise nicht die richtige Antwort ist. Mir wurde gesagt, dass sich das Ergebnis von dem tatsächlichen Standardzeichensatz unterscheidet, der von java.io-Klassen bei mehreren Gelegenheiten verwendet wird. Java behält anscheinend zwei Sätze von Standardzeichensätzen bei. Hat jemand irgendwelche …

10
All-inclusive-Zeichensatz zur Vermeidung von "java.nio.charset.MalformedInputException: Eingabelänge = 1"?
Ich erstelle ein einfaches Wordcount-Programm in Java, das die textbasierten Dateien eines Verzeichnisses liest. Ich erhalte jedoch immer wieder den Fehler: java.nio.charset.MalformedInputException: Input length = 1 aus dieser Codezeile: BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8")); Ich weiß, dass ich das wahrscheinlich bekomme, weil ich ein verwendet habe Charset, das einige der Zeichen …

6
Probleme bei der Codierung der Git-Protokollausgabe an der Windows 10-Eingabeaufforderung
Problem Wie wird die git logBefehlsausgabe an der Windows-Eingabeaufforderung richtig angezeigt? Beispiel Wie Sie sehen können, kann ich diakritische Zeichen richtig eingeben, aber auf git logder Ausgabe ist irgendwie entkommen. Gemäß der UTF-8Codierungstabelle entsprechen die Codes zwischen spitzen Klammern ( <und >) von der Ausgabe den zuvor eingegebenen git configParametern. …

5
Python: Konvertierung von ISO-8859-1 / latin1 nach UTF-8
Ich habe diese Zeichenfolge, die mit dem E-Mail-Modul von Quoted-printable nach ISO-8859-1 dekodiert wurde. Dies gibt mir Zeichenfolgen wie "\ xC4pple", die "Äpple" (Apple auf Schwedisch) entsprechen würden. Ich kann diese Zeichenfolgen jedoch nicht in UTF-8 konvertieren. >>> apple = "\xC4pple" >>> apple '\xc4pple' >>> apple.encode("UTF-8") Traceback (most recent call …




Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.