Programmierung character-encoding

6

Mein Lehrer sagte mir, dass ASCII ein 8-Bit-Zeichencodierungsschema ist. Es ist jedoch nur für 0-127-Codes definiert, was bedeutet, dass es in 7-Bit-Codes eingepasst werden kann. Kann man also nicht behaupten, dass das ASCII-Bit tatsächlich 7-Bit-Code ist? Und was wollen wir überhaupt sagen, wenn wir sagen, dass ASCII überhaupt 8-Bit-Code ist?

100 character-encoding ascii

7

So erraten Sie zuverlässig die Codierung zwischen MacRoman, CP1252, Latin1, UTF-8 und ASCII

Bei der Arbeit scheint es, als würde keine Woche ohne eine kodierungsbedingte Verbindung, ein Unglück oder eine Katastrophe vergehen. Das Problem ist normalerweise auf Programmierer zurückzuführen, die glauben, eine Textdatei zuverlässig verarbeiten zu können, ohne die Codierung anzugeben. Aber du kannst nicht. Daher wurde beschlossen, Dateien künftig zu verbieten, jemals …

99 java python perl macos character-encoding

10

Wie viele Zeichen kann UTF-8 codieren?

Wenn UTF-8 8 Bit umfasst, bedeutet dies nicht, dass nur maximal 256 verschiedene Zeichen vorhanden sein können? Die ersten 128 Codepunkte sind dieselben wie in ASCII. Aber es heißt, dass UTF-8 bis zu Millionen von Zeichen unterstützen kann? Wie funktioniert das?

97 utf-8 character-encoding ascii

3

Ist "& # 160;" ein Ersatz für "& nbsp;"?

In meiner ASP.NET-Anwendung habe ich versucht, durch Eingabe der Leertaste einige Leerzeichen zwischen zwei Textfeldern einzufügen. Die entsprechende HTML-Quelle war &#160;anstelle von &nbsp;. Also wollte ich nur überprüfen: Ist dies der neue Ersatz für Leerzeichen? Wenn ja, eine Idee, warum sie sich geändert haben?

97 html asp.net visual-studio-2008 character-encoding

4

Festlegen der Standardcodierung in Visual Studio

Ich suche nach einer Möglichkeit, Visual Studio so einzurichten, dass meine Dateien immer in UTF-8 gespeichert werden. Ich habe nur Optionen gefunden, um dieses Projekt weit zu setzen. Gibt es eine Möglichkeit, Visual Studio breit einzustellen?

97 visual-studio visual-studio-2008 encoding character-encoding

2

Wie viele Bits oder Bytes enthält ein Zeichen? [geschlossen]

Es ist schwer zu sagen, was hier gefragt wird. Diese Frage ist mehrdeutig, vage, unvollständig, zu weit gefasst oder rhetorisch und kann in ihrer gegenwärtigen Form nicht angemessen beantwortet werden. Wenn Sie Hilfe zur Klärung dieser Frage benötigen, damit sie wieder geöffnet werden kann, besuchen Sie die Hilfe . Geschlossen …

94 character-encoding byte

9

Lesen einer UTF8-CSV-Datei mit Python

Ich versuche, eine CSV-Datei mit Akzentzeichen mit Python zu lesen (nur französische und / oder spanische Zeichen). Basierend auf der Python 2.5-Dokumentation für den csvreader ( http://docs.python.org/library/csv.html ) habe ich den folgenden Code zum Lesen der CSV-Datei entwickelt, da der csvreader nur ASCII unterstützt. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py …

93 python utf-8 csv character-encoding

3

JsonParseException: Unzulässiges Zeichen ohne Anführungszeichen ((STRG-CHAR, Code 10)

Ich versuche, org.apache.httpcomponentseine Rest-API zu verwenden, die Daten im JSON-Format an die API sendet. Ich bekomme diese Ausnahme: Auslöser: com.fasterxml.jackson.core.JsonParseException: Unzulässiges Zeichen ohne Anführungszeichen ((STRG-CHAR, Code 10)): muss mit einem Backslash maskiert werden, um in die Zeichenfolge aufgenommen zu werden. Der Grund dafür ist, dass ctrl-charin der JSON-Zeichenfolge enthalten ist. …

93 java json character-encoding apache-httpclient-4.x

6

Wie finde ich den Standardzeichensatz / die Standardcodierung in Java?

Die offensichtliche Antwort ist zu verwenden, Charset.defaultCharset()aber wir haben kürzlich herausgefunden, dass dies möglicherweise nicht die richtige Antwort ist. Mir wurde gesagt, dass sich das Ergebnis von dem tatsächlichen Standardzeichensatz unterscheidet, der von java.io-Klassen bei mehreren Gelegenheiten verwendet wird. Java behält anscheinend zwei Sätze von Standardzeichensätzen bei. Hat jemand irgendwelche …

92 java encoding character-encoding

10

All-inclusive-Zeichensatz zur Vermeidung von "java.nio.charset.MalformedInputException: Eingabelänge = 1"?

Ich erstelle ein einfaches Wordcount-Programm in Java, das die textbasierten Dateien eines Verzeichnisses liest. Ich erhalte jedoch immer wieder den Fehler: java.nio.charset.MalformedInputException: Input length = 1 aus dieser Codezeile: BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8")); Ich weiß, dass ich das wahrscheinlich bekomme, weil ich ein verwendet habe Charset, das einige der Zeichen …

91 java character-encoding

6

Probleme bei der Codierung der Git-Protokollausgabe an der Windows 10-Eingabeaufforderung

Problem Wie wird die git logBefehlsausgabe an der Windows-Eingabeaufforderung richtig angezeigt? Beispiel Wie Sie sehen können, kann ich diakritische Zeichen richtig eingeben, aber auf git logder Ausgabe ist irgendwie entkommen. Gemäß der UTF-8Codierungstabelle entsprechen die Codes zwischen spitzen Klammern ( <und >) von der Ausgabe den zuvor eingegebenen git configParametern. …

89 git character-encoding locale command-prompt

5

Python: Konvertierung von ISO-8859-1 / latin1 nach UTF-8

Ich habe diese Zeichenfolge, die mit dem E-Mail-Modul von Quoted-printable nach ISO-8859-1 dekodiert wurde. Dies gibt mir Zeichenfolgen wie "\ xC4pple", die "Äpple" (Apple auf Schwedisch) entsprechen würden. Ich kann diese Zeichenfolgen jedoch nicht in UTF-8 konvertieren. >>> apple = "\xC4pple" >>> apple '\xc4pple' >>> apple.encode("UTF-8") Traceback (most recent call …

86 python character-encoding

13

Speichern Sie alle Dateien im Visual Studio-Projekt als UTF-8

Ich frage mich, ob es möglich ist, alle Dateien in einem Visual Studio 2008-Projekt in einer bestimmten Zeichenkodierung zu speichern. Ich habe eine Lösung mit gemischten Codierungen und möchte sie alle gleich machen (UTF-8 mit Signatur). Ich weiß, wie man einzelne Dateien speichert, aber wie steht es mit allen Dateien …

86 visual-studio utf-8 character-encoding

7

Konvertieren eines Byte-Arrays in einen String (Java)

Ich schreibe eine Webanwendung in der Google App Engine. Es ermöglicht den Benutzern, HTML-Code zu bearbeiten, der als .htmlDatei im Blobstore gespeichert wird. Ich verwende fetchData, um eines byte[]der Zeichen in der Datei zurückzugeben. Ich versuche, in ein HTML zu drucken, damit der Benutzer den HTML-Code bearbeiten kann. Alles funktioniert …

85 java google-app-engine character-encoding bytearray

4

Gibt es eine Reihe von "Lorem ipsums" -Dateien zum Testen von Problemen mit der Zeichenkodierung?

Für das Layout haben wir unseren berühmten "Lorem ipsum" -Text, um zu testen, wie er aussieht. Was ich suche, ist eine Reihe von Dateien, die Text enthalten, der mit verschiedenen Codierungen codiert ist, die ich in meinen JUnit-Tests verwenden kann, um einige Methoden zu testen, die sich mit der Zeichencodierung …

85 java unit-testing character-encoding junit

Als «character-encoding» getaggte Fragen