Binär- und Textdaten werden nicht getrennt: Es handelt sich lediglich um Daten . Es kommt auf die Interpretation an, die sie zum einen oder anderen macht. Wenn Sie Binärdaten (z. B. eine Bilddatei) in einem Texteditor öffnen, ist vieles davon nicht sinnvoll, da es nicht zu der von Ihnen gewählten Interpretation (als Text) passt .
Was Sie als Text bezeichnen, ist eine Teilmenge des möglichen Dateiinhalts: Daten, die in einem bestimmten Zeichensatz in lesbare Zeichen umgewandelt werden.
In ASCII sehen Sie beispielsweise, dass von 128 "erlaubten" Werten nur etwa die Hälfte Buchstaben und Zahlen sind, 30 Satzzeichen und der Rest Steuerzeichen . Die letztere Gruppe wird in Textdateien nur selten verwendet, und sie haben keine wirklich gute Textdarstellung. Einige von ihnen sind Tabulatoren und Zeilenumbrüche , bei denen Texteditoren bereits kreativ werden müssen, um sie anzuzeigen.
Einige Texteditoren verfügen über Optionen zum expliziten Anzeigen von Leerzeichen. Dann werden sie zusätzlich zu ihrem normalen Formatierungsverhalten (das auch nur die Interpretation dieser Zeichen ist) tatsächlich als Zeichen gezeichnet .
Pure ASCII interpretiert nur 128 Werte. Die zum Speichern dieser Informationen verwendeten Bytes haben jeweils 256 mögliche Werte, sodass die Hälfte der möglichen Werte in ASCII nicht zulässig ist. Diese werden z. B. in regionenspezifischen Zeichensätzen wie Latin 1 verwendet, in ASCII sind sie jedoch undefiniert. Sie haben keine nützliche Darstellung in einem Text-Viewer, der nur ASCII verarbeiten kann.
Binärdaten werden normalerweise nicht als Text interpretiert. In diesen Dateien sind also üblicherweise alle möglichen Bytewerte zu finden. Alles andere wäre verschwenderisch (und das ist ein Grund, warum Sie Text sehr gut komprimieren können). Bilddateiformate sind kompliziert und werden normalerweise nicht als Text angezeigt, sodass sie nicht lesbar sein müssen.
Da es keine gemeinsame Dateninterpretation (Zeichensatz) gibt, die alle möglichen Werte lesbaren Zeichen zuordnet, und da dies ohnehin keinen Sinn ergibt (da es sich um nicht lesbaren Text handelt), werden Hauptteile als Kauderwelsch angezeigt.
Ein Hex-Editor wählt eine andere Darstellung für die Daten: Er zeigt jedes Byte als zwei hexadezimale Ziffern an. Es ist nur eine andere Darstellung und eine mit einem leicht lesbaren Zeichensatz: Alle 256 möglichen Bytewerte können als zwei hexadezimale Ziffern dargestellt werden.
Da es eine einfache Zuordnung von Binärdaten zu Hex und umgekehrt gibt (4 Binärziffern zu / von einer Hexadezimalziffer) und Binärdaten nur sehr wenige Informationen pro Ziffer enthalten, ist Hexadezimal für Menschen im Allgemeinen die bevorzugte Methode, Binärdaten zu lesen, sofern es keine spezifischen gibt Gründe, eine andere Darstellung zu bevorzugen.
Einige Texteditoren haben möglicherweise einen Hex-Editor-Modus und eine Heuristik, die versucht, festzustellen, ob es sich bei einer Datei um Text oder um eine Binärdatei handelt, und wählen automatisch den einen oder den anderen Modus aus. Es kann jedoch schwierig sein, dies zu korrigieren, und es ist keine spezifische Eigenschaft der Datei, die angibt, ob es sich um die eine oder die andere Art handelt.
Einige FTP-Clients fordern Sie auf, anzugeben, welche Dateiendungen für Textdaten verwendet werden . Diese Programme ändern dann den Dateiinhalt entsprechend dem Betriebssystem des Computers, mit dem Sie verbunden sind, da Windows eine andere Zeilenendezeichenfolge ( CR/LF
) verwendet als Linux und Unix (einschließlich Mac OS X; LF
).