Das in der Frage beschriebene Problem tritt auf, wenn ein leeres / neues Dokument auf "ANSI" festgelegt ist und Unicode- Zeichen darin eingefügt werden.
Es gibt keine automatische Erkennung, wenn ein leeres / neues Dokument verwendet wird, zumindest nicht in der Version von Notepad ++, auf der ich es getestet habe (v5.4.5). "ANSI" ist die Standardeinstellung in Notepad ++ für ein neues Dokument, es sei denn, Sie haben im Menü Einstellungen → Voreinstellungen → Registerkarte Neues Dokument / Verzeichnis öffnen festgelegt .
Lösung
Die Lösung besteht darin, die Codierung vor dem Einfügen auf UTF-8 zu setzen , Menü Format → In UTF-8 codieren :
Beispiel
Ich habe Text in ein neues Notepad ++ - Dokument kopiert, Russisch (русский язык, russkiy yazyk) von Firefox, das die russische Sprache der Wikipedia-Seite zeigt .
Wenn die Kodierung nicht von "ANSI" geändert wird , ist dies das Ergebnis:
Wenn die Kodierung geändert wird , ist dies das Ergebnis:
Wie in der folgenden Abbildung zu sehen ist (der kyrillische Teil ist hervorgehoben), konvertiert Notepad ++ die Unicode-Zeichen tatsächlich in ASCII 63 (hexadezimal 3F), Fragezeichen. Aus diesem Grund gehen die Unicode-Zeichen verloren (im "ANSI" -Modus), wenn Sie den Text aus der Zwischenablage kopieren (es handelt sich nicht um eine Schriftart, da Informationen verloren gehen).
Getestet auf: Notepad ++ v5.4.5 (UNICODE).