Ich habe diese Frage auf dem Typografie-Site-Vorschlag gesehen und es hat mich irritiert, dass ich die Antwort nicht kannte. Ich hatte Glyphen und Zeichen immer als austauschbar behandelt.
Nach dem Lesen einer Erklärung auf der Seite Unicode Character Encoding Model (Unicode-Zeichencodierungsmodell) habe ich ungefähr Folgendes verstanden:
- Zeichen werden durch ihre Bedeutung in der Sprache, Glyphen, durch ihr Aussehen definiert . Die Ligatur für das ästhetische Kombinieren
fi
ist also eine Glyphe, aber zwei Zeichen.
Mein Glaube ist (bitte korrigieren Sie mich, wenn ich falsch liege), dass der praktische Unterschied sein würde:
- Textparser, die sich nicht für die Ästhetik von Text interessieren, lesen Glyphen als ihre jeweiligen Zeichen. So:
- Wenn Sie Text mit Glyphen kopieren und in einen Nur-Text-Editor einfügen, werden die Glyphen in die entsprechenden Zeichen umgewandelt (ein
fi
Ligatur-Glyphen wird zuf
undi
). - Jedes gut gemachte automatisierte System, das auf Textanalyse basiert (z. B. Suchmaschinen-Crawler, Bildschirmleser, Rechtschreibprüfer), würde die Glyphen als ihre jeweiligen Zeichen interpretieren.
- Ein Zeichen kann viele Glyphen oder Glyphensätze enthalten. Ich möchte sagen, dass eine Glyphe nur ein Zeichen haben kann, aber dies ist eindeutig nicht richtig, da es auf dem verlinkten Artikel ein Beispiel von 3 Glyphen und Glyphensätzen gibt, die anscheinend jeweils einem Zeichen und einer Reihe von Zeichen entsprechen. Ich verstehe nicht ganz, wie das funktionieren könnte: Das bedeutet sicherlich, dass die Interpretation dieser Glyphen inkonsistent oder mehrdeutig ist und je nach Interpret variiert. (oder variiert es je nach Sprache oder Schriftart?)
- Während Glyphenbrowser (z. B. der in Illustrator) den vollständigen Glyphensatz einer Schriftart enthalten, enthalten Zeichenzuordnungen (z. B. die Windows-Zeichenzuordnung) nur Zeichen, keine Glyphen, die mehrere Zeichen wie Ligaturen enthalten (etwas, das ich vorher nicht bemerkt habe).
- Wenn Sie Text mit Glyphen kopieren und in einen Nur-Text-Editor einfügen, werden die Glyphen in die entsprechenden Zeichen umgewandelt (ein
Ich habe das Gefühl, dass ich fast da bin, aber ich habe irgendwo auf der Linie eindeutig etwas falsch verstanden: Nicht nur die Sache "Ein Glyphen, mehrere Zeichen", sondern auch das Kopieren und Einfügen von Verhalten mit Ligaturen entspricht nicht meinen Erwartungen:
- Kopieren Sie die Ligatur
fi
aus Illustrator in dieses Eingabefeld: Fügtfi
wie erwartet (zwei Zeichen) ein. - Fügen Sie den HTML-Code ein (
fi
) - wird als Ligatur angezeigt, wenn Sie sich nicht in einem Codeblock befinden (fi - sieht in dieser Schriftart nicht wie eine Ligatur aus, wird aber angezeigt, wenn Sie versuchen, nur die Hälfte auszuwählen davon), und der Code, wenn in einem Codeblock (fi
), wie erwartet. - Kopieren Sie die gerenderte Nicht-Code-Block-Ligatur und fügen Sie sie wieder in das Eingabefeld ein: Fügt sie als Ligaturzeichen ein und rendert sie als Ligatur, unabhängig davon, ob sie sich in einem Code-Block befindet oder nicht (fi und
fi
). Ebenso enthalten Wörter: fit misfits (fit misfits
) fügt als fit misfits (fit misfits
) ein. Vielleicht hängt es davon ab, ob der Ort, an dem es eingefügt wird, die verwendete Kodierung versteht?
Inwieweit verstehe ich das falsch? Kann jemand mich richtig stellen: eine klare Definition des Unterschieds zwischen Glyphen und Zeichen (wenn meine falsch ist oder verbessert werden kann) und klarere / genauere Beispiele als meine geben, was dies in der Praxis bedeutet ?