Allgemeines
Diese Zeichen sind nicht für regulären lateinischen Alphabettext gedacht, sondern für Phonetik, kyrillischen Alphabettext, zur Verwendung als mathematische Symbole (die Variablen darstellen) oder ähnliches. Die einzige Unicode-kompatible Möglichkeit, Text im lateinischen Grundalphabet zu codieren, besteht in der Verwendung der hauptsächlich für diesen Zweck verwendeten Zeichen (dh aus dem lateinischen Grundunicode-Block).
Wie bei vielen anderen Standards sollten Sie sich überlegen, ob Sie gegen Unicode verstoßen. Darüber hinaus umfasst Unicode so viele Schriftsysteme, Anwendungsfälle und Dinge, die nur zur Abwärtskompatibilität mit anderen Standards existieren 1, dass es eine Wissenschaft für sich ist, alle ihre Motivationen vollständig zu verstehen. Lange Rede, kurzer Sinn, wenn Sie nicht wirklich genau wissen, was Sie tun, ist es sehr wahrscheinlich, dass etwas kaputt geht, an das Sie nicht einmal aus der Ferne gedacht haben.
Spezifische Beispiele
Barrierefreiheit
Codierter Text existiert nicht nur zum Rendern in einer bestimmten Schriftart. Sie kann zB auch von Screenreadern interpretiert werden. Und ein Screenreader sollte nicht raten müssen, ob
𝓽𝓱𝓮
soll der bestimmte Artikel oder das mathematische Produkt 2 der Variablen 𝓽, 𝓱 und 𝓮 sein - wofür diese Zeichen gemacht sind. Das beste Verhalten ist daher, diese Zeichen zu buchstabieren, z. B. wörtlich Folgendes zu sagen:
Fettschrift klein t, Fettschrift klein h, Fettschrift klein e
Es sollte stattdessen nicht nur "das" sagen, da dann mathematische Texte, deren Symbole zufällig ein aussprechbares Wort bilden, nicht richtig gelesen werden. 3
Portabilität
Wenn Ihr Text auf Ihrem Computer gut wiedergegeben wird, bedeutet dies nicht, dass er auch auf dem des Lesers wiedergegeben wird. Das offensichtlichste Beispiel ist, dass der Leser keine Schriftart hat, die diese Zeichen unterstützt, oder der Text von einer Software gerendert wird, die keine Ersatzschriftarten unterstützt. Dies wird freilich immer seltener. Beachten Sie jedoch, dass manche Menschen wie Legastheniker spezielle Schriftarten benötigen, die diese Zeichen mit geringerer Wahrscheinlichkeit unterstützen.
Aber selbst wenn das Lesegerät nur eine andere Schriftart verwendet, kann dies die Lesbarkeit des Texts erheblich beeinträchtigen. Für ein erstes Beispiel wird dies mit zwei verschiedenen Schriftarten gerendert:
Mit Free Serif wird der Text so gerendert, wie Sie es wahrscheinlich möchten, wenn Sie zur Simulation von Text Sonderzeichen verwenden. Diese Zeichen werden jedoch als mathematische Symbole verwendet, was keinen Sinn ergibt. Daher entspricht das Rendering von STIX , das speziell für mathematische Zwecke entwickelt wurde, eher der Art und Weise, wie diese Zeichen verwendet werden sollen.
Nehmen wir in einem zweiten Beispiel an , Sie oder der Leser kursiv schreiben „с “т мy вᴀʀ“ aus irgendeinem Grund. Mit einer guten Schriftart erhalten Sie 4 :
Der Grund dafür ist, dass die Kapitälchen (teilweise) mit kyrillischen Buchstaben simuliert wurden und kyrillische Kursivschrift manchmal sehr unterschiedlich zu ihren aufrechten Gegenstücken aussieht . Das ist also wieder das richtige Verhalten.
Durchsuchbarkeit
Stellen Sie sich als erstes Beispiel vor, was eine sinnvolle Suche mit dem Zeichen 𝒲 (mathematisches Skript W ) bewirken soll . Es sei angenommen, dass die Suche zwei Modi hat, den Standardmodus und den genauen Modus (normalerweise unter Berücksichtigung der Groß- und Kleinschreibung ). Dieses Zeichen sollte sein:
gefunden bei der Suche nach w oder W im Standardmodus - für diejenigen, die sich nicht die Mühe machen möchten, das Sonderzeichen in das Suchfeld einzugeben oder einzufügen;
gefunden bei der Suche nach 𝒲 im genauen Modus - für diejenigen, die suchen möchten, wo die entsprechende Variable in einem mathematischen Dokument erwähnt wird³;
nicht gefunden, wenn im exakten Modus nach 𝓌, w oder W gesucht wird, da eine Suche abgebrochen wurde, die der obigen ähnelt.
Wenn Sie dieses Zeichen jedoch verwenden, um normalen Text zu simulieren, sollte es gefunden werden, wenn Sie im exakten Modus nach W oder 𝒲 suchen , was im Widerspruch zum obigen steht.
Als zweites Beispiel ist zu berücksichtigen, dass kyrillische Zeichen bei der Suche nach lateinischen Zeichen und umgekehrt niemals gefunden werden sollten, da sie völlig unterschiedliche Dinge sind. Wenn Sie jedoch kyrillische Zeichen verwenden, um lateinische Kapitälchen zu simulieren, müssen Sie dies tun, wenn die Durchsuchbarkeit nicht beeinträchtigt werden soll. Dies würde dazu führen, dass die Leute viele nutzlose Dinge finden, wenn sie nach einem seltenen lateinischen Alphabet suchen, das zufällig den falschen Großbuchstaben eines beliebten kyrillischen Alphabets entspricht (und umgekehrt).
Eine genaue Suchoption kann dieses Problem nicht lösen, da dies in diesen Alphabeten für andere Zwecke reserviert ist.
Im Allgemeinen ist es unmöglich, eine Suche (ohne eine verrückte Anzahl von Optionen) zu erstellen, die nicht durch die Verwendung von Sonderzeichen zum Simulieren von formatiertem lateinischem Text unterbrochen wird.
1 Sie wissen, dass XKCD über das unvermeidliche Scheitern der Vereinheitlichung von Standards ? Nun, Unicode hat es geschafft.
2 oder was auch immer der leere Operator in der einschlägigen Konvention ist
3 Ich bin mir bewusst, dass heutzutage nur sehr wenige mathematische Texte diese Kodierung oder etwas Kompatibles unterstützen, aber der Punkt ist, dass sie es eines Tages hoffentlich tun. Ihr Unicode-missbräuchlicher Text ist möglicherweise noch vorhanden und wird dann gelesen.
4 Sofern Sie nicht für Mazedonisch oder Serbisch lokalisiert haben, erhalten Sie ein anderes, aber immer noch unerwünschtes Ergebnis.