Latein
aka Unicode Latin1-Supplement (U + 0080 bis U + 00FF) soll hauptsächlich westeuropäische Sprachen unterstützen (wie Sie bereits erwähnt haben: Französisch, Deutsch, Spanisch, auch Portugiesisch, Italienisch, Irisch, Isländisch, Sprachen skandinavischer Länder und ungewollt auch andere Sprachen in der Liste unten erwähnt). Englisch wird von Standard-ASCII unterstützt. ASCII (die ersten 127 Zeichen, 95 davon sind Grapheme U + 0020 bis U + 007E) wurde als allererster Block in Unicode mit dem Namen Basic Latin platziert. Dieser Block wird als Teil von "Latin" betrachtet und normalerweise auch in nicht-lateinischen Schriftarten unterstützt, um den Schriftnamen auf lateinischen Systemen korrekt anzuzeigen.
Lateinisch erweitert
Latin Extended in Google-Schriftarten bedeutet, Latin-Extended-A (U + 0100 bis U + 017F) praktisch zu blockieren, das (kombiniert mit "Latin") alle gängigen lateinisch geschriebenen Texte unterstützen soll. Die meisten Sprachen, die diesen Block verwenden, verwenden auch Zeichen aus "Latein". Daher enthalten "Latin-Extended" -Schriftarten normalerweise eine Obermenge von "Latein" -Zeichen, dies ist jedoch nicht garantiert.
In Unicode gibt es auch einen lateinisch-erweiterten B-Block, der in nationalen Alphabeten für die Zeichen Ə, Ș, Ț (diese werden jedoch häufig durch Ä, Ş, Ţ aus Extended-A ersetzt) und vietnamesisch Ơ, Ư (aber dies) benötigt wird hat eine eigene Kategorie für Google-Schriftarten).
Afrikanische lateinische Sprachen werden von den Blöcken Unicode Latin-Extended-B und Latin-Extended-Additional unterstützt, diese werden jedoch meist nicht von der Kategorie Latin Extended von Google unterstützt. Es gibt noch exotischere C-, D- und E-Erweiterungen (insgesamt 252 Zeichen), aber ich habe sie im wirklichen Leben nicht gesehen, daher zählt Google sie vermutlich auch nicht in der Kategorie Latin Extended.
Nach meiner Beobachtung ordnet Google Schriftarten in die Kategorie Latin Extended ein, wenn sie einige, aber nicht unbedingt alle Zeichen aus dem Latin-Extended-A-Block enthalten . Webfonts müssen klein sein, um das Laden von Seiten nicht zu verlangsamen (das Format woff / woff2 wird bevorzugt). Je mehr Zeichen die Schriftart enthält, desto größer ist ihre Größe (Schriftarten, die das gesamte BMP abdecken, können über 10 MB wachsen). Der Autor beschreibt häufig den Zweck seiner Schriftart, sodass nur er die Logik hinter der Zeichenunterstützung beschreiben kann. Beispielsweise unterstützt die Schriftart Lato Google nur polnische Zeichen aus dem Block Latin Extended A (der Autor ist ein Pole), befindet sich jedoch in der Kategorie "Latin Extended" von Google. Versuchen Sie, Zeichen aus der folgenden Liste anzuzeigen, um herauszufinden, ob die Schriftart eine bestimmte Sprache unterstützt.
Sprachunterstützung
Aus der Liste der lateinisch geschriebenen Alphabete, die
unten auf Omniglot und anderen Quellen geprüft wurden , zähle ich nicht:
- Digraphen aus Latin Extended, die üblicherweise durch separate Zeichen ersetzt werden (Æ wird von Latin1-Supplement unterstützt, ß war früher Digraph)
- Nicht-lateinische Alphabete, da es sich um Latin vs. Latin-Extended handelt. Einige Sprachen verwenden zwei Schriftsysteme: Ich schließe diese nicht ein, wenn Latein selten ist (wie Abchasisch), bis ein offizieller Schritt gemacht wird (wie Kasachstan).
- Minderheitensprachen und tote Sprachen (Adyghe, Archi, alte baltische Sprachen, Bislama, Chamorro, Tschuwaschisch, Zypriotisch, Dalecarlianisch, Extremaduranisch, Fala, Elfdalisch, Färöisch, Gilbertesisch, Glosa, Haida und Eskimo-Aleutisch, Ikizu, Iñupiaq, Latgalisch, Istriotisch, Livländisch, Ladinisch, Kaschubisch, Marshallisch, Mirandisch, Montenegrinisch, Altnordisch, Nuxalkisch, Okzitanisch, Rätoromanisch, Rotokas, Sami-Sprachen, Samoanisch, Ober- und Unter-Sorbisch, Tahitianisch, Tawlu, Tetum, Tonganisch, Ulithianisch, Yapeseisch, Zuni, indianisches Latein Alphabete)
- historische Zeichen, die in den neuesten Versionen von Alphabeten nicht verwendet wurden (wie doppelte Grabakzente, ſ, ĸ)
- Transliterationszeichen, die fast ausschließlich Linguisten vorbehalten sind, nämlich Pinyin, IPA, UPA
Bitte kommentieren Sie, wenn etwas Wichtiges fehlt oder wenn in der elektronischen Kommunikation eine Minderheitensprache verwendet wird.
ASCII (Basic Latin, wird oft auch in nicht-lateinischen Schriftarten unterstützt)
Klassisches Latein, Afrikaans, Asturisch, Corsu, Niederländisch, Grönländisch, Gälisch, Haitianisch (Kreolisch), Malaiisch, Shona, Sizilianisch, Suaheli.
Englisch wird ebenfalls unterstützt, mit handlichen '¢' (amerikanisch) und '£' (britisch) aus dem Latin1 Supplement, obwohl andere Währungssymbole (wie '€') viel später hinzugefügt wurden: seit Unicode 2.0 im Jahr 1998, im Blockstart 0x20A0).
Latein
- Albanisch Ç, Ë (Ç ist nicht im Arbëresh-Dialekt)
- Katalanisch À, É, È, Í, Ï, Ŀ, Ó, Ò, Ú, Ü, Ç (Ŀ aus Ext-A kann als L mit Zwischenzeichen geschrieben werden)
- Dänisch , Norwegisch Æ, Å, Ø
- Finnisch Å, Ä, Ö, Š, Ž (Š, Ž aus Ext-A selten verwendet, kann S, Z verwenden)
- Philippinisch Á, À, Â, É, È, Ê, Ë, Í, Ì, Î, Ñ, Ó, Ò, Ô, Ú, Ù, Û
- Französisch Æ, Œ, Â, À, É, È, Ê, Ë, Ç, Î, Ï, Ô, Ù, Û, Ü, Ÿ, »,« (Œ aus Ext-A weniger verbreitet und auf Wegweisern verwendet, aber Leute verwenden oe normalerweise stattdessen in Nachrichten, selten Ÿ von Ext-A nur in französischen Namen, der Rest einschließlich ÿ in der lateinischen 1-Beilage, Geschichte dahinter [fr] , Anmerkung auf Wikipedia [en] )
- Deutsch Ä, Ö, Ü, ß
- Isländisch Æ, Á, É, Í, Ó, Ö, Ú, Ý, Þ, Ð
- Irisch Á, É, Í, Ó, Ú
- Italienisch Ì, Ù, ª, º (die letzten beiden manchmal unterstrichen, auf Englisch auch in Numero beliebt - Nº)
- Khasi Ñ, Ï
- Piemontesisch Ë, Ò
- Portugiesisch Á, Â, Ã, À, Ç, É, Ê, Ó, Ô, Õ, Ú, ª, º
- Sardinisch Ç
- Spanisch und Galizisch Ñ, ¿, ¡, ª, º
- Schwedisch Å, Ä, Ö
Lateinisch erweitert
- Azeri Ç, Ğ, I (punktloser Kleinbuchstabe), İ, Ö, Ş, Ü, Ə (Ə aus Ext-B kann durch Ä ersetzt werden, dann dasselbe Alphabet wie Türkisch)
- Krimtatar Ç, Ǧ, I (punktloser Kleinbuchstabe), İ, Ñ, Ö, Ş, Ü (Ǧ aus Ext-B kann durch Ğ aus Ext-A ersetzt werden)
- Serbisch , Bosnisch und Kroatisch Ć, Č, Đ, Š, Ž
- Tschechisch Á, Č, Ď, Ě, É, Í, Ň, Ó, Ř, Š, Ť, Ú, Ů, Ý, Ž
- Estnisch Ä, Ö, Õ, Ü, Š, Ž
- Esperanto Ĉ, Ĝ, Ĥ, Ĵ, Ŝ, Ŭ
- Friaulisch , Ê, Î, Ô, Û
- Gagaus (Moldawien) Ä, Ç, Ê, I (punktloser Kleinbuchstabe), İ, Ö, Ş, Ţ, Ü
- Guaraní (Paraguay) Á, Í, Ó, Ã, Ẽ, G̃, Ĩ, Ñ, Õ, Ũ, Ỹ (Ĩ, Ũ von Ext-A, Ẽ, Ỹ von Ext-Additional, G̃ nicht in Unicode, nur mit Kombination diakritische Zeichen) Zeichen außerhalb des Ext-A-Bereichs werden häufig mit Zirkumflex (Ê, Ĝ, Î, Û, Ŷ) transkribiert.
- Hawaiianer Ā, Ē, Ī
- Ungarisch Á, É, Í, Ó, Ö, Ő, Ú, Ü, Ű
- Kasachisch (2017-2025 geplant, von kyrilisch zu wechseln) Ä, Ç, Ğ, I (punktloser Kleinbuchstabe), İ, Ŋ, Ö, Ş, Ü (mehrfach überarbeitet, Version 2019 )
- Kurdisch Ç, Ê, Î, Ş, Û
- Lettisch Ā, Č, Ē, Ģ, Ķ, Ī, Ļ, Ņ, Ō, Ū, Ŗ, Š, Ž
- Litauisch Ą, Č, Ę, Ė, Į, Š, Ų, Ū, Ž
- Maltesisch Ċ, Ġ, Ħ
- Maori Ā, Ē, Ī, Ō, Ū (Minderheit, aber seit 2015 bekannter und beliebter)
- Polnisch Ą, Ć, Ę, Ł, Ń, Ó, Ś, Ź, Ż
- Romani Č, Š, Ž (gesprochene, aber selten geschriebene Sprache)
- Rumänisch Ă, Â, Î, Ș, Ț (Ș, Ț aus dem lateinischen Ext-B, kann Ş, Ţ aus Ext-A verwenden)
- Sami (Nord-, Minderheitensprache, hat aber ein exklusives Ŧ in Ext-A) Á, Č, Đ, Ŋ, Š, Ŧ, Ž
- Slowakisch Ä, Á, Č, Ď, É, Í, Ĺ, Ľ, Ň, Ó, Ô, Ú, Š, Ŕ, Ť, Ý, Ž
- Slowenisch Č, Š, Ž
- Tatar (seit 2012) Ä, Ç, Ğ, İ, I (punktloser Kleinbuchstabe), Ñ, Ö, Ş, Ü
- Türkisch Ç, Ğ, I (punktloser Kleinbuchstabe), İ, Ö, Ş, Ü
- Vietnamesisch Ă, Â, Đ, Ê, Ô, Ơ, Ư (Ơ, Ư in Ext-B plus Kombinieren der Töne 0x300 und 0x301, siehe Kombinieren diakritischer Zeichen unten, hat eine spezielle Kategorie für Google-Schriftarten)
- Walisisch , Ê, Î, Ô, Û, Ŵ, Ŷ
Latin Extended, African (wird in Latin-Extended-Schriftarten meist nicht unterstützt) . Volle Unterstützung des afrikanischen Alphabets haben Ubuntu, Fira Sans, EB Garamond, Tinos, Nachrichtenzyklus, Didact Gothic, M Plus, Sawarabi, Cousine, Caudex, Judson, Andika (und natürlich Noto, siehe unten).
- Bari (Kongo) Ŋ, Ö
- Bambara (Mali) Ɛ, Ɲ, Ɔ (alle aus Ext-B)
- Berber (Tuareg) (Sahara) Ă, Ḍ, Ɣ, Ǝ, Š, Ž, Ḥ, Ḷ, Ṣ, Ṭ, Ẓ (Ɣ, Ǝ aus Ext-B, Zeichen mit Punkt unten aus Ext-Additional)
- Chichewa (Chewa) (Ostafrika) Ŵ
- Dagbani (Kongo) Ɛ, Ɣ, Ɔ, Ŋ, Ʒ (Ɛ, Ɣ, Ɔ aus Ext-B)
- Dinka (Sudan) Ä, Ë, Ɛ, Ɛ̈, Ɣ, Ï, Ŋ, Ö, Ɔ, Ɔ̈ (Ɛ, Ɣ, Ɔ aus Ext-B, Ɛ̈, Ɔ̈ nicht in Unicode, nur mit kombinierter diakritischer Markierung)
- Fula (Westafrika) Ɓ, Ɗ, Ƴ, Ŋ (Ŋ aus Ext-A, Rest aus Ext-B)
- Hausa (Tschad) Ɓ, Ɗ, Ƴ, Ƙ, R̃ (R̃ nicht in Unicode, nur mit kombinierter diakritischer Markierung, Rest von Ext-B)
- Igbo (Nigeria) Ṅ, Ị (Ext-Additional)
- Madagassisch (Madagaskar) N̈ (nicht in Unicode, nur mit kombinierter diakritischer Marke, kann durch Ñ aus dem Lateinischen ersetzt werden)
- Pan-Nigerian Ɓ, Ɗ, Ǝ, Ẹ, Ị, Ƙ, Ṣ, Ụ (Ɓ, Ɗ, Ǝ, Ƙ von Ext-B, Ẹ, Ị, Ṣ, Ụ von Ext-Additional)
- Wolof (Senegal) À, É, Ë, Ñ, Ŋ, Ó
- Yoruba (Westafrika) Ẹ, Ọ, Ṣ (Ext-Additional + Kombinationstöne Á, À, Ā)
Diakritische Zeichen kombinieren
Alternativ kann die Schriftart den Block Kombinieren diakritischer Zeichen unterstützen: U + 0300 bis U + 036F. Zum Beispiel Řkann entweder als eingegeben werden U+0158(auch bekannt als vorverfasstes Zeichen ) oder als R+ U+030C. Programme, die Unicode unterstützen, sollten sowohl als eigenständiges Zeichen angezeigt als auch behandelt werden. Wenn das Programm oder die Schriftart jedoch kein Repertoire unterstützt , wird die kombinierte diakritische Markierung möglicherweise etwas verlegt (wie zu niedrig Ɛ̈ hier auf meinem System) Sehr detaillierte Fragen und Antworten zu Unicode zu diesem Thema.
Nützliche Schriftarten mit mehrsprachiger Unterstützung
Möglicherweise möchten Sie einige Schriftarten (sofern die Lizenz dies zulässt) über den Font Squirrel- Dienst anpassen oder als Backup verwenden. Zunächst gibt es breite unterstützende kostenlose Schriftarten:
- Ich mag wirklich gut aussehende Serif Quivira Open-Type-Schrift mit 11 + k Zeichen, 1,5 MB
- Auf vielen Computern ist Arial Unicode installiert (Teil von MS Office, über 50.000 Zeichen, 22 MB).
- Es gibt ein Noto-Projekt von Google, das ALLE, aber die neuesten Unicode-Zeichen in Serifen-, Sans-Serif- und UI-Schriftarten enthält, die nach Blockunterstützung sortiert sind (1,1 GB).
- als letztes Backup - Schriftart, können Sie hässlich suchen betrachten Unifont (50 + k Zeichen, aber nur 11 MB und Embedded - Geräte freundlich)