RFC 3066 enthält die Details der zulässigen Werte (Hervorhebung und Links hinzugefügt):
Alle 2-Buchstaben-Untertags werden als ISO 3166 Alpha-2-Ländercodes aus [ISO 3166] interpretiert oder anschließend von der ISO 3166-Wartungsagentur oder den zuständigen Normungsgremien zugewiesen, wobei der Bereich angegeben wird, auf den sich diese Sprachvariante bezieht.
Ich interpretiere das so, dass jeder gültige (gemäß ISO 3166) 2-Buchstaben-Code als Untertag gültig ist. Der RFC fährt fort:
Tags mit zweiten Untertags mit 3 bis 8 Buchstaben können gemäß den Regeln in Kapitel 5 dieses Dokuments bei IANA registriert werden.
Das sieht übrigens wie ein Tippfehler aus, da sich Kapitel 3 auf den Registrierungsprozess zu beziehen scheint, nicht auf Kapitel 5.
Eine schnelle Suche nach der IANA-Registrierung zeigt eine sehr lange Liste aller verfügbaren Sprachuntertags. Hier ist ein Beispiel aus der Liste (das als verwendet werden würde en-scouse
):
Typ: Variante
Subtag: scouse
Beschreibung: Scouse
Hinzugefügt: 2006-09-18
Präfix: en
Kommentare: Englischer Liverpudlianischer Dialekt, bekannt als 'Scouse'
Es sind alle Arten von Untertags verfügbar. Eine schnelle Schriftrolle hat bereits gezeigt fr-1694acad
(Französisch des 17. Jahrhunderts).
Die Nützlichkeit einiger dieser (ich würde sagen die überwiegende Mehrheit dieser) Tags für Dokumente, die für die Anzeige im Browser entwickelt wurden, ist begrenzt. In der W3C-Internationalisierungsspezifikation heißt es einfach:
Browser und andere Anwendungen können Informationen über die Sprache des Inhalts verwenden, um den Benutzern die am besten geeigneten Informationen bereitzustellen oder den Benutzern die Informationen auf die am besten geeignete Weise zu präsentieren. Je mehr Inhalte korrekt markiert und markiert werden, desto nützlicher und umfassender werden solche Anwendungen.
Ich habe Probleme, detaillierte Informationen darüber zu finden, wie sich Browser verhalten, wenn sie auf verschiedene Sprach-Tags stoßen, aber sie werden höchstwahrscheinlich den Benutzern, die einen Bildschirmleser verwenden, einen Vorteil bieten, der das Tag zur Bestimmung der Sprache / des Dialekts / des Akzents verwenden kann in dem der Inhalt zu präsentieren.