Hat jemand gute Ideen, außer eine Liste aller TLDs zu speichern?
Nein, da sich jede TLD darin unterscheidet, was als Subdomain, Second Level Domain usw. zählt.
Beachten Sie, dass es Domänen der obersten Ebene, Domänen der zweiten Ebene und Unterdomänen gibt. Technisch gesehen ist alles außer der TLD eine Subdomain.
Im Beispiel domain.com.uk ist "domain" eine Subdomain, "com" eine Domain der zweiten Ebene und "uk" die TLD.
Die Frage bleibt also komplexer als auf den ersten Blick und hängt davon ab, wie jede TLD verwaltet wird. Sie benötigen eine Datenbank aller TLDs, die ihre jeweilige Partitionierung enthalten, sowie eine Datenbank der zweiten Ebene und eine Subdomäne. Es gibt jedoch nicht zu viele TLDs, sodass die Liste einigermaßen überschaubar ist, aber das Sammeln all dieser Informationen ist nicht trivial. Möglicherweise ist eine solche Liste bereits verfügbar.
Es sieht so aus, als ob http://publicsuffix.org/ eine solche Liste ist - alle gängigen Suffixe (.com, .co.uk usw.) in einer Liste, die für die Suche geeignet ist. Es wird immer noch nicht einfach sein, es zu analysieren, aber zumindest müssen Sie die Liste nicht pflegen.
Ein "öffentliches Suffix" ist eines, unter dem Internetbenutzer Namen direkt registrieren können. Einige Beispiele für öffentliche Suffixe sind ".com", ".co.uk" und "pvt.k12.wy.us". Die öffentliche Suffixliste ist eine Liste aller bekannten öffentlichen Suffixe.
Die Public Suffix List ist eine Initiative der Mozilla Foundation. Es kann in jeder Software verwendet werden, wurde jedoch ursprünglich entwickelt, um die Anforderungen der Browserhersteller zu erfüllen. Es ermöglicht Browsern zum Beispiel:
- Vermeiden Sie, dass datenschutzschädigende "Supercookies" für Domain-Suffixe auf hoher Ebene festgelegt werden
- Markieren Sie den wichtigsten Teil eines Domainnamens in der Benutzeroberfläche
- Sortieren Sie Verlaufseinträge genau nach Site
Wenn Sie die Liste durchsehen, sehen Sie, dass dies kein triviales Problem ist. Ich denke, eine Liste ist der einzig richtige Weg, um dies zu erreichen ...