Welche Methoden werden von GeoIP-Diensten neben WHOIS-Informationen verwendet? [geschlossen]


11

Ich habe mich nur gefragt, wie GeoIP-Dienste neben der Überprüfung der WHOIS-Informationen zur IP-Adresse auch Daten über den geografischen Standort von IPs sammeln. Zum Beispiel bin ich auf diese Website gestoßen, auf der steht, dass sich IP 74.207.244.221 in Fremont, Kalifornien, befindet: https://ipinfo.io/74.207.244.221

Aber ich kann diese Informationen auf dieser IP-Whois-Information nicht finden. ipinfo.io gibt an, dass:

Ursprünglich verwendete unsere API MaxMind-Daten, aber wir waren sehr damit beschäftigt, unsere eigenen Geolokalisierungsdaten zu erstellen. Wir haben große Fortschritte erzielt und verwenden jetzt unsere eigenen Daten, um etwa die Hälfte aller Anfragen zu bearbeiten. Wir greifen jedoch immer noch auf MaxMind-Daten zurück

Und das hat mich interessiert, wie Dienste wie ipinfo.io und MaxMind GeoIP-Daten sammeln.

Antworten:


11

Solche Dienste verwenden normalerweise drei Möglichkeiten, um eine IP-Adresse zu lokalisieren:

  1. Wenn man durch Whois - Datenbanken für eine Adresse suchen;
  2. Verfolgen von Reverse-DNS-Abfragen, um anhand von Domänennameneinträgen nach Hinweisen zu suchen, oder Verfolgen des Pfads des an das Ziel gesendeten Pakets, das auch Hinweise geben kann (z. B. mithilfe von Traceroute).
  3. Und schließlich verwenden sie die RTT-Triangulation.

Die Round-Trip-Time-Triangulation (RTT) ist eine Methode, mit der die ungefähre Geolokalisierung einer IP-Adresse durch Messen der Ping-Latenz von drei verschiedenen Standorten ermittelt wird.

Wenn Sie beispielsweise drei Server in Form eines Dreiecks auf der ganzen Welt haben und eine IP-Adresse von allen drei anpingen und die gleichen Ergebnisse für die Latenz erhalten, bedeutet dies, dass sich die IP-Adresse direkt in befindet das Zentrum dieses Dreiecks. So funktioniert Triangulation, in diesem Fall wird sie jedoch mit ICMP-Pings verwendet.

Ressourcen, die Sie lesen können:
Was ist Ping? @ Wikipedia
SIGCOMM-Artikel über RTT-Triangulation


5
Wow, ich würde nie denken, dass es eine Triangulation gibt, die auf RTT basiert. Interessant. Wenn also ein Server eine Geolokalisierung vermeiden möchte, kann dies zu einer zufälligen Verzögerung der ICMP-Antworten führen.
Lerner

Ich möchte hinzufügen, dass es hilfreich sein könnte, sich tracert / traceroute anzusehen, wie auf iplocation.net geschrieben: "Sie können den Befehl 'traceroute' verwenden, um Hinweise auf den Speicherort der IP-Adresse zu finden. Die Namen der Router, über die Pakete, die von Ihrem Host zum Zielhost fließen, weisen möglicherweise auf den geografischen Pfad des endgültigen Standorts hin. "
Lerner

1
@Learner, das ist eine nette Ergänzung, die jedoch bereits in meiner Antwort in Form von "Tracking Reverse DNS Queries" enthalten ist. Obwohl traceroute das nicht wirklich tut, zeigt es Ihnen alle Domänen / Adressen, durch die eine Abfrage läuft. Ich werde eine Notiz hinzufügen, um es trotzdem klarer zu machen :)
Fanatique

5

Ich bin der Gründer von IPinfo , daher kann ich definitiv einige Details dazu anbieten! Es gibt keine einzige Methode oder eine einzige Datenquelle, um unsere eigene Geolokalisierungsdatenbank (oder einen unserer anderen Datensätze wie IP an Unternehmen oder IP an Netzbetreiber) zu erstellen. Es ist eine Mischung aus einer Reihe verschiedener Datensätze, Datenverarbeitungstechniken und Lehren, die wir seit einigen Jahren daraus ziehen!

Einige Datenquellen und Techniken, die nicht oft erwähnt werden, umfassen:

  • Direkte Feeds von ISPs. Unser Service bearbeitet täglich rund 500 Millionen API-Anfragen und wird auf vielen beliebten hochkarätigen Websites verwendet. Daher werden ISPs dazu angeregt, uns genaue und aktuelle Geolokalisierungsdaten zur Verfügung zu stellen, damit ihre Kunden eine großartige Erfahrung im Web erhalten. Wir arbeiten ständig direkt mit immer mehr ISPs zusammen.

  • GPS-Standortdaten. Mit GPS auf Mobilgeräten können präzise Standortinformationen erfasst werden. Sie können dies mit der IP-Adresse und einigen Rückschlüssen auf die Netzwerktopologie koppeln, um den Standort für IP-Bereiche mit nur wenigen Messungen zu ermitteln.

  • Vom Benutzer eingereichte Korrekturen. Wenn der Standort falsch ist (oder er nach einer Änderung nicht aktualisiert wurde), erhalten wir häufig schnell Feedback von Benutzern und können den Standort manuell korrigieren oder unseren Algorithmus optimieren, um sicherzustellen, dass er beim nächsten Durchlauf von korrekt positioniert ist unsere Datenverarbeitungspipeline.

Für unseren IP-to-Company-Datensatz kratzen wir jeden Monat jeden einzelnen Domain-Namen und verweisen auf die Daten, die wir dort extrahieren, mit IP-Besitzinformationen, Rwhois-Datensätzen und vielem mehr. Wir verwenden dann auch die Domain-Scraping-Daten, um zu zeigen, welche Domains auf welchen IP-Adressen gehostet werden, und in unserem IP-Typ-Klassifikator zusammen mit vielen anderen Datenquellen, um die Wahrscheinlichkeit zu bestimmen, dass eine IP-Adresse hauptsächlich als ISP für Privathaushalte verwendet wird. Geschäfts- oder Hosting-Anbieter. Wir analysieren auch die Link - Struktur der Seiten, und einige dieser Daten zeigen host.io .


Vielen Dank! Ich hatte nicht erwartet, dass der Gründer dieser Website auf meine Frage antworten wird :) Es war sehr interessant.
Lerner
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.