Diese Frage begann als " Clustering von Geodaten in R " und wurde nun in die DBSCAN-Frage verschoben.
Als die Antworten auf die erste Frage nahelegten, suchte ich nach Informationen über DBSCAN und las einige Dokumente darüber. Neue Fragen sind aufgetaucht.
DBSCAN erfordert einige Parameter, einer davon ist "Entfernung". Welche "Entfernung" sollte ich verwenden, da meine Daten dreidimensional sind, Längengrad, Breite und Temperatur? Welche Dimension hängt mit dieser Entfernung zusammen? Ich nehme an, es sollte Temperatur sein. Wie finde ich einen solchen Mindestabstand mit R?
Ein weiterer Parameter ist die Mindestanzahl von Punkten, die zur Bildung eines Clusters erforderlich sind. Gibt es eine Methode, um diese Nummer zu finden? Leider habe ich nicht gefunden.
Durch Google suchen Ich konnte kein R-Beispiel für die Verwendung von dbscan in einem ähnlichen Datensatz wie meinem finden. Kennen Sie eine Website mit solchen Beispielen? So kann ich lesen und versuchen, mich an meinen Fall anzupassen.
Die letzte Frage ist, dass mein erster R-Versuch mit DBSCAN (ohne eine richtige Antwort auf die vorherigen Fragen) zu einem Speicherproblem führte. R sagt, dass es keinen Vektor zuordnen kann. Ich beginne mit einem 4 km beabstandeten Raster mit 779191 Punkten, das in ungefähr 300000 Zeilen x 3 Spalten (Breite, Länge und Temperatur) endet, wenn nicht gültige SST-Punkte entfernt werden. Hinweise zur Behebung dieses Speicherproblems. Kommt es auf meinen Computer oder in DBSCAN selbst an?
Vielen Dank für die Geduld, eine lange und wahrscheinlich langweilige Nachricht zu lesen, und für Ihre Hilfe.