Ich habe Datensätze, die unter anderem GPS-Koordinaten (Längen- und Breitengrad) enthalten. Ich möchte diese Datensätze verwenden, um Probleme zu untersuchen wie: (1) Berechnen der ETA, um zwischen Start- und Endpunkten zu fahren; und (2) Schätzen des Ausmaßes der Kriminalität für einen bestimmten Punkt.
Ich möchte ein lineares Regressionsmodell verwenden. Kann ich diese GPS-Koordinaten jedoch direkt in einem linearen Modell verwenden?
Breite und Länge haben keine ordinale Eigenschaft , wie zum Beispiel das Alter einer Person. Beispielsweise scheinen die beiden Punkte (40.805996, -96.681473) und (41.226682, -95.986587) keine sinnvolle Reihenfolge zu haben. Sie sind nur Punkte im Raum. Ich dachte daran, sie durch kategoriale US-Postleitzahlen zu ersetzen und dann eine One-Hot-Codierung durchzuführen , aber das würde zu vielen Variablen führen.