Die statistischen Standardwerkzeuge sind der Korrelationskoeffizient (siehe Antwort von Michael Chernick), ein Wert zwischen [-1,1] und einheitenunabhängig. Bezogen auf den Korrelationskoeffizienten ist die Kovarianz. Die Kovarianz wird durch Einheiten beeinflusst, ist jedoch möglicherweise leichter zu interpretieren. Ich mag jedoch keine dieser Optionen im allgemeinen Fall. Ich mag sie nicht, weil sie nicht unabhängig von der konformen Transformation sind. Beachten Sie, dass eine gerade horizontale oder vertikale Linie bei beiden Maßnahmen als nicht linear angesehen wird.
Eine bessere Option ohne Einheit ist die Verwendung einer SVD (Singular Value Decomposition). Die SVD zerlegt Daten in Komponenten, die nach der Größe ihres Beitrags zum Ganzen geordnet sind. Das Verhältnis der größten Singularzahl zur zweitgrößten Singularzahl ist daher eine Metrik der Linearität. Beachten Sie, dass Sie zur Verwendung dieser Methode zuerst die Daten zentralisieren müssen (machen Sie die durchschnittlichen X-, Y-, Z- usw. Koordinaten gleich Null).
Beispiel: Pkt.: 1126640.141 233575.2013; 1126630.008 233572.8567; 1126625.829 233572.7434;
1126625.416 233577.3781;
Zentralisierte Punkte: 9.792639127 0.656480018; -0,340591673 -1,68817349; -4,519928343 -1,801499913; -4,932119113 2,833193384;
SVD, D-Matrix: 11,86500017 0; 0 3,813448344
Verhältnis der Singularwerte 3.111357
Das obige Verhältnis kann grob so interpretiert werden, dass die Daten in Richtung der Best-Fit-Linie dreimal so lang sind wie kreuzlinear.
Für eine Lösung mit Einheiten, die Einheiten haben und keine SVD benötigen. Führen Sie eine Linienanpassung durch, bei der der Mittelpunkt der Linie einer der Parameter ist. Die Verwendung der oben genannten zentralisierten Daten ist einfach: Zeile pt = 0 0 (bei zentralisierten Daten immer der Fall) Zeilenrichtung = -0,999956849 -0,009289783
Vektoren von der Mitte der Linie zu jedem Punkt sind die zentralisierten Koordinaten der Punkte. Bestimmen Sie die Länge der Projektion dieser Vektoren auf die Linie (absoluter Wert des Vektors punktiert die Linienrichtung) und die Länge der senkrechten Vektorkomponente (Länge der Vektorkreuzungslinienrichtung). Länge parallel, Länge senkrecht 9,798315123, 0,565480194; 0,356259742, 1,684936621; 4,536468847, 1,759433021; 4,905586534, 2,878889448;
Das Maximum paralleler Projektionen ist die Datenstrecke entlang der Linie. Die maximale Länge der senkrechten Projektion ist ein Maß für die Nichtlinearität. Das Verhältnis der beiden ist eine Annäherung an das obige Verhältnis der Singularwerte.
Anmerkungen 1. Eine affine Invarianz in der Linearität ist nicht möglich. Bedenken Sie, dass wir in einer affinen Transformation alle Koordinatenachsen bis auf eine auf nahe Null skalieren könnten (wodurch jeder Satz von Punkten linear wird). Konforme Invarianz ist also das Beste, was wir tun können. 2. Diese Methoden sind NICHT ROBUST für Ausreißerdaten. 3. Beispiele sind 2D, aber auf N-dimensional verallgemeinert.