Ich habe einen Datensatz mit Ereignissen, die im selben Zeitraum aufgetreten sind. Jedes Ereignis hat einen Typ (es gibt nur wenige verschiedene Typen, weniger als zehn) und einen Ort, der als 2D-Punkt dargestellt wird.
Ich möchte prüfen, ob eine Korrelation zwischen Ereignistypen oder zwischen Typ und Ort besteht. Beispielsweise treten Ereignisse vom Typ A normalerweise nicht dort auf, wo Ereignisse vom Typ B auftreten. Oder vielleicht gibt es in einigen Gebieten meistens Ereignisse vom Typ C.
Welche Tools könnte ich verwenden, um dies durchzuführen? Als Anfänger in der statistischen Analyse bestand meine erste Idee darin, eine Art PCA (Principal Component Analysis) für diesen Datensatz zu verwenden, um festzustellen, ob jeder Ereignistyp eine eigene Komponente hat oder ob einige dieselbe gemeinsam haben (dh korreliert sind).
Ich muss erwähnen, dass mein Datensatz in der Größenordnung von 500'000 Punkten , was die Handhabung etwas erschwert .
BEARBEITEN: Wie in den Antworten unten und in den Kommentaren angegeben, müssen Sie dies als markierten Punktprozess modellieren und dann mit R das gesamte Schwerheben ausführen, wie in diesem Workshop-Bericht ausführlich erläutert: http: / /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html