Gibt es unbeaufsichtigte Lernalgorithmen für zeitlich geordnete Daten?


9

Jede Beobachtung in meinen Daten wurde mit einer Differenz von 0,1 Sekunden gesammelt. Ich nenne es keine Zeitreihe, weil es keinen Datums- und Zeitstempel hat. In den Beispielen für Clustering-Algorithmen (die ich online gefunden habe) und PCA haben die Probendaten 1 Beobachtung pro Fall und sind nicht zeitgesteuert. Aber meine Daten haben Hunderte von Beobachtungen alle 0,1 Sekunden pro Fahrzeug gesammelt und es gibt viele Fahrzeuge.

Hinweis: Ich habe diese Frage auch zu Quora gestellt.


1
Bitte beachten Sie die Sprache. Ihre Frage ist völlig unklar. Was bedeutet "die Probendaten haben 1 Beobachtung pro Fall und sind nicht zeitgesteuert"?
Kasra Manshaei

1
Ich habe über die Beispiele gesprochen, die ich in Online-Tutorials gefunden habe. Die von ihnen verwendeten Beispieldaten enthalten nur 1 Beobachtung pro Fall / Person (z. B. Kunde, Land usw.). Und diese Daten sind keine Zeitreihen.
Umair Durrani

Antworten:


7

Was Sie haben, ist eine zeitliche Abfolge von Ereignissen. Zögern Sie also nicht, sie Zeitreihen zu nennen!

Clustering in Zeitreihen hat zwei verschiedene Bedeutungen:

  1. Segmentierung von Zeitreihen, dh Sie möchten eine einzelne Zeitreihe nach internen Ähnlichkeiten in verschiedene Zeitintervalle unterteilen.
  2. Zeitreihen-Clustering, dh Sie haben mehrere Zeitreihen und möchten verschiedene Cluster nach Ähnlichkeiten zwischen ihnen finden.

Ich nehme an, Sie meinen den zweiten und hier ist mein Vorschlag:

Sie haben viele Fahrzeuge und viele Beobachtungen pro Fahrzeug, dh Sie haben viele Fahrzeuge. Sie haben also mehrere Matrizen (jedes Fahrzeug ist eine Matrix) und jede Matrix enthält N Zeilen (Anzahl der Beobachtungen) und T Spalten (Zeitpunkte). Ein Vorschlag könnte darin bestehen, PCA auf jede Matrix anzuwenden, um die Dimensionalität zu verringern und Daten im PC-Raum zu beobachten und festzustellen, ob zwischen verschiedenen Beobachtungen innerhalb einer Matrix (eines Fahrzeugs) sinnvolle Beziehungen bestehen . Dann können Sie jede Beobachtung für alle Fahrzeuge aufeinander setzen und eine Matrix erstellen und PCA darauf anwenden, um die Beziehungen einer einzelnen Beobachtung zwischen verschiedenen Fahrzeugen zu sehen.

Wenn Sie keine negativen Werte haben, wird die Matrixfaktorisierung zur Dimensionsreduzierung von Matrixformulardaten dringend empfohlen.

Ein weiterer Vorschlag könnte darin bestehen, alle Matrizen übereinander zu legen und einen N x M x T- Tensor zu erstellen, wobei N die Anzahl der Fahrzeuge, M die Anzahl der Beobachtungen und T die zeitliche Abfolge ist und die Tensor-Zerlegung angewendet wird , um Beziehungen global zu sehen.

Ein sehr guter Ansatz für das Zeitreihen-Clustering wird in diesem Dokument gezeigt, in dem die Implementierung unkompliziert ist.

Ich hoffe es hat geholfen!

Viel Glück :)


BEARBEITEN

Wie Sie bereits erwähnt haben, meinen Sie Zeitreihensegmentierung. Ich füge dies der Antwort hinzu.

Die Zeitreihensegmentierung ist das einzige Clustering-Problem, das eine Grundwahrheit für die Bewertung hat. Tatsächlich betrachten Sie die Erzeugungsverteilung hinter den Zeitreihen und analysieren ich empfehlen , diese , diese , diese , diese , diese und diese , wo Ihr Problem umfassend untersucht. Speziell die letzte und die Doktorarbeit.

Viel Glück!


1
Danke für eine tolle Antwort. Mein Ziel ist es, für jedes Fahrzeug in meinem Datensatz eine "Segmentierung von Zeitreihen" durchzuführen.
Umair Durrani

1
Ich studiere Tutorials zur Zeitreihenzerlegung. Ich fand heraus, dass es Möglichkeiten gibt, sie in Trend-, saisonale und zyklische Komponenten zu zerlegen. Meine Zeitreihen sind jedoch einige Sekunden der Fahrzeugbahn. Ist es möglich, sie basierend auf den Trends bei Beschleunigungen, Geschwindigkeiten, Fahrzeuggeschwindigkeiten und Beschleunigungen innerhalb einer beobachteten Flugbahn in verschiedene Fahrverhaltenskomponenten zu zerlegen?
Umair Durrani

2
Vielleicht! Hierfür sollten sowohl "Zerlegung" als auch "Segmentierung" besser berücksichtigt werden. Wenn Ihre Zeitreihen beispielsweise signifikante Cluster im PC-Bereich aufweisen, können Sie diese mit dem Fahrverhalten in Beziehung setzen. Die Segmentierung dient auch dazu, unterschiedliche Fahrverhalten innerhalb einer Zeitreihe zu erkennen. Kurz gesagt, Sie können die Segmentierung für verschiedene Fahrverhaltenssegmente für ein Fahrzeug und Zerlegungstechniken zum Erkennen des globalen Fahrverhaltens für alle Fahrzeuge verwenden.
Kasra Manshaei
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.