Ich arbeite in erneuerbaren Energien. Mein Unternehmen sammelt viele Daten von Geräten. Dies umfasst typischerweise Prozessdaten (wie Transformatortemperatur, Netzspannungen, Ströme usw.) und diskrete Alarme (z. B. Leistungsschalterauslösung, Wechselrichteralarmwerte, Transformatorübertemperaturalarm). Dies ist ein grobes Beispiel dafür, wie unsere Daten aussehen (als CSV-Zeilen zu lesen):
- Zeitstempel, Tag, Wert
- 25.05.2016 14:30:01, INVERTER_1.VOLTAGE_DC, 249.5
- 25.05.2016 14:30:06, INVERTER_1.VOLTAGE_DC, 250.1
- 25.05.2016 14:45:02, TRANSFORMER_1.TEMP_ALARM, 0
- 25.05.2016 14:45:15, TRANSFORMER_1.TEMP_ALARM, 1
Ich möchte eine Musteranalyse für diese Daten in Ruhe durchführen, nicht in Echtzeit (zumindest für den Moment). Ich glaube, was ich versuchen möchte, ist unbeaufsichtigtes Feature-Lernen, aber ich bin mir nicht ganz sicher. Es wäre schön (ich denke), maschinelles Lernen anzuwenden, um 1) Muster zu identifizieren, die nicht offensichtlich sind, und 2) einem Algorithmus zu erlauben, Signaturen von Mustern in den Daten zu identifizieren (z. B. verlieren alle Wechselrichter eines einzelnen Abzweigs die Kommunikation, wenn ein Leistungsschalter auftritt ist offen).
Meine erste Frage: Werden dies als Zeitreihendaten betrachtet? In meiner bisherigen Forschung scheinen Zeitreihendaten auf Daten zu verweisen, die eine Funktion der Zeit sind. Für die meisten meiner Daten glaube ich als Domain-Experte nicht, dass das Definieren von Funktionen für meine Daten für diese Analyse nützlich ist. In meiner Forschung scheint es auch so, als ob sich Zeitreihendaten auf reelle Werte beziehen und nicht diskret.
Kommentare oder relevante Referenzen wären hilfreich.