Ich weiß , dass traditionelle statistische Modelle wie Cox Proportional - Hazards - Regression und einige Kaplan-Meier - Modelle verwendet werden können Tage bis zum nächsten Auftreten eines Ereignisses sagt Ausfall etc. dh zur Vorhersage überleben Analyse
Fragen
- Wie können Regressionsversionen von Modellen für maschinelles Lernen wie GBM, neuronale Netze usw. verwendet werden, um Tage bis zum Auftreten eines Ereignisses vorherzusagen?
- Ich glaube, nur Tage bis zum Auftreten als Zielvariable zu verwenden und einfach ein Regressionsmodell auszuführen, wird nicht funktionieren? Warum funktioniert es nicht und wie kann es behoben werden?
- Können wir das Problem der Überlebensanalyse in eine Klassifikation umwandeln und dann Überlebenswahrscheinlichkeiten erhalten? Wenn ja, wie wird die binäre Zielvariable erstellt?
- Welche Vor- und Nachteile hat der Ansatz des maschinellen Lernens im Vergleich zu Cox Proportional Hazards Regression und Kaplan-Meier-Modellen usw.?
Stellen Sie sich vor, die Eingabedaten haben das folgende Format
Hinweis:
- Der Sensor pingt die Daten in Intervallen von 10 Minuten, aber manchmal können Daten aufgrund von Netzwerkproblemen usw. fehlen, wie in der Zeile mit NA dargestellt.
- var1, var2, var3 sind die Prädiktoren und erklärenden Variablen.
- failure_flag gibt an, ob der Computer ausgefallen ist oder nicht.
- Wir haben die Daten der letzten 6 Monate alle 10 Minuten für jede der Maschinen-IDs
BEARBEITEN:
Die erwartete Ausgabeprognose sollte im folgenden Format vorliegen
Hinweis: Ich möchte die Ausfallwahrscheinlichkeit für jede Maschine für die nächsten 30 Tage auf Tagesebene vorhersagen.
failure_flag
.