Ich hoffe, dass ich diese Frage richtig stellen kann. Ich habe Zugriff auf Play-by-Play-Daten, daher ist es eher ein Problem mit der besten Vorgehensweise und der korrekten Erstellung der Daten.
Was ich tun möchte, ist zu berechnen, wie wahrscheinlich es ist, ein NHL-Spiel zu gewinnen, wenn das Ergebnis und die verbleibende Zeit in der Regulierung berücksichtigt werden. Ich glaube, ich könnte eine logistische Regression verwenden, bin mir aber nicht sicher, wie der Datensatz aussehen soll. Hätte ich mehrere Beobachtungen pro Spiel und für jeden Zeitraum, an dem ich interessiert bin? Hätte ich eine Beobachtung pro Spiel und würde ich pro Zeitscheibe verschiedene Modelle einsetzen? Ist logistische Regression überhaupt der richtige Weg?
Jede mögliche Hilfe, die Sie zur Verfügung stellen können, wird sehr geschätzt!
Freundliche Grüße.