Ich arbeite an der Entwicklung eines Vorhersagemodells für Versicherungsrisiken. Bei diesen Modellen handelt es sich um "seltene Ereignisse" wie No-Show-Vorhersage von Fluggesellschaften, Erkennung von Hardwarefehlern usw. Als ich meinen Datensatz vorbereitete, versuchte ich, eine Klassifizierung anzuwenden, konnte jedoch aufgrund des hohen Anteils negativer Fälle keine nützlichen Klassifizierer erhalten .
Ich habe nicht viel Erfahrung in Statistik und Modellierung von Daten über einen Statistikkurs in der High School hinaus, daher bin ich etwas verwirrt.
Als ersten Gedanken habe ich darüber nachgedacht, ein inhomogenes Poisson-Prozessmodell zu verwenden. Ich habe es anhand von Ereignisdaten (Datum, Lat, Lon) klassifiziert, um eine gute Schätzung der Wahrscheinlichkeit eines Risikos zu einer bestimmten Zeit an einem bestimmten Tag an einem bestimmten Ort zu erhalten.
Ich würde gerne wissen, mit welchen Methoden / Algorithmen seltene Ereignisse vorhergesagt werden können.
Was empfehlen Sie als Ansatz zur Lösung dieses Problems?