In einer der Übungen für meinen Kurs verwenden wir einen medizinischen Datensatz von Kaggle .
Die Übung sagt:
Wir möchten die Verteilung der einzelnen Gebühren modellieren und wir möchten auch in der Lage sein, unsere Unsicherheit über diese Verteilung zu erfassen, damit wir den Wertebereich, den wir möglicherweise sehen, besser erfassen können. Laden der Daten und Ausführen einer ersten Ansicht:
Wir können davon ausgehen, dass es hier eine Art exponentielle Verteilung gibt. ... Die Gebühren für Versicherungsansprüche können möglicherweise multimodal sein. Die Gammaverteilung ist möglicherweise anwendbar, und wir könnten dies auf die Verteilung von Gebühren testen, die nicht erst Versicherungsansprüche waren.
Ich suchte nach "Gammaverteilung" und fand "eine kontinuierliche, nur positive, unimodale Verteilung, die die Zeit codiert, die für das Auftreten von" Alpha "-Ereignissen in einem Poisson-Prozess mit einer mittleren Ankunftszeit von" Beta "erforderlich ist".
Hier ist keine Zeit erforderlich, nur nicht verbundene Kosten, entweder versichert oder nicht.
Warum sollten sie eine Gammaverteilung wählen?