Sei eine Zufallsvariable, die der Tweedie-Verteilung für Parameter folgt . Die Verknüpfungsfunktion sei das natürliche Protokoll. Angenommen, wir haben eine Datenbank mit Nummern des Formulars
...
.
Die Variablen sind eine Mischung aus kategorialen Variablen und kontinuierlichen Variablen. Da dies ein GLM ist, wissen wir das
. Hier ist meine Frage: Angesichts der Zahlendatenbank und der Tatsache, dass es sich um eine Tweedie-Distribution mit einem bestimmten Parameter handelt, welchen Algorithmus verwende ich am besten, um auszuwählen ? Gibt es eine Fehlerfunktion, die ich minimieren muss, oder schätze ich Parameter mit maximaler Wahrscheinlichkeit?
statmod
(und einige zusätzliche nützliche Funktionen sind im tweedie
Paket in R enthalten, z. B. AICtweedie
). Während Sie ohne diese auskommen können, wenn Sie wissen, wie man glm gut genug fährt, würde ich vorschlagen, dass Sie die Pakete verwenden.