Vor kurzem war ich daran interessiert, ein Beta-Regressionsmodell für ein proportionales Ergebnis zu implementieren. Beachten Sie, dass dieses Ergebnis nicht in einen Binomialkontext passt, da es in diesem Kontext kein aussagekräftiges Konzept für einen diskreten "Erfolg" gibt. Tatsächlich ist das Ergebnis tatsächlich ein Anteil der Dauer; Der Zähler ist die Anzahl der Sekunden, während eine bestimmte Bedingung aktiv ist, über die Gesamtzahl der Sekunden, in denen die Bedingung aktiv sein konnte. Ich entschuldige mich für die Unklarheiten, aber ich möchte mich nicht zu sehr auf diesen genauen Kontext konzentrieren, da mir klar ist, dass es neben der Beta-Regression eine Vielzahl von Möglichkeiten gibt, einen solchen Prozess zu modellieren, und ich interessiere mich derzeit mehr für Theorie Fragen, die sich bei meinen Versuchen ergeben haben, ein solches Modell zu implementieren (obwohl ich es natürlich bin)
In jedem Fall haben alle Ressourcen, die ich finden konnte, darauf hingewiesen, dass die Beta-Regression normalerweise mithilfe eines Logit- (oder Probit- / Cloglog-) Links angepasst ist und die Parameter als Änderungen der Log-Quoten interpretiert werden. Ich habe jedoch noch keine Referenz gefunden, die tatsächlich eine Rechtfertigung dafür liefert, warum man diesen Link verwenden möchte.
Das Originalpapier von Ferrari & Cribari-Neto (2004) liefert keine Rechtfertigung; Sie stellen lediglich fest, dass die Logit-Funktion aufgrund der Odds-Ratio-Interpretation der potenzierten Parameter "besonders nützlich" ist. Andere Quellen verweisen auf den Wunsch, vom Intervall (0,1) auf die reale Linie abzubilden. Benötigen wir jedoch unbedingt eine Link-Funktion für ein solches Mapping, da wir bereits von einer Beta-Distribution ausgehen? Welche Vorteile bietet die Link-Funktion über die Einschränkungen hinaus, die sich aus der Annahme der Beta-Verteilung ergeben?Ich habe ein paar schnelle Simulationen durchgeführt und keine Vorhersagen außerhalb des (0,1) -Intervalls mit einem Identitätslink gesehen, selbst wenn ich aus Beta-Verteilungen simuliere, deren Wahrscheinlichkeitsmasse weitgehend nahe 0 oder 1 liegt, aber vielleicht meine Simulationen waren nicht allgemein genug, um einige der Pathologien zu erfassen.
Es scheint mir basierend darauf, wie Individuen in der Praxis die Parameterschätzungen aus Beta-Regressionsmodellen (dh als Quotenverhältnisse) interpretieren, dass sie implizit Rückschlüsse auf die Chancen eines "Erfolgs" ziehen; Das heißt, sie verwenden die Beta-Regression als Ersatz für ein Binomialmodell. Vielleicht ist dies in einigen Zusammenhängen angesichts der Beziehung zwischen Beta- und Binomialverteilungen angemessen, aber es scheint mir, dass dies eher ein Sonderfall als der allgemeine sein sollte. In dieser Frage wird eine Antwort für die Interpretation des Quotenverhältnisses in Bezug auf den kontinuierlichen Anteil und nicht auf das Ergebnis gegeben, aber es scheint mir unnötig umständlich zu sein, Dinge auf diese Weise zu interpretieren, anstatt beispielsweise ein Protokoll zu verwenden oder Identitätsverknüpfung und Interpretation von% Änderungen oder Einheitenverschiebungen.
Warum verwenden wir den Logit-Link für Beta-Regressionsmodelle? Ist es einfach eine Frage der Bequemlichkeit, es mit den Binomialmodellen in Beziehung zu setzen?