Beta-Regression (dh GLM mit Beta-Verteilung und normalerweise der Logit-Link-Funktion) wird häufig empfohlen, um Antworten zu behandeln, die als abhängige Variablen mit Werten zwischen 0 und 1 bezeichnet werden, z. B. Brüche, Verhältnisse oder Wahrscheinlichkeiten. Regression für ein Ergebnis (Verhältnis oder Bruch) zwischen 0 und 1 .
Es wird jedoch immer behauptet, dass die Beta-Regression nicht verwendet werden kann, sobald die Antwortvariable mindestens einmal gleich 0 oder 1 ist. Ist dies der Fall, man braucht zu verwenden entweder Null / Eins-aufgeblasenen Beta - Modell, oder eine Transformation der Antwort machen, etc .: Beta Regression der Anteil Daten einschließlich 1 und 0 .
Meine Frage ist: Welche Eigenschaft der Beta-Verteilung verhindert, dass die Beta-Regression mit exakten Nullen und Einsen umgeht, und warum?
Ich vermute, es ist, dass und nicht in der Unterstützung der Beta-Verteilung sind. Aber für alle Formparameter und , beide Null und Eins sind in der Unterstützung der Beta - Verteilung, es ist nur für kleinere Formparameter , dass die Verteilung an einer oder beiden Seiten ins Unendliche geht. Und vielleicht sind die Beispieldaten so, dass und die die beste Anpassung liefern, beide über .1 α > 1 β > 1β 1
Bedeutet es , dass in einigen Fällen ein könnte in der Tat Regression Verwendung Beta auch mit Nullen / Einsen?
Selbst wenn 0 und 1 die Beta-Verteilung unterstützen, ist die Wahrscheinlichkeit, genau 0 oder 1 zu beobachten, natürlich Null. Aber wie groß ist die Wahrscheinlichkeit, dass ein anderer zählbarer Satz von Werten beobachtet wird? Das kann also kein Problem sein, oder? (Vgl. Diesen Kommentar von @Glen_b).
Im Kontext der Beta-Regression wird die Beta-Verteilung unterschiedlich parametrisiert, aber mit sollte sie für alle immer noch genau auf definiert sein .[ 0 ,μ