Warum werden Beta / Dirichlet-Regressionen nicht als verallgemeinerte lineare Modelle betrachtet?


26

Voraussetzung ist dieses Zitat aus der Vignette des R-Pakets betareg1 .

Darüber hinaus hat das Modell einige Eigenschaften (z. B. linearer Prädiktor, Verknüpfungsfunktion, Dispersionsparameter) mit verallgemeinerten linearen Modellen (GLMs; McCullagh und Nelder 1989) gemeinsam, ist jedoch kein Sonderfall dieses Frameworks (auch nicht für feste Dispersion) )

Diese Antwort spielt auch auf die Tatsache an:

[...] Dies ist eine Art von Regressionsmodell, das geeignet ist, wenn die Antwortvariable als Beta verteilt wird. Sie können es sich analog zu einem verallgemeinerten linearen Modell vorstellen. Es ist genau das, was Sie suchen [...] (Hervorhebung von mir)

Der Fragentitel sagt schon alles: Warum werden Beta / Dirichlet-Regression nicht als verallgemeinerte lineare Modelle betrachtet (oder nicht)?


Soweit ich weiß, definiert das verallgemeinerte lineare Modell Modelle, die auf der Erwartung ihrer abhängigen Variablen beruhen, die von den unabhängigen abhängig sind.

f ist die Verknüpfungsfunktion, die die Erwartung abbildet, ist die Wahrscheinlichkeitsverteilung, die Ergebnisse und die Vorhersagen, sind lineare Parameter und die Varianz.gYXβσ2

f(E(YX))g(βX,Iσ2)

Verschiedene GLMs legen die Beziehung zwischen Mittelwert und Varianz fest (oder lockern sie), aber muss eine Wahrscheinlichkeitsverteilung in der Exponentialfamilie sein, eine wünschenswerte Eigenschaft, die die Robustheit der Schätzung verbessern sollte, wenn ich mich richtig erinnere. Die Beta- und Dirichlet-Distributionen gehören jedoch zur exponentiellen Familie, daher habe ich keine Ideen mehr.g


[1] Cribari-Neto, F. & Zeileis, A. (2009). Beta-Regression in R.



@amoeba Danke für den Link, hatte diese Frage noch nie gesehen.
Firebug

2
Ich denke, das Problem ist, dass, wenn Sie die Betaverteilung mit den Standardparametern , b schreiben (dh a = b = 1 impliziert Uniform (0,1)), die Betaverteilung in der Exponentialfamilie liegt, wenn Sie sie schreiben in Bezug auf μ (Mittelwert) und ϕ (Dispersion) ist dies nicht der Fall . Aber ich habe mich nie so sehr darum gekümmert, ob eine Verteilung in der exponentiellen Familie liegt. aba=b=1μϕ
Cliff AB

@CliffAB Nach dem Lesen der Kommentare unter Tims Antwort scheint die Parametrisierung der Beta zu einer Nichtorthogonalität der Parameter zu führen, was für McCullagh-Nelder-GLMs eine Voraussetzung zu sein scheint.
Firebug

1
Ich denke, diese kurze Antwort: stats.stackexchange.com/a/18812/28666 ist relevant und ergänzt die Antworten hier (was darauf hindeutet, warum GLMs ursprünglich mit exponentieller Dispersionsfamilie definiert wurden).
Amöbe sagt Reinstate Monica

Antworten:


20

Überprüfen Sie die Originalreferenz:

Ferrari, S. & Cribari-Neto, F. (2004). Beta-Regression für die Modellierung von Raten und Anteilen. Journal of Applied Statistics, 31 (7), 799-815.

Wie die Autoren bemerken, sind die Parameter der reparametrisierten Beta-Verteilung korreliert

Beachten Sie, dass die Parameter und ϕ nicht orthogonal sind, im Gegensatz zu dem, was in der Klasse der verallgemeinerten linearen Regressionsmodelle (McCullagh und Nelder, 1989) bestätigt wird.βϕ

Während das Modell wie ein GLM aussieht und wie ein GLM quakt, passt es nicht perfekt zum Framework.


7
+1, aber es wäre toll, eine detailliertere Antwort zu haben. Ich persönlich verstehe das Zitat nicht (auch nach dem Öffnen des verlinkten Papiers). Warum sind diese Parameter nicht orthogonal in der Beta - Regression .. Warum dies für GLMs erforderlich ist .. Etc.?
Amöbe sagt wieder einzusetzen Monica

3
@amoeba ehrlich, ich bin nicht die Art von Person, die Ihnen eine detaillierte Antwort darauf geben kann. Ich war noch nie so sehr an der Theorie hinter GLM interessiert, um ein tiefes Verständnis für solche Feinheiten zu haben. McCullagh und Nelder erwähnen diese Anforderung, aber ich muss in ihrem Buch nachlesen, warum genau das wichtig ist. Wenn jemand ausführlich erklären würde, warum dies ein Problem ist, würde ich in Betracht ziehen, ein Kopfgeld für eine solche Antwort auszustellen.
Tim

9
Die Orthogonalitätsanforderung in GLMs ist wichtig: Dies bedeutet, dass Sie die Gleichung abschätzen können, ohne sich Gedanken darüber zu machen, dass der Rest der Wahrscheinlichkeit falsch angegeben wird. Parameterschätzungen sind konsistent, wenn die obige mittlere Gleichung korrekt angegeben ist. Inferenz ist gültig, wenn zusätzlich die Varianz korrekt angegeben ist. In der Beta-Regression können Sie die beiden Modellgleichungen jedoch nicht auf diese Weise trennen, selbst wenn ϕ nur eine Konstante ist. Für konsistente Ergebnisse muss alles korrekt angegeben werden. g(μ)=xβϕ
Achim Zeileis

3
@AchimZeileis Ich erinnere mich, dass ich Ihren Namen im Lebenslauf gesehen habe. Was Sie sagen, macht vollkommen Sinn. Vielleicht möchten Sie Ihren Kommentar in eine Antwort umwandeln, indem Sie weitere Gründe hinzufügen? Wie gesagt, ich würde gerne ein Kopfgeld für jemanden vergeben, der ausführlich genug Antwort auf die Frage gibt.
Tim

2
@Tim Ich werde es versuchen, wenn ich mehr Zeit habe. Deshalb dachte ich, ein kurzer Kommentar ist besser als nichts ...
Achim Zeileis

8

Die Antwort von @probabilityislogic ist auf dem richtigen Weg.

Die Beta-Verteilung liegt in der Zwei-Parameter-Exponentialfamilie . Die von Nelder und Wedderburn (1972) beschriebenen einfachen GLM-Modelle enthalten nicht alle Verteilungen in der Zwei-Parameter-Exponentialfamilie.

In Bezug auf den Artikel von N & W bezieht sich das GLM auf die Dichtefunktionen des folgenden Typs (dieser wurde später in Jørgensen 1987 als exponentielle Dispersionsfamilie bezeichnet ):

π(z;θ,ϕ)=exp[α(ϕ){zθg(θ)+h(z)}+β(ϕ,z)]

mit einer zusätzlichen Verknüpfungsfunktion und einem linearen Modell für den natürlichen Parameter θ = f ( μ ) = f ( X β ) .f()θ=f(μ)=f(Xβ)


So könnten wir die obige Distribution auch umschreiben:

π(z;μ,ϕ)=exp[z(f(μ)α(ϕ))+h(z)α(ϕ)g(f(μ))α(ϕ)+β(ϕ,z)]

Die Exponentialfamilie mit zwei Parametern ist:

f(z;θ1,θ2)=exp[T1(z)η1(θ1,θ2)+T2(z)η2(θ1,θ2)g(θ1,θ2)+h(z)]

Das sieht ähnlich aus, ist aber allgemeiner (auch wenn eines der konstant ist).θ


Der Unterschied ist klar und es ist auch nicht möglich, die Beta-Distribution in eine Form als GLM zu bringen.

Es fehlt mir jedoch ein ausreichendes Verständnis, um eine intuitivere und fundiertere Antwort zu erstellen (ich habe das Gefühl, dass es viel tiefere und elegantere Beziehungen zu einer Vielzahl grundlegender Prinzipien geben kann). Der GLM verallgemeinert die Verteilung des Fehlers unter Verwendung eines einzelnen variablen Exponentialdispersionsmodells anstelle eines Modells der kleinsten Quadrate und verallgemeinert die lineare Beziehung im Mittel unter Verwendung einer Verknüpfungsfunktion.

Die beste und einfachste Intuition scheint die Dispersion- -Terme im Exponential zu sein, die mit allem multipliziert wird und daher die Dispersion nicht mit θ variiert . Während mehrere Zwei-Parameter-Exponentialfamilien und Quasi-Likelihood-Methoden ermöglichen, dass der Dispersionsparameter auch eine Funktion von θ ist .α(ϕ)θθ


Der zweite Parameter in der N & W-Definition df ist die Dispersion. Es erweitert die natürliche Exponentialfamilie mit einem Parameter π ( z ; θ )ϕπ(z;θ)
Sextus Empiricus

@amoeba beta ist eine bivariate exponentielle Familienverteilung, zB www2.stat.duke.edu/courses/Spring11/sta114/lec/expofam.pdf
Tim

2
Ich bin mir nicht sicher, ob es auch mit fester Dispersion nicht ganz möglich ist. Zumindest nicht nach den Angaben von N & W (was ich weiß, ist, dass viele Leute viel schwierigere Dinge tun, um die Beta-Regression zu lösen). Ich werde die Antwort bearbeiten, um zu zeigen, was passiert und wo es schief geht, wenn wir versuchen, den gleichen Weg iterativ neu gewichteter kleinster Quadrate zu beschreiten.
Sextus Empiricus

2
Ich habe die Antwort etwas bearbeitet. 1) Meine anfängliche Beschreibung der Familien und Ausbreitungsmodelle war falsch. Der GLM enthält alle Verteilungen der Ein-Parameter-Exponentialfamilien, da es sich nicht nur um diese Dichtefunktion, sondern auch um eine Verknüpfungsfunktion handelt. 2) Im Sinne einer besseren intuitiven Ansicht konnte ich nicht weit kommen und erwarte nicht, bald weit zu kommen. Die GLM-Modelle beziehen sich auf das klassische Modell in verschiedenen Darstellungen, wobei der Matrixformulierung von Anpassungsprozeduren Gewichte hinzugefügt werden, Ableitungen der Log-Likelihood-Funktionen einschließlich Terme mit der Verknüpfungsfunktion und Varianz, .....
Sextus Empiricus,

2
Ich habe mir die Freiheit genommen, Ihre Antwort ein wenig zu bearbeiten. Ich hoffe, Sie sind mit den Änderungen einverstanden. Es sieht auch so aus, als ob diese Antwort stats.stackexchange.com/a/18812/28666 Hinweise darauf gibt, warum N & W diese bestimmte und keine umfassendere Distributionsfamilie verwendet hat.
Amöbe sagt Reinstate Monica

2

Ich glaube nicht, dass die Betaverteilung Teil der exponentiellen Dispersionsfamilie ist . Um dies zu erreichen, müssen Sie eine Dichte haben

f(y;θ,τ)=exp(yθc(θ)τ+d(y,τ))

für angegebene Funktionen und d ( ) . Der Mittelwert wird als c ' ( & thgr; ) und die Varianz als & tgr; c " ( & thgr; ) angegeben . Der Parameter θ wird als kanonischer Parameter bezeichnet.c()d()c(θ)τc(θ)θ

Die Betaverteilung kann nicht auf diese Weise geschrieben werden - eine Möglichkeit, dies zu sehen, besteht darin, festzustellen, dass die Log-Wahrscheinlichkeit keinen Ausdruck enthält -, sondern stattdessen log [ y ] und log [ 1 - y ]ylog[y]log[1y]

fbeta(y;μ,ϕ)=exp(ϕμlog[y1y]+ϕlog[1y]log[B(ϕμ,ϕ(1μ)]log[y1y])

Ein weiterer Weg, um zu sehen, dass Beta keine exponentielle Dispersionsfamilie ist, besteht darin, dass es als wobeixundzunabhängig sind und beide Gammaverteilungen mit dem gleichen Skalenparameter folgen (und Gamma die Exponentialfamilie ist).y=xx+zxz


1
Diese Antwort ist nicht korrekt wie geschrieben. Ein Weg, dies zu sehen, ist, dass nach der vorgestellten Logik die Bernoulli- und Binomialverteilungen zum Beispiel auch nicht in der Klasse der Exponentialfamilien liegen würden.
Kardinal

2
Entschuldigung, Sie haben Recht, dass das von mir angegebene Beispiel falsch war. (Warnung: Die mentale Arithmetik und der mobile Einsatz von CrossValidated können gefährlich sein!) Mein Standpunkt bleibt jedoch bestehen. Diese Antwort ist falsch, weil sie sich für ein sehr eng definiertes Konzept der "Exponentialfamilie" entscheidet - viel enger als jede herkömmliche Quelle oder praktische Verwendung.
Kardinal

2
Hmm. Wikipedia listet Beta in der Liste der exponentiellen Familienverteilungen auf.
Amöbe sagt Reinstate Monica

1
Stimmt - ich dachte an die natürliche exponentielle Familie - was ein Sonderfall ist
Wahrscheinlichkeitslogik

1
θ
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.