Was ist Modellidentifizierbarkeit?


38

Ich weiß, dass mit einem Modell, das nicht identifizierbar ist, die Daten durch mehrere unterschiedliche Zuweisungen zu den Modellparametern generiert werden können. Ich weiß, dass es manchmal möglich ist, Parameter so einzuschränken, dass alle identifizierbar sind, wie im Beispiel in Cassella & Berger, 2. Aufl., Abschnitt 11.2.

Wie kann ich bei einem bestimmten Modell beurteilen, ob es identifizierbar ist oder nicht?

Antworten:


45

Aus Gründen der Identifizierbarkeit sprechen wir über einen Parameter (der ein Vektor sein könnte), der sich über einen Parameterraum Θ erstreckt , und über eine Familie von Verteilungen (der Einfachheit halber sei an PDFs gedacht), die mit θ indiziert sind und in der Regel wie { f θ | geschrieben werdenθΘθ . Zum Beispiel θ könnte θ = β und f könnte sein{fθ|θΘ}θθ=βf

was bedeuten würde, dassΘ=(0,). Um das Modellidentifizieren ist, die Transformationdie abbildetθzufθsollteeine Eins-zu-eins. Wenn Sie ein Modell in Ihrer Runde haben, können Sie dies am einfachsten überprüfen, indem Sie mit der Gleichungfθ 1 =fθ 2 beginnen (diese Gleichheit sollte für (fast) allexin derRundegelten)

fθ(x)=1βex/β, x>0, β>0,
Θ=(0,)θfθfθ1=fθ2xsupport ) und zu versuchen, mit Algebra (oder einem anderen Argument) zu zeigen, dass gerade eine solche Gleichung impliziert, dass tatsächlich .θ1=θ2

Wenn Sie mit diesem Plan erfolgreich sind, ist Ihr Modell identifizierbar. Machen Sie mit Ihrem Geschäft weiter. Wenn Sie dies nicht tun, ist Ihr Modell entweder nicht identifizierbar oder Sie müssen ein anderes Argument finden. Die Intuition ist die gleiche, ungeachtet dessen: In einem identifizierbaren Modell ist es unmöglich, dass zwei unterschiedliche Parameter (die Vektoren sein könnten) dieselbe Wahrscheinlichkeitsfunktion hervorrufen.

Dies ist sinnvoll, denn wenn für feste Daten zwei eindeutige Parameter die gleiche Wahrscheinlichkeit hervorrufen würden, wäre es unmöglich, die beiden Kandidatenparameter allein anhand der Daten zu unterscheiden. In diesem Fall ist es unmöglich , den wahren Parameter zu identifizieren .

fθ1=fθ2

1β1ex/β1=1β2ex/β2,
x>0
lnβ1xβ1=lnβ2xβ2
x>0
(1β11β2)x(lnβ1lnβ2)

f(y)=y2y[1,1]y[0,1]


2
(+1) Nette, umfassende, bodenständige Erklärung. Die Analogien, die Sie zeichnen, verdeutlichen die Konzepte.
Kardinal

Sie haben die Frage, die ich gestellt habe, sicherlich beantwortet, aber ich bin zu unerfahren, um Ihre Antwort wirklich zu verstehen. Wenn Sie eine Erklärung kennen, die für einen Anfänger besser ist, lassen Sie es mich bitte wissen.
Jack Tanner

1
@ Kardinal, danke. Für Jack, okay, ich verstehe. Wie wäre es damit: Wenn etwas darüber noch nicht klar ist und Sie mich darauf hinweisen, dann kann ich versuchen, es noch weiter zu konkretisieren. Wenn Sie möchten, können Sie auch eine andere Frage schreiben, in der eine Erklärung für "Laien" oder Beispiele für diese Ideen angefordert werden. Ich denke, es ist fair zu sagen, dass Identifizierbarkeit ein Thema ist, das normalerweise nach der typischen Einführungsphase des Studiums auftaucht. Wenn Sie also einen Kontext angeben möchten, warum Sie jetzt auf dieses Problem stoßen, könnte dies potenziellen Antwortenden helfen.

2
yij=μ+α1+α2++αk+εi

23

ΣΣΣ

Σ

Wenn Sie ein Maximum-Likelihood-Problem haben, wissen Sie, dass die asymptotische Kovarianzmatrix Ihrer Schätzungen der Umkehrung der bei der MLE ausgewerteten Fischerinformationen entspricht. Die Überprüfung der Fischerinformationsmatrix auf (ungefähre) Singularität ist daher auch eine vernünftige Methode zur Beurteilung der Identifizierbarkeit. Dies funktioniert auch, wenn die theoretischen Fischerinformationen schwierig zu berechnen sind, da es häufig möglich ist, einen konsistenten Schätzer der Fischerinformationsmatrix numerisch sehr genau anzunähern, indem beispielsweise das erwartete äußere Produkt der Bewertungsfunktion durch das beobachtete durchschnittliche äußere Produkt geschätzt wird .

Σ


2
(+1) Gut gemacht. Ich hatte nicht einmal daran gedacht, mich dieser Frage aus dieser Richtung zu nähern.

1
Ein Grund, warum die Idee, eine Kovarianzmatrix basierend auf simulierten Daten zu berechnen, besonders einfach ist, ist, dass man die Daten sowieso simulieren sollte, um einen Cook-Gelman-Rubin- Check durchzuführen.
Jack Tanner
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.