Definieren wir zunächst die folgenden Objekte: In einem statistischen Modell , das zum Modellieren von als Funktion von , gibt es Parameter, die mit vector . Diese Parameter dürfen innerhalb des Parameterraums variieren . Wir sind nicht an der Schätzung all dieser Parameter interessiert , sondern nur an einer bestimmten Teilmenge, beispielsweise in der Parameter, die wir als und die innerhalb des Parameterraums variieren . In unserem Modell die Variablen und die ParameterY X p θ Θ ⊂ R p q ≤ p θ 0 Θ 0 ⊂ R q M X θ Y MMYXpθΘ⊂Rpq≤pθ0Θ0⊂RqMXθ wird nun so abgebildet, dass . Diese Zuordnung wird durch und die Parameter definiert.YM
In dieser Umgebung sagt die Identifizierbarkeit etwas über die Beobachtungsäquivalenz aus . Insbesondere wenn die Parameter für identifizierbar sind, gilt , dass . Mit anderen Worten, es gibt keinen anderen Parametervektor , der angesichts unserer Modellspezifikation den gleichen Datenerzeugungsprozess induzieren würde . Um diese Konzepte besser denkbar zu machen, gebe ich zwei Beispiele. M ∄ θ 1 ∈ θ 0 : θ 1 ≠ θ 0 , M.θ0Mθ 1 M.∄θ1∈Θ0:θ1≠θ0,M(θ0)=M(θ1)θ1M
Beispiel 1 : Definiere für ; das einfache statistische Modell :
und nehme an, dass (also ). Es ist klar, dass, ob oder , immer gilt, dass identifizierbar ist: Der Prozess, der aus hat eine Beziehung zu den Parametern und . FestsetzungX ∼ N ( μ , σ 2 I n ) ; ε ∼ N ( 0 , σ 2 e I n ) M Y = a + X b + ε ( a , b ) ∈ Rθ=(a,b)X∼N(μ,σ2In);ε∼N(0,σ2eIn)M
Y=a+Xb+ε
Θ= R 2 θ 0 =(a,b) θ(a,b)∈R2Θ=R2θ0=(a,b)& thgr; 0 Y X 1 : 1 a b ( a , b ) R.θ0=aθ0YX1:1ab(a,b) ist es nicht möglich, ein zweites Tupel in , das denselben Datengenerierungsprozess beschreibt.
R
Beispiel 2 : Definiere für ; das schwierigere statistische Modell :
und nehme an, dass und (also ). Während dies für ein identifizierbares statistisches Modell wäre, gilt dies nicht, wenn einer einen anderen Parameter enthält (dh oder ). Warum? Denn für jedes Paar vonX ∼ N ( μ , σ 2 I n ) ; ε ∼ N ( 0 , σ 2 eθ=(a,b,c)M ' Y = a + X ( bX∼N(μ,σ2In);ε∼N(0,σ2eIn)M′(a,b)∈R2c∈R∖{0}Θ=R3∖{(l,m,0)| (l,m)∈R2}θ0bc(b,c)B:={(x,y)|
Y=a+X(bc)+ε
(a,b)∈R2c∈R∖{0}Θ=R3∖{(l,m,0)|(l,m)∈R2}θ0bc(b,c)gibt es unendlich viele andere Paare in der Menge . Die offensichtliche Lösung für das Problem in diesem Fall wäre die Einführung eines neuen Parameters der den Bruch ersetzt, um das Modell zu identifizieren. Aus theoretischen Gründen könnte man sich jedoch für und als separate Parameter interessieren - die Parameter könnten interessierenden Parametern im Sinne einer (ökonomischen) Theorie entsprechen. (ZB könnte "Konsumneigung" und "Vertrauen" sein, und Sie möchten diese beiden Größen möglicherweise aus Ihrem Regressionsmodell abschätzen. Leider wäre dies nicht möglich.)
d = b / c b c b cB:={(x,y)|(x/y)=(b/c),(x,y)∈R2}d=b/cbcbc