Die Leute der "Sampling-Theorie" werden Ihnen sagen, dass keine solche Schätzung existiert. Aber Sie können eine bekommen, Sie müssen nur vernünftig mit Ihren vorherigen Informationen umgehen und viel härter rechnen.
Wenn Sie eine Bayes'sche Schätzmethode angegeben haben und der hintere Teil mit dem vorherigen identisch ist, können Sie sagen, dass die Daten nichts über den Parameter aussagen. Da die Dinge für uns "singulär" werden können, können wir keine unendlichen Parameterräume verwenden. Ich gehe davon aus, dass Sie aufgrund der Pearson-Korrelation eine bivariate normale Wahrscheinlichkeit haben:
wobei
Qi=(xi-μx)2
p(D|μx,μy,σx,σy,ρ)=(σxσy2π(1−ρ2)−−−−−−−−√)−Nexp(−∑iQi2(1−ρ2))
Qi=(xi−μx)2σ2x+(yi−μy)2σ2y−2ρ(xi−μx)(yi−μy)σxσy
Um anzuzeigen, dass ein Datensatz den gleichen Wert haben kann, schreiben Sie , und dann erhalten wir:yi=y
wobei
s2x=1 ist
∑iQi=N[(y−μy)2σ2y+s2x+(x¯¯¯−μx)2σ2x−2ρ(x¯¯¯−μx)(y−μy)σxσy]
s2x=1N∑i(xi−x¯¯¯)2
Und so Ihre Wahrscheinlichkeit auf vier Zahlen abhängt, . Sie möchten also eine Schätzung von ρ , müssen also mit einem vorherigen multiplizieren und die Störparameter μ x , μ y , σ x , σ y integrieren . Nun bereiten wir uns auf die Integration vor und "vervollständigen das Quadrat"
∑ i Q is2x,y,x¯¯¯,Nρμx,μy,σx,σy
∑iQi1−ρ2=N⎡⎣⎢⎢(μy−[y−(x¯¯¯−μx)ρσyσx])2σ2y(1−ρ2)+s2xσ2x(1−ρ2)+(x¯¯¯−μx)2σ2x⎤⎦⎥⎥
Jetzt sollten wir auf Nummer sicher gehen und eine richtig normalisierte Wahrscheinlichkeit sicherstellen. Auf diese Weise können wir keinen Ärger bekommen. Eine solche Option besteht darin, einen schwach informativen Prior zu verwenden, der lediglich die Reichweite jedes einzelnen einschränkt. Wir haben also für das Mittel mit dem flachen Prior und L σ < σ x , σ y < U σ für die Standardabweichungen mit jeffreys prior. Diese Grenzen können leicht mit ein wenig "gesundem Menschenverstand" festgelegt werden, der über das Problem nachdenkt. Ich werde einen nicht näher bezeichneten Prior für ρ nehmenLμ<μx,μy<UμLσ<σx,σy<Uσρ, und so bekommen wir (Uniform sollte funktionieren, wenn nicht die Singularität bei abgeschnitten ):±1
p(ρ,μx,μy,σx,σy)=p(ρ)Aσxσy
A=2(Uμ−Lμ)2[log(Uσ)−log(Lσ)]2
p(ρ|D)=∫p(ρ,μx,μy,σx,σy)p(D|μx,μy,σx,σy,ρ)dμydμxdσxdσy
=p(ρ)A[2π(1−ρ2)]N2∫UσLσ∫UσLσ(σxσy)−N−1exp(−Ns2x2σ2x(1−ρ2))×
∫UμLμexp(−N(x¯¯¯−μx)22σ2x)∫UμLμexp⎛⎝⎜⎜−N(μy−[y−(x¯¯¯−μx)ρσyσx])22σ2y(1−ρ2)⎞⎠⎟⎟dμydμxdσxdσy
Now the first integration over μy can be done by making a change of variables z=N−−√μy−[y−(x¯¯¯−μx)ρσyσx]σy1−ρ2√⟹dz=N√σy1−ρ2√dμy and the first integral over μy becomes:
σy2π(1−ρ2)−−−−−−−−√N−−√⎡⎣⎢Φ⎛⎝⎜Uμ−[y−(x¯¯¯−μx)ρσyσx]σyN√1−ρ2−−−−−√⎞⎠⎟−Φ⎛⎝⎜Lμ−[y−(x¯¯¯−μx)ρσyσx]σyN√1−ρ2−−−−−√⎞⎠⎟⎤⎦⎥
And you can see from here, no analytic solutions are possible. However, it is also worthwhile to note that the value ρ has not dropped out of the equations. This means that the data and prior information still have something to say about the true correlation. If the data said nothing about the correlation, then we would be simply left with p(ρ) as the only function of ρ in these equations.
It also shows how that passing to the limit of infinite bounds for μy "throws away" some of the information about ρ, which is contained in the complicated looking normal CDF function Φ(.). Now if you have a lot of data, then passing to the limit is fine, you don't loose much, but if you have very scarce information, such as in your case - it is important keep every scrap you have. It means ugly maths, but this example is not too hard to do numerically. So we can evaluate the integrated likelihood for ρ at values of say −0.99,−0.98,…,0.98,0.99 fairly easily. Just replace the integrals by summations over a small enough intervals - so you have a triple summation