Diese Frage wurde in der klassischen Reihe von Arbeiten zum James-Stein-Schätzer im empirischen Bayes-Kontext, die in den 1970er Jahren von Efron & Morris verfasst wurden, explizit beantwortet. Ich beziehe mich hauptsächlich auf:
Efron und Morris, 1973, Steins Schätzregel und ihre Konkurrenten - Ein empirischer Bayes-Ansatz
Efron und Morris, 1975, Datenanalyse mit Steins Schätzer und seinen Verallgemeinerungen
Efron und Morris, 1977, Steins Paradoxon in der Statistik
Das Papier von 1977 ist eine nichttechnische Darstellung, die man unbedingt lesen muss. Dort stellen sie das Baseball-Schlagbeispiel vor (das in dem Thread, mit dem Sie verlinkt haben, besprochen wird). In diesem Beispiel sollen die Beobachtungsvarianzen tatsächlich für alle Variablen gleich sein, und der Schrumpfungsfaktor c ist konstant.
Sie geben jedoch ein weiteres Beispiel an, bei dem die Toxoplasmoseraten in einer Reihe von Städten in El Salvador geschätzt werden. In jeder Stadt wurde eine unterschiedliche Anzahl von Personen befragt, so dass bei einzelnen Beobachtungen (Toxoplasmoserate in jeder Stadt) unterschiedliche Varianzen angenommen werden können (je geringer die Anzahl der befragten Personen ist, desto höher ist die Varianz). Die Intuition ist sicherlich, dass Datenpunkte mit geringer Varianz (geringe Unsicherheit) nicht so stark geschrumpft werden müssen wie Datenpunkte mit hoher Varianz (hohe Unsicherheit). Das Ergebnis ihrer Analyse ist in der folgenden Abbildung dargestellt, in der dies tatsächlich zu sehen ist:
Dieselben Daten und Analysen werden auch in dem viel technischeren Papier von 1975 in einer viel eleganteren Abbildung dargestellt (die einzelnen Abweichungen werden jedoch leider nicht angezeigt), siehe Abschnitt 3:
Dort präsentieren sie eine vereinfachte empirische Bayes-Behandlung, die wie folgt abläuft. Sei Xi|θi∼N(θi,Di)θi∼N(0,A)
wobeiA unbekannt ist. Falls alleDi=1 identisch sind, ist die StandardEmpirical Bayes Behandlung abzuschätzen1/(1+A) als(k−2)/∑X2j , und den a posteriori Mittelwert zu berechnenθi als θ i = ( 1 - 1θ^i=(1−11+A)Xi=(1−k−2∑X2j)Xi,
was nichts anderes als der James-Stein-Schätzer ist.
Wenn jetzt Di≠1 , dann ist die Aktualisierung der Bayes - Regel θ i = ( 1 - D iθ^i=(1−DiDi+A)Xi
und wir können den gleichen empirische Bayes Trick verwendenum abzuschätzenA, auch wenn es für keine geschlossene FormelAin diesem Fall (siehe Papier). Sie stellen jedoch fest, dassA^
... diese Regel reduziert sich nicht auf Steins, wenn alle Dj gleich sind, und wir verwenden stattdessen eine geringfügige Variante dieses Schätzers, die in [der Arbeit von 1973] abgeleitet wurde und sich auf Steins reduziert. Die Variante Regel schätzt einen anderen Wert A i für jede Stadt. Der Unterschied zwischen den Regeln ist in diesem Fall gering, aber es könnte wichtig sein, wenn k kleiner wäre.A^ik
Der relevante Abschnitt in der Veröffentlichung von 1973 ist Abschnitt 8, und es ist etwas schwieriger zu lesen. Interessanterweise haben sie dort einen expliziten Kommentar zu dem Vorschlag von @guy in den obigen Kommentaren:
x~i=D−1/2ixi,θ~i=D−1/2iθix~i∼N(θ~i,1)θiθ^i=(1−k−2∑[X2j/Dj])Xi.
Xi
A^i