Um Watanabes Diskussion zu verstehen, ist es wichtig zu verstehen, was er mit "Singularität" meinte. Die (strenge) Singularität stimmt in seiner Theorie mit dem geometrischen Begriff der singulären Metrik überein.
S. 10 [Watanabe]: "Ein statistisches Modell wird als regulär bezeichnet, wenn es identifizierbar ist und eine positiv definierte Metrik aufweist. Wenn ein statistisches Modell nicht regulär ist, wird es als streng singulär bezeichnet."p(x∣w)
In der Praxis tritt Singularität normalerweise auf, wenn die vom Modell induzierte Fisher-Informationsmetrik auf der vom Modell definierten Mannigfaltigkeit degeneriert ist, wie dies bei Fällen mit niedrigem Rang oder geringer Dichte beim "maschinellen Lernen" der Fall ist.
ρ(θ,δ(X))=−logp(X∣θ)M(X)XD(θ0,θ)=Eθ0ρ(θ,δ)
inf|θ−θ0|≥ϵ(|D(θ0,θ)−D(θ0,θ0)|)>0
supθ∣∣∣1n∑iρ(θ,δ(Xi))−D(θ0,θ)∣∣∣→0,n→∞
θn^:=argminθρ(θ,δ(Xn))
θ0Pθ0
Also hier gehen Bayes'sche Schätzer und MLE auseinander. Wenn wir immer noch eine schwache Topologie verwenden, um die Konsistenz von Bayes'schen Schätzern zu diskutieren, ist dies bedeutungslos, da Bayes'sche Schätzer immer (mit der Wahrscheinlichkeit eins) von Doob konsistent sind. Eine geeignetere Topologie ist daher die Schwarz-Verteilungstopologie, die schwache Ableitungen zulässt, und von Mises Theorie kam ins Spiel. Barron hatte einen sehr guten technischen Bericht zu diesem Thema, wie wir den Satz von Schwartz verwenden könnten, um Konsistenz zu erhalten.
D
Das "singuläre Lernergebnis" wird beeinflusst, weil Doobs Konsistenzsatz, wie wir sehen, sicherstellt, dass Bayes'sche Schätzer in schwacher Topologie schwach konsistent sind (auch im singulären Modell), während MLE bestimmte Anforderungen in derselben Topologie erfüllen sollte.
Nur ein Wort, [Watanabe] ist nichts für Anfänger. Es hat einige tiefgreifende Auswirkungen auf reale analytische Mengen, die eine höhere mathematische Reife erfordern als die meisten Statistiker. Daher ist es wahrscheinlich keine gute Idee, sie ohne entsprechende Anleitung zu lesen.
■
[Watanabe] Watanabe, Sumio. Algebraische Geometrie und statistische Lerntheorie. Vol. 25. Cambridge University Press, 2009.
[Huber] Huber, Peter J. "Das Verhalten von Maximum-Likelihood-Schätzungen unter nicht standardisierten Bedingungen." Tagungsband des fünften Berkeley-Symposiums zu mathematischer Statistik und Wahrscheinlichkeit. Vol. 1. Nr. 1. 1967.
[Doob] Doob, Joseph L. "Anwendung der Theorie der Martingale." Le calcul des probabilites et ses applications (1949): 23-27.