Ich bringe mir zum Spaß ein paar Statistiken bei und bin verwirrt, was ausreichende Statistiken angeht . Ich schreibe meine Verwirrungen in Listenform auf:
Wenn eine Distribution Parameter hat, hat sie dann ausreichende Statistiken?n
Gibt es eine direkte Korrespondenz zwischen der ausreichenden Statistik und den Parametern? Oder dienen die ausreichenden Statistiken nur als "Informationspool", damit wir die Einstellung neu erstellen und die gleichen Schätzungen für die Parameter der zugrunde liegenden Verteilung berechnen können.
Verfügen alle Distributionen über ausreichende Statistiken? dh Kann der Faktorisierungssatz jemals versagen?
Anhand unserer Datenstichprobe gehen wir von einer Verteilung aus, aus der die Daten mit größter Wahrscheinlichkeit stammen, und können dann Schätzungen (z. B. die MLE) für die Parameter für die Verteilung berechnen. Ausreichende Statistiken sind eine Möglichkeit, die gleichen Schätzungen für die Parameter zu berechnen, ohne sich auf die Daten selbst verlassen zu müssen, oder?
Verfügen alle ausreichenden Statistiken über eine ausreichende Mindeststatistik?
Dies ist das Material, mit dem ich versuche, das Thema zu verstehen: https://onlinecourses.science.psu.edu/stat414/node/283
Soweit ich weiß, haben wir einen Faktorisierungssatz, der die gemeinsame Verteilung in zwei Funktionen unterteilt, aber ich verstehe nicht, wie wir die ausreichende Statistik extrahieren können, nachdem wir die Verteilung in unsere Funktionen zerlegt haben.
Die in diesem Beispiel angegebene Poisson-Frage hatte eine klare Faktorisierung, aber dann wurde festgestellt, dass die ausreichende Statistik der Stichprobenmittelwert und die Stichprobensumme waren. Woher wussten wir, dass dies die ausreichende Statistik ist, wenn wir uns nur die Form der ersten Gleichung ansehen?
Wie ist es möglich, dieselben MLE-Schätzungen unter Verwendung ausreichender Statistiken durchzuführen, wenn die zweite Gleichung des Faktorisierungsergebnisses manchmal von den Datenwerten selbst abhängt ? Im Poisson-Fall zum Beispiel hing die zweite Funktion von der Umkehrung des Produkts der Fakultäten der Daten ab, und wir hätten die Daten nicht mehr!
Warum ist die Stichprobengröße im Vergleich zum Poisson-Beispiel auf der Webseite keine ausreichende Statistik ? Wir würden n benötigen, um bestimmte Teile der ersten Funktion zu rekonstruieren. Warum ist dies nicht auch eine ausreichende Statistik?