Zitat aus Wikipedia:
In der Statistik ist ein konsistenter Schätzer oder ein asymptotisch konsistenter Schätzer ein Schätzer - eine Regel zum Berechnen von Schätzungen eines Parameters - mit der Eigenschaft, dass die resultierende Folge von Schätzungen mit zunehmender Anzahl verwendeter Datenpunkte mit einer Wahrscheinlichkeit gegen konvergiert .θ ∗
Um diese Aussage genau zu machen, sei der Wert des wahren Parameters, den Sie schätzen möchten, und sei die Regel für die Schätzung dieses Parameters als Funktion der Daten. Dann kann die Definition der Konsistenz eines Schätzers folgendermaßen ausgedrückt werden:
Meine Frage scheint auf den ersten Blick oberflächlich zu sein, aber sie lautet: Warum wurde das Wort "Konsistenz / Konsistenz" verwendet, um dieses Verhalten eines Schätzers zu beschreiben?
Der Grund, warum mir das wichtig ist, ist, dass für mich das Wort „konsistent“ intuitiv etwas anderes bedeutet (oder zumindest scheint es mir etwas anderes zu sein, vielleicht kann gezeigt werden, dass sie gleich sind). Lassen Sie mich anhand eines Beispiels erklären, was es bedeutet. Sagen Sie "Sie" sind durchweg "gut" (für eine Definition von "gut"), dann bedeutet "konsequent", dass Sie jedes Mal, wenn Sie die Chance haben, mir zu beweisen, dass Sie gut sind, tatsächlich beweisen, dass Sie gut sind (oder zumindest die meiste Zeit).
Wenden wir meine Intuition an, um die Konsistenz eines Schätzers zu definieren. Sei "Sie" die Funktion, die \ hat {\ theta} berechnet, und "gut" bedeutet, wie weit Sie von der wahren Schätzung (gut, im Sinne der Norm , warum nicht). Dann wäre eine bessere Definition der Konsistenz:
Auch wenn dies eine weniger nützliche Definition der Konsistenz ist, ist es für mich sinnvoller, die Konsistenz zu definieren, da ich für alle Trainings- / Beispielsätze, die Sie in meinen Estimator \ hat \ theta werfen , in der Lage sein werde, Folgendes zu tun: gute Arbeit, dh ich werde durchweg gut abschneiden. Mir ist bewusst, dass es ein wenig unrealistisch ist, es für alle n zu tun (wahrscheinlich unmöglich), aber wir können diese Definition beheben, indem wir sagen:
dh für ausreichend großes n wird unser Schätzer nicht schlechter sein als (dh nicht mehr als von der "Wahrheit" entfernt) vom wahren (das versucht, die Intuition zu erfassen, die Sie mindestens benötigen eine Anzahl von Beispielen, um etwas zu lernen / zu schätzen, und sobald Sie diese Anzahl erreicht haben, wird Ihr Schätzer die meiste Zeit gut abschneiden, wenn es in der Art und Weise konsistent ist, wie wir versuchen, es zu definieren).ϵ θ ∗
Die vorige Definition ist jedoch zu stark, vielleicht könnten wir zulassen, dass wir für die meisten Trainingsmengen der Größe eine geringe Wahrscheinlichkeit haben, weit von zu sein (dh dies ist nicht für alle erforderlich , sondern für alle über die Verteilung von oder so ähnlich). Daher haben wir nur sehr selten einen hohen Fehler für die meisten der von uns zur Verfügung gestellten Beispiel- / Trainingssätze.
Wie auch immer, meine Frage ist, sind diese vorgeschlagenen Definitionen von "Konsistenz" tatsächlich die gleichen wie die "offizielle" Definition von Konsistenz, aber die Gleichwertigkeit ist schwer zu beweisen? Wenn Sie den Beweis kennen, teilen Sie ihn bitte mit! Oder ist meine Intuition völlig veraltet und gibt es einen tieferen Grund, die Definitionskonsistenz so zu wählen, wie sie normalerweise definiert wird? Warum ist ("offizielle") Konsistenz so definiert, wie sie ist?
Einige meiner Gedanken eines Kandidat Beweis für irgendeine Art von Gleichwertigkeit, oder vielleicht Ähnlichkeit zwischen meinem Begriff der Konsistenz und dem akzeptierten Begriff der Konsistenz könnte die Definition einer Grenze in der offiziellen Definition von Konsistenz zu entwirren, die unter Verwendung Definition eines Limits. Ich war mir jedoch nicht hundertprozentig sicher, wie ich das machen sollte, und selbst wenn ich es versuchte, scheint die offizielle Definition der Konsistenz nicht zu berücksichtigen, dass über alle möglichen Trainings- / Beispielsätze gesprochen wird. Da ich glaube, dass sie gleichwertig sind, ist die offizielle Definition, die ich angegeben habe, unvollständig (dh, warum geht es nicht um die Datensätze, die wir könnten, oder alle verschiedenen Datensätze, die unsere Stichprobensätze erzeugen könnten)?
Einer meiner letzten Gedanken ist, dass jede Definition, die wir liefern, auch genau sein sollte, um wessen Wahrscheinlichkeitsverteilung es sich handelt, ist es oder ist es . Ich denke, ein Kandidat sollte auch präzise sein, wenn er garantiert, ob er es auf eine feste Verteilung oder auf alle möglichen Verteilungen auf die Trainingssätze garantiert ... richtig?