Diese Frage beschäftigt sich mit der Frage, was Statistik ist und wie eine gute statistische Analyse durchgeführt werden kann. Es wirft viele Fragen auf, einige der Terminologie und andere der Theorie. Um sie zu verdeutlichen, betrachten wir zunächst den impliziten Kontext der Frage und definieren von dort aus die Schlüsselbegriffe "Parameter", "Eigenschaft" und "Schätzer". Die verschiedenen Teile der Frage werden beantwortet, sobald sie in der Diskussion auftauchen. Der letzte abschließende Abschnitt fasst die wichtigsten Ideen zusammen.
Zustandsräume
Eine gebräuchliche statistische Verwendung von "der Verteilung", wie in "der Normalverteilung mit PDF proportional zu "ist eigentlich ein (schwerwiegender) Missbrauch des Englischen, da es sich offensichtlich nicht um eine einzige Verteilung handelt: Es handelt sich um eine ganze Familie von Verteilungen, diedurch die Symboleμundσparametrisiert sind. Eine Standardnotation für Dies ist der "Zustandsraum"Ω, eineMengeexp( - 12( x - & mgr; ) / & sgr ;.)2) dxμσΩvon Distributionen. (Ich vereinfache hier ein wenig, um dies zu erläutern, und werde es im weiteren Verlauf weiter vereinfachen, wobei ich so streng wie möglich bleibe.) Seine Aufgabe besteht darin, die möglichen Ziele unserer statistischen Verfahren abzugrenzen: Wenn wir etwas schätzen, sind wir es Auswählen eines (oder mehrerer) Elemente von .Ω
Manchmal werden Zustandsräume explizit parametrisiert, wie in . In dieser Beschreibung gibt es eine Eins-zu-Eins-Entsprechung zwischen der Menge der Tupel { ( μ , σ ) } in der oberen Halbebene und der Menge der Verteilungen, die wir zur Modellierung unserer Daten verwenden werden. Ein Wert einer solchen Parametrisierung ist, dass wir uns nun konkret auf Verteilungen in Ω mit Hilfe eines geordneten Paars reeller Zahlen beziehen können.Ω = { N( μ , σ2) | μ ∈ R , σ> 0 }{ ( μ , σ) }Ω
In anderen Fällen werden Zustandsräume nicht explizit parametrisiert. Ein Beispiel wäre die Menge aller unimodalen stetigen Verteilungen. Im Folgenden werden wir uns mit der Frage befassen, ob in solchen Fällen ohnehin eine ausreichende Parametrisierung zu finden ist.
Parametrisierungen
Im Allgemeinen wird eine Parametrisierung von ist eine Entsprechung (mathematische Funktion ) von einer Untergruppe von R d (mit d finite) zu Ω . Das heißt, es werden geordnete Sätze von d- Tupeln verwendet, um die Verteilungen zu kennzeichnen. Aber es ist nicht irgendeine Korrespondenz, es muss "gut benommen" sein. Um dies zu verstehen, betrachten Sie die Menge aller fortlaufenden Distributionen, deren PDFs endliche Erwartungen haben. Dies würde allgemein als "nicht parametrisch" in dem Sinne angesehen, dass jeder "natürliche" Versuch, diese Menge zu parametrisieren, eine abzählbare Folge von reellen Zahlen beinhalten würde (unter Verwendung einer Erweiterung auf einer beliebigen orthogonalen Basis). Trotzdem, weil diese Menge die Kardinalität ℵ hatΩRddΩd , welches die Kardinalität der Realzahlen ist, muss eine Eins-zu-Eins-Entsprechung zwischen diesen Verteilungen und R bestehen . Paradoxerweise scheint dies einparametrisierterZustandsraum mit einemeinzigenreellen Parameter zu sein!ℵ1R
Das Paradoxon wird durch die Feststellung gelöst, dass eine einzelne reelle Zahl keine "nette" Beziehung zu den Verteilungen haben kann: Wenn wir den Wert dieser Zahl ändern, muss sich die Verteilung, der sie entspricht, in einigen Fällen radikal ändern. Wir schließen solche "pathologischen" Parametrisierungen aus, indem wir verlangen, dass Verteilungen, die engen Werten ihrer Parameter entsprechen, selbst nahe beieinander liegen müssen. Die Diskussion geeigneter Definitionen von "nah" würde uns zu weit führen, aber ich hoffe, dass diese Beschreibung ausreicht, um zu demonstrieren, dass ein Parameter viel mehr beinhaltet, als nur eine bestimmte Distribution zu benennen.
Eigenschaften von Distributionen
Durch wiederholte Anwendung gewöhnen wir uns daran, eine "Eigenschaft" einer Distribution als eine verständliche Größe zu betrachten, die in unserer Arbeit häufig vorkommt, wie z. B. ihre Erwartung, Varianz und so weiter. Das Problem dabei als mögliche Definition von "Eigentum" ist, dass es zu vage und nicht allgemein genug ist. (Hier befand sich Mitte des 18. Jahrhunderts die Mathematik, in der "Funktionen" als endliche Prozesse auf Objekte angewendet wurden.) Stattdessen besteht die einzig sinnvolle Definition von "Eigenschaft" darin, eine Eigenschaft als zu betrachten eine Zahl, die jeder Verteilung in Ω eindeutig zugeordnet istΩ. Dies beinhaltet den Mittelwert, die Varianz, jeden Moment, jede algebraische Kombination von Momenten, jedes Quantil und vieles mehr, einschließlich der Dinge, die nicht einmal berechnet werden können. Es enthält jedoch keine Dinge, die für einige der Elemente von keinen Sinn ergeben würden . Wenn zum Beispiel Ω aus allen Student-t-Verteilungen besteht, ist der Mittelwert keine gültige Eigenschaft für Ω (weil t 1 keinen Mittelwert hat). Dies beeindruckt uns erneut, wie sehr unsere Ideen davon abhängen, woraus Ω wirklich besteht.ΩΩΩt1Ω
Eigenschaften sind nicht immer Parameter
Eine Eigenschaft kann eine so komplizierte Funktion sein, dass sie nicht als Parameter dient. Betrachten Sie den Fall der "Normalverteilung". Wir möchten vielleicht wissen, ob der Mittelwert der wahren Verteilung, wenn er auf die nächste ganze Zahl gerundet wird, gerade ist. Das ist eine Eigenschaft. Es wird aber nicht als Parameter dienen.
Parameter sind nicht unbedingt Eigenschaften
Wenn Parameter und Verteilungen eins zu eins übereinstimmen, ist offensichtlich jeder Parameter und jede Funktion der Parameter eine Eigenschaft gemäß unserer Definition. Es muss jedoch keine Eins-zu-Eins-Entsprechung zwischen Parametern und Verteilungen geben: Manchmal müssen einige Verteilungen durch zwei oder mehr deutlich unterschiedliche Werte der Parameter beschrieben werden. Beispielsweise würde ein Positionsparameter für Punkte auf der Kugel natürlich Breiten- und Längengrade verwenden. Das ist in Ordnung - außer an den beiden Polen, die einem bestimmten Breitengrad und einem gültigen Längengrad entsprechen. Die lage(Punkt auf der Kugel) ist zwar eine Eigenschaft, aber ihre Länge ist nicht unbedingt eine Eigenschaft. Obwohl es verschiedene Ausweichmanöver gibt (deklarieren Sie beispielsweise die Länge eines Pols als Null), wird in diesem Thema der wichtige konzeptionelle Unterschied zwischen einer Eigenschaft (die eindeutig mit einer Verteilung verknüpft ist) und einem Parameter (der eine Art der Beschriftung darstellt) hervorgehoben die Verteilung und möglicherweise nicht eindeutig).
Statistische Verfahren
Das Ziel einer Schätzung wird Schätzand genannt . Es ist nur eine Eigenschaft. Die Statistikerin kann den Schätzwert nicht frei wählen: das ist die Provinz ihres Klienten. Wenn jemand mit einer Stichprobe einer Bevölkerung zu Ihnen kommt und Sie auffordert, das 99. Perzentil der Bevölkerung zu schätzen, ist es wahrscheinlich ein Versäumnis, stattdessen einen Schätzer für den Mittelwert anzugeben! Ihre Aufgabe als Statistiker ist es, ein gutes Verfahren für die Schätzung des Schätzwerts zu finden, den Sie erhalten haben. (Manchmal ist es Ihre Aufgabe, Ihren Kunden davon zu überzeugen, dass er die falsche Schätzung für seine wissenschaftlichen Ziele gewählt hat, aber das ist ein anderes Thema ...)
Per Definition ist eine Prozedur eine Möglichkeit, eine Zahl aus den Daten zu erhalten. Prozeduren werden normalerweise als Formeln angegeben, die auf die Daten angewendet werden sollen, wie "Addiere sie alle und dividiere durch ihre Anzahl". Wörtlich kann jede Prozedur als "Schätzer" eines gegebenen Schätzers bezeichnet werden. Zum Beispiel könnte ich erklären, dass der Stichprobenmittelwert (eine Formel, die auf die Daten angewendet wird) die Populationsvarianz schätzt (eine Eigenschaft der Population, vorausgesetzt, unser Kunde hat die Menge der möglichen Populationen auf diejenigen beschränkt, die tatsächlich Varianzen aufweisen).Ω
Schätzer
Ein Schätzer muss keine offensichtliche Verbindung zum Schätzer haben. Sehen Sie zum Beispiel einen Zusammenhang zwischen dem Stichprobenmittelwert und einer Populationsvarianz? Ich auch nicht. Trotzdem ist der Stichprobenmittelwert tatsächlich ein anständiger Schätzer der Populationsvarianz für bestimmte Ω (wie die Menge aller Poisson-Verteilungen). Hierin liegt ein Schlüssel zum Verständnis von Schätzern: Ihre Eigenschaften hängen von der Menge der möglichen Zustände . Aber das ist nur ein Teil davon.Ω
Ein kompetenter Statistiker möchte wissen, wie gut das von ihm empfohlene Verfahren tatsächlich funktioniert. Nennen wir die Prozedur " " und lassen Sie den Schätzwert θ sein . Da sie nicht weiß, welche Verteilung tatsächlich die wahre ist, wird sie die Leistung der Prozedur für jede mögliche Verteilung F ∈ Ω betrachten . Wenn ein solches F gegeben ist und ein mögliches Ergebnis s gegeben ist (d. H. Ein Satz von Daten), vergleicht sie t ( s ) (was ihre Prozedur schätzt) mit θ ( F ) (den Wert des Schätzers für F ). tθ F∈ΩFst(s)θ(F)FEs liegt in der Verantwortung ihrer Klientin, ihr zu sagen, wie nah oder fern diese beiden sind. (Dies geschieht häufig mit einer "Verlust" -Funktion.) Sie kann dann die Erwartung des Abstands zwischen und θ ( F ) betrachten . Dies ist das Risiko ihres Verfahrens. Da es von F abhängt , ist das Risiko eine auf Ω definierte Funktion .t(s)θ(F)FΩ
(Gute) Statistiker empfehlen Verfahren, die auf einem Risikovergleich beruhen. Nehmen wir zum Beispiel an, dass für jedes das Risiko der Prozedur t 1 kleiner oder gleich dem Risiko von t ist . Dann gibt es keinen Grund, t jemals zu verwenden : es ist "unzulässig". Ansonsten ist es "zulässig".F∈Ωt1tt
(Ein "Bayesian" -Statistiker vergleicht Risiken immer durch Mittelung über eine "vorherige" Verteilung möglicher Zustände (in der Regel vom Kunden bereitgestellt). Ein "Frequentist" -Statistiker könnte dies tun, wenn dies gerechtfertigt ist, ist aber auch dazu bereit Risiken auf andere Weise vergleichen (Bayesianer meiden)
Schlussfolgerungen
Wir haben das Recht zu sagen, dass jedes , das für θ zulässig ist, ein Schätzer von θ ist . tθθ Aus praktischen Gründen (weil zulässige Verfahren schwer zu finden sind) müssen wir dies so ändern, dass wir sagen, dass jedes , das ein annehmbar geringes Risiko aufweist (wenn es mit θ verglichen wird ), unter den praktikablen Verfahren ein Schätzer von θ ist . tθθ "Akzeptabel" und "praktikabel" werden natürlich vom Kunden festgelegt: "akzeptabel" bezieht sich auf sein Risiko und "praktikabel" spiegelt die (letztendlich von ihnen bezahlten) Kosten für die Durchführung des Verfahrens wider.
Dieser prägnanten Definition liegen alle eben diskutierten Ideen zugrunde: Um sie zu verstehen, müssen wir ein bestimmtes (das ein Modell des Problems, des Prozesses oder der untersuchten Population ist), einen bestimmten Schätzwert (vom Kunden geliefert), a spezifische Verlustfunktion (die quantitativ verbindet t zum estimand und auch durch die Kunden gegeben wird), ist die Idee des Risikos (berechnet durch die Statistiker), einige Verfahren für den Vergleich von Risikofunktionen (die Verantwortung der Statistiker in Absprache mit dem Kunden), und ein Gefühl dafür, welche Verfahren tatsächlich ausgeführt werden können (das Problem der "Praktikabilität"), obwohl keines davon ausdrücklich in der Definition erwähnt wird.Ωt