(Um zu sehen, warum ich das geschrieben habe, lesen Sie die Kommentare unter meiner Antwort auf diese Frage .)
Typ-III-Fehler und statistische Entscheidungstheorie
Die richtige Antwort auf die falsche Frage zu geben, wird manchmal als Typ-III-Fehler bezeichnet. Die statistische Entscheidungstheorie ist eine Formalisierung der Entscheidungsfindung unter Unsicherheit. Es bietet einen konzeptionellen Rahmen, mit dem Fehler vom Typ III vermieden werden können. Das Schlüsselelement des Frameworks heißt Verlustfunktion . Es werden zwei Argumente benötigt: Das erste ist (die relevante Teilmenge von) der wahre Zustand der Welt (z. B. bei Parameterschätzungsproblemen der wahre Parameterwert ); Die zweite ist ein Element in der Menge der möglichen Aktionen (z. B. bei Parameterschätzungsproblemen die Schätzung. Die Ausgabe modelliert den Verlust, der mit jeder möglichen Aktion in Bezug auf jeden möglichen wahren Zustand der Welt verbunden ist. Bei Parameterschätzungsproblemen sind zum Beispiel einige bekannte Verlustfunktionen:
- der absolute Fehlerverlust
- der quadratische Fehlerverlust
- Hal Varians LINEX-Verlust
Untersuchen Sie die Antwort, um die Frage zu finden
Es gibt einen Fall, bei dem man versuchen könnte, Fehler vom Typ III zu vermeiden, indem man sich auf die Formulierung einer korrekten Verlustfunktion konzentriert und den Rest des entscheidungs-theoretischen Ansatzes durchläuft (hier nicht näher erläutert). Das ist nicht meine Aufgabe - schließlich sind Statistiker mit vielen Techniken und Methoden gut ausgestattet, die gut funktionieren, auch wenn sie nicht von einem solchen Ansatz abgeleitet sind. Aber das Endergebnis scheint mir zu sein, dass die überwiegende Mehrheit der Statistiker die statistische Entscheidungstheorie nicht kennt und sich nicht darum kümmert, und ich denke, sie verpassen sie. Für diese Statistiker würde ich argumentieren, dass sie die statistische Entscheidungstheorie zur Vermeidung von Fehlern des Typs III als wertvoll erachten, weil sie einen Rahmen bietet, in dem sie nach einem vorgeschlagenen Datenanalyseverfahren fragen können:Mit welcher Verlustfunktion (falls vorhanden) wird das Verfahren optimal bewältigt? Das heißt, in welcher Entscheidungssituation liefert es genau die beste Antwort?
Hinterer erwarteter Verlust
Aus Bayes-Sicht ist die Verlustfunktion alles, was wir brauchen. Wir können so ziemlich den Rest der Entscheidungstheorie überspringen - fast per definitionem das Beste , was zu tun ist , Verlust zu minimieren posterior erwartet, das heißt, findet die Aktion , dass mindernd .~ L ( a ) = ∫ & THgr; L ( θ , a ) P ( θ | D ) d θ
(Und was nicht-Bayesianische Perspektiven betrifft? Nun, es ist ein Theorem der frequentistischen Entscheidungstheorie - insbesondere Walds vollständiges Klassensatz -, dass die optimale Maßnahme immer darin besteht, den Bayesianischen posterioren erwarteten Verlust in Bezug auf einige (möglicherweise unangemessene) zu minimieren. ) Die Schwierigkeit bei diesem Ergebnis besteht darin, dass es sich um einen Existenzsatz handelt, der keine Hinweise darauf gibt, welche vor der Verwendung verwendet werden sollen, aber er schränkt die Klasse von Prozeduren, die wir "umkehren" können, fruchtbar ein, um genau herauszufinden, welche Frage es ist, dass wir sind Insbesondere besteht der erste Schritt beim Invertieren eines nicht-Bayesianischen Verfahrens darin, herauszufinden, welches Bayesianische Verfahren (falls vorhanden) repliziert oder approximiert wird.)
Hey Cyan, du weißt, dass dies eine Q & A-Seite ist, oder?
Was mich schließlich zu einer statistischen Frage bringt. In der Bayes'schen Statistik sind bei der Bereitstellung von Intervallschätzungen für univariate Parameter zwei gängige glaubwürdige Intervallverfahren das quantilbasierte glaubwürdige Intervall und das glaubwürdige Intervall mit der höchsten hinteren Dichte. Welche Verlustfunktionen stecken hinter diesen Verfahren?