Subjektivität in der Frequenzstatistik

Ich höre oft die Behauptung, dass die Bayes'schen Statistiken sehr subjektiv sein können. Das Hauptargument ist, dass die Schlussfolgerung von der Wahl eines Priores abhängt (obwohl man das Prinzip der Gleichgültigkeit oder der maximalen Entropie anwenden könnte, um einen Prior zu wählen). Im Vergleich dazu, so die Behauptung, ist die frequentistische Statistik im Allgemeinen objektiver. Wie viel Wahrheit steckt in dieser Aussage?

Auch das wundert mich:

Was sind konkrete Elemente der Frequentist-Statistik (falls vorhanden), die besonders subjektiv sein können und in der Bayes'schen Statistik nicht vorhanden oder weniger wichtig sind?
Ist die Subjektivität in der Bayes'schen stärker verbreitet als in der frequentistischen Statistik?

— Amelio Vazquez-Reina
quelle

Gewiss sind frequentistische Methoden viel subjektiver als beworben, aber ich würde argumentieren, dass Bayes-Methoden noch subjektiver sind. Und überzeugen Sie sich bitte nicht davon, dass die Invarianz Ihrer Prioritäten unter einer Gruppe oder die Angabe einer MaxEnt-Prioritätsstufe in irgendeiner Weise "objektiv" ist - beide Typen drücken möglicherweise Überzeugungen aus, die ich für informativ halte, und auf jeden Fall ist keine der beiden Strategien allgemein anwendbar (z. B. glaube ich nicht, dass es invariante oder MaxEnt-Prioritäten im Bereich von CDFs gibt, und alle Prioritäten in diesem Bereich weisen einer topologisch mageren Menge die Wahrscheinlichkeit 1 zu).

— Kerl

Bayesianer beginnen auf subjektivem Boden, dann ziehen sie Daten (hoffentlich) zurück in die objektive Realität. Frequentisten gehen von objektiven Positionen aus (oder denken zumindest, dass sie dies tun), aber am Ende verschmutzen sie die Analyse mit ihren subjektiven Annahmen.

— Aksakal

Bayesianer kennen und sind mit ihren Annahmen ganz vorne mit dabei. Frequentisten sind in der Regel nicht.

— Alexis

Antworten:

Ich höre oft die Behauptung, dass die Bayes'schen Statistiken sehr subjektiv sein können.

Ich auch. Beachten Sie jedoch, dass es eine große Mehrdeutigkeit gibt, etwas Subjektives zu nennen.

Subjektivität (beide Sinne)

Subjektiv kann bedeuten (mindestens) eines von

hängt von den Eigenheiten des Forschers ab
explizit mit dem Kenntnisstand einer Person befasst

Der Bayesianismus ist im zweiten Sinne subjektiv, weil er immer eine Möglichkeit bietet, die durch Wahrscheinlichkeitsverteilungen repräsentierten Überzeugungen durch Konditionierung auf Informationen zu aktualisieren. (Beachten Sie, dass es für die Entscheidung, ob es sich bei diesen Annahmen um Annahmen handelt, die ein Subjekt tatsächlich hat oder nur um Annahmen, die ein Subjekt haben könnte , unerheblich ist.)

Das Hauptargument ist, dass die Schlussfolgerung von der Wahl eines Priores abhängt

Eigentlich, wenn ein vor Ihrer persönlichen Glauben an etwas repräsentiert dann fast Sie sicher nicht wählen , es bei mehr als Sie die meisten Ihrer Überzeugungen gewählt haben. Und wenn es die Überzeugungen eines Menschen repräsentiert, kann es eine mehr oder weniger genaue Darstellung dieser Überzeugungen sein. Ironischerweise gibt es eine eher objektive Tatsache darüber, wie gut es ihn repräsentiert.

(obwohl man das Prinzip der Gleichgültigkeit oder der maximalen Entropie verwenden könnte, um einen Prior zu wählen).

Man könnte, obwohl dies nicht dazu neigt, sehr reibungslos auf kontinuierliche Domänen zu verallgemeinern. Außerdem ist es wohl unmöglich, in allen Parametrisierungen gleichzeitig flach oder "gleichgültig" zu sein (obwohl ich mir nie ganz sicher war, warum Sie das wollen).

Im Vergleich dazu, so die Behauptung, ist die frequentistische Statistik im Allgemeinen objektiver. Wie viel Wahrheit steckt in dieser Aussage?

Wie können wir diese Behauptung bewerten?

Ich schlage vor, dass im zweiten Sinne subjektiv: es ist meistens richtig. Und im ersten Sinne subjektiv: Es ist wahrscheinlich falsch.

Frequenz als subjektiv (zweiter Sinn)

Einige historische Details sind hilfreich, um die Probleme abzubilden

Für Neyman und Pearson gibt es nur induktives Verhalten, keine induktive Inferenz, und alle statistischen Auswertungen funktionieren mit Langzeitstichproben von Schätzern. (Daher Alpha und Potenzanalyse, aber keine p-Werte). Das ist in beiden Sinnen ziemlich unsubjektiv.

In der Tat ist es möglich, und ich halte es für vernünftig, in diesem Sinne zu argumentieren, dass Frequentismus eigentlich überhaupt kein Inferenzrahmen ist, sondern eine Sammlung von Bewertungskriterien für alle möglichen Inferenzverfahren, die ihr Verhalten bei wiederholter Anwendung hervorheben. Einfache Beispiele wären Konsistenz, Unparteilichkeit usw. Dies macht es in Sinn 2 offensichtlich unsubjektiv. Es besteht jedoch auch die Gefahr, dass wir in Sinn 1 subjektiv sind, wenn wir entscheiden müssen, was zu tun ist, wenn diese Kriterien nicht zutreffen (z. B. wenn dies nicht der Fall ist ein unvoreingenommener Schätzer zu haben) oder wenn sie zutreffen, aber widersprechen.

Fisher bot einen weniger unsubjektiven Frequentismus an, der interessant ist. Für Fisher gibt es eine induktive Folgerung in dem Sinne, dass ein Subjekt, der Wissenschaftler, auf der Grundlage einer vom Statistiker durchgeführten Datenanalyse Schlussfolgerungen zieht. (Daher p-Werte, aber keine Alpha- und Potenzanalyse). Die Entscheidung darüber, wie man sich verhält, ob man weiter forscht usw., wird jedoch von der Wissenschaftlerin auf der Grundlage ihres Verständnisses der Domänentheorie getroffen, nicht von der Statistikerin, die das Inferenzparadigma anwendet. Aufgrund dieser Arbeitsteilung in den Fischern liegen sowohl die Subjektivität (Sinn 2) als auch das einzelne Subjekt (Sinn 1) auf der wissenschaftlichen Seite, nicht auf der statistischen Seite.

Legalistisch gesprochen, der Fishers Frequentism ist subjektiv. Es ist nur so, dass das subjektive Subjekt nicht der Statistiker ist.

Es gibt verschiedene Synthesen davon, sowohl die kaum kohärente Mischung aus diesen beiden, die Sie in Lehrbüchern für angewandte Statistik finden, als auch differenziertere Versionen, z. B. die von Deborah Mayo vorgelegte 'Fehlerstatistik'. Letzteres ist in Sinn 2 ziemlich unsubjektiv, in Sinn 1 jedoch höchst subjektiv, da der Forscher mit wissenschaftlichem Urteilsvermögen - im Fisher-Stil - herausfinden muss, welche Fehlerwahrscheinlichkeiten wichtig sind und getestet werden müssen.

Frequentismus als subjektiv (erster Sinn)

Ist der Frequentismus also im ersten Sinne weniger subjektiv? Es hängt davon ab, ob. Jede Inferenzprozedur kann mit tatsächlich angewendeten Eigenheiten durchsetzt sein. Vielleicht ist es also sinnvoller zu fragen, ob der Frequentismus einen weniger subjektiven (ersten Sinn) Ansatz fördert . Ich bezweifle es - ich denke, die selbstbewusste Anwendung subjektiver (zweiter Sinn) Methoden führt zu weniger subjektiven (erster Sinn) Ergebnissen, aber es kann so oder so argumentiert werden.

Nehmen Sie für einen Moment an, dass sich Subjektivität (erster Sinn) über "Entscheidungen" in eine Analyse einschleicht. Der Bayesianismus scheint mehr Wahlmöglichkeiten mit sich zu bringen. Im einfachsten Fall ergeben sich folgende Auswahlmöglichkeiten: eine Menge potenziell eigenwilliger Annahmen für den Frequentisten (die Wahrscheinlichkeitsfunktion oder ein Äquivalent) und zwei Mengen für den Bayesian (die Wahrscheinlichkeit und ein Prior gegenüber den Unbekannten).

Die Bayesianer wissen jedoch, dass sie bei all diesen Entscheidungen subjektiv sind (im zweiten Sinne), sodass sie sich der Auswirkungen, die zu weniger Subjektivität führen sollten (im ersten Sinne), eher bewusst sind.

Wenn man im Gegensatz dazu einen Test in einem großen Testbuch nachschlägt, könnte man das Gefühl bekommen, dass das Ergebnis weniger subjektiv ist (erster Sinn), aber das liegt wohl daran, dass man das Problemverständnis eines anderen Subjekts durch das eigene ersetzt . Es ist nicht klar, dass man auf diese Weise weniger subjektiv geworden ist, aber es könnte sich so anfühlen. Ich denke, die meisten würden zustimmen, dass das nicht hilfreich ist.

— Conjugateprior
quelle

Eine Wörterbuchdefinition von "subjektiv" (direkt von Google) besagt: basierend auf oder beeinflusst von persönlichen Gefühlen, Geschmäcken oder Meinungen. zB "seine Ansichten sind höchst subjektive" Synonyme: persönlich, personalisiert, individuell, innerlich, emotional, instinktiv, intuitiv, impressionistisch . Beachten Sie, dass dies eine Volkstheorie widerspiegelt, die besagt, dass eine "Ansicht" (dh ein Glaube) subjektiv ist (Sinn 1: impressionistisch, intuitiv, seltsam usw.), weil sie den inneren Zustand eines bestimmten Subjekts betrifft (Sinn 2: personalisiert, individuell usw.) .) anstatt öffentlich zu sein, dh unpersönlich .

— Conjugateprior

Es könnte hilfreich sein, über die kognitive Psychologie als Beispiel nachzudenken. Dieses Feld ist völlig subjektiv (in der zweiten Sinne, denn es ist alles über die internen Zustände von Menschen und die Auswirkungen auf jenen , das Verhalten der Menschen) , aber es ist nicht im ersten Sinne subjektiv, weil Psychologen können nicht eigentlich nur herumsitzen und bildet Material auf die Grundlage ihres eigenen inneren Zustandes.

— Conjugateprior

Das entgegengesetzte Extrem, bei dem etwas völlig eigenwillig und subjektiv ist (Sinn 1), sich aber überhaupt nicht mit Themen befasst, ist schwieriger zu finden. Vielleicht ist Lucretius, der Atome und Leere in de Rerum Naturae erklärt, ein Beispiel.

— Conjugateprior

Genau. Englisch ist in dieser Hinsicht nicht hilfreich ...

— conjugateprior

und ich habe die vorgeschlagene Änderung genehmigt (und leicht angepasst)

— conjugateprior

Die Subjektivität in frequentistischen Ansätzen ist bei der Anwendung von Inferenz weit verbreitet. Wenn Sie eine Hypothese testen, legen Sie ein Konfidenzniveau fest, beispielsweise 95% oder 99%. Woher kommt das? Es kommt nicht von irgendwoher, sondern von Ihren eigenen Vorlieben oder einer vorherrschenden Praxis auf Ihrem Gebiet.

Bayesianische Prioritäten spielen bei großen Datenmengen nur eine sehr geringe Rolle, da bei einer Aktualisierung mit den Daten die posteriore Verteilung von Ihren Prioritäten abweicht, wenn immer mehr Daten verarbeitet werden.

Allerdings gehen Bayesianer von der subjektiven Definition von Wahrscheinlichkeiten, Überzeugungen usw. aus. Dies unterscheidet sie von Frequentisten, die in objektiven Wahrscheinlichkeiten denken. Bei kleinen Datenmengen macht dies einen Unterschied

UPDATE: Ich hoffe, Sie hassen Philosophie so sehr wie ich, aber sie haben von Zeit zu Zeit einige interessante Gedanken, denken Sie über Subjektivismus nach . Woher weiß ich, dass ich wirklich auf SE bin? Was ist, wenn es mein Traum ist? etc. :)

— Aksakal
quelle

Neben der Wahl eines Konfidenzniveaus beim Testen von Hypothesen (da dasselbe in der Bayes'schen Statistik zum Beispiel bei der Auswahl eines Kriteriums für den Vergleich von HDP / HDI mit ROPE zur Ablehnung oder Annahme einer Hypothese argumentiert werden könnte ) spielt die Subjektivität eine Rolle bei Erhalten Sie eine Punktschätzung oder erhalten Sie Konfidenzintervalle, vielleicht bei der Auswahl der Schätzer?

— Amelio Vazquez-Reina

Mein Verständnis ist auch, dass Signifikanzniveaus in Frequentist-Statistiken im Kontext der Entscheidungsfindung festgelegt werden (dh sollten wir die Nullhypothese ablehnen?), Nicht in der Berechnung von Wahrscheinlichkeiten. In der Bayes'schen Entscheidungstheorie könnte dasselbe über die Wahl einer Verlustfunktion argumentiert werden, die die optimale (gewählte) Entscheidung beeinflussen kann. Darüber hinaus werden die Konfidenzniveaus normalerweise aus einer akzeptablen Fehlerrate vom Typ I ausgewählt (z. B. 95% in NHST werden direkt aus einer falsch positiven Rate von "nicht mehr als 5%" ermittelt)

— Amelio Vazquez-Reina

Bei der Analyse großer Datenmengen ist der Stand der Technik für die interessantesten Probleme der Neuzeit von großer Bedeutung. Es stimmt, wir haben asymptotische Ergebnisse, wenn

n \to \infty

$n \to \infty$ und

p ≪ n

$p \ll n$ , aber in der Regel Menschen mit großen Datensätzen stellen große Fragen, so dass in gewissem Sinne

p \to \infty

$p \to \infty$ mit einer Rate vergleichbar mit

n

$n$ , und hier wird sich ein angemessener Prior wie ein Regularizer verhalten und eine große Rolle spielen.

— Kerl

Es kann erwähnenswert sein, dass Verlustfunktionen möglicherweise nicht subjektiv sind (dh nicht vollständig durch den Kontext bestimmt sind). In diesem Fall können Bayes'sche optimale Entscheidungen abgesehen vom Prioritätswert vollständig objektiv sein.

@Matthew Ja, obwohl das auch für die Auswahl gilt

α

$\alpha$ in NHST von der maximal tolerierbaren falsch positiven Rate, wie ich oben erwähnt habe.

— Amelio Vazquez-Reina