Gibt es Unterschiede in der bayesianischen und der frequentistischen Herangehensweise an EDA?


14

Ganz einfach gesagt: Gibt es Unterschiede in den Bayesianischen und Frequentistischen Ansätzen zur exploratorischen Datenanalyse?

Ich kenne keine inhärenten Verzerrungen in EDA-Methoden, da ein Histogramm ein Histogramm ist, ein Streudiagramm ein Streudiagramm ist usw., und ich habe auch keine Beispiele für Unterschiede in der Darstellung oder Vermittlung von EDA gefunden (wobei eine besonders theoretische Abhandlung von A. Gelman ignoriert wurde). . Schließlich habe ich mir CRAN angesehen, den Schiedsrichter aller angewandten Dinge: Ich habe keine Pakete gefunden, die auf einen Bayes'schen Ansatz zugeschnitten sind. Ich dachte jedoch, CV könnte ein paar Leute haben, die Licht ins Dunkel bringen könnten.

Warum sollte es Unterschiede geben?

Für Starter:

  1. Sollte man bei der Identifizierung geeigneter früherer Verteilungen dies nicht visuell untersuchen?
  2. Sollte die EDA bei der Zusammenfassung der Daten und dem Vorschlag, ein frequentistisches oder ein bayesianisches Modell zu verwenden, nicht die Richtung vorschlagen, in die sie gehen soll?
  3. Die beiden Ansätze weisen sehr deutliche Unterschiede im Umgang mit Mischungsmodellen auf. Die Feststellung, dass eine Probe wahrscheinlich aus einer Mischung von Populationen stammt, ist schwierig und hängt direkt mit der Methode zusammen, die zur Schätzung der Mischungsparameter verwendet wird.
  4. Beide Ansätze beinhalten stochastische Modelle und die Auswahl des Modells basiert auf dem Verständnis der Daten. Komplexere Daten oder komplexere Modelle erfordern mehr Zeit in EDA. Bei solchen Unterscheidungen zwischen stochastischen Modellen oder Erzeugungsprozessen gibt es Unterschiede bei den EDA-Aktivitäten. Sollte es also nicht Unterschiede geben, die sich aus unterschiedlichen stochastischen Ansätzen ergeben?

Anmerkung 1: Ich beschäftige mich nicht mit den Philosophien der beiden "Lager" - ich möchte nur Lücken in meinem EDA-Toolkit und meinen Methoden schließen.

Antworten:


17

In meinen Augen geht es bei Bayes vs frequentist um formale Schlussfolgerungen, und bei der explorativen Datenanalyse geht es auch nicht.

Natürlich wird es bei der Modellbewertung / Anpassungsgüte- und Sensitivitätsanalyse, bei der ich Ihre Punkte (1), (3) und (4) klassifizieren würde, Unterschiede in der Vorgehensweise geben, aber Das liegt an der Natur der Unterschiede zwischen den Analyse- und Berechnungsmethoden und nicht an der Philosophie.

In Bezug auf Ihre (2) sehe ich die Ergebnisse der EDA im Allgemeinen nicht als Hinweis auf den bayesianischen oder frquentistischen Ansatz, sondern eher als das Ziel der Studie, das am wichtigsten war.

Für mich persönlich würde die EDA (plus tiefe Selbstbeobachtung) mich auf ein Modell hinweisen, und wenn ich einen natürlichen, häufig auftretenden Ansatz finden könnte, der die wissenschaftliche Frage einigermaßen gut beantwortet, würde ich damit einverstanden sein, aber wenn es der Natur der Situation entspricht , keine frequentistische Methode würde gut funktionieren, und wenn es eine vernünftige Methode gäbe, würde ich Bayes verwenden.


(+1) Sehr gut gesagt - besonders, "EDA (plus tiefe Selbstbeobachtung) würde mich auf ein Modell
hinweisen

+1 auch. Bei EDA geht es nicht wirklich darum, eine Perspektive auszuwählen, sondern darum, Ihre Daten zu verstehen, um fundiertere Entscheidungen zu treffen.
Fomite

+1 Für eine gute Antwort. Leider denke ich, dass die ursprüngliche Frage missverstanden wurde. Ich habe nicht nach EDA gefragt, um mich zwischen bayesianischen oder frequentistischen Modellen zu entscheiden. Ich muss überprüfen, wie ich es formuliert habe, wenn es den Anschein hat, dass mehrere Personen dasselbe Missverständnis haben.
Iterator

@Iterator Ich verstehe Ihre Hauptfrage als: Gibt es Unterschiede zwischen der Einstellung der Bayesianer und der der Frequentisten zu EDA? Meine Antwort darauf lautet: nein; EDA ist weder häufig noch bayesianisch.
Karl

3
Ich denke, meine Definition von "explorativer Datenanalyse" ist enger als Ihre. Meiner Ansicht nach beinhaltet jede gute Datenanalyse die Erkundung. Was die "explorative Datenanalyse" auszeichnet, ist das Fehlen eines Modells oder der Versuch, formale Schlussfolgerungen zu ziehen.
Karl

0

Ich denke, dass EDA Ihnen hilft, ein Modell zu erstellen, einige Annahmen zu treffen und (falls erforderlich) das Modell und seine Annahmen zu aktualisieren. Ich wähle einen pragmatischen Ansatz für die Modellanpassung und -bewertung.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.