Ganz einfach gesagt: Gibt es Unterschiede in den Bayesianischen und Frequentistischen Ansätzen zur exploratorischen Datenanalyse?
Ich kenne keine inhärenten Verzerrungen in EDA-Methoden, da ein Histogramm ein Histogramm ist, ein Streudiagramm ein Streudiagramm ist usw., und ich habe auch keine Beispiele für Unterschiede in der Darstellung oder Vermittlung von EDA gefunden (wobei eine besonders theoretische Abhandlung von A. Gelman ignoriert wurde). . Schließlich habe ich mir CRAN angesehen, den Schiedsrichter aller angewandten Dinge: Ich habe keine Pakete gefunden, die auf einen Bayes'schen Ansatz zugeschnitten sind. Ich dachte jedoch, CV könnte ein paar Leute haben, die Licht ins Dunkel bringen könnten.
Warum sollte es Unterschiede geben?
Für Starter:
- Sollte man bei der Identifizierung geeigneter früherer Verteilungen dies nicht visuell untersuchen?
- Sollte die EDA bei der Zusammenfassung der Daten und dem Vorschlag, ein frequentistisches oder ein bayesianisches Modell zu verwenden, nicht die Richtung vorschlagen, in die sie gehen soll?
- Die beiden Ansätze weisen sehr deutliche Unterschiede im Umgang mit Mischungsmodellen auf. Die Feststellung, dass eine Probe wahrscheinlich aus einer Mischung von Populationen stammt, ist schwierig und hängt direkt mit der Methode zusammen, die zur Schätzung der Mischungsparameter verwendet wird.
- Beide Ansätze beinhalten stochastische Modelle und die Auswahl des Modells basiert auf dem Verständnis der Daten. Komplexere Daten oder komplexere Modelle erfordern mehr Zeit in EDA. Bei solchen Unterscheidungen zwischen stochastischen Modellen oder Erzeugungsprozessen gibt es Unterschiede bei den EDA-Aktivitäten. Sollte es also nicht Unterschiede geben, die sich aus unterschiedlichen stochastischen Ansätzen ergeben?
Anmerkung 1: Ich beschäftige mich nicht mit den Philosophien der beiden "Lager" - ich möchte nur Lücken in meinem EDA-Toolkit und meinen Methoden schließen.