Ich habe viel Zeit in die Entwicklung von Methoden und Software für die Validierung von Vorhersagemodellen im Bereich der traditionellen Statistik investiert. Wenn ich mehr Bayes'sche Ideen in die Praxis umsetze und unterrichte, sehe ich einige wesentliche Unterschiede, die ich berücksichtigen muss. Erstens fordert die Bayes'sche Vorhersagemodellierung den Analysten auf, über frühere Verteilungen nachzudenken, die an die Kandidatenmerkmale angepasst werden können, und diese Prioritäten ziehen das Modell in ihre Richtung (dh Schrumpfung / Bestrafung / Regularisierung mit unterschiedlichem Ausmaß der Bestrafung für unterschiedliche Vorhersagemerkmale) ). Zweitens führt der "echte" Bayes'sche Weg nicht zu einem einzigen Modell, sondern man erhält eine gesamte hintere Verteilung für eine Vorhersage.
Was bedeutet Überanpassung angesichts dieser Bayes'schen Merkmale? Sollen wir es beurteilen? Wenn das so ist, wie? Woher wissen wir, wann ein Bayes'sches Modell für den Feldeinsatz zuverlässig ist? Oder ist das ein strittiger Punkt, da der Posterior alle vorsichtigen Unsicherheiten mit sich bringt, wenn wir das Modell verwenden, das wir für die Vorhersage entwickelt haben?
Wie würde sich das Denken ändern, wenn wir das Bayes'sche Modell zwingen würden, auf eine einzige Zahl zu destillieren, z. B. posteriores Mittel / Modus / mittleres Risiko?
Ich sehe einige relevante Gedanken hier . Eine parallele Diskussion finden Sie hier .
Folgefrage : Wenn wir vollständig bayesianisch sind und einige Zeit über die Prioritäten nachdenken, bevor wir die Daten sehen, und wenn wir ein Modell anpassen, in dem die Datenwahrscheinlichkeit angemessen spezifiziert wurde, sind wir gezwungen, mit unserem Modell in Bezug auf Überanpassung zufrieden zu sein ? Oder müssen wir das tun, was wir in der frequentistischen Welt tun, wo ein zufällig ausgewähltes Thema im Durchschnitt gut vorhergesagt werden kann, aber wenn wir ein Thema mit einer sehr niedrigen Vorhersage oder einem mit einem sehr hohen vorhergesagten Wert auswählen, kommt es zu einer Regression zum Mittelwert?