Warum ist die Bayes'sche Statistik für die statistische Prozesskontrolle nicht beliebter?

Mein Verständnis der Debatte zwischen Bayesian und Frequentist ist folgende:

ist (oder behauptet, objektiv zu sein)
oder zumindest unvoreingenommen
Verschiedene Forscher, die unterschiedliche Annahmen verwenden, können daher immer noch quantitativ vergleichbare Ergebnisse erzielen

während Bayes'sche Statistik

behauptet, "bessere" Vorhersagen zu treffen (dh den erwarteten Verlust zu senken), weil es Vorkenntnisse nutzen kann (unter anderem aus Gründen)
Es sind weniger "Ad-hoc" -Auswahlen erforderlich, die durch (zumindest prinzipiell) realistisch interpretierte Voraus- / Modellauswahlen ersetzt werden.

Angesichts dessen hätte ich erwartet, dass die Bayes'schen Statistiken in SPC sehr populär sein würden: Wenn ich ein Fabrikbesitzer wäre, der versucht, meine Prozessqualität zu kontrollieren, würde ich mich hauptsächlich um den erwarteten Verlust kümmern; Wenn ich das reduzieren könnte, weil ich mehr / besseres Vorwissen habe als meine Konkurrenten, noch besser.

Praktisch alles, was ich über SPC gelesen habe, scheint stark frequentistisch zu sein (dh keine vorherigen Verteilungen, Punktschätzungen aller Parameter, viele Ad-hoc-Entscheidungen über Stichprobengröße, p-Werte usw.).

Warum das? Ich kann sehen, warum in den 1960er Jahren, als SPC mit Stift und Papier durchgeführt wurde, häufigere Statistiken die bessere Wahl waren. Aber warum hat seitdem noch niemand andere Methoden ausprobiert?

bayesian quality-control

— Nikie
quelle

Ich denke, Bayesianische Statistiken sind meine digitale SLP-Kamera, während ich häufig als iPhone-Kamera arbeite. Irgendwann habe ich beide gekauft, aber ich benutze DSLR weniger als 5% der Fotos, während das Telefon zu 95% ruht. Weil es einfach, handlich und in der Tasche ist und viel Zeit pro Qualität bietet (basierend auf meinen DSLR-Kenntnissen). Genau wie das Einbeziehen der Priors und der laufenden Ketten in Heu muss ich ein optimales Gleichgewicht zwischen Öffnungsdauer, Länge und anderen Parametern finden. Iphone ende von beliebtem.

— Ram Sharma

@RamSharma du solltest das als Antwort posten! Ich mag es besser als meine Kochmesser-Analogie.

— Shadowtalker

Antworten:

WARNUNG Ich habe diese Antwort vor langer Zeit mit sehr wenig Ahnung geschrieben, wovon ich sprach. Ich kann es nicht löschen, da es akzeptiert wurde, aber ich kann nicht hinter den meisten Inhalten stehen.

Dies ist eine sehr lange Antwort und ich hoffe, dass sie irgendwie hilfreich sein wird. SPC ist nicht mein Gebiet, aber ich denke, diese Kommentare sind allgemein genug, dass sie hier gelten.

Ich würde argumentieren, dass der am häufigsten genannte Vorteil - die Fähigkeit, frühere Überzeugungen einzubeziehen - ein schwacher Vorteil in den angewandten / empirischen Bereichen ist. Das liegt daran, dass Sie Ihren Prior quantifizieren müssen . Auch wenn ich sagen kann "naja, Level z ist definitiv unplausibel", kann ich dir für mein ganzes Leben nicht sagen, was unter z passieren soll. Sofern die Autoren nicht beginnen, ihre Rohdaten in Scharen zu veröffentlichen, sind meine besten Vermutungen bedingte Momente aus früheren Arbeiten, die möglicherweise unter ähnlichen Bedingungen wie die, denen Sie gegenüberstehen, angepasst wurden oder nicht.

Grundsätzlich sind Bayes'sche Techniken (zumindest auf konzeptioneller Ebene) hervorragend geeignet, wenn Sie eine starke Annahme / Idee / ein starkes Modell haben und diese / s auf Daten übertragen möchten, um festzustellen, wie falsch oder nicht falsch Sie sich herausstellen. Häufig möchten Sie jedoch nicht wissen, ob Sie mit einem bestimmten Modell für Ihren Geschäftsprozess Recht haben. eher hast du keineModell, und schauen, um zu sehen, was Ihr Prozess tun wird. Sie möchten Ihre Schlussfolgerungen nicht pushen, Sie möchten, dass Ihre Daten Ihre Schlussfolgerungen pushen. Wenn Sie über genügend Daten verfügen, wird dies sowieso passieren, aber warum sollten Sie sich in diesem Fall um den Prior kümmern? Vielleicht ist das zu skeptisch und risikoavers, aber ich habe noch nie von einem optimistischen Geschäftsmann gehört, der auch erfolgreich war. Es gibt keine Möglichkeit , Ihre Unsicherheit über die eigenen Überzeugungen zu quantifizieren, und Sie lieber nicht das Risiko, laufen übermütig in der falschen Sache. Sie setzen also einen nicht informativen Prior und der Vorteil verschwindet.

Dies ist im SPC-Fall interessant, da Ihre Geschäftsprozesse im Gegensatz zum digitalen Marketing nicht für immer in einem unvorhersehbaren Zustand sind. Mein Eindruck ist, dass sich Geschäftsprozesse in der Regel bewusst und inkrementell ändern. Das heißt, Sie haben eine lange Zeit, um gute, sichere Priors aufzubauen. Aber denken Sie daran, dass es bei Prioren nur darum geht, Unsicherheit zu verbreiten. Subjectivity beiseite, hat Bayesianismus den Vorteil , dass sie objektiv ausbreitet Unsicherheit über tief verschachtelte Datenerzeugungsprozesse. Das ist für mich, ist wirklich was Bayes - Statistik ist gut für. Und wenn Sie nach einer Prozesssicherheit suchen, die weit über den Grenzwert von 1 zu 20 hinausgeht, möchten Sie anscheinend so viel Unsicherheit wie möglich berücksichtigen.

Also, wo sind die Bayes'schen Modelle? Zunächst einmal sind sie schwer zu implementieren. Um es ganz klar auszudrücken, ich kann einem Maschinenbauingenieur in 15 Minuten OLS beibringen und ihn Regressionen und T-Tests in Matlab in weiteren 5 durchführen lassen. Um Bayes zu verwenden, muss ich zuerst entscheiden, welches Modell ich anpasse. und dann schauen Sie, ob es eine fertige Bibliothek dafür in einer Sprache gibt, die jemand in meiner Firma kennt. Wenn nicht, muss ich BUGS oder Stan verwenden. Und dann muss ich Simulationen ausführen, um eine einfache Antwort zu erhalten. Auf einem 8-Core-i7-Computer dauert das ungefähr 15 Minuten. Soviel zum Rapid Prototyping. Und zweitens, bis Sie eine Antwort erhalten, haben Sie zwei Stunden mit dem Codieren und Warten verbracht, nur um das gleiche Ergebnis zu erzielen, wie Sie es mit zufälligen Frequenzeffekten mit geclusterten Standardfehlern erzielen könnten. Vielleicht ist das alles anmaßend und falsch und ich verstehe SPC überhaupt nicht.

Ich vergleiche den Bayesianismus mit einem sehr hochwertigen Kochmesser, einem Suppentopf und einer Bratpfanne . Frequentismus ist wie eine Küche voller TV-Geräte wie Bananenschneider und Nudeltöpfe mit Löchern im Deckel, die das Abtropfen erleichtern . Wenn Sie ein erfahrener Koch mit viel Erfahrung in der Küche sind - in der Tat, in Ihrer eigenen Küche mit fundiertem Wissen, das sauber und organisiert ist und Sie wissen, wo sich alles befindet -, können Sie mit Ihrer kleinen Auswahl erstaunliche Dinge tun elegante, hochwertige Werkzeuge. Oder Sie können eine Reihe verschiedener kleiner Ad-hoc-Tools * verwenden, für deren Verwendung keine besonderen Fähigkeiten erforderlich sind, um eine Mahlzeit zuzubereiten, die einfach, wirklich nicht halbwegs schlecht ist und einige grundlegende Geschmacksrichtungen aufweist, die den Kern der Sache ausmachen. Sie sind gerade von den Data Mines nach Hause gekommen und hungrig nach Ergebnissen. welcher koch bist du

* Bayes ist genauso ad-hoc, aber weniger transparent . Wie viel Wein steckt in Ihrem Coq au Vin? Keine Ahnung, du musterst es, weil du ein Profi bist. Oder Sie können den Unterschied zwischen einem Pinot Grigio und einem Pinot Noir nicht erkennen, aber das erste Rezept auf Epicurious soll 2 Tassen des roten verwenden. Welches ist mehr "ad-hoc?"

— Shadowtalker
quelle

+1, tolle Antwort. Ich bin gespannt: Können Sie einen Absatz über kleine / adaptive Stichprobengrößen hinzufügen? In SPC scheinen Stichprobengrößen von 3 bis 5 üblich zu sein. Und wenn die SPC-Software dem Techniker nach 2 Proben sagen könnte, ob er wirklich 3 weitere Proben benötigt oder nicht, wäre das eine großartige Funktion. Bei einem Bayes'schen Modell ist das fast ein Kinderspiel: Definieren Sie die Kosten für Messungen, Falsch-Positive und -Negative und schätzen Sie dann die erwarteten Kosten für eine weitere Messung im Vergleich zum Stoppen. In der Statistik der

— Frequentisten müssten

Was die Stichprobengröße angeht, so ist das Problem, und ich hätte dies erwähnt, wenn ich gewusst hätte, dass die Stichproben so klein sind, dass Ihre Schätzungen bei sehr wenigen Beobachtungen sehr empfindlich auf Ihre vorherige Auswahl reagieren. Sie können kein Blut aus einem Stein bekommen, daher ist dies ein Kompromiss: Entweder passen Sie einem häufig auftretenden Schätzer zu stark an, tun dies jedoch mit wenigen Annahmen, oder Sie beziehen Ihr eigenes Wissen (oder einen Mangel daran) in ein ausreichend vages vorheriges und ein Passen Sie im Wesentlichen sowohl an die Daten an, die Sie vor sich haben, als auch an die "Daten", die Sie in Ihrem Kopf haben. Sie dürfen eine Uniform im Kopf haben.

— Shadowtalker

Grundsätzlich belastet Bayes die Analytikerin mehr, wenn sie gleich zu Beginn ihr Gehirn einsetzt. Ich persönlich halte es für ein Zeichen dafür, dass Sie entweder a) zu faul sind oder b) nicht wirklich verstehen, wie Statistiken funktionieren (man braucht einen, um einen zu kennen usw.). Ich sagte, es sei schwierig, Prioritäten in meiner Antwort zu quantifizieren. Dem stimme ich in der Praxis eigentlich nicht zu. Eine Sache, die Sie immer tun können, ist, eine Glockenkurve auf eine Seite zu zeichnen und sich zu fragen: "Würde ich erwarten, dass meine Daten so aussehen?" Wenn nicht, fangen Sie an, die Kurve zu optimieren. Und wenn Sie sich nicht entscheiden können, wo Sie den Modus verwenden möchten, verwenden Sie einen Hyperprior.

— Shadowtalker

Eine Frage (die nicht brüchig sein soll): Sie wissen, dass es eine Literatur gibt, die sich mit (quantitativ) der Forderung nach früheren Überzeugungen befasst, oder? Einschließlich veröffentlichter Überzeugungen, befragter Experten- und Nicht-Experten-Überzeugungen sowie Selbstüberzeugungen. Der Grund, den ich frage, ist, dass ich diese Beschwerde schon einmal gehört habe, aber die Verfasser solcher Beschwerden dachten, dass ihr Einwand das Ende der Diskussion und nicht den Beginn einer Untersuchung darstellte.

— Alexis

@CliffAB Interessant… Ich habe diese Literatur nicht gründlich gelesen (Bernardo, Kaas, Garthwaite ... seit mehreren Jahrzehnten)… aber das ist eine wertvolle Wissenschaft für Sie: Unterschiedliche frühere Überzeugungen geben Auskunft darüber, ob man frequentistische oder bayesianische Methoden bevorzugt. ;)

— Alexis

Meiner bescheidenen Meinung nach weist die Bayes'sche Statistik einige Nachteile auf, die im Widerspruch zu ihrer weit verbreiteten Verwendung stehen (in SPC, aber auch in anderen Forschungsbereichen):

Es ist schwieriger, Schätzungen im Vergleich zu seinem häufigeren Gegenstück zu erhalten (der größte Teil der statistischen Klassen verwendet den häufigeren Ansatz. Übrigens wäre es interessant zu untersuchen, ob dies die Ursache oder der Effekt der begrenzten Popularität der Bayes'schen Statistik ist ).
In der Bayes'schen Statistik wird häufig die Wahl zwischen verschiedenen Methoden zur Behandlung desselben Problems (z. B. welche ist die beste Lösung?) Und nicht nur " Click-and-See" (dieser Ansatz sollte auch im Rahmen des Frequentismus nicht gefördert werden).
Die Bayes'sche Statistik enthält einige Themen, die von weniger als sehr erfahrenen Statistikern (z. B. unangemessenen Vorgesetzten ) nur schwer verwaltet werden können .
Es erfordert Sensitivitätsanalysen (die normalerweise im Rahmen der Frequentisten vermieden werden) und Ausnahmen für einige Themen, z. B. die Analyse fehlender Daten.
Es steht nur eine (lobenswerterweise kostenlos herunterladbare) Software zur Berechnung zur Verfügung.
Es braucht mehr Zeit , um ein autonomer Forscher mit Bayesian zu sein, als mit häufig benutzten Werkzeugen.

— Carlo Lazzaro
quelle

Gute Antwort, aber ich bin mit Punkt 5 nicht einverstanden: Ich kann mir viele verschiedene (kostenlose) Software für die Bayes'sche Analyse vorstellen: WinBUGS, OpenBUGS, JAGS, Stan, PyMC ... und ich bin sicher, dass es noch mehr gibt. Was ich sagen würde, ist, dass alle diese Software eine steile Lernkurve haben und eine angemessene Menge an Programmier- und Statistikkenntnissen erfordern.

— COOLSerdash

COOLSerdash hat recht und ich begrüße sowohl Klarstellung als auch Kommentar. Mein Mangel an Vollständigkeit bei der Auflistung von Bayes-Analyse-Software war wahrscheinlich nur auf meine (lockere) Vertrautheit mit WinBugs zurückzuführen.

— Carlo Lazzaro

@CarloLazzaro Ich stimme COOLSerdashs Punkt zu Nummer 5 ebenfalls zu: Ab Version 14 enthält das privat lizenzierte und dennoch Mainstream-Statistikpaket Stata jetzt Bayes'sche Modelle und Schätzungen im Vanille-Paket. Ich denke, dass die rechnerische Verfügbarkeit von Bayes nur zunehmen wird. Aber Ihre anderen Punkte sind wichtig und sollten dazu beitragen, die Agenda für Bayesianische Befürworter zu informieren.

— Alexis

@Alexis: Als Stata-Benutzer bin ich mit dem Bayes'schen Geschmack der letzten Zeit zufrieden. Generell würde ich mich dafür einsetzen, dass ich während des Statistikunterrichts an der Universität sowohl frequentistische als auch bayesianische Ansätze lerne (wahrscheinlich fangen Likelihoodisten an zu meckern !!).

— Carlo Lazzaro

Ein Grund dafür ist, dass die Bayes'sche Statistik bis etwa 1990 aus dem Mainstream verdrängt wurde. Als ich in den 1970er Jahren Statistik studierte, war es fast ketzerisch (nicht überall, aber in den meisten Hochschulstudiengängen). Es hat nicht geholfen, dass die meisten der interessanten Probleme unlösbar waren. Infolgedessen wird fast jeder, der heute Statistik unterrichtet (und Artikel für Zeitschriften prüft und Lehrpläne entwirft), zum Frequentisten ausgebildet. Mit der Verbreitung der Markov-Chain-Monte-Carlo-Methoden (MCMC), die sich allmählich in Paketen wie SAS und Stata durchsetzen, änderte sich etwas. Persönlich denke ich, dass sie in 10 Jahren viel häufiger auftreten werden, obwohl sie in speziellen Anwendungen (SPC) möglicherweise keinen großen Vorteil haben.

Eine Gruppe, die erwacht, um die Bayes'sche Analyse breiter verfügbar zu machen, ist die Gruppe, die das STAN-Paket entwickelt (mc-stan.org).

— equinn1
quelle

Willkommen auf unserer Webseite! Nur eine Anmerkung, dass es "Stata" ist und nicht "STATA" - ich war am falschen Ende der Stata-Benutzer, als ich es selbst groß geschrieben habe! (Ich dachte, es wäre wie SAS, SPSS usw., aber anscheinend nicht ...)

— Silverfish