Mein Hintergrund liegt hauptsächlich im maschinellen Lernen und ich habe versucht zu lernen, was das Testen der Bayes'schen Hypothese bedeutet. Ich bin mit der Bayes'schen Interpretation der Wahrscheinlichkeit einverstanden und im Kontext probabilistischer grafischer Modelle damit vertraut. Was mich jedoch verwirrt, ist die Bedeutung des Wortes "Hypothese" im Zusammenhang mit statistischer Folgerung.
Ich glaube, ich bin meistens verwirrt über den Wortschatz, den ich beim maschinellen Lernen gewohnt bin, im Vergleich zu dem, was normalerweise in Statistik und Inferenz verwendet wird.
Im Rahmen des überwachten Lernens , denke ich normalerweise von der Hypothese als Vorhersagefunktion , die Beispiele auf ihre Etiketten dh Karten . Es scheint mir jedoch, dass der Begriff Hypothese in den Lesungen, die ich tue, nicht die gleiche Bedeutung hat. Lassen Sie mich einen Auszug der Lesungen einfügen, die ich gerade lese:

Wenn Sie sorgfältig lesen, heißt es auch:
Es gibt ein anderes Modell für die beobachteten Daten ...
wo sie das Wort Modell verwenden. Das Wort Modell lässt mich an eine Reihe von Funktionen denken, bei denen wir eine bestimmte Vorhersagefunktion auswählen. dh eine Hypothesenklasse der Funktion. Zum Beispiel könnte die Hypothesenklasse quadratischer Funktionen sein (Polynom 2. Grades). Es scheint mir jedoch, dass sie das Wortmodell und die Hypothese als Synonyme in diesem Auszug verwenden (wobei es sich für mich um völlig unterschiedliche Wörter handelt).
Dann wird erwähnt, dass wir die Hypothese vorziehen können (eine völlig vernünftige Sache, die man in einer bayesianischen Umgebung machen kann):
Wir können die Daten auch mit einer aktuellen Hypothese charakterisieren:
und aktualisieren Sie unsere aktuellen Überzeugungen anhand einiger Daten (und der Baye-Regel):
Ich bin jedoch eher daran gewöhnt, eine Bayes'sche Schätzung auf einen bestimmten Parameter (sagen wir ) einer Hypothesenklasse anzuwenden, als auf die gesamte Hypothesenklasse. Da es den Anschein hat, dass diese "Hypothesen" nicht die gleichen Hypothesen aus dem Kontext des maschinellen Lernens sind, an die ich gewöhnt bin, scheint es mir, dass diese Hypothesen einem bestimmten Parameter ähnlicher sind als einer Hypothesenklasse.θ
Zu diesem Zeitpunkt war ich überzeugt, dass "Hypothese" dasselbe bedeutete wie in der Vorhersagefunktion ( zum Beispiel parametrisiert durch einen Parameter ), aber ich glaube, ich habe mich geirrt ...
Um meine Verwirrung noch schlimmer zu machen, wurde später bei dieser Lektüre für jedes beobachtete Trainingsbeispiel eine bestimmte "Hypothese" angegeben. Lassen Sie mich einen Auszug dessen einfügen, was ich meine:

Das verwirrt mich, weil es für mich keinen Sinn macht, für jeden angezeigten Beispielwert einen bestimmten Parameter anzugeben, wenn ich die Hypothese als Parameter interpretiere. Zu diesem Zeitpunkt kam ich zu dem Schluss, dass ich wirklich nicht wusste, was sie mit Hypothese meinten, und stellte diese Frage.
Ich habe jedoch nicht ganz aufgegeben, sondern nachgeforscht, was Hypothesen in der frequentistischen Statistik bedeuten, und das folgende Video der Khan-Akademie gefunden . Das Video macht für mich sehr viel Sinn (vielleicht bist du ein Frequentist! :) . Es scheint jedoch, dass sie eine Reihe von Daten erhalten (wie etwa ein "Beispielsatz") und basierend auf den Eigenschaften des Beispielsatzes entscheiden sie, ob sie die Nullhypothese zu den Daten akzeptieren oder ablehnen. Doch in dem Bayes - Kontext , dass wir lesen werden, scheint es mir , dass für jeden Datum [Punkt] Vektor , der beobachtet wird, sie „beschriftet“ mit einer Hypothese mit dem „Likelihood Ratio - Test“:

Die Art und Weise, wie sie jeder Datenstichprobe eine Hypothese zuweisen, scheint sogar eine überwachte Lernumgebung zu sein, in der wir jedem Trainingssatz ein Etikett hinzufügen. Ich glaube jedoch nicht, dass sie dies in diesem Zusammenhang tun. Was machen sie? Was bedeutet es, jeder Datenprobe eine Hypothese zuzuweisen? Was bedeutet eine Hypothese? Was bedeutet das Wort Modell?
Weiß jemand nach dieser langen Erklärung meiner Verwirrung im Grunde, was das Testen von Bayes'schen Hypothesen in diesem Zusammenhang bedeutet?
Wenn Sie eine Klarstellung oder etwas brauchen, um meine Frage zu verbessern oder um die Frage sinnvoll zu machen, helfe ich Ihnen gerne :)
Auf meiner Suche nach einer Antwort habe ich einige nützliche Dinge im Zusammenhang mit dem Testen statistischer Hypothesen gefunden:
Dieser Artikel bietet eine gute Einführung in das Thema, wenn Sie einen CS-Hintergrund haben (wie ich):
Was ist eine gute Einführung in das Testen statistischer Hypothesen für Informatiker?
Irgendwann fragte ich nach "Standardparametern" (die ich hätte definieren sollen, was ich meinte. Ich dachte, es sei ein Standardbegriff, aber das ist er nicht, deshalb werde ich hier darauf eingehen) und ich denke, was ich wirklich meinte, ist, wie es geht Sie geben Parameter für jede Hypothese an, die Sie haben. Wie entscheiden Sie beispielsweise, was Ihre Nullhypothese ist und welche Parameter sie hat? Dazu gibt es eine Frage:
