Die Definition von wahrscheinlich ungefähr korrekt ist Valiant zu verdanken. Es soll eine mathematisch strenge Definition dessen geben, was maschinelles Lernen ist.
Lass mich ein bisschen streifen. Während PAC den Begriff "Hypothese" verwendet, verwenden die meisten Menschen das Wortmodell anstelle der Hypothese. Mit einer Anspielung auf die Statistik-Community bevorzuge ich model, aber ich werde versuchen, beide zu verwenden. Maschinelles Lernen beginnt mit einigen Daten, und man will eine Hypothese oder das Modell finden , das wird angesichts der Eingänge zurückkehren oder etwas ganz in der Nähe. Noch wichtiger ist, dass das Modell bei neuen Daten die entsprechende berechnet oder vorhersagt .x i y i ˜ x ˜ y(xi,yi)xiyix~y~
Wirklich interessiert es nicht, wie genau die Hypothese auf den gegebenen (Trainings-) Daten ist, außer dass es kaum zu glauben ist, dass ein Modell, das unter Verwendung einiger Daten erstellt wurde, diesen Datensatz nicht genau widerspiegelt, sondern in Zukunft genau sein wird Datensätze. Die beiden wichtigen Vorbehalte sind, dass man neue Daten nicht mit 100% iger Genauigkeit vorhersagen kann und dass die Datenbeispiele, die man gesehen hat, möglicherweise etwas Wichtiges verpassen. Ein Spielzeugbeispiel wäre, wenn ich Ihnen die 'Daten' 1,2,3,4 geben würde, würde man 'vorhersagen', dass 5 die nächste Zahl sein würde. Wenn Sie dies testen, indem Sie Leute fragen, was die nächste Nummer in der Sequenz ist, würden die meisten Leute sagen 5. Jemand könnte esaber sagen 1.000.000. Wenn Sie die Sequenz 1, 2, 3, ..., 999, 999 hätten, wäre man sicherer, dass die nächste Zahl 1.000.000 ist. Die nächste Zahl könnte jedoch 999.999,5 oder sogar 5 sein. Der Punkt ist, je mehr Daten man sieht, desto sicherer kann man sein, dass man ein genaues Modell erstellt hat, aber man kann nie absolut sicher sein.
Die Definition von wahrscheinlich ungefähr richtig gibt eine mathematisch genaue Version dieser Idee. Bei gegebenen Daten mit der Ausgabe und einer Klasse von Modellen die die Hypothesen bilden, kann man 2 Fragen stellen. Können wir die Daten verwenden, um eine bestimmte Hypothese für zu finden, die bei der Vorhersage neuer Werte wahrscheinlich sehr genau ist? Wie wahrscheinlich ist es außerdem, dass das Modell so genau ist, wie wir es erwarten? Das heißt, wir können ein Modell trainieren, das höchstwahrscheinlich sehr genau ist. Wie in der Antwort von Sean Easter sagen wir, dass eine Klasse von Hypothesen (Klasse von Modellen) PAC ist, wenn wir ein Epsilon-Delta-Argument machen können. Das heißt, wir können mit der Wahrscheinlichkeit sagen, dass unser Modelly i f θ f Θ p > 1 - δxi,1≤i≤myifθfΘp>1−δfΘ ist innerhalb von genau . Wie viele Daten man sehen muss, um ein bestimmtes Paar zu erfüllen hängt vom tatsächlichen Wert und davon, wie komplex die angegebene Klasse von Hypothesen ist.ϵ(δ,ϵ)(δ,ϵ)
Genauer gesagt ist eine Klasse von Hypothesen oder Modellen PAC, wenn es für ein Paar mit ein bestimmtes Modell alle neuen Daten , dieses Modell mit erfüllen Wahrscheinlichkeit wenn das Modell mit mindestens Trainingsbeispielen ausgewählt (trainiert) wurde . Hier ist Err die gewählte Verlustfunktion, die normalerweise .Hfθ(ϵ,δ)0<ϵ,δ,<.5fΘx~,y~Err(fΘ(x~),y~)<ϵp>1−δm=m(δ,ϵ,H)(fΘ(x~)−y~)2
Das Diagramm, das Sie haben, gibt eine Formel dafür an, wie viele Daten für eine bestimmte Klasse von Hypothesen trainiert werden müssen, um ein bestimmtes Paar zu erfüllen . Ich könnte mich irren, aber ich glaube, dass diese Definition von Valiant in einem Artikel mit dem Titel "A Theory of the Learnable" gegeben wurde und teilweise dafür verantwortlich war, dass Valiant den Turing-Preis gewann.(δ,ϵ)