Ich habe zwei Fragen zum Konzept der "Lernkonsistenz" für diejenigen, die mit der statistischen Lerntheorie a la Vapnik vertraut sind.
Frage 1.
Der Lernprozess heißt konsistent (für die Funktionsklasse und die Wahrscheinlichkeitsverteilung ), wenn
Diese beiden Bedingungen sind unabhängig. Auf P. 83 von Vapniks "Statistical Learning Theory" gibt es ein Beispiel für eine Reihe von Klassifikatoren so dass die zweite Konvergenz stattfindet, die erste jedoch nicht. Ich habe über ein Beispiel für eine Reihe von Klassifikatoren nachgedacht, bei denen die erste Konvergenz stattfindet, die zweite jedoch nicht und mir nichts einfallen lässt. Kann mir hier jemand helfen?
Frage 2.
Der Lernprozess wird als nichttrivial konsistent (oder streng konsistent) (für die Funktionsklasse und die Wahrscheinlichkeitsverteilung ) bezeichnet, wenn für eine reelle Zahl so gilt, dass ist nicht leer.
S. 81 von Vapniks "Statistical Learning Theory" veranschaulicht, warum wir strikte Konsistenz anstelle der in Frage 1 definierten Konsistenz betrachten wollen, dh warum wir einführen und für jedes . Alle anderen Texte, die strenge Konsistenz berücksichtigen, duplizieren im Wesentlichen Vapniks Darstellung, wenn sie die Gründe für das Konzept der strengen Konsistenz erläutern möchten. Ich bin jedoch aus zwei Gründen nicht wirklich zufrieden mit Vapniks Darstellung: Erstens erfolgt dies in Bezug auf die Verlustfunktionenund nicht die Klassifikatoren, und zweitens Abb. 3.2. aus dem Buch macht nicht wirklich Sinn, wenn wir die allgemeine Verlustfunktion für Klassifizierungsprobleme betrachten, dh die Funktion, die gleich 0 ist, wenn die vorhergesagte Klassenbezeichnung gleich der wahren Klassenbezeichnung ist, und ansonsten 1.
Ist es also möglich, die Gründe für das Konzept der strengen Konsistenz noch einmal vernünftiger zu veranschaulichen? Im Wesentlichen benötigen wir ein Beispiel für eine Reihe von Klassifizierern, sodass diese Klassifizierer nicht konsistent sind (im Sinne der Definition aus Frage 1) und einige neue Klassifizierer eine bessere Leistung als alle Klassifizierer aus der Gruppe aufweisen, sodass wir diese Klassifizierer hinzufügen Zum Set führen wir zum Fall der "trivialen Konsistenz". Irgendwelche Ideen?