Ein eng verwandtes Thema ist das der Konzentrationsungleichheiten , die Ihnen eine Grenze (der Art, nach der Sie suchen) geben, die auch von der Anzahl der Proben (unter anderem) abhängt. Konkret ist das Konzept der Rademacher-Komplexität ein Standardwerkzeug, um diese Art von Problemen anzugehen. Die Rademacher-Komplexität kann als Permutationstest verstanden werden, bei dem Sie Ihre Beschriftungen zufällig ändern. Wenn Sie sich mit dem Problem der Schätzung des Mittelwerts befassen, gibt die Grenze an, wie wahrscheinlich es ist, dass Sie sich zufällig dem tatsächlichen Mittelwert nähern (wie konzentriert sind die Stichproben um den Mittelwert und wie stabil sind Ihre Schätzungen basierend auf verschiedenen Stichproben). .
Genauer gesagt, für eine Stichprobe der Größe , die aus einer Wahrscheinlichkeitsverteilung , und für eine reelle Funktionsklasse mit Domäne die empirische Rademacher-Komplexität ist die Zufallsvariable, definiert als
wobei unabhängige Uniform sind bewertete Zufallsvariablen. Die Rademacher-Komplexität ist,
X=(xi)lDFX
R^l(F)=Eσ[supf∈F∣∣∣∣2l∑i=1lσif(xi)∣∣∣∣X]
σ=(σ1,...,σl)±1Rl(F)=ES∼D[R^l(F)]=ESσ[supf∈F∣∣∣∣2l∑i=1lσif(xi)∣∣∣∣X]
Das sup bedeutet, dass es nach der höchstmöglichen Korrelation mit zufälligem Rauschen sucht. Dieses Konzept ist nun aufgrund des folgenden Satzes relevant:
Unter den obigen Bedingungen wird angenommen, dass die Klasse der Abbildungen von bis zum Intervall , und sei eine Stichprobe der Größe . Wenn Sie fixieren , dann erfüllt mit der Wahrscheinlichkeit über zufällige Ziehungen der Größe jedes ,FX[0,1](zi)lδ∈(0,1)1−δlf∈F
E[f(z)]≤E^[f(z)]+Rl(F)+ln(2/δ)2l−−−−−−−√≤E^[f(z)]+R^l(F)+3ln(2/δ)2l−−−−−−−√
Beachten Sie, dass der Hut verwendet wird, um die empirische Erwartung anzuzeigen, die an einer bestimmten Probe gemessen wurde.
Die Idee ist, eine solche Familie von f zu finden und den Satz zu verwenden. Da eine kompakte Unterstützung hat, wissen Sie, dass in , wobei der Radius der Kugel ist.D(W−E[W])2/R[0,1]R
Mit den Eigenschaften der Rademacher Komplexität und einen zweiten Satz mit dem Sie die Rademacher Komplexität für lineare Vorhersage gibt (Details finden sich hier und im Detail hier ), erhalten Sie die folgende für Ihre Wahrscheinlichkeit gebunden
2R2l−−−−√(2–√+ln1δ−−−−√)
PS Ich habe gerade festgestellt, dass Sie sich auf die p-Norm bezogen haben. Trotzdem können Sie die Khintchine-Ungleichung verwenden, um diese Menge an die 2-Norm zu binden.