Lassen Sie Ihren Eingabebereich darstellen, dh den Bereich, in dem sich Ihre Datenpunkte befinden. Stellen Sie sich eine Funktion so vor, dass sie einen Punkt aus Ihrem Eingabebereich entnimmt und einem Punkt in zuordnet . Nehmen wir nun an, wir haben alle Ihre Datenpunkte von auf diesen neuen Bereich abgebildet . Wenn Sie nun versuchen, das normale lineare svm in diesem neuen Raum anstelle von zu lösen , werden Sie feststellen, dass alle früheren Arbeiten einfach gleich aussehen, außer dass alle Punkte als dargestellt werden ΦXΦ:X→FXFXFFXxiΦ(xi)und anstatt (Punktprodukt) zu verwenden, das das natürliche innere Produkt für den euklidischen Raum ist, ersetzen wir es durch das das natürliche innere Produkt im neuen Raum darstellt . Am Ende würde Ihr so aussehen:xTy⟨Φ(x),Φ(y)⟩Fw∗
w∗=∑i∈SVhiyiΦ(xi)
und daher
⟨w∗,Φ(x)⟩=∑i∈SVhiyi⟨Φ(xi),Φ(x)⟩
In ähnlicher Weise ist
b∗=1|SV|∑i∈SV(yi−∑j=1N(hjyj⟨Φ(xj),Φ(xi)⟩))
und Ihre Klassifizierungsregel sieht folgendermaßen aus: .cx=sign(⟨w,Φ(x)⟩+b)
So weit so gut, es gibt nichts Neues, da wir die normale lineare SVM einfach auf einen anderen Raum angewendet haben. Der magische Teil ist jedoch dieser -
Nehmen wir an, es gibt eine Funktion so dass . Dann können wir alle obigen Punktprodukte durch ersetzen . Ein solches wird als Kernelfunktion bezeichnet. k ( x i , x j ) = ⟨ Φ ( x i ) , Φ ( x j ) ⟩ k ( x i , x j ) kk:X×X→Rk(xi,xj)=⟨Φ(xi),Φ(xj)⟩k(xi,xj)k
w∗b∗
⟨w∗,Φ(x)⟩=∑i∈SVhiyik(xi,x)
b∗=1|SV|∑i∈SV(yi−∑j=1N(hjyjk(xj,xi)))
Für welche Kernelfunktionen gilt die obige Ersetzung? Nun, das ist eine etwas komplizierte Frage, und Sie möchten vielleicht richtiges Lesematerial aufnehmen, um diese Implikationen zu verstehen. Ich möchte jedoch nur hinzufügen, dass das oben Gesagte für den RBF-Kernel gilt.
wxw
hiFXΦkΦ
max∑ihi−∑i,jyiyjhihjk(xi,xj)subject to : ∑iyihi=0,hi≥0