Antworten:
Ich würde die folgende theoretische Anleitung vorschlagen. Wenn Sie den Gaußschen RBF-Kernel verwenden, basiert Ihre Trennfläche auf einer Kombination von glockenförmigen Flächen, die an jedem Stützvektor zentriert sind. Die Breite jeder glockenförmigen Oberfläche ist umgekehrt proportional zu . Wenn diese Breite kleiner als der minimale paarweise Abstand für Ihre Daten ist, liegt im Wesentlichen eine Überanpassung vor. Wenn diese Breite größer ist als der maximale paarweise Abstand für Ihre Daten, fallen alle Ihre Punkte in eine Klasse und Sie haben auch keine gute Leistung. Die optimale Breite sollte also irgendwo zwischen diesen beiden Extremen liegen.
Nein, es ist im Wesentlichen datenabhängig. Die Rastersuche (über logarithmisch transformierte Hyperparameter) ist eine sehr gute Methode, wenn Sie nur eine kleine Anzahl von Hyperparametern einstellen müssen, die Rasterauflösung jedoch nicht zu fein einstellen oder die Abstimmung wahrscheinlich zu stark anpassen Kriterium. Bei Problemen mit einer größeren Anzahl von Kernelparametern finde ich, dass die Nelder-Mead-Simplex-Methode gut funktioniert.
pair-wise distance for your data
= einfacher euklidischer Abstand nach der Skalierung?