Ich habe 12 positive Trainingssätze (Krebszellen, die mit Medikamenten mit jeweils 12 verschiedenen Wirkmechanismen behandelt wurden). Für jeden dieser positiven Trainingssätze möchte ich eine Support-Vektor-Maschine trainieren, um sie von einem negativen Satz gleicher Größe zu unterscheiden, der aus dem Experiment entnommen wurde. Jeder Satz hat zwischen 1000 und 6000 Zellen, und es gibt 476 Merkmale (Bildmerkmale) jeder Zelle, die jeweils linear auf [0, 1] skaliert sind.
Ich benutze LIBSVM und den Gaußschen RGB-Kernel. Mit der fünffachen Kreuzvalidierung habe ich eine Rastersuche nach log₂ C ∈ [-5, 15] und log₂ ɣ ∈ [-15, 3] durchgeführt. Die Ergebnisse sind wie folgt:
Ich war enttäuscht, dass es keinen einzigen Parametersatz gibt, der für alle 12 Klassifizierungsprobleme eine hohe Genauigkeit bietet. Ich war auch überrascht, dass die Gitter im Allgemeinen keinen hochgenauen Bereich aufweisen, der von niedrigeren Genauigkeiten umgeben ist. Bedeutet dies nur, dass ich den Suchparameterraum erweitern muss, oder ist die Rastersuche ein Hinweis darauf, dass etwas anderes nicht stimmt?