Mehrere Kernel-Lernmethoden zielen darauf ab, ein Kernelmodell zu erstellen, bei dem der Kernel eine lineare Kombination von Kerneln mit fester Basis ist. Das Erlernen des Kernels besteht dann darin, die Gewichtungskoeffizienten für jeden Basiskern zu lernen, anstatt die Kernelparameter eines einzelnen Kernels zu optimieren.
Die Nachteile des Lernens mehrerer Kernel scheinen darin zu liegen, dass sie weniger interpretierbar und rechenintensiv sind (um die Modellausgabe zu bewerten, müssen Sie alle Basiskerne bewerten). Wenn also eine ähnliche Leistung durch einfaches Optimieren eines einzelnen Kernels erzielt werden kann, welche Vorteile bietet MKL?