Ich versuche, die Hyperparameter des von mir implementierten Gaußschen Prozessregressionsalgorithmus abzustimmen. Ich möchte einfach die logarithmische Grenzwahrscheinlichkeit maximieren, die durch die Formel wobeiKdie Kovarianzmatrix mit den ElementenKij=k(xi,xj)=b-1exp(- ist
Die partielle Ableitung der logarithmischen Grenzwahrscheinlichkeit für die Parameter ist durch das folgende
. Dies bedeutet, wenn ein gradientenbasierter Optimierer verwendet wird, erfordert die Auswertung des Gradienten an einem bestimmten Punkt (Parameterwert) eine Neuberechnung der Kovarianzmatrix. In meiner Anwendung ist dies nicht möglich, da die Berechnung der Kovarianzmatrix von Grund auf und die Berechnung ihrer Inversen bei jeder Iteration des Gradientenaufstiegs zu teuer ist. Meine Frage ist, welche Möglichkeiten ich habe, um eine ziemlich gute Kombination dieser drei Parameter zu finden. und ich weiß auch nicht, welchen Parameter ich zuerst optimieren soll, und ich würde mich auch über Hinweise zu diesem Thema freuen.