Ich versuche zu verstehen, wie die adjungierte Optimierungsmethode für eine PDE-beschränkte Optimierung funktioniert. Insbesondere versuche ich zu verstehen, warum die adjungierte Methode bei Problemen effizienter ist, bei denen die Anzahl der Entwurfsvariablen groß ist, die "Anzahl der Gleichungen jedoch klein".
Was ich verstehe:
Betrachten Sie das folgende Optimierungsproblem mit eingeschränkter PDE:
wobei eine (ausreichend kontinuierliche) Zielfunktion einer Vektorentwurfsvariablen und eines Vektors von Feldvariablen unbekannt die von den Entwurfsvariablen abhängen, und die Restform der PDE ist.
Klar, wir können die ersten Variationen von I und R als
Durch Einführung eines Vektors von Lagrange-Multiplikatoren kann die Variation der Zielfunktion wie folgt geschrieben werden
Wenn wir Begriffe neu ordnen, können wir schreiben:
Wenn wir also in der Lage sind, nach zu lösen, so dass
Dann wird der Gradient ausgewertet nur in Bezug auf die Designvariablen .
Somit würde ein adjungierter Optimierungsalgorithmus die folgenden Schritte durchlaufen:
- Angesichts der aktuellen Designvariablen
- Löse nach den Feldvariablen (aus der PDE)
- Löse nach den Lagrange-Multiplikatoren (aus der nebenstehenden Gleichung)
- Berechnen Sie die Farbverläufe
- Designvariablen
Meine Frage
Wie verbessert dieser zusätzliche Trick die Kosten für die Optimierung pro Iteration, wenn die Anzahl der Entwurfsvariablen groß ist? Ich habe gehört, dass die Kosten für die Gradientenbewertung für die adjungierte Methode "unabhängig" von der Anzahl der Entwurfsvariablen sind. Aber wie genau ist das wahr?
Ich bin sicher, es gibt etwas sehr Offensichtliches, das ich irgendwie übersehen habe.