Welche allgemeinen Methoden des maschinellen Lernens gibt es, die versuchen, eine glatte multivariate Funktion zu "lernen" oder zu interpolieren, und die tatsächlich die Punkte auswählen können, an denen die Funktion während des Lernprozesses bewertet wird (Exploration)?
Die Idee wäre, dass jede Funktionsbewertung mehr oder weniger kostspielig ist und der Algorithmus lernt, die Regionen des Raums zu erkunden, in denen der Wissensgewinn am größten ist (im Vergleich zu den Kosten für die Bewertung der Funktion). Die Funktion kann in den interessantesten Fällen nicht analytisch sein (z. B. mit Knicken).
Mein Hintergrund ist Physik, und ich bin mir sicher, dass es solche Methoden gibt, aber trotz einiger Suche konnte ich nichts finden, was direkt relevant ist, möglicherweise weil ich nicht die richtigen Begriffe kenne, nach denen ich suchen soll. Ich weiß nur, dass "Verstärkungslernen" im weiteren Sinne der Bereich der KI ist, der sich mit Erforschung und Belohnungen befasst. Vielleicht stellen die Methoden, nach denen ich frage, einen besonderen Fall dar.
Zur Verdeutlichung hier ein Beispiel: Möglicherweise möchten Sie das Phasendiagramm einer Substanz erhalten, dh die Dichte als Funktion des Drucks p und der Temperatur T. Wir haben es also mit einer (meistens) glatten Funktion zweier Variablen zu tun (p, T). Die Auswertung an einem bestimmten Punkt (p, T) erfordert eine teure Monte-Carlo-Simulation (viel CPU-Zeit; wie viel davon abhängt, wo Sie sich im p, T-Raum befinden). Der ideale Algorithmus würde mit Bedacht Punkte (p, T) auswählen, an denen die Dichte bewertet werden soll, und versuchen, zu Regionen zu gelangen, in denen die Funktion die hervorstechendsten Merkmale aufweist (z. B. Phasenübergangslinien, dh Nichtanalytiken). Wenn Sie anschließend den Algorithmus an einem anderen Punkt (p, T) nach der Dichte fragen, bietet er die bestmögliche Interpolation / Extrapolation, die er angesichts aller Informationen, die er während seiner Erkundungsphase erhalten hat, erzielen kann.