Ich lese ein Lehrbuch über den Gaußschen Prozess für maschinelles Lernen von CE Rasmussen und CKI Williams und habe Probleme zu verstehen, was Verteilung über Funktionen bedeutet. In dem Lehrbuch wird ein Beispiel gegeben, dass man sich eine Funktion als einen sehr langen Vektor vorstellen sollte (in der Tat sollte sie unendlich lang sein?). Ich stelle mir also eine Verteilung über Funktionen als eine Wahrscheinlichkeitsverteilung vor, die "über" solchen Vektorwerten gezeichnet ist. Wäre es dann wahrscheinlich, dass eine Funktion diesen bestimmten Wert annimmt? Oder ist es wahrscheinlich, dass eine Funktion einen Wert annimmt, der in einem bestimmten Bereich liegt? Oder ist die Verteilung über Funktionen eine Wahrscheinlichkeit, die einer ganzen Funktion zugeordnet ist?
Zitate aus dem Lehrbuch:
Kapitel 1: Einführung, Seite 2
Ein Gaußscher Prozess ist eine Verallgemeinerung der Gaußschen Wahrscheinlichkeitsverteilung. Während eine Wahrscheinlichkeitsverteilung Zufallsvariablen beschreibt, die Skalare oder Vektoren sind (für multivariate Verteilungen), regelt ein stochastischer Prozess die Eigenschaften von Funktionen. Abgesehen von der mathematischen Raffinesse kann man sich eine Funktion locker als einen sehr langen Vektor vorstellen, wobei jeder Eintrag im Vektor den Funktionswert f (x) an einem bestimmten Eingang x angibt. Es stellt sich heraus, dass diese Idee zwar ein wenig naiv ist, aber überraschend nah dran ist, was wir brauchen. In der Tat hat die Frage, wie wir rechnerisch mit diesen unendlich dimensionalen Objekten umgehen, die angenehmste Auflösung, die man sich vorstellen kann: Wenn Sie nur nach den Eigenschaften der Funktion bei einer endlichen Anzahl von Punkten fragen,
Kapitel 2: Regression, Seite 7
Es gibt verschiedene Möglichkeiten, Regressionsmodelle nach dem Gaußschen Prozess (GP) zu interpretieren. Man kann sich einen Gaußschen Prozess als die Definition einer Verteilung über Funktionen vorstellen und die Folgerung direkt im Raum der Funktionen, der Funktionsraumsicht.
Aus der Ausgangsfrage:
Ich habe dieses konzeptionelle Bild gemacht, um dies für mich selbst zu visualisieren. Ich bin mir nicht sicher, ob eine solche Erklärung, die ich für mich selbst abgegeben habe, richtig ist.
Nach dem Update:
Nach der Antwort von Gijs habe ich das Bild so aktualisiert, dass es konzeptionell ungefähr so aussieht: