Wie kann das Vorhersageintervall eines Gaußschen Prozesses bewertet werden? Ich weiß nicht, wie ich dieses Intervall schätzen soll, obwohl ich ein 95% -Konfidenzintervall für die mittlere Linie finden kann.
Wie kann das Vorhersageintervall eines Gaußschen Prozesses bewertet werden? Ich weiß nicht, wie ich dieses Intervall schätzen soll, obwohl ich ein 95% -Konfidenzintervall für die mittlere Linie finden kann.
Antworten:
Ich werde Ihre Frage im Rahmen von Bayes beantworten. Wenn Sie speziell eine frequentistische Lösung benötigen, können Sie eine erhalten, indem Sie meine Antwort leicht ändern. Ich denke jedoch, dass dies die tatsächliche Unsicherheit unterschätzen wird: Sie würden einen vollständig frequentistischen Ansatz benötigen, aber ich weiß nicht, wie ich das in diesem speziellen Fall tun soll .
Um das Bayesian GPR-Framework (Gaussian Process Regression) kurz zusammenzufassen, nehmen Sie das Modell an
wobei , dh Die latenten Variablen oder Funktionswerte werden als Gaußscher Prozess unter der Bedingung der Hyperparameter , und ist das übliche iid-Gaußsche Rauschen.
Eigentlich ist ein Hyperparameter, also gehört er wirklich zu , aber ich wollte unterstreichen, dass GPR normalerweise eine triviale Kovarianzstruktur für das Rauschen annimmt.
Die posteriore prädiktive Verteilung von an einem neuen Punkt , bedingt durch Daten und auf Hyperparametern ist . Nehmen wir nun an, dass die mittlere Funktion des Gaußschen Prozesses Null ist: Der allgemeine Fall kann ebenfalls behandelt werden, aber versuchen wir, die Dinge einfach zu halten. Dann bekommen wir mit der üblichen GPR-Maschinerie
wo
dh abhängig von beobachteten Daten und Hyperparametern ist die Verteilung der latenten Variablen an einem neuen Punkt immer noch Gaußsch, wobei der Mittelwert und die Standardabweichung oben gezeigt sind.
Wir sind jedoch an der Verteilung einer neuen Beobachtung interessiert , nicht einer neuen latenten Variablen. Dies ist einfach, da in unserem Modell das Rauschen additiv ist, unabhängig von allen anderen Variablen und normalerweise mit dem Mittelwert Null und der Varianz verteilt ist. Daher müssen wir nur die Rauschvarianz addieren:
Beachten Sie, dass ich eine einzelne neue Beobachtung Betracht , sodass die Verteilung nur ein univariater Gaußscher Wert ist und die Varianz tatsächlich eine Varianz und keine a ist Varianz-Kovarianz-Matrix.
Um diesen Ausdruck tatsächlich verwenden zu können, benötigen Sie Werte für die Hyperparameter, die nicht bekannt sind. Hieraus gibt es zwei Möglichkeiten:
In einem vollständig Bayes'schen Ansatz interessieren Sie sich nicht wirklich für , sondern für die prädiktive Verteilung von bei , die durch erhalten wird nach Integration der Hyperparameter:
Hier gibt es zwei Probleme: Bei einer vorherigen Verteilung für die Hyperparameter ist die posteriore Verteilung , die im Integral erscheint, gegeben nicht bekannt, muss aber unter Verwendung des Bayes-Theorems abgeleitet werden, was für die meisten Hyperprioren bedeutet, dass ein MCMC ausgeführt werden muss. Daher haben wir keinen expliziten Ausdruck für , sondern nur Beispiele aus der MCMC. Und selbst wenn wir einen Ausdruck für , wäre es unmöglich , das Integral in geschlossener Form in zu bewerten meiste Fälle. Die Lösung ist eine hierarchische Bayes-Simulation: für jede Probe aus mit dem MCMC erhalten Sie eine Stichprobe aus . Verwenden Sie diese Stichproben , um ein HPD-Intervall für zu schätzen , und schon sind Sie da.
Aus intuitiver Sicht werden bei der zweiten Lösung Stichproben aus einer Verteilung gezogen, bei der die Hyperparameter "nicht festgelegt" sind, aber entsprechend ihrer posterioren Verteilung zufällig variieren dürfen . Somit berücksichtigt das im zweiten Fall erhaltene Vorhersageintervall die Unsicherheit aufgrund unseres Mangels an Wissen über die Hyperparameter.
Wenn Sie sich auf die Bayes'sche Regression mit Gaußscher Wahrscheinlichkeit beziehen, ist die hintere Verteilung eines Gaußschen Prozesses Gauß'sch: wobei die und die Datenwerte sind und und mit Bayes'scher Inferenz berechnet werden: wobei der Kernelvektor zwischen und und mit
Daher ist ein ~ 95% -Konfidenzintervall für einfach .