Ich muss ein kompliziertes Regressionsproblem über die Einheitsplatte lösen. Die ursprüngliche Frage zog einige interessante Kommentare an, aber leider keine Antworten. In der Zwischenzeit habe ich etwas mehr über dieses Problem gelernt, daher werde ich versuchen, das ursprüngliche Problem in Teilprobleme aufzuteilen und zu sehen, ob ich diesmal besseres Glück habe.
Ich habe 40 Temperatursensoren, die regelmäßig in einem schmalen Ring innerhalb der Gerätescheibe angeordnet sind:
Diese Sensoren erfassen die Temperatur rechtzeitig. Da die zeitliche Variation jedoch viel kleiner als die räumliche Variation ist, vereinfachen wir das Problem, indem wir die zeitliche Variabilität ignorieren und davon ausgehen, dass jeder Sensor nur einen zeitlichen Durchschnitt angibt. Dies bedeutet, dass ich 40 Proben habe (eine für jeden Sensor) und keine wiederholten Proben habe.
Ich möchte aus den Sensordaten eine Regressionsfläche erstellen. Die Regression hat zwei Ziele:
- Ich muss ein mittleres radiales Temperaturprofil schätzen . Bei der linearen Regression schätze ich bereits eine Oberfläche, die die mittlere Temperaturoberfläche ist. Daher muss ich meine Oberfläche nur in Bezug auf , oder? Wenn ich Polynome für die Regression verwende, sollte dieser Schritt ein Kinderspiel sein.
- Ich muss ein radiales Temperaturprofil schätzen , so dass an jeder radialen Position .
Welche Technik sollte ich angesichts dieser beiden Ziele für die Regression auf der Einheitsplatte verwenden? Natürlich werden Gaußsche Prozesse häufig für die räumliche Regression verwendet. Die Definition eines guten Kernels für die Einheitsfestplatte ist jedoch nicht trivial. Daher möchte ich die Dinge einfach halten und Polynome verwenden, es sei denn, Sie glauben, dass dies eine verlierende Strategie ist. Ich habe über Zernike-Polynome gelesen . Die Zernike-Polynome scheinen für die Regression über die Einheitsscheibe geeignet zu sein, da sie in periodisch sind .
Sobald das Modell ausgewählt ist, muss ich ein Schätzverfahren auswählen. Da dies ein räumliches Regressionsproblem ist, sollten Fehler an verschiedenen Orten korreliert werden. Gewöhnliche kleinste Quadrate setzen unkorrelierte Fehler voraus, daher denke ich, dass verallgemeinerte kleinste Quadrate besser geeignet wären. GLS scheint eine relativ verbreitete statistische Technik zu sein, da gls
die Standard-R-Verteilung eine Funktion enthält. Ich habe jedoch noch nie GLS verwendet und habe Zweifel. Wie schätze ich beispielsweise die Kovarianzmatrix? Ein ausgearbeitetes Beispiel, auch mit nur wenigen Sensoren, wäre großartig.
PS Ich habe mich für Zernike-Polynome und GLS entschieden, weil es mir logisch erscheint, dies hier zu tun. Ich bin jedoch kein Experte, und wenn Sie das Gefühl haben, dass ich in die falsche Richtung gehe, können Sie einen völlig anderen Ansatz wählen.