Hier ist ein Zusammenhang. Ich möchte herausfinden, wie sich zwei Umgebungsvariablen (Temperatur, Nährstoffgehalt) über einen Zeitraum von 11 Jahren auf den Mittelwert einer Antwortvariablen auswirken. Innerhalb eines Jahres gibt es Daten von über 100.000 Standorten.
Ziel ist es zu bestimmen, ob der Mittelwert der Antwortvariablen über den Zeitraum von 11 Jahren auf Änderungen der Umgebungsvariablen reagiert hat (z. B. wärmere Temperatur + mehr Nährstoffe würden eine größere Antwort bedeuten).
Da es sich bei der Antwort leider um den Mittelwert handelt (ohne den Mittelwert zu betrachten, wird das Signal nur durch regelmäßige Schwankungen zwischen den Jahren übersteuert), beträgt die Regression 11 Datenpunkte (1 Mittelwert pro Jahr) mit 2 erklärenden Variablen. Für mich ist selbst eine lineare positive Regression schwerlich als sinnvoll zu betrachten, da der Datensatz so klein ist (erfüllt nicht einmal die nominalen 40 Punkte / Variable, es sei denn, die Beziehung ist super stark).
Habe ich Recht, diese Annahme zu machen? Kann jemand andere Gedanken / Perspektiven anbieten, die mir fehlen könnten?
PS: Einige Vorbehalte: Es gibt keine Möglichkeit, mehr Daten zu erhalten, ohne weitere Jahre zu warten. Die verfügbaren Daten sind also das, womit wir wirklich arbeiten müssen.