Ich besuche einen Datenanalysekurs und einige meiner tief verwurzelten Ideen werden erschüttert. Die Idee, dass der Fehler (epsilon) sowie jede andere Art von Varianz nur für eine Gruppe (eine Stichprobe oder eine gesamte Population) gilt (so dachte ich). Jetzt wird uns beigebracht, dass eine der Regressionsannahmen darin besteht, dass die Varianz "für alle Individuen gleich" ist. Das ist irgendwie schockierend für mich. Ich dachte immer, dass es die Varianz in Y über alle Werte von X war, die als konstant angenommen wurde.
Ich habe mich mit dem Professor unterhalten, der mir sagte, dass wir bei einer Regression davon ausgehen, dass unser Modell wahr ist. Und ich denke, das ist der schwierige Teil. Für mich bedeutete der Fehlerbegriff (epsilon) immer so etwas wie "alle Elemente, die wir nicht kennen und die unsere Ergebnisvariable beeinflussen könnten, plus einige Messfehler". In der Art und Weise, wie die Klasse unterrichtet wird, gibt es kein "anderes Zeug"; Unser Modell wird als wahr und vollständig angenommen. Dies bedeutet, dass alle verbleibenden Abweichungen als Produkt eines Messfehlers betrachtet werden müssen (daher wird erwartet, dass eine 20-malige Messung einer Person dieselbe Varianz ergibt wie eine einmalige Messung von 20 Personen).
Ich habe das Gefühl, dass irgendwo etwas nicht stimmt. Ich hätte gerne eine Expertenmeinung dazu ... Gibt es konzeptionell einen Interpretationsspielraum für den Fehlerbegriff?