Ich interessiere mich für den Unterschied zwischen einer linearen Regression und einem linearen Modell. Nach meinem Verständnis gehört die lineare Regression zu einer größeren Familie linearer Modelle, aber beide Begriffe werden häufig als Synonyme verwendet. Nun wurde mir vorgeschlagen, eine Regressionsanalyse durch ein lineares Modell zu ersetzen, um die Annahmen zu umgehen, die bei der Durchführung einer linearen Regression erfüllt werden müssen. Wenn Sie Lesevorschläge zum Thema haben, sind diese sehr willkommen.
Ich möchte, dass Sie mir helfen, herauszufinden, ob ich was tue
- ist eine lineare Regression und sollte so behandelt werden
- könnte durch ein "lineares Modell" ersetzt werden
- Meine Methode ist ein Synonym für ein "lineares Modell".
Also, hier ist was ich kurz gemacht habe. Der Zweck der Analyse bestand darin, eine Linie in einem Streudiagramm zu zeichnen. Sowohl die Steigung als auch der Schnittpunkt der Linie mit der x-Achse würden zur Analyse des Datensatzes verwendet. Die Ergebnisvariable war eine Rate (Konzentration pro Zeit) eines chemischen Elements und der Prädiktor war ein Verhältnis von zwei Konzentrationen (also keine Einheit). Ich habe Raten in verschiedenen Umgebungen (Tiefen) gemessen, die in einem Diagramm verglichen werden müssen. Nur eine der Tiefen entspricht nicht den Regressionsannahmen.
- Ich habe die lm-Funktion in R verwendet, um eine lineare Gleichung zu berechnen.
- Ich habe die Residuen des lm-Objekts überprüft.
- Ich fand heraus, dass Residuen weder normal verteilt waren noch gleiche Varianzen hatten.
- Ich nahm an, dass die logarithmische Transformation der Ergebnisvariable (Rate) die Varianz korrigieren würde, aber die Residuen waren immer noch nicht normal verteilt.
- Ich habe mich für eine robuste Methode entschieden, damit die Gleichung weniger von Ausreißern beeinflusst wird, die ich nicht von der Analyse ausschließen kann (Funktion lmrob, Paket robustbase).
- Ich habe die Linie wegen der Protokolltransformation nicht gezeichnet. Es gibt andere Daten im Diagramm, die nicht protokolltransformiert werden müssen, aber mit dem Datensatz vergleichbar bleiben sollten, der Probleme verursacht. Es ist auch nicht möglich, das Diagramm mit einem logarithmischen Maßstab um ein anderes zu erweitern, da das ursprüngliche Diagramm Teil eines bereits recht umfangreichen Mehrfachplotdesigns ist.
Vielleicht sind für meinen Zweck die Regressionsannahmen nicht von Interesse? Im Moment bin ich ziemlich festgefahren, was zu tun ist. Vielen Dank für Ihre Hilfe!