Meine Situation ist:
Ich habe 1 kontinuierliche abhängige und 1 kontinuierliche Prädiktorvariable, die ich logarithmisch transformiert habe, um ihre Residuen für eine einfache lineare Regression zu normalisieren.
Ich würde mich über jede Hilfe freuen, wie ich diese transformierten Variablen mit ihrem ursprünglichen Kontext in Beziehung setzen kann.
Ich möchte eine lineare Regression verwenden, um die Anzahl der Tage, an denen Schüler 2011 die Schule verpasst haben, basierend auf der Anzahl der Tage, die sie 2010 verpasst haben, vorherzusagen. Die meisten Schüler verpassen 0 Tage oder nur wenige Tage. Die Daten sind positiv nach links verschoben. Daher besteht ein Transformationsbedarf, um eine lineare Regression zu verwenden.
Ich habe log10 (var + 1) für beide Variablen verwendet (ich habe +1 für Schüler verwendet, die 0 Schultage verpasst hatten). Ich verwende Regression, weil ich kategoriale Faktoren hinzufügen möchte - Geschlecht / ethnische Zugehörigkeit usw.
Mein Problem ist:
Das Publikum, dem ich eine Rückmeldung geben möchte, würde log10 (y) = log (Konstante) + log (var2) x nicht verstehen (und ehrlich gesagt auch nicht ich).
Meine Fragen sind:
a) Gibt es bessere Möglichkeiten, transformierte Variablen in der Regression zu interpretieren? Dh für immer 1 Tag im Jahr 2010 verpasst werden sie 2 Tage im Jahr 2011 verpassen, im Gegensatz zu für immer 1 Log-Einheit-Änderung im Jahr 2010 wird es x Log-Einheiten-Änderung im Jahr 2011 geben?
b) Insbesondere unter Berücksichtigung der zitierten Passage aus dieser Quelle wie folgt:
"Dies ist die negative binomiale Regressionsschätzung für eine Erhöhung des mathematisch standardisierten Testergebnisses um eine Einheit, da die anderen Variablen im Modell konstant gehalten werden. Wenn ein Schüler sein Mathnce-Testergebnis um einen Punkt erhöht, beträgt die Differenz in den Protokollen von Es wird erwartet, dass die erwarteten Zählungen um 0,0016 Einheiten abnehmen, während die anderen Variablen im Modell konstant bleiben. "
Ich würde gerne wissen:
- Sagt diese Passage, dass für jede Einheit eine Erhöhung der Punktzahl der
UNTRANSFORMED
variablen Mathematik zu einer Abnahme der Konstante (a) um 0,0016 führt. Wenn also dieUNTRANSFORMED
Punktzahl der Mathematik um zwei Punkte steigt, subtrahiere ich 0,0016 * 2 von der Konstante a? - Bedeutet das, dass ich den geometrischen Mittelwert durch Verwendung von Exponential (a)) und Exponential (a + beta * 2) erhalte und dass ich die prozentuale Differenz zwischen diesen beiden berechnen muss, um zu sagen, welchen Effekt die Prädiktorvariable (n) hat auf die abhängige Variable haben?
- Oder habe ich das völlig falsch verstanden?
Ich verwende SPSS v20. Entschuldigen Sie, dass Sie dies in einer langen Frage formuliert haben.
R
hat Pakete für Modelle ohne