Vor ein paar Monaten habe ich bei dieser Organisation ein Praktikum gemacht. und als weggeschenk beschloss ich, meine letzte woche mit meiner freizeit zu verbringen, um die faktoren zu untersuchen, die die lehrergehälter beeinflussen. Ein Problem, auf das ich bei den Lehrergehältern stieß, war, dass die Verteilung für den gegebenen Staat verzerrt war. Ich hatte viele Beobachtungen, die am unteren Ende des Lohnspektrums lagen. Ich habe versucht, dieses Problem zu lösen, indem ich einen Vergleichslohnindex in meine abhängige Variable (Lehrerlohn) aufgenommen habe, aber die Ergebnisse, die ich gefunden habe, waren für den Umfang meines Projekts völlig veraltet. Ich entschied mich stattdessen, meine abhängige Variable zu protokollieren. Das war schön, denn jetzt hatte mein Lohn eine normale Verteilung und es sah im Histogramm einfach perfekt aus. Als ich anfing, Tests durchzuführen, kam ich an den Punkt, an dem ich eine letzte unabhängige Variable, die Grundsteuererklärung, hatte. Das Problem mit meinen normativen Löhnen zeigte sich auch in meinen Beobachtungen zur Grundsteuererklärung. Ich hatte eine enorme Verschiebung der Zahlen der Grundsteuererklärung zum unteren Ende des Spektrums. Also habe ich diese Variable ebenfalls protokolliert und sie hat den Nullhypothesentest trotzdem bestanden.
Ich bin nicht sicher, ob dies genau richtig ist, aber durch den Vergleich der Änderung einer protokollierten Variablen mit einer anderen protokollierten Variablen erhielt ich die Elastizität. Unter der Annahme, dass dies korrekt ist, zeigt meine Regressionsgleichung (so etwas wie LogWages = B0 + B1 (LogPropertyTaxReturns)) die Elastizität zwischen den beiden Variablen. Ist das aber sinnvoll? Wenn mein Ziel darin bestand, herauszufinden, welche Variable die am meisten betroffenen Lehrergehälter in einem bestimmten Landkreis meines Bundesstaates aufweist, ist es dann hilfreich, die Elastizität zwischen den beiden Variablen zu zeigen? Wir wollen die Landkreise mit den niedrigsten Lehrergehältern erhöhen, um ihren Lebensstandard zu erhöhen, aber ich befürchte, dass ich so weit entfernt von den tatsächlichen Beobachtungen extrapoliert habe, dass meine abschließende Regressionsgleichung bedeutungslos ist.
Bearbeiten: Eine meiner größeren Befürchtungen ist, dass ich ein nichtlineares Modell hätte verwenden sollen, um die Beziehung zu zeigen. Ich bin der Meinung, dass es in gewisser Weise irreführend ist, sowohl die abhängige als auch die unabhängige Variable zu zwingen, bei dieser linearen Regression zusammenzuarbeiten.