Ich analysiere Daten aus zwei Umfragen, die ich zusammengeführt habe:
Schulpersonalbefragung für die Jahre 2005-06 und 2007-08
Schülerbefragung für die Jahre 2005-06 bis 2008-09
Für beide Datensätze habe ich Beobachtungen (auf Schüler- oder Personalebene) aus 3 verschiedenen Schulbezirken, die jeweils repräsentative Stichproben pro Jahr in ihrem jeweiligen Schulbezirk enthalten.
Zur Analyse habe ich die Studentendaten in zwei Zweijahresperioden (2005-07 und 2007-09) zusammengefasst. Dann habe ich jeden Datensatz "bearbeitet", um Prozentsätze der Mitarbeiter oder Studenten zu erhalten, die auf Fragen nach Grenzwerten geantwortet haben (z. B. ob sie mit "Einverstanden" geantwortet haben oder ob der Student angegeben hat, dass sie Alkohol konsumiert haben). usw.). Wenn ich also die Datensätze auf Personal- und Schülerebene zusammengeführt habe, ist die Schule die Analyseeinheit, und ich habe nur 1 Beobachtung pro Schule pro 2-Jahres-Zeitraum (vorausgesetzt, der Schule fehlten für einen bestimmten Zeitraum keine Daten ).
Mein Ziel ist es, die Assoziationen zwischen den Antworten von Mitarbeitern und Studenten abzuschätzen. Bisher war mein Plan, Pearson-Korrelationskoeffizienten zwischen allen Variablen (da sie alle kontinuierliche Antworten sind, die Prozentsätze darstellen) für jeden Schulbezirk getrennt voneinander zu erhalten (da dies die Annahme der Generalisierbarkeit für die anderen Bezirke in diesem Datensatz beseitigt). . Zu diesem Zweck würde ich die Distriktdaten ohnehin über die zwei Jahre mitteln, um nur eine Beobachtung pro Schule zu erhalten.
Fragen:
- Ist das ein angemessener Analyseplan? Gibt es eine andere Methode, die ich verwenden könnte, um eine bessere Schlussfolgerung oder Leistung zu erzielen?
- Wenn mein Plan angemessen ist, sollte ich gewichtete Korrelationen basierend auf der Einschulung erhalten (da es mehr kleinere als große Schulen gibt, die überproportional zu den Korrelationskoeffizienten beitragen würden)?
Ich habe den Datenadministrator danach gefragt, und er erwähnte, dass die Hauptfaktoren, die die Notwendigkeit der Gewichtung meiner Daten bestimmen, darin bestehen, ob ich denke, dass die Schulgröße den Korrelationsgrad beeinflusst oder nicht, und ob meine Interpretation auf Schüler- oder Schulebene erfolgt. Ich denke, meine Interpretation wird auf Schulebene erfolgen (z. B. "Eine Schule mit diesem Prozentsatz der Mitarbeiter, die auf diese Weise antworten, korreliert mit diesem Prozentsatz der Schüler, die auf diese Weise antworten ...").