12 Lehrer unterrichten 600 Schüler. Die 12 von diesen Lehrern unterrichteten Kohorten haben eine Größe von 40 bis 90 Schülern, und wir erwarten systematische Unterschiede zwischen den Kohorten, da Doktoranden überproportional bestimmten Kohorten zugeordnet wurden. Frühere Erfahrungen haben gezeigt, dass die Absolventen im Durchschnitt erheblich höher sind als die Studenten.
Die Lehrer haben alle Arbeiten in ihrer Kohorte bewertet und ihnen eine Note von 100 zugewiesen.
Jeder Lehrer hat sich auch ein zufällig ausgewähltes Papier von drei anderen Lehrern angesehen und es mit 100 bewertet. Jeder Lehrer hat drei seiner Papiere von einem anderen Lehrer markieren lassen. Auf diese Weise wurden 36 verschiedene Papiere mit einem Kreuz markiert, und ich nenne dies meine Kalibrierungsdaten.
Ich kann auch sehen, wie viele Doktoranden in jeder Kohorte waren.
Meine Fragen sind:
A) Wie kann ich diese Kalibrierungsdaten verwenden, um die Originalmarkierungen anzupassen, um sie fairer zu machen? Insbesondere möchte ich die Auswirkungen übermäßig großzügiger / unanständiger Macher so weit wie möglich auswaschen.
B) Wie angemessen sind meine Kalibrierungsdaten? Ich hatte keine Wahl in den eher begrenzten 36 Datenpunkten der Kalibrierungsdaten, die ich in diesem Kurs erhalten habe, und habe im laufenden Semester keine Möglichkeit mehr zu sammeln. Wenn diese Situation jedoch erneut auftritt, kann ich möglicherweise mehr Kalibrierungsdaten oder verschiedene Arten von Kalibrierungsdaten erfassen.
Diese Frage ist ein Verwandter einer beliebten Frage, die ich gestellt habe: Wie kann ich am besten mit den Auswirkungen von Markern mit unterschiedlichem Maß an Großzügigkeit bei der Bewertung von Studienarbeiten umgehen? . Es ist jedoch ein anderer Kurs und ich bin mir nicht sicher, wie nützlich das Lesen dieser Frage als Hintergrund für diese aktuelle Frage wäre, da das Hauptproblem darin bestand, dass ich keine Kalibrierungsdaten hatte.
lm(score ~ gradStudent + ... + teacherID
es tun.