Hier ist eine überraschend große Auswahl an Antwortkopie-Indizes, wobei ihre Vorzüge jedoch nur wenig diskutiert werden: http://www.bjournal.co.uk/paper/BJASS_01_01_06.pdf .
Es gibt ein Gebiet der (Bildungs-) Psychologie namens Item Response Theory (IRT), das den statistischen Hintergrund für Fragen wie diese liefert. Wenn Sie Amerikaner sind und einen SAT, ACT oder GRE absolviert haben, haben Sie sich mit einem Test befasst, der unter Berücksichtigung von IRT entwickelt wurde. Das Grundpostulat des IRT ist, dass jeder Schüler durch seine Fähigkeit charakterisiert ist ; Jede Frage ist durch ihre Schwierigkeit . und die Wahrscheinlichkeit, eine Frage richtig zu beantworten, ist
wobei das cdf der Standardnormalen ist unda i b j π ( a i , b j ; c ) = P r o b [ Schüler i beantwortet Frage j richtig ] = Φ ( c ( a i - b j ) ) Φ ( z ) c c j iicheinichbj
π( aich, bj;; c ) = P r o b [ Schüler i beantwortet Frage j richtig ] = Φ ( c ( aich- bj) )
Φ ( z)cist ein zusätzlicher Empfindlichkeits- / Unterscheidungsparameter (manchmal wird er gemacht, , wenn genügend Informationen vorhanden sind, dh genügend Testteilnehmer, um die Unterschiede zu identifizieren). Eine versteckte Annahme hier, dass angesichts der Fähigkeit der Schüler Antworten auf verschiedene Fragen unabhängig sind. Diese Annahme wird verletzt, wenn Sie eine Reihe von Fragen zu demselben Textabschnitt haben, aber lassen Sie uns für eine Minute davon abstrahieren.
cjich
Bei "Ja / Nein" -Fragen kann dies das Ende der Geschichte sein. Bei mehr als zwei Kategoriefragen können wir zusätzlich davon ausgehen, dass alle falschen Entscheidungen gleich wahrscheinlich sind. für eine Frage mit Entscheidungen ist die Wahrscheinlichkeit jeder falschen Wahl .k j π ' ( a i , b j ; c ) = [ 1 - π ( a i , b j ; c ) ] / ( k j - 1 )jkjπ′(ai,bj;c)=[1−π(ai,bj;c)]/(kj−1)
Für Studierende der Fähigkeiten und , die Wahrscheinlichkeit , dass sie für eine Frage mit Mühe auf ihre Antworten entsprechen ist
Wenn Sie , können Sie dies in die Wahrscheinlichkeit der Übereinstimmung mit der richtigen Antwort und die Wahrscheinlichkeit der Übereinstimmung mit einer falschen Antwort, , obwohl diese Unterscheidung vom konzeptionellen Rahmen der IRT kaum wesentlich ist.aiakbj
ψ(ai,ak;bj,c)=π(ai,bj;c)π(ak,bj;c)+(k−1)π′(ai,bj;c)π′(ak,bj;c)
ψc(ai,ak;bj,c)=π(ai,bj;c)π(ak,bj;c)ψi(ai,ak;bj,c)=(k−1)π′(ai,bj;c)π′(ak,bj;c)
Jetzt können Sie die Wahrscheinlichkeit einer Übereinstimmung berechnen, aber sie wird wahrscheinlich kombinatorisch winzig sein. Ein besseres Maß kann das Verhältnis der Informationen im paarweisen Antwortmuster
und beziehe es auf die Entropie
Sie können dies für alle Schülerpaare tun, sie zeichnen oder ordnen und das größte Verhältnis von Information zu Entropie untersuchen.
I(i,k)=∑j1{matchj}lnψ(ai,ak;bj,c)+1{non-matchj}ln[1−ψ(ai,ak;bj,c)]
E(i,k)=E[I(i,k)]=∑jψ(ai,ak;bj,c)lnψ(ai,ak;bj,c)+(1−ψ(ai,ak;bj,c))ln[1−ψ(ai,ak;bj,c)]
Die Parameter des Tests und der Schülerfähigkeiten fallen nicht aus dem Himmel, können aber in moderner Software wie R mit leicht geschätzt werden
oder ähnliche Pakete:{ a i }{c,bj,j=1,2,…}{ai}lme4
irt <- glmer( answer ~ 1 + (1|student) + (1|question), family = binomial)
oder etwas sehr nahes daran.