Obwohl ich mich ein wenig verlegen fühle, wenn ich sowohl einem "angesehenen Text" als auch einem anderen Lebenslaufbenutzer widerspreche, scheint es mir, dass die Spearman-Brown-Formel nicht durch Elemente mit unterschiedlichen Schwierigkeitsgraden beeinflusst wird. Natürlich wird die Spearman-Brown-Formel normalerweise unter der Annahme abgeleitet, dass wir parallele Elemente haben, was (unter anderem) impliziert, dass die Elemente die gleichen Schwierigkeiten haben. Es stellt sich jedoch heraus, dass diese Annahme nicht notwendig ist. Es kann gelockert werden, um ungleiche Schwierigkeiten zuzulassen, und die Spearman-Brown-Formel bleibt bestehen. Ich demonstriere dies unten.
Es sei daran erinnert, dass in der klassischen Testtheorie angenommen wird, dass eine Messung die Summe einer "True Score" -Komponente und einer Fehlerkomponente ist,
wobei und korreliert sind. Bei parallelen Elementen wird davon ausgegangen, dass alle Elemente die gleichen wahren Bewertungen aufweisen und sich nur in ihren Fehlerkomponenten unterscheiden, obwohl davon ausgegangen wird, dass diese die gleiche Varianz aufweisen. In Symbolen, für jedes Paar von Elementen undXTE
X=T+E,
TEXX′T=T′var(E)=var(E′).
Lassen Sie uns sehen, was passiert, wenn wir die erste Annahme lockern, sodass sich die Elemente in ihren Schwierigkeiten unterscheiden können, und dann die Zuverlässigkeit einer Gesamttestpunktzahl unter diesen neuen Annahmen ableiten. Nehmen Sie insbesondere an, dass sich die wahren Bewertungen möglicherweise um eine additive Konstante unterscheiden, die Fehler jedoch immer noch dieselbe Varianz aufweisen. In Symbolen ist
Schwierigkeitsunterschiede werden durch die additive Konstante erfasst. Wenn zum Beispiel , sind die Punktzahlen auf tendenziell höher als die Punktzahlen auf , so dass "einfacher" als . Wir könnten diese im
Wesentlichen parallel nennenT=T′+c′var(E)=var(E′).
c′>0XX′XX′Elemente, in Analogie zur Annahme einer "wesentlichen Tau-Äquivalenz", die das Tau-Äquivalent-Modell auf ähnliche Weise entspannt.
Nun soll die Zuverlässigkeit einer Testform solcher Elemente abgeleitet werden. Betrachten Sie einen Test, der aus Wesentlichen parallelen Elementen besteht, deren Summe die Testbewertung ergibt. Die Zuverlässigkeit ist per Definition das Verhältnis der tatsächlichen Bewertungsvarianz zur beobachteten Bewertungsvarianz. Für die Zuverlässigkeit der einzelnen Elemente folgt aus der Definition der wesentlichen Parallelität, dass sie dieselbe Zuverlässigkeit haben, die wir mit mit ist die wahre Score-Varianz und die Fehlervarianz. Für die Zuverlässigkeit der Gesamttestpunktzahl untersuchen wir zunächst die Varianz der Gesamttestpunktzahl
kρ=σ2T/(σ2T+σ2E)σ2Tσ2E Tσ 2 T σ 2 E k 2 σ 2 T.
var(∑i=1kTi+Ei)=var(∑i=1kT+ci+Ei)=k2σ2T+kσ2E,
wobei (nicht tiefgestellt ) jeder beliebiger wahre Wert ist , dass alle wahren Scores , um die Einzelteile können über ihre konstanten Bedingungen zu verschoben werden, ist die wahre Score-Varianz und ist die Fehlervarianz. Beachten Sie, dass die konstanten Terme ausfallen! Das ist der Schlüssel. Dann ist die Zuverlässigkeit der Gesamttestpunktzahl
Tσ2Tσ2Ek2σ2Tk2σ2T+kσ2E=kσ2Tkσ2T+σ2X−σ2T=kρ1+(k−1)ρ,
Das ist nur die klassische Spearman-Brown-Formel, unverändert. Dies zeigt, dass die Spearman-Brown-Formel auch dann gilt, wenn die "Schwierigkeit" der Elemente, definiert als ihre Durchschnittswerte, variiert wird.
@JeremyMiles wirft einige interessante und wichtige Punkte darüber auf, was passieren kann, wenn wir die Testlänge "in der realen Welt" erhöhen, aber zumindest gemäß den idealisierten Annahmen der klassischen Testtheorie spielen Variationen in der Schwierigkeit des Gegenstands keine Rolle für die Zuverlässigkeit von a Testform (im krassen Gegensatz zu den Annahmen der modernen Item-Response-Theorie!). Dieselbe grundlegende Argumentation ist auch der Grund, warum wir normalerweise eher von einer wesentlichen Tau-Äquivalenz als von einer Tau-Äquivalenz sprechen , da die meisten wichtigen Ergebnisse für den milderen Fall gelten, in dem sich die Schwierigkeiten der Gegenstände (dh die Mittelwerte) unterscheiden können.