Dies besteht aus zwei Teilen: (a) Auswählen eines Diagramms ( experimentelles Design ), um zu bestimmen, welche Aufsatzpaare die Schüler im Peer-Benotungsprozess bewerten werden, und (b) Einordnen aller Aufsätze basierend auf den Peer-Noten des Schülers zu Bestimmen Sie, welchen Rang der Lehrer haben soll. Ich werde für jede Methode einige vorschlagen.
Grafik auswählen
Problemstellung. Der erste Schritt besteht darin, ein Diagramm zu erstellen. Mit anderen Worten, Sie müssen auswählen, welche Aufsatzpaare den Schülern während der Peer-Grading-Übung gezeigt werden sollen.
Vorgeschlagene Lösung. Für diese Aufgabe schlage ich vor, dass Sie einen Zufallsgraphen generieren , der gleichmäßig zufällig aus der Menge aller 3-regulären (einfachen) Graphen ausgewählt wird.G
d
n
Glücklicherweise sind dafür Algorithmen bekannt. Grundsätzlich machen Sie Folgendes:
3 nn3 n3 n
n
Testen Sie als Nächstes, ob das resultierende Diagramm einfach ist (dh es hat keine Selbstschleifen und keine wiederholten Kanten). Wenn es nicht einfach ist, verwerfen Sie das Diagramm und fahren Sie mit Schritt 1 fort. Wenn es einfach ist, sind Sie fertig. Geben Sie dieses Diagramm aus.
O ( 1 )
Ich habe gesehen, wie dieser Ansatz Bollobas, Bender und Canfield zugeschrieben wurde. Der Ansatz wird auch in Wikipedia kurz zusammengefasst . Sie können auch eine Diskussion in diesem Blog-Beitrag finden .
nnn
Ranking aller Aufsätze
Problemstellung. OK, jetzt haben Sie eine Grafik und haben diese Aufsatzpaare (wie durch die Kanten in der Grafik angegeben) den Schülern präsentiert, damit sie während der Peer-Grading-Übung benoten können. Sie haben die Ergebnisse jedes Aufsatzvergleichs. Jetzt besteht Ihre Aufgabe darin, eine lineare Rangfolge für alle Aufsätze abzuleiten, um festzustellen, welche vom Lehrer bewertet werden sollen.
Lösung. Ich schlug vor, dass Sie das Bradley-Terry-Modell verwenden . Es ist ein mathematischer Ansatz, der genau dieses Problem löst. Es wurde für die Rangfolge von Spielern in bestimmten Sportarten entwickelt, basierend auf den Ergebnissen von Spielen zwischen einigen Spielerpaaren. Es wird davon ausgegangen, dass jeder Spieler eine (unbekannte) Stärke hat, die als reelle Zahl quantifiziert werden kann, und die Wahrscheinlichkeit, dass Alice Bob schlägt, wird durch eine glatte Funktion der Differenz ihrer Stärken bestimmt. In Anbetracht der paarweisen Gewinn- / Verlust-Rekorde wird dann die Stärke jedes Spielers geschätzt.
Dies sollte perfekt für Sie sein. Sie können jeden Aufsatz als Spieler behandeln. Jeder Vergleich zwischen zwei Aufsätzen (während des Peer-Grading-Prozesses) ist wie das Ergebnis einer Übereinstimmung zwischen ihnen. Mit dem Bradley-Terry-Modell können Sie all diese Daten erfassen und für jeden Aufsatz eine Stärke ableiten , wobei höhere Stärken besseren Aufsätzen entsprechen. Jetzt können Sie diese Stärken nutzen, um alle Aufsätze nach Rang zu ordnen.
ij
Es gibt alternative Möglichkeiten, um Bewertungen oder Rankings für alle Aufsätze abzuleiten, wenn Sie über die Daten verfügen. Zum Beispiel ist die Elo-Methode eine andere. Ich fasse einige davon in meiner Antwort auf eine andere Frage zusammen . Lesen Sie diese Antwort für weitere Details.
Ein weiterer Kommentar: Das Bradley-Terry-Modell geht davon aus, dass das Ergebnis jedes Vergleichs zwischen zwei Spielern ein Gewinn oder ein Verlust ist (dh ein binäres Ergebnis). Es hört sich jedoch so an, als hätten Sie tatsächlich detailliertere Daten: Ihr Schieberegler gibt eine grobe Schätzung darüber, wie viel besser der Peer-Grader einen Aufsatz als einen anderen bewertet hat. Der einfachste Ansatz wäre, einfach jeden Schieberegler einem binären Ergebnis zuzuordnen. Wenn Sie jedoch wirklich möchten, können Sie möglicherweise alle Daten mithilfe einer komplexeren Analyse verwenden. Das Bradley-Terry-Modell beinhaltet eine logistische Regression. Wenn Sie dies verallgemeinern, um geordnetes Logit zu verwenden , können Sie die zusätzlichen Informationen, die Sie von jedem Schieberegler erhalten, nutzen, da die Ergebnisse der Schieberegler nicht binär sind, sondern eine von mehreren Möglichkeiten darstellen.
Effizienter Einsatz des Lehrers
Sie schlagen vor, dass der Lehrer die oberen X% und unteren X% aller Aufsätze manuell bewertet (unter Verwendung der Rangfolge, die aus den Ergebnissen der Peer-Bewertung abgeleitet wurde). Dies könnte funktionieren, aber ich vermute, dass dies nicht die effizienteste Nutzung der begrenzten Zeit des Lehrers ist. Stattdessen möchte ich einen alternativen Ansatz vorschlagen.
Ich schlage vor, dass der Lehrer eine Teilmenge der Aufsätze benotet, wobei die Teilmenge sorgfältig ausgewählt wird, um die bestmögliche Kalibrierung für alle Aufsätze zu erzielen, die nicht vom Lehrer bewertet wurden. Ich denke, es könnte hilfreich sein, wenn Sie eine Auswahl von Aufsätzen auswählen, die den Bereich möglicher Antworten abdecken (für jeden Aufsatz gibt es einen von Lehrern bewerteten Aufsatz, der nicht zu weit davon entfernt ist). Dafür kann ich mir zwei Ansätze vorstellen, die Sie ausprobieren könnten:
nkkk
kd(ei,ej)eiejSd(e,S)=mine′∈Sd(e,e′)eSke1,e2,…,ekei+1d(e,{e1,e2,…,ei})ee∉{e1,e2,…,ei}kkk
Ich vermute, dass einer dieser Ansätze genauere Ergebnisse liefert, als wenn der Lehrer die oberen X% und unteren X% der Aufsätze bewertet - da die allerbesten und schlechtesten Aufsätze wahrscheinlich nicht repräsentativ für die Masse der Aufsätze in der Mitte sind.
d(e1,e2)=(s(e1)−s(e2))2s(e)ewie vom Terry-Bradley-Modell basierend auf den Ergebnissen der Peer-Bewertung geschätzt. Sie können jedoch etwas Anspruchsvolleres tun. Zum Beispiel könnten Sie den normalisierten Levenshtein-Bearbeitungsabstand zwischen Aufsatz berechnene1e2k