Benötigen Sie immer weniger EXTRA richtige Antworten, um in standardisierten Prüfungen eine Bewertungskurve zu erreichen?


7

Eine Bewertungskurve des Vorjahres für eine Prüfung, an der ich teilnehmen werde, lautet: Geben Sie hier die Bildbeschreibung ein

Angenommen, die Prüfung enthält 100 (oder eine beliebige Anzahl) Fragen, die jeweils gleich gewichtet sind. Werden weniger zusätzliche richtige Antworten benötigt, um die Perzentile zu erhöhen, wenn Sie sich vom Durchschnitt entfernen?

Brauche ich beispielsweise weniger zusätzliche richtige Antworten, um vom 60. zum 70. Perzentil zu wechseln, als vom 45. zum 55. Perzentil? Und wenn ja, warum?

Mein Grund zu der Annahme, dass dies der Fall ist, liegt in einer anderen Kurve, die ich aus einer ähnlich markierten Prüfung habe:

Geben Sie hier die Bildbeschreibung ein

Dieses Diagramm zeigt keine Perzentile, aber wenn man es betrachtet, scheint es weniger zusätzliche Markierungen zu erfordern, um die Perzentile zu erhöhen (oder zu senken), wenn man sich vom Durchschnitt entfernt. Hinweis: 1 Stern steht für 4 Schüler. Die Zahlen auf der linken Seite geben an, wie viele Rohfragen richtig sind. *

Ich kann mir jedoch keinen formalen Grund dafür ausdenken (meine statistischen Kenntnisse sind begrenzt).

Oder ist es so, dass 1 zusätzliche Markierung in der Prüfung mich die Perzentilkurve um den gleichen Betrag nach oben bewegen würde, unabhängig davon, wo auf der Kurve ich ursprünglich sitze?

Zu Ihrer Information: Diese Prüfung gibt uns kein AB oder C, je nachdem, wie viel Prozent von 100 wir bekommen. Es ordnet einfach die Schüler ein, so dass das 100. Perzentil (oder 99,99: das hat mich immer verwirrt) der beste Schüler sein wird, selbst wenn sie nur 50% der Antworten richtig verstanden haben.


Wenn Sie sich fragen, warum ich das wissen möchte. Meine Prüfung besteht aus mehreren Abschnitten und wir erhalten für jeden Abschnitt eine Perzentilbewertung. Die Gesamtpunktzahl ist dann der Durchschnitt jedes Abschnitts. Abhängig von der Antwort auf meine Frage wird also bestimmt, ob ich für alle Abschnitte der Prüfung gleichmäßig lerne (und beispielsweise den 55., 55., 55. anstrebe) oder mein Studium zugunsten meiner stärksten Fächer verzerre, um diese Note zu erreichen. " schnell "(und streben Sie beispielsweise den 45., 45., 80. an) die Perzentilkurve hinauf.


Könnte mich bitte auch jemand wissen lassen, ob dies eine bessere Frage für den Austausch von Mathematikstapeln gewesen wäre? Ich habe das normale Verteilungs-Tag sowohl auf dieser als auch auf dieser Site gefunden.
K-Feldspat

1
Um die Form der Perzentilkurve zu verstehen, können Sie modellieren, ob Sie als unabhängige Bernoulli-Studie eine Frage richtig gestellt haben . Wenn die Wahrscheinlichkeit, jede Frage richtig zu beantworten, gleich wäre, würde die Gesamtpunktzahl einer Person der Binomialverteilung folgen (die durch die Normalverteilung angenähert werden kann).
Matthew Gunn

Danke für die Antwort. Ich habe diese Links durchgelesen, aber die Antwort ist mir immer noch nicht klar (ich konnte nicht herausfinden, wie ich den Bernoulli-Prozess durchführen soll). Ich habe jedoch diese 7sage.com/lsat-score-percentile-conversion gefunden, die Rohnoten gegenüber Perzentil für eine andere Prüfung anzeigt . Daraus ergibt sich das Gegenteil von dem, was ich für wahr hielt. Es zeigt, dass Sie beim Übergang von 90 auf 100 richtige Fragen um 2% (wie bei 2 Perzentilen), beim Übergang von 60 auf 70 richtige Fragen um 22% (wie bei 22 Perzentilen) steigen.
K-Feldspat

Auf dieser Grundlage würde ich zu dem Schluss kommen, dass es zunehmend schwierig ist, die Perzentile nach oben zu verschieben, und dass immer korrektere Antworten erforderlich sind, um die Perzentile nach oben zu verschieben, wenn Sie sich vom Durchschnitt entfernen (dies scheint jedoch im Widerspruch zu dem zweiten Diagramm zu stehen, das ich veröffentlicht habe, wenn ich es richtig interpretiert habe ).
K-Feldspat

1
Ich habe meinen letzten Kommentar gelöscht, weil ich ein kompletter Bonehead war (es war völlig falsch). Wenn Sie sich die Perzentilkurve ansehen, ist die Steigung in der Mitte am höchsten. Wenn Sie von 37 nach 39 nach rechts oder von 73 nach 75 nach rechts gehen, wirkt sich dies weniger auf Ihr Perzentil aus als nach 57 nach 59 nach rechts. Eine zusätzliche Frage richtig zu stellen, hat den größten Wert in Abschnitten, in denen Sie durchschnittlich sind.
Matthew Gunn

Antworten:


4

Ein gewisses Verständnis des Warum kann aus einem einfachen, aber realistischen Modell gewonnen werden.

Die in der Frage gezeigte Kurve stimmt mit einem 46-Fragen-Test überein, zu dem jede Frage beiträgt 100/462zur Gesamtpunktzahl bei richtiger Beantwortung und sonst nichts. Es ist "konsistent" in dem Sinne, dass die Verteilung der Punktzahlen sehr nahe an dem liegt, was erhalten würde, wenn jeder Schüler jede Frage unabhängig mit a erraten würde54.5% Chance auf Richtigkeit und 10054.5=45.5% Chance, falsch zu sein.

Berücksichtigen Sie einige Umstände gegen Ende der Testdurchführung. Sie haben alle Fragen beantwortet; Sie kennen Ihre Punktzahl nicht; Aber Sie denken darüber nach, einige Antworten zu ändern.

  1. Angenommen, Ihre Punktzahl (ohne Ihr Wissen) liegt in der Mitte und ist gleich 54.5. Dies entspricht einer Rohpunktzahl von54.5%×46=25und zeigt an, dass du hast 25 Fragen richtig und 4625=21falsch. Wenn Sie eine Frage zufällig auswählen und ändern würden, gäbe es eine25/46=54.5% Zufall ist es richtig - und Sie würden Ihre Antwort in eine falsche verwandeln - und nur eine 45.5%wahrscheinlich ist es falsch und du würdest es in ein richtiges verwandeln. Daher ist es etwas schwieriger, die Punktzahl zu erhöhen, als sie zu verringern.

  2. Angenommen, Ihre Punktzahl ist tatsächlich hoch und gleich 65: das ist, 30 richtig und 16falsche Antworten. Jetzt geht es nur noch darum, zufällig auf eine der falschen Fragen zu landen und diese zu ändern - wodurch sich Ihre Punktzahl verbessert1/3. Es ist doppelt so schwer, diesen Highscore zu erhöhen als zu verringern.

  3. Umgekehrt ist es mit einer ähnlichen Analyse einfacher, eine niedrige Punktzahl zu verbessern, indem eine der Antworten zufällig geändert wird.

Allgemeiner - und Sie finden, dass dies ein ansprechenderes Modell ist als eines, das allein auf Glück zu beruhen scheint - sollten Sie jeden Test in Betracht ziehen, bei dem Ihre Punktzahl erwartet wird 100p%der Summe basierend auf Ihrem zugrunde liegenden Wissen. Um Ihr erwartetes Testergebnis von zu verbessern100p zu 100(p+x)% - das heißt, eine Zunahme von 100x Punkte - Sie müssten Ihre Leistung auf dem behalten 100p% der Antworten, die Sie richtig verstanden haben, als Sie genug gelernt haben, um sie hinzuzufügen 100x weist aus dem 100(1p)Punkte verloren bei den falschen Antworten. Diese relative Verbesserung Ihres Wissens kann auf zwei Arten ausgedrückt werden:

  1. Sie haben den Anteil reduziert 1p von falschen Antworten auf 1px, eine Änderung von x/(1p);; und

  2. Sie haben den Anteil erhöht p von richtigen Antworten auf p+x, eine Änderung von +x/p.

Das Verhältnis von diesen (bis zum Vorzeichen), nämlich

xpx(1p)=p1p

ist die Wahrscheinlichkeit vonp. In ausgewogener Weise - indem berücksichtigt wird, dass sowohl weniger falsche als auch mehr richtige Antworten erforderlich sind - wird gemessen, wie schwierig es ist, eine geringfügige Erhöhung vorzunehmen100x beginnend mit einer Punktzahl von 100p. Wie100p wächst in Richtung 100 Punkte, die schwindende Größe des Nenners 1pzeigt, wie es zunehmend schwieriger wird, eine bereits hohe Punktzahl zu verbessern. Grob steigt von90% zu 95% zu 97%sind ebenso schwierig. (Dies sind Quoten von ungefähr9, 19, und 32, beziehungsweise.)

Beachten Sie auch, dass es weitaus wahrscheinlicher ist, dass Ihre Punktzahl aufgrund kleiner Fehler bei Fragen sinkt, als dass sie steigt, wenn Ihre Punktzahl über 50% liegt. Umgekehrt gilt dies für niedrigere Punktzahlen: Vermutungen und zufällige Fehler kommen dem armen Schüler zugute und verletzte den guten Schüler.

In Bezug auf eine Studienstrategie legt diese Analyse nahe, dass Sie den größten Nutzen aus der Untersuchung der Abschnitte ziehen, in denen Sie am schwächsten sind - vorausgesetzt, dass jede Einheit des Studienaufwands in jedem Abschnitt zu derselben relativen Leistungssteigerung führt.


Danke @whuber, das ist sehr interessant. Darf ich fragen, warum Sie 100 / 46≈2 anstelle von 100/50 = 2 gewählt haben, dh einen 46-Fragen-Test anstelle von 50? Welche Bedeutung hat 46?
K-Feldspat
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.