Übereinstimmung ist der Grad, in dem zwei Bewerter, Instrumente usw. denselben Wert angeben, wenn sie auf dasselbe Objekt angewendet werden. Für diese Aufgabe wurden spezielle statistische Methoden entwickelt.
Wenn Sie in letzter Zeit die Community-Bulletins gelesen haben, haben Sie wahrscheinlich The Hunting of the Snark gesehen, einen Beitrag auf dem offiziellen StackExchange-Blog von Joel Spolsky, dem CEO des StackExchange-Netzwerks. Er diskutiert eine statistische Analyse, die an einer Stichprobe von SE-Kommentaren durchgeführt wurde, um deren "Freundlichkeit" aus der Perspektive …
Welche Zuverlässigkeitsmethoden zwischen Bewertern eignen sich am besten für Ordnungs- oder Intervalldaten? Ich glaube, dass "Joint Probability of Agreement" oder "Kappa" für Nenndaten ausgelegt sind. Während "Pearson" und "Spearman" verwendet werden können, werden sie hauptsächlich für zwei Bewerter verwendet (obwohl sie für mehr als zwei Bewerter verwendet werden können). Welche …
Rund 600 Studierende haben eine Punktzahl für ein umfangreiches Assessment, bei dem von einer guten Zuverlässigkeit / Validität ausgegangen werden kann. Die Bewertung wird mit 100 Punkten bewertet, und es handelt sich um einen vom Computer bewerteten Multiple-Choice-Test. Diese 600 Schüler haben auch Punkte für eine zweite, kleinere Bewertung. In …
Ich habe mehrere unabhängige Programmierer, die versuchen, Ereignisse in einer Zeitreihe zu identifizieren. In diesem Fall sehen sie sich ein Video von Gesprächen von Angesicht zu Angesicht an, suchen nach bestimmten nonverbalen Verhaltensweisen (z. B. Kopfnicken) und codieren die Zeit und die Kategorie der einzelnen Ereignisse Veranstaltung. Diese Daten könnten …
12 Lehrer unterrichten 600 Schüler. Die 12 von diesen Lehrern unterrichteten Kohorten haben eine Größe von 40 bis 90 Schülern, und wir erwarten systematische Unterschiede zwischen den Kohorten, da Doktoranden überproportional bestimmten Kohorten zugeordnet wurden. Frühere Erfahrungen haben gezeigt, dass die Absolventen im Durchschnitt erheblich höher sind als die Studenten. …
Wikipedia schlägt vor, dass eine Möglichkeit, die Zuverlässigkeit zwischen Bewertern zu untersuchen, darin besteht, ein Zufallseffektmodell zur Berechnung der Korrelation zwischen Klassen zu verwenden . Das Beispiel der Intraclass-Korrelation spricht vom Betrachten σ2ασ2α+σ2ϵσα2σα2+σϵ2\frac{\sigma_\alpha^2}{\sigma_\alpha^2+\sigma_\epsilon^2} von einem Modell Yij=μ+αi+ϵijYij=μ+αi+ϵijY_{ij} = \mu + \alpha_i + \epsilon_{ij} "wobei Y ij die j- te Beobachtung …
Der Matthews-Korrelationskoeffizient ( MCCMCC\textrm{MCC} ) ist eine Messung zur Messung der Qualität einer binären Klassifikation ([Wikipedia] [1]). MCCMCC\textrm{MCC} Formulierung wird für die binäre Klassifizierung unter Verwendung von wahr-positiven ( T.P.TPTP ), falsch positiven ( F.P.FPFP ), falsch negativen ( F.N.FNFN ) und wahr-negativen ( T.N.TNTN ) Werten angegeben, wie nachstehend …
Ich habe die großartigen Kommentare zum Umgang mit fehlenden Werten vor dem Anwenden von SVD gelesen, möchte aber anhand eines einfachen Beispiels wissen, wie dies funktioniert: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Wenn ich in der …
Die Teilnehmer wurden zweimal bewertet, wobei die 2 Bewertungen durch 3 Jahre getrennt waren. Bei den meisten Teilnehmern wurden die Bewertungen von verschiedenen Bewertern vorgenommen, bei einigen (<10%) führte derselbe Bewerter beide Bewertungen durch. Insgesamt gab es 8 Bewerter, von denen 2 zu beiden Zeitpunkten Bewertungen abgaben. Da die Bewertungen …
Ich habe einen Datensatz von mehr als 11.000 verschiedenen Elementen, von denen jedes von mindestens 3 verschiedenen Bewertern auf Amazon Mechanical Turk auf einer nominalen Skala klassifiziert wurde . 88 verschiedene Bewerter gaben Urteile für die Aufgabe ab, und kein Bewerter vervollständigte mehr als 800 Urteile. Die meisten lieferten deutlich …
Hintergrund: Acht Ärzte bewerteten jeweils die gleichen 54 Patienten anhand einer Überzeugungsmaßnahme (1-7 Likert-Skala). Die mittlere Punktzahl für das Überzeugungsmaß wird schließlich das Ergebnismaß meines Experiments sein. Die Interrater-Zuverlässigkeit wurde als Intraclass-Korrelationskoeffizient (ICC) unter Verwendung des Zwei-Wege-Zufallseffektmodells mit Konsistenz quantifiziert. Leider war die Interrater-Zuverlässigkeit der acht Ärzte gering (ICC = …
Ich finde, dass Bland-Altman-Diagramme zum Vergleich zweier Methoden bei der Beurteilung der Übereinstimmung äußerst nützlich sind. Ich bin jedoch gespannt, ob es eine ähnliche Methode oder Transformation gibt, die verwendet werden kann, wenn die Skalen der beiden Methoden nicht identisch sind, aber dennoch dasselbe zugrunde liegende Phänomen messen. Zum Beispiel …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.