Warum sollte Netflix von seinem Fünf-Sterne-Bewertungssystem zu einem Like / Dislike-System wechseln?


11

Netflix stützte seine Vorschläge auf die von einem Benutzer eingereichten Bewertungen anderer Filme / Shows. Dieses Bewertungssystem hatte fünf Sterne.

Mit Netflix können Benutzer jetzt Filme / Shows mögen / nicht mögen (Daumen hoch / Daumen runter). Sie behaupten, es sei einfacher, Filme zu bewerten.

Wäre diese 2-Wege-Klassifizierung nicht statistisch weniger aussagekräftig als ein 5-Wege-Klassifizierungssystem? Würde es nicht weniger Variationen erfassen?


1
Ich denke, alle Antworten sollten die eigene Erklärung von Netflix ernst nehmen, einschließlich der Tatsache, dass sie bei A / B-Tests im 2-Wege-System viermal so viele Bewertungen erhalten haben. Das allein ist riesig. Außerdem war das Ergebnis des berühmten Netflix Konkurrenz , dass eine bessere Vorhersage der Bewertungen (was sie von der Konkurrenz bekam) nicht übersetzen in eine bessere Vorhersage von Verhalten . Sie könnten "Pride and Prejudice" als einen besseren Film beurteilen, aber eher "Die Hard" sehen. Netflix kümmert sich wahrscheinlich viel mehr darum, was Sie sehen möchten (oder wollen), als darum, was Sie für einen besseren Film halten.
ctwardy

Antworten:


11

Nach einem Artikel von Preston & Coleman (2000) unterscheidet sich die Zuverlässigkeit von 2 Artikeln nicht wesentlich von der Zuverlässigkeit von 5 Artikeln:

Zuverlässigkeit von Artikelwaagen

Das Thema der Messung war die Zufriedenheit mit Restaurants, aber es lässt sich gut auf die Filmbewertung übertragen. Die Benutzerfreundlichkeit, die Schnelligkeit der Verwendung und die Fähigkeit einer Person, Gefühle auf verschiedenen Skalen auszudrücken, wurden ebenfalls gemessen. Die Ergebnisse sind wie folgt:

Zufriedenheitsmaßnahmen

Es ist klar, dass Benutzer die 2-Artikel-Skala im Vergleich zur 5-Artikel-Skala etwas einfacher und schneller zu verwenden finden, aber auch sehr unzureichend, um die wahren Überzeugungen des Benutzers auszudrücken. Dies weist darauf hin, dass die 2-Punkte-Skala die zugrunde liegende Variabilität nicht sehr gut erfasst und zu einem Verlust der Variabilität führt. Die Diskriminierungsindizes sind für 2 Item-Skalen im Vergleich zu 5 Item-Skalen ebenfalls deutlich schlechter.

Unter Berücksichtigung all dieser Punkte würde ich spekulieren, dass Netflix bereit ist, eine gewisse Abstimmungsgenauigkeit auszutauschen, um mehr Benutzer zur Abstimmung zu bewegen. Ich denke, sie bevorzugen mehr Leute, die wählen, da dies die Stichprobenabdeckung erhöht. Dies kann zu einem besseren Verständnis weniger engagierter Benutzer führen. Der Grenzwert zusätzlicher Informationen für weniger engagierte Benutzer ist im Vergleich zu engagierten Benutzern wahrscheinlich viel höher.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.