"Keine grafischen Methoden" ist eine Art großes Handicap, aber ... hier sind ein paar seltsame Ideen. Beide behandeln die Bewertungen als fortlaufend, was eine konzeptionelle Schwäche darstellt und wahrscheinlich nicht die einzige ...
Kurtosis
- Die Kurtosis von {1,1,1,5,5,5} = 1. Sie erhalten keine niedrigere Kurtosis mit einer Kombination von 1–5 Bewertungen.
- Die Kurtosis von {1,2,3,4,5} = 1,7. Niedriger bedeutet extremere Werte; höher bedeutet mehr Mitte.
- Dies funktioniert nicht, wenn die Verteilung nicht ungefähr symmetrisch ist. Ich werde unten demonstrieren.
Negative binomiale Regression
R a t i n g12345F r e qu e n c y31157937
F r e qu e n c y ∼ R a t i n g + R a t i n g------√ -Koeffizient sollte nahe Null sein, wenn die Bewertungen
gleichmäßig verteilt sind, positiv, wenn proportional mehr Mittelbereichswerte vorliegen (siehe
Binomialverteilung), oder negativ bei polarisierten Verteilungen wie der obigen, für die der Koeffizient gilt: 11.8.
R a t i n g------√
FWIW, hier ist der r Code , den ich mit dem Spielen um habe:
x=rbinom(99,4,c(.1,.9))+1;y=sample(0:4,99,replace=T)+1 #Some polarized & uniform rating data
table(x);table(y) #Frequencies
require(moments);kurtosis(x);kurtosis(y) #Kurtosis
Y=data.frame(n=as.numeric(table(y)),rating=as.numeric(levels(factor(y)))) #Data frame setup
X=data.frame(n=as.numeric(table(x)),rating=as.numeric(levels(factor(x)))) #Data frame setup
require(MASS);summary(glm.nb(n~rating+sqrt(rating),X)) #Negative binomial of polarized data
summary(glm.nb(n~rating+sqrt(rating),Y)) #Negative binomial of uniform data
Kann nicht widerstehen, in einem Grundstück zu werfen ...
require(ggplot2);ggplot(X,aes(x=rating,y=n))+geom_point()+stat_smooth(formula=y~x+I(sqrt(x)),method='glm',family='poisson')
Das R a t i n g------√
Bearbeiten:
Ich habe gerade gesehen, wie diese Frage in der Seitenleiste beworben wurde:
und als ich darauf klickte, habe ich sie in den Hot Network Questions gesehen, die sich wieder auf sich selbst verlinken, wie es manchmal passiert ,
Daher dachte ich, dass dies in einer allgemeineren, nützlichen Art und Weise eine Wiederholung verdienen könnte. Ich habe mich entschlossen, meine Methoden an den Amazon-Kundenrezensionen für The Mountain Three Wolf Moon - Kurzärmliges T-Shirt zu testen :
R a t i n gF r e qu e n c y1208254389419852273
βR a t i n g√= - 19,1
σ2F r e qu e n c yThe Mountain Three Wolf Moon Kurzarm-T-Shirt Bewertungen= 1,31
x=rep(5:1,c(2273,198,89,54,208))
var(x)/(4*length(x)/(length(x)-1))