Ein guter Ansatz für diese Art von Problem findet sich in Abschnitt 4 des Papiers The Bayesian Image Retrieval System, PicHunter von Cox et al. (2000). Die Daten sind eine Menge von ganzzahligen Ergebnissen wobei die Anzahl der Versuche ist. In Ihrem Fall gibt es 3 mögliche Ergebnisse pro Studie. Ich werde den Index des ausgelassenen Gesichts sein lassen. Die Idee ist, ein generatives Modell für das Ergebnis bei bestimmten Modellparametern zu postulieren und die Parameter dann anhand der maximalen Wahrscheinlichkeit zu schätzen. Wenn wir Gesichter und der Teilnehmer sagt, dass am ähnlichsten sind, ist das Ergebnis mit Wahrscheinlichkeit
A1,...,ANNAi(X1,X2,X3)(X2,X3)A=1d ( X 2 , X 3 ) σ d ( x , y ) = √
p(A=1 | X1,X2,X3)∝exp(−d(X2,X3)/σ)
wobei der Abstand zwischen den Flächen 2 und 3 ist und ist ein Parameter für die Menge an "Rauschen" (dh wie konsistent die Teilnehmer sind). Da Sie eine Einbettung in den euklidischen Raum wünschen, wäre Ihr Abstandsmaß:
wobei das (Unbekannte) ist ) Einbettung von Gesicht . Die Parameter dieses Modells sind und , die Sie aus Daten über die maximale Wahrscheinlichkeit abschätzen können. Das Papier verwendete den Gradientenanstieg, um das Maximum zu finden.
d(X2,X3)σθxxθσd(x,y)=∑k(θxk−θyk)2−−−−−−−−−−−−√
θxxθσ
Das Modell in dem Papier war etwas anders, da das Papier bekannte Attribute der Bilder zur Berechnung der Entfernung verwendete und keine unbekannte Einbettung. Um eine Einbettung zu lernen, benötigen Sie einen viel größeren Datensatz, in dem jedes Gesicht mehrmals angezeigt wurde.
Dieses Grundmodell geht davon aus, dass alle Studien unabhängig sind und alle Teilnehmer gleich sind. Ein netter Vorteil dieses Ansatzes ist, dass Sie das Modell leicht so verschönern können, dass es Nichtunabhängigkeit, Teilnehmereffekte oder andere Kovariaten enthält.