Ein einfacher Ansatz wäre wie folgt.
Nehmen Sie für die beiden Präferenzfragen den absoluten Unterschied zwischen den Antworten der beiden Befragten und geben Sie zwei Variablen an, z. B. z1 und z2 anstelle von vier.
Für die Wichtigkeitsfragen könnte ich eine Punktzahl erstellen, die die beiden Antworten kombiniert. Wenn die Antworten beispielsweise (1,1) wären, würde ich eine 1 geben, eine (1,2) oder (2,1) eine 2, eine (1,3) oder (3,1) eine a 3, a (2,3) oder (3,2) erhält eine 4 und a (3,3) erhält eine 5. Nennen wir das den "Wichtigkeitswert". Eine Alternative wäre, nur max (Antwort) zu verwenden und 3 statt 5 Kategorien zu vergeben, aber ich denke, die Version mit 5 Kategorien ist besser.
Ich würde jetzt zehn Variablen erstellen, x1 - x10 (der Vollständigkeit halber), alle mit Standardwerten von Null. Für jene Beobachtungen mit einer Wichtigkeitsbewertung für die erste Frage = 1, x1 = z1. Wenn der Wichtigkeitswert für die zweite Frage ebenfalls = 1 ist, ist x2 = z2. Für Beobachtungen mit einer Wichtigkeitsbewertung für die erste Frage = 2, x3 = z1 und wenn die Wichtigkeitsbewertung für die zweite Frage = 2, x4 = z2 usw. ist. Für jede Beobachtung ist genau eine von x1, x3, x5, x7, x9! = 0 und ähnlich für x2, x4, x6, x8, x10.
Nachdem ich das alles getan hatte, führte ich eine logistische Regression mit dem binären Ergebnis als Zielvariable und x1 - x10 als Regressoren durch.
Anspruchsvollere Versionen davon können zu höheren Wichtigkeitswerten führen, indem die Wichtigkeit von männlichen und weiblichen Befragten unterschiedlich behandelt wird, z. B. a (1,2)! = A (2,1), wobei wir die Antworten nach Geschlecht geordnet haben.
Ein Mangel dieses Modells besteht darin, dass Sie möglicherweise mehrere Beobachtungen derselben Person haben, was bedeuten würde, dass die "Fehler", lose gesagt, nicht unabhängig von Beobachtungen sind. Bei vielen Personen in der Stichprobe würde ich dies jedoch wahrscheinlich für einen ersten Durchgang einfach ignorieren oder eine Stichprobe erstellen, bei der keine Duplikate vorhanden sind.
Ein weiterer Mangel besteht darin, dass es plausibel ist, dass mit zunehmender Bedeutung auch die Auswirkung eines bestimmten Unterschieds zwischen Präferenzen auf p (Fehler) zunehmen würde, was eine Beziehung zwischen den Koeffizienten von (x1, x3, x5, x7, x9) und auch impliziert zwischen den Koeffizienten von (x2, x4, x6, x8, x10). (Wahrscheinlich keine vollständige Bestellung, da mir nicht von vornherein klar ist, wie sich ein (2,2) Wichtigkeitswert auf einen (1,3) Wichtigkeitswert bezieht.) Dies haben wir jedoch im Modell nicht festgelegt. Ich würde das wahrscheinlich zuerst ignorieren und sehen, ob mich die Ergebnisse überraschen.
Der Vorteil dieses Ansatzes besteht darin, dass keine Annahme über die funktionale Form der Beziehung zwischen "Wichtigkeit" und dem Unterschied zwischen Präferenzantworten gemacht wird. Dies widerspricht dem vorherigen Mangelkommentar, aber ich denke, das Fehlen einer auferlegten funktionalen Form ist wahrscheinlich vorteilhafter als das damit verbundene Versäumnis, die erwarteten Beziehungen zwischen Koeffizienten zu berücksichtigen.