Es ist sehr häufig, dass wir Benutzerproduktdaten haben, die als "Klick" gekennzeichnet sind. Um das Modell zu lernen, benötige ich Klick- und No-Click-Daten.
Der einfachste Ansatz zum Generieren besteht darin, Benutzer-Produkt-Paare zu verwenden, die nicht in Klickdaten enthalten sind. Dies kann jedoch irreführend sein. Beispiel:
user1, product1 (click)
user2, product2 (click)
user2, product3 (click)
user3, product2 (click)
Ich kann Benutzer1 mit allen Produkten außer Produkt1 nehmen und sie als "no_click" usw. kennzeichnen. Dies kann jedoch nicht wahr sein. Vielleicht hätte Benutzer1 auf Produkt2 geklickt, wenn ihm Produkt2 gezeigt worden wäre. Aber nur weil ihm andere Produktgruppen gezeigt wurden, hatte er keine Gelegenheit, sich für ein Klick- / No-Click-Produkt zu entscheiden2.
Wie kann man also ein Problem mit unären Daten lösen?