Ich bin kürzlich in den Bereich des maschinellen Lernens eingetreten. Für ein Projekt, an dem ich arbeite, muss ich Benutzer anhand der Reihenfolge gruppieren, in der sie Webseiten auf einer Website besucht haben. Ich habe Daten in Form von:
['user_id', 1, 2, 4, 6, 3, 7, 3, 2, 4...]
Dabei ist jede Nummer eine Kategorie / Seite, die der Benutzer besucht hat. Außerdem ist die Datenlänge für jeden Benutzer nicht gleich, dh einige Benutzer besuchen mehr Seiten als andere.
Mir ist klar, dass dies wirklich vage ist und es schwierig ist, Ähnlichkeit zu definieren. Ich habe versucht, dem Beispiel in diesem Forschungsbericht zu folgen, und um ehrlich zu sein, ging mir vieles über den Kopf.
Ich brauche Hilfe bei der Lösung dieses Problems und bin offen für neue Ideen und Vorschläge.