Ich stellte eine ähnliche Frage nach der Entfernung zwischen "Dokumenten" (Wikipedia-Artikel, Nachrichten usw.). Ich habe dies zu einer separaten Frage gemacht, da Suchanfragen erheblich kleiner als Dokumente und erheblich lauter sind. Ich weiß daher nicht (und bezweifle), ob hier die gleichen Entfernungsmetriken verwendet werden würden.
Entweder werden lexikalische Vanille-Distanzmetriken oder semantische Distanzmetriken nach dem Stand der Technik bevorzugt, wobei letztere stärker bevorzugt werden.