Hier erfahren Sie, ob ein Benutzer auf einen Link geklickt hat

Ich habe große Verkehrsdateien, die ich statistisch analysieren möchte, um zu überprüfen, ob ein Benutzer auf Links auf bestimmten Websites klickt.

Es ist wichtig zu sagen, dass meine Pakete nach Flüssen sortiert sind (IP1 <=> IP2).

Meine erste Idee war, den Paketinhalt zu durchsuchen und nach hrefs und Links zu suchen, sie alle mit ihren Zeitstempeln in einer Art Datenstruktur zu speichern und dann die Pakete erneut zu durchlaufen, um kurz vor dem Erscheinen der Links nach Anfragen zu suchen .

So etwas wie im folgenden Pseudocode:

for each packet in each flow:
      search for "href" or "http://" or "https://"
      save the links with their timestamp
for each packet in each flow:
      if it's an http request and its url matches some url in the list and the 
         time is close enough, record it

Das Problem mit diesem Code ist, dass einige (wichtige) Links dynamisch generiert werden, während die Seite geladen wird, und mit der obigen Methode nicht gefunden werden können.

Eine andere Idee war, das Referrer-Feld im HTTP-Header zu überprüfen und nach Paketen zu suchen, auf die von den relevanten Sites verwiesen wurde. Diese Methode generiert aufgrund von Frames und eingebetteten Objekten viele False Positives.

Es ist wichtig zu erwähnen, dass dies nicht mein Server ist und ich beabsichtige, ein Tool zur statistischen Analyse des Nutzerverhaltens zu erstellen (daher kann ich meiner Site keinen Klick-Tracker hinzufügen).

Hat jemand eine Idee, was ich tun kann, um zu überprüfen, ob die Benutzer entsprechend ihres Netzwerkverkehrs auf Links geklickt haben?
Jede Hilfe wird geschätzt!
Danke

— usr371
quelle

Sie verwenden das falsche Werkzeug für den Job. Warum nicht (zumindest) die Serverprotokolle verwenden? Wenn die Links dynamisch generiert werden, können Sie diese Informationen nicht abrufen, ohne dieselbe Generierung (muss einem Muster folgen?) Oder eine gute Vermutung anzustellen. Schließlich gibt es wahrscheinlich nur eine Reihe von Möglichkeiten, auf eine bestimmte Site zuzugreifen.

— Seth

Vielen Dank für Ihre Antwort! Ich denke, Sie haben Recht und meine Sichtweise ist hier falsch. Meine Absicht ist es, das Verhalten der Benutzer nur anhand ihres Datenverkehrs zu bestimmen, und gemäß meinen Annahmen habe ich keinen Zugriff auf den Server selbst (auf lange Sicht möchte ich das Verhalten beim Klicken auf Links für einige (bestimmte) Websites überprüfen Ich kann keine serverseitigen Programme verwenden. Ich habe tatsächlich gesehen, dass es Klicks gibt, die nicht in ihrer vollständigen Form im Paket angezeigt werden (sondern als Verkettung von Variablen). \ N Haben Sie eine andere Vorstellung davon, was ich tun kann, um sie zu überprüfen?

— USR371