Speichern des Browserverlaufs für die persönliche Analyse


1

Ich interessiere mich für Personal Analytics und möchte einen zuverlässigen Weg finden, um meinen Webbrowser-Verlauf in einem Format zusammenzufassen und zu speichern, das ich verstehen und bearbeiten kann. Ich benutze meistens Google Chrome.

Seit einiger Zeit verwende ich ein Python-Skript in dieser Richtung (das ist Code, den ich von einer anderen Stelle bekommen habe, aber ich habe vergessen, wo):

pattern = "(((http)|(https))(://)(www.)|().*?)\.[a-z]*/"
SQL_STATEMENT = 'SELECT urls.url, visit_time FROM visits, urls WHERE visits.url=urls.id;'

dumpdir = '...\Chrome History Dump'
storage = open(dumpdir+'/hdump.txt', 'a')

def date_from_webkit(webkit_timestamp):
    epoch_start = datetime.datetime(1601,1,1)
    delta = datetime.timedelta(microseconds=int(webkit_timestamp))
    return epoch_start + delta

paths = ["...\AppData\Local\Google\Chrome\User Data\Default\Archived History", 
         "...\AppData\Local\Google\Chrome\User Data\Default\History"] 

for path in paths:
    c = sqlite3.connect(path) 
    for row in c.execute(SQL_STATEMENT):
        date_time = date_from_webkit(row[1])
        url = re.search(pattern, row[0])
        try: urlc = url.group(0)
        except: urlc = "ERROR"
        storage.write(str(date_time)[0:19] + "\t" + row[0] + "\n")
    c.close()
    os.remove(path)

Leider haben die letzten Chrome-Updates diesen Ansatz gebrochen. Ich habe noch nicht untersucht, warum, aber ich habe mich entschlossen, einen besseren Weg zu finden, um dies zu tun. Hat jemand irgendwelche Vorschläge? Dies sind einige der Kriterien, an die ich denke:

  • Die Lösung sollte den Browserverlauf extrahieren und (vorzugsweise) die Kopie von Google entfernen.
  • Es wäre gut, wenn es möglich wäre, es automatisch auszuführen, entweder bei jedem Start von Chrome (wie ich es mit dem kleinen Skript oben getan habe) oder nach einem regelmäßigen Zeitplan.
  • Die Lösung sollte so robust wie möglich gegenüber Änderungen in der Art und Weise sein, in der Chrome seinen Verlauf speichert - entweder aufgrund des Designs oder (noch besser), weil es sich um eine kontinuierlich gewartete Software handelt.
  • Es müssen nur die URL und die Besuchszeit gespeichert werden, die Informationen im Verlauf können verworfen werden.

Danke vielmals.


Es wäre wahrscheinlich produktiver, herauszufinden, wie Sie Ihre aktuelle Lösung für die neueste Version von Chrome reparieren können, als nach einer möglicherweise nicht vorhandenen Lösung zu suchen.
Ivo Flipse

Na vielleicht. Aber selbst als ich diese Lösung zum ersten Mal benutzte, war ich nicht ganz glücklich damit. Ich finde es sehr schwer zu glauben, dass es keinen besseren Weg gibt, so etwas zu tun.
JOwen

1
Wenn es Ihnen nichts ausmacht, dass Google Ihre Leseergebnisse überwacht
mvark
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.