Für jeden Benutzer auf Wikipedia möchte ich herausfinden, welche Seiten von diesen Benutzern erstellt wurden. Wie finde ich alle Seiten, die von einem bestimmten Wikipedia- oder Mediawiki-Benutzer erstellt wurden?
Für jeden Benutzer auf Wikipedia möchte ich herausfinden, welche Seiten von diesen Benutzern erstellt wurden. Wie finde ich alle Seiten, die von einem bestimmten Wikipedia- oder Mediawiki-Benutzer erstellt wurden?
Antworten:
Soweit ich weiß, gibt es keinen einfachen Weg, dies zu tun. Aber ich sehe einige Möglichkeiten (beginnend mit denen, die praktisch nicht funktionieren):
Verwenden Sie die API. Die API hat keine direkte Möglichkeit, dies zu tun, aber Sie könnten versuchen, dies zu umgehen:
Gehen Sie alle Seiten durch und finden Sie für jede Seite den Ersteller heraus. Aufgrund der Einschränkungen der API bei der Arbeit mit Revisionen würde dies 1 Anfrage pro Seite bedeuten, was dies für ein so großes Wiki wie Wikipedia völlig unmöglich macht.
Die erste Abfrage würde ungefähr so aussehen: http://en.wikipedia.org/w/api.php?action=query&generator=allpages&gaplimit=1&prop=revisions&rvdir=newer&rvprop=user&rvlimit=1
Gehen Sie für jeden Benutzer seine Beiträge durch und finden Sie heraus, welche seiner Änderungen eine neue Seite erstellt haben. Da Sie mit der API die Beiträge nicht filtern können, um nur Seitenerstellungen anzuzeigen, müssen Sie diese selbst filtern. Dies wäre wahrscheinlich viel schneller als die obige Option, aber für Wikipedia immer noch viel zu langsam:
Die Abfrage für Benutzer: Svick würde folgendermaßen aussehen: http://en.wikipedia.org/w/api.php?action=query&list=usercontribs&ucuser=Svick&ucprop=title|flags&uclimit=max
Laden Sie den Stub-Meta-History-Dump (32 GB, komprimiert für die englische Wikipedia) herunter, der Informationen zu Revisionen aller Seiten in XML enthält. Sie können dies durchgehen, um den Ersteller jeder Seite herauszufinden (vorausgesetzt, es wurden keine Revisionen gelöscht).
Auf dem Wikimedia Toolserver führe ich ein Skript aus (ursprünglich nicht von mir geschrieben), das die Tabelle regelmäßig aktualisiert u_svick_enwiki_page_creators_p
und Informationen zu Benutzern enthält, die jede Seite erstellt haben. Diese Tabelle ist für andere Benutzer des Toolservers zugänglich, jedoch nicht für die Öffentlichkeit.
Zusammenfassend lässt sich sagen, dass es keine gute Lösung gibt und Sie zwei Möglichkeiten haben: 32 GB Daten herunterladen und analysieren oder ein Toolserver-Konto einrichten und dann die von mir erwähnte Tabelle verwenden.
Ab Wikimedia 1.23 kann dies mit dem Usercontribs
Modul in der API über die new
Option des ucshow
Parameters erfolgen.
Dafür gibt es ein Tool: https://tools.wmflabs.org/xtools/pages/
(XTools hat auch einige andere nützliche Tools)
Alternativ können Sie in einem bestimmten Wiki auch alle Seiten anzeigen, die von einem benannten Benutzer über diese Suche erstellt wurden .