Eine Möglichkeit besteht darin, den Artikelverlauf zu exportieren und die Überarbeitungen dann mit einem lokalen Tool wie dem folgenden zu verarbeiten git blame
. Dies kann mithilfe eines Skripts erfolgen.
Um den Artikel zu Geschichte zu exportieren, verwendenSpecial:Export
, insbesondere: https://en.wikipedia.org/w/index.php?title=Special:Export&history=1&action=submit&pages=Blinkenlights
.
Um die Schuld zu generieren, fügen Sie zuerst die Revisionen einem temporären Git-Repository hinzu (in Python 3 gezeigt):
import tempfile
import subprocess
with tempfile.TemporaryDirectory() as repo:
os.chdir(repo.name)
subprocess.check_call(['git', 'init'])
Laden Sie dann das exportierte Verlaufs-XML herunter, analysieren Sie es mit so etwas wie lxml.etree
und durchlaufen Sie die Revisionen (xpath //revision
). Schreiben Sie für jede Revision den Text in eine Datei (etwa article.wiki
), lesen Sie den Autor und führen Sie ihn aus
subprocess.check_call(['git', 'commit', '-a', '-m', 'blah', '--author=' + str(author)])
Nachdem alle Revisionen zum Repo hinzugefügt wurden, führen Sie den Befehl aus, um git blame article.wiki
den Autor jeder Zeile anzuzeigen .
Hinweis: Special:Export
Möglicherweise wird die Anzahl der exportierten Revisionen eingeschränkt. In Seiten mit langem Verlauf müssen Sie die XML-Datei daher möglicherweise mehrmals abrufen.