Eine Möglichkeit besteht darin, den Artikelverlauf zu exportieren und die Überarbeitungen dann mit einem lokalen Tool wie dem folgenden zu verarbeiten git blame. Dies kann mithilfe eines Skripts erfolgen.
Um den Artikel zu Geschichte zu exportieren, verwendenSpecial:Export , insbesondere: https://en.wikipedia.org/w/index.php?title=Special:Export&history=1&action=submit&pages=Blinkenlights.
Um die Schuld zu generieren, fügen Sie zuerst die Revisionen einem temporären Git-Repository hinzu (in Python 3 gezeigt):
import tempfile
import subprocess
with tempfile.TemporaryDirectory() as repo:
os.chdir(repo.name)
subprocess.check_call(['git', 'init'])
Laden Sie dann das exportierte Verlaufs-XML herunter, analysieren Sie es mit so etwas wie lxml.etreeund durchlaufen Sie die Revisionen (xpath //revision). Schreiben Sie für jede Revision den Text in eine Datei (etwa article.wiki), lesen Sie den Autor und führen Sie ihn aus
subprocess.check_call(['git', 'commit', '-a', '-m', 'blah', '--author=' + str(author)])
Nachdem alle Revisionen zum Repo hinzugefügt wurden, führen Sie den Befehl aus, um git blame article.wikiden Autor jeder Zeile anzuzeigen .
Hinweis: Special:ExportMöglicherweise wird die Anzahl der exportierten Revisionen eingeschränkt. In Seiten mit langem Verlauf müssen Sie die XML-Datei daher möglicherweise mehrmals abrufen.