Hacking Recaptcha (auch bekannt als "The Penis Flood")
Die nächste angewandte Taktik bestand darin, festzustellen, ob sie einen Fehler in der reCAPTCHA-Implementierung finden konnten. Eine Sache, die sie bei reCAPTCHA entdeckt haben, war, dass es einem Benutzer immer zwei Wörter zum Decodieren präsentiert - ein Wort ist ein Steuerwort, das dem reCAPTCHA-System bekannt ist, während das andere ein unbekanntes Wort ist (reCAPTCHA verwendet die Menschen, um OCR-Fehler zu korrigieren). Wikipedia beschreibt den Prozess wie folgt: „Gescannter Text wird von zwei verschiedenen optischen Zeichenerkennungsprogrammen analysiert. In Fällen, in denen die Programme nicht übereinstimmen, wird das fragliche Wort in ein CAPTCHA umgewandelt. Das Wort wird zusammen mit einem bereits bekannten Steuerwort angezeigt und vom Menschen beschriftet. Die Wörter, die von menschlichen Richtern durchweg mit einem einzigen Etikett versehen werden, werden als Kontrollwörter recycelt. “ 2iasdo4 Was Anonymous erkannte, war, dass, wenn sie den unbekannten gescannten Text immer mit demselben Wort beschrifteten - und wenn sie dies tausende und tausende Male taten, schließlich ein großer Prozentsatz der unbekannten Wörter mit ihrem Wort falsch beschriftet würde. Alles, was sie tun mussten, war, sich die beiden Wörter im Captcha anzusehen, das richtige Etikett für das "einfache" einzugeben (vermutlich das, auf das sich die beiden optischen Scanner einigen würden) und das Wort "Penis" für das einzugeben schwer. Wenn sie dies oft genug taten, würde bald ein erheblicher Prozentsatz der Bilder als "Penis" bezeichnet und die Fähigkeit zur automatischen Abstimmung wiederhergestellt (ein Nebeneffekt, der bei Anonymous nicht verloren ging, war die Vorstellung, dass dies für die kommenden Jahre der Fall sein würde Es würde eine Reihe digitaler Bücher geben, in denen das Wort "Penis" zufällig im Text eingefügt wird. Update: Ich fragte Ben Maurer:
ReCAPTCHA optimieren
So ansprechend wie der Gedanke, das Wort "Penis" in Texte zu streuen, wusste das anonyme Team, dass die Uhr tickt, und wenn sie die Nachricht wiederherstellen wollten, hatten sie keine Zeit zu warten, bis die Autovooter wieder online waren - Sie mussten viele, viele Male manuell abstimmen. Und so mussten sie in der Lage sein, so schnell wie möglich in Captchas einzutreten. Sie entwickelten eine Reihe von Richtlinien, anhand derer sie schnell entscheiden konnten, welche reCAPTCHA-Wörter sie überspringen konnten. Beispielsweise:
Sie erhalten 2 Wörter: 1 echtes, 1 falsches.
Für [REAL FAKE]
oder [FAKE REAL]
können Sie einfach eingeben REAL
und es sollte akzeptiert werden.
Wenn es [LOOKSREAL LOOKSREAL]
oder ist [LOOKSFAKE LOOKSFAKE]
, ist es normalerweise nur schneller, beide Wörter einzugeben. Verschwenden Sie keine kostbare Zeit damit, zu entscheiden, welcher von ihnen echt ist.
Verwenden Sie sowohl das Aussehen als auch die Art des Wortes, um ein falsches Wort zu identifizieren. Verlassen Sie sich nicht nur auf einen von ihnen.
Der ganze Regelsatz ist hier: Fake Captcha .