Sie können ein Stück Software schreiben, um:
- Übernehmen Sie die Schlüsselwörter aus dem regulären Ausdruck.
- Google die Schlüsselwörter und erhalte eine Ergebnisliste;
- Durchforsten Sie jeden resultierenden URI und filtern Sie ihn mit vollständigem regulären Ausdruck.
Lassen Sie uns einen Fall untersuchen: site:gog.com
Finden Sie alle Spiele, die spanische Voice-Over haben.
Der reguläre Ausdruck lautet:
Audio[^:]*:[^.,]*Spanish
Es muss zum Beispiel passen:
Audio lanuage: English, German, Spanish, French.
Und nicht passend:
Audio language: only-English. Text language: Spanish.
Schritt 1. Lassen Sie Ihre Software dies bei Google suchen:
site:gog.com audio Spanish inurl:game
inurl:game
hier bedeutet nur in Spielbeschreibungsseiten suchen
Schritt 2. Holen Sie sich die 300 resultierenden Links und crawlen Sie in jeden von ihnen.
Schritt 3. Filtern Sie das Ergebnis mit dem angegebenen regulären Ausdruck:
Audio[^:]*:[^.,]*Spanish
Dies sollte einfach zu bauen sein. Tatsächlich verstehe ich nicht, warum ich etwas nicht finden konnte, das bereits so gebaut ist.
Da sich Suchmaschinen die Ressource zum Scannen ihrer Daten mit regulären Ausdrücken nicht leisten können, liegt dieser schmutzige Job bei Ihnen, und Ihr Computer sollte dies mit den bereits von Suchmaschinen bereitgestellten Mitteln tun.