Webmaster web-crawlers

2

Gibt es einen Unterschied zwischen einer leeren robots.txt und keiner robots.txt?

Auf einem Webserver muss ich jetzt noch administrieren, dass mir aufgefallen ist, dass die robots.txt leer ist. Ich fragte mich, ob es einen Unterschied zwischen einer leeren robots.txt und gar keiner Datei gibt. Verhalten sich Crawler in diesen beiden Fällen unterschiedlich? Ist es also sicher, nur eine leere robots.txt zu …

28 web-crawlers robots.txt webserver

1

Bingbot-Anforderung für trafficbasedsspsitemap.xml, die nicht vorhanden ist

In den Protokollen für eine von mir verwaltete Website wird eine Anfrage nach einer nicht vorhandenen Datei von Bingbot angezeigt. Die Details der Anfrage sind Pfad: /trafficbasedsspsitemap.xml Useragent: "Mozilla / 5.0 (kompatibel; Bingbot / 2.0; + http://www.bing.com/bingbot.htm )" IP-Adresse: 65.55.213.244 (Reverse Lookup wird in msnbot-65-55-213-244.search.msn.com aufgelöst. ) Aus welchem Grund …

28 bing logging web-crawlers

8

Verhindern, dass Roboter bestimmte Teile einer Seite crawlen

Als Webmaster, der für eine winzige Website mit einem Forum zuständig ist, erhalte ich regelmäßig Beschwerden von Nutzern, dass sowohl die interne Suchmaschine als auch die externen Suchanfragen (wie bei Google) durch die Signaturen meiner Nutzer (die sie lange verwenden) vollständig verschmutzt sind Unterschriften und das ist ein Teil der …

28 html search-engines forum web-crawlers

4

Ist die Yahoo-Suche jetzt die gleiche wie die Bing-Suche?

Wir hatten in der Vergangenheit einige schwerwiegende Probleme mit der (unglaublich) schlecht geschriebenen Spinne von Yahoo und haben sie daher blockiert. Marco Arment von Tumblr teilte uns am 31.08.2009 auch seine Frustrationen mit, was ein Faktor dafür war, dass wir sie blockierten. [Yahoo's Spider] hat uns seit ungefähr 5:30 EST …

25 user-agent bing yahoo web-crawlers

5

Rendert der Google Spider JavaScript?

Diese Frage wurde von Stack Overflow migriert, da sie in Webmasters Stack Exchange beantwortet werden kann. Vor 9 Jahren migriert . Kann der Google Spider JavaScript oder nur HTML rendern?

22 javascript google seo web-crawlers

6

Gutes Tool, um meine Website zu crawlen und mir zu helfen, tote und nicht verknüpfte Dateien zu finden [geschlossen]

Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage, damit sie für Webmasters Stack Exchange zum Thema gehört . Geschlossen vor 6 Jahren . Ich habe eine ziemlich große Legacy-Site mit buchstäblich Tausenden von PDFs, die manchmal …

21 site-maintenance web-crawlers dead-links

3

Ist es möglich, die Baiduspider-Crawling-Frequenz zu verlangsamen?

Viel wurde von der Baidu-Spinnen-Crawling-Frequenz gemacht. Es ist wahr: "Baiduspider kriecht wie verrückt." Ich habe dieses Phänomen an Standorten erlebt, mit denen ich arbeite. In mindestens einem Fall habe ich festgestellt, dass Baiduspider ungefähr mit der gleichen Häufigkeit wie Googlebot crawlt, obwohl Baidu etwa 0,1% mehr Traffic liefert als Google. …

18 seo search-engines googlebot web-crawlers

3

Welchen User Agent soll ich einstellen?

Es gibt Ask bot, der diesen Header setzt: Mozilla/2.0 (compatible; Ask Jeeves/Teoma) In Anbetracht dessen habe ich folgende Fragen: Welchen User Agent soll ich verwenden, wenn ich einen Webcrawler namens Goofy schreibe? Was ist der Unterschied wenn ich Mozilla/2.0oder lege Mozilla/5.0? Weitere Vorschläge zur Formatierung meines User Agents gemäß den …

18 user-agent web-crawlers

3

Kann sich robots.txt im Unterverzeichnis eines Servers befinden?

Ich habe ein Unterverzeichnis, das ich vor den Suchmaschinen-Webcrawlern verstecken möchte. Eine Möglichkeit, dies zu tun, ist die Verwendung von a robots.txtim Stammverzeichnis des Servers (die Standardmethode). Jeder, der die URL der Website kennt und über grundlegende Webkenntnisse verfügt, kann auf den Inhalt von robots.txt zugreifen und die unzulässigen Verzeichnisse …

16 web-crawlers robots.txt

3

SEO - Responsive Website und doppelte Menüs

Immer wenn ich eine Responsive-Website erstelle, erstelle ich normalerweise zwei Menüs: 1 ausgeblendet und für Mobilgeräte verwendet und das andere als Hauptmenü angezeigt und dann ausgeblendet, um das Mobilmenü anzuzeigen. Wann immer es um SEO und Spinnen geht, die auf der Website navigieren, bekomme ich das Problem, dass ich doppelte …

15 seo web-crawlers googlebot navigation

7

Wie man baidu Spinnen blockiert

Die meisten meiner Besuche stammen von Baidu-Spinnen. Ich denke, es hilft Suchmaschinen überhaupt nicht, also denke ich darüber nach, wie ich sie blockieren kann. Könnte dies über Iptables erfolgen? Ich benutze Nginx als Webserver.

15 traffic nginx web-crawlers baidu

3

Verhindern Sie, dass böswillige Bots Spam versenden

Ich erinnere mich an eine Seite, die wegen Missbrauch geschlossen wurde, und ich frage mich, ob Bots einen Teil davon haben. Wenn der Bot etwas auf meiner Seite veröffentlicht, wie kann ich es bekämpfen? Ich habe überlegt, einige Cookies zu setzen und die Cookies über JavaScript + Zeitstempel und Signatur …

15 web-crawlers spam-prevention spam-bots

3

Wie findet Google eine Domain ohne Links dazu?

Ich habe kürzlich eine neue Domain registriert, auf meinen vorhandenen Server verwiesen und eine minimale Seite eingerichtet, auf der nur "test" und sonst nichts steht. Ich habe gerade heute Abend festgestellt, dass die Seite bereits in Google indiziert ist! Es gibt keine Links zur Site (ich habe noch niemandem von …

13 search-engine-indexing domain-registration web-crawlers

2

Sollte ich Bots von meiner Website blockieren und warum?

Meine Logbücher sind voll von Bot-Besuchern, oft aus Osteuropa und China. Die Bots werden als Ahrefs, Seznam, LSSRocketCrawler, Yandex, Sogou usw. identifiziert. Soll ich diese Bots von meiner Website aus blockieren und warum? Welche haben einen legitimen Zweck, um den Traffic auf meiner Site zu erhöhen? Viele von ihnen sind …

12 seo web-crawlers user-agent

1

Warum crawlt baidu meine Seite wie verrückt?

Wenn ich mein Apache-Protokoll überprüfe, kann ich feststellen, dass baidu meine Website in den letzten 2 Wochen 10 Mal am Tag gecrawlt hat. Es ist nicht so, dass es mich interessiert, aber ich bin wirklich neugierig, warum er das tut. Es ist eine sehr kleine Single-Page-Website mit wenig eingehenden Links. …

12 seo web-crawlers baidu

Als «web-crawlers» getaggte Fragen