Webmaster web-crawlers

2

Ich habe eine Site auf eine neue Domain migriert. Die Seite selbst ist ziemlich unkompliziert (sie verwendet Jekyll) und alles ist gut gelaufen - außer der Migration von Disqus-Threads. Ich hatte teilweise Erfolg - einige der Threads wurden erfolgreich migriert, aber nicht alle. Ich habe den Domänenmigrationsassistenten (der einige abgefangen …

9 web-crawlers

2

Ask.com Sitemap Crawler down (für immer)?

Ich habe Ask.comals eine der Suchmaschinen meine Sitemap gepingt. Als ich heute meine Sitemap anpingte, um meine Sitemap neu zu indizieren, wurde auf der Website ( http://submissions.ask.com/ping ) angegeben, dass sie nicht mehr existiert. Ich habe eine DNS-Suche durchgeführt submissions.ask.comund es sieht so Ask.comaus, als hätte die Subdomain entfernt, aber …

9 search-engines sitemap web-crawlers ping

3

Taktiken für den Umgang mit sich schlecht benehmenden Robotern

Ich habe eine Website, die aus regulatorischen Gründen möglicherweise nicht automatisch indiziert oder durchsucht wird. Dies bedeutet, dass wir alle Roboter fernhalten und verhindern müssen, dass sie die Site spinnen. Offensichtlich hatten wir eine robots.txt-Datei, die von Anfang an nicht erlaubt ist. Das Beobachten der robots.txt-Datei ist jedoch etwas, was …

9 apache web-crawlers user-agent

1

Sollte ich eine leere ads.txt-Datei für eine Website veröffentlichen, auf der keine Anzeigen geschaltet werden?

Ich habe einige 404-Fehler gesehen, als auf einigen von mir verwalteten Websites ads.txt angefordert wurde. Ich vermute, die Antwort ist möglicherweise identisch mit der Frage nach einer leeren robots.txt-Datei oder gar keiner Datei (verhindern Sie nur einige 404-Fehler). Es fällt mir jedoch schwer, die zugrunde liegenden Konzepte hinter ads.txt zu …

8 web-crawlers advertising

5

Verweigern Sie den Zugriff auf Archive.is

Ich möchte den archive.isZugriff auf meine Website verweigern . (Ich möchte nicht, dass diese Website meine ohne meine Zustimmung zwischenspeichert). Wissen Sie, ob es möglich ist?

8 web-crawlers noarchive

2

Welches Meta-Roboter-Tag wird bevorzugt?

Meine Frau arbeitet an einem Gymnasium in Deutschland. Ich habe kürzlich festgestellt, dass es extrem schwierig ist , die Homepage dieser Schule mit Google zu finden. Ich habe mir den Quellcode der Seite angesehen und glaube, ich habe den Grund gefunden: Es gibt zwei <meta name="robots">Tags; einer ist <meta name="robots" …

8 seo web-crawlers meta-robots

2

Können Webcrawler statische Seiten anzeigen, ohne einem Link zu ihnen zu folgen?

Wenn ich eine statische Seite in einer Domain erstelle (http://www.domain.com/page.html), kann ein Crawler sie dann weiterhin sehen, wenn auf der Site keine Links dazu vorhanden sind?

8 web-crawlers

2

Facebook-Crawler ohne Benutzeragenten, der unsere Website bei einem möglichen DoS-Angriff spammt

Auf Facebook registrierte Crawler (ipv6 mit der Endung: face: b00c :: 1) knallten unsere Website und sahen in nur 20 Minuten Zehntausende von Treffern. Wir haben festgestellt, dass sie keinen Benutzeragenten im Header haben, und haben eine Regel für Cloudflare implementiert, um uns selbst zu schützen. Es scheint, dass sie …

8 web-crawlers facebook cdn cloudflare ddos

1

Bei Googlebot treten JavaScript-Fehler auf, da veraltete HTML-Dateien mit neueren JS-Dateien gerendert werden

Wir sind kürzlich auf ein Problem gestoßen, bei dem wir var GLOBAL_VAR = true;einer HTML-Seite (z. B. ) eine JavaScript-Variable (z. B. ) hinzugefügt /Search/Indexund die separate JS-Datei (z. B. ) aktualisiert haben, /Scripts/search/index.jsum auf diese JS-Variable zuzugreifen und sie zu verwenden. Nachdem wir diese Änderungen live im Web veröffentlicht …

8 javascript web-crawlers googlebot

2

Crawlen Suchmaschinen immer noch eine No-Index-Seite?

Crawlen Suchmaschinen eine Seite mit dem Metaattribut 'noindex'? Der Grund, den ich frage, ist, dass wir nahezu doppelten Inhalt haben, der durch die facettierte Navigation verursacht wird, und die gefilterten Seiten "noindex" angegeben haben und ich mich gefragt habe, ob diese Seiten immer noch als doppelte Inhalte erkannt werden? Muss …

7 seo web-crawlers duplicate-content noindex nofollow

2

Verfolgt der Webcrawler von Google HTML-Importe?

Ist Googlebot - Googles webcrawler - follow - Browser-Seite HTML - Importe wie die folgenden? <link rel="import" href="header.html"> Ich denke darüber nach, Webinhalte auf meinem Webserver zu hosten, der diese Richtlinie verwendet, die im W3C-Entwurf enthalten ist . Ich mache mir jedoch Sorgen, dass der gesamte Text auf meiner Website …

7 web-crawlers html5

3

Sollte ich das Crawlen von HTTP nach dem Wechsel zu HTTPS nicht zulassen?

Ich migriere meine gut indizierte Website nur von HTTP auf HTTPS. Geplante Schritte: Alle HTML-Seiten können jetzt HTTPS sein Alle HTTP-Seiten werden mit derselben URL zu HTTPS umgeleitet Alle Sitemaps haben HTTPS-URLs Alle Links auf HTML-Seiten sind HTTPS Fehler 1: Derzeit robots.txtauf HTTPS-Ebene nicht zulassen, da der Crawler keine HTTPS-Seiten …

7 seo 301-redirect https web-crawlers migration

2

So ermitteln Sie, ob die IP-Adresse wirklich die IP-Adresse von Google ist

Nach dem, was ich in meinen Serverprotokollen gelernt habe, gehören IP-Adressen, die mit 64.249 beginnen, zu Google. Wenn ich auf meinem Computer eine Host-Suche für Google durchführe, erhalte ich 11 verschiedene IP-Adressen, die alle mit 74.125.226 beginnen. Ich gehe dann hier http://www.iplists.com/ und finde heraus, dass es eine Menge weiterer …

7 google web-crawlers ip-address

1

Wie lange wartet der Google Bot, nachdem das Dokument fertig ist, bevor er einen Schnappschuss der Webseite erstellt?

Wie lange wartet der Google-Bot beim Crawlen, während der JS seine Arbeit an der Seite ausführt, bis das Javascript ausgeführt wird, nachdem das Dokument fertig ist? Angenommen, ich habe eine AJAX-Antwort, die länger als gewöhnlich dauert. Wie kann sichergestellt werden, dass der Google Bot die inhaltsreiche Website crawlt (mit der …

7 seo javascript web-crawlers googlebot

1

Bestraft Google Websites für die Anzeige eines anderen Menüs für Handys als für Desktops?

Ich bin wirklich besorgt über ein Design, das mir von einem Designer übergeben wurde. Es ändert das Menü für Mobile und Desktop. Auf Mobilgeräten können Sie nur auf die Hauptkategorien zugreifen, die zu allen Inhalten und Unterlinks führen. Auf dem Desktop kann das Menü mehr anzeigen und erleichtert und beschleunigt …

7 seo google web-crawlers responsive-webdesign navigation

Als «web-crawlers» getaggte Fragen