Googlebot ist die Bot-Software, mit der Google täglich über 20 Milliarden Seiten crawlt. Die beim Crawlen erhaltenen Daten werden dann analysiert und in der Google-Suche eingestuft.
Ich verfolge die Geolocation jedes Mitglieds (mit db-ip) und alles ist in Ordnung, außer Handys mit dem Chrome-Browser. Sie geben mir immer das Ergebnis US Mountain View California ip:66.249.xxx.xxx. Das ist Google; Da bin ich mir 100% sicher. Aber die Person, die die Website besucht, bin ich. Ich bin nicht …
Wie verhindere ich, dass meine XML-Sitemap-Dateien in Google-Suchergebnissen angezeigt werden, beispielsweise als Ergebnis einer site:Suchabfrage: Ich verstehe nicht, warum Google zunächst Sitemap-Dateien in den Suchergebnissen anzeigt. Diese Dateien sind nicht für den menschlichen Verzehr bestimmt. Google muss es crawlen können, damit es verarbeitet werden kann. Daher kann ich es in …
Viel wurde von der Baidu-Spinnen-Crawling-Frequenz gemacht. Es ist wahr: "Baiduspider kriecht wie verrückt." Ich habe dieses Phänomen an Standorten erlebt, mit denen ich arbeite. In mindestens einem Fall habe ich festgestellt, dass Baiduspider ungefähr mit der gleichen Häufigkeit wie Googlebot crawlt, obwohl Baidu etwa 0,1% mehr Traffic liefert als Google. …
Ich habe vor einer Woche eine robots.txt- Datei zu einer meiner Websites hinzugefügt , die Googlebot daran hindern sollte, bestimmte URLs abzurufen. An diesem Wochenende kann ich jedoch feststellen, dass Googlebot genau diese URLs lädt. Zwischenspeichert Google die Datei robots.txt und sollte dies der Fall sein?
Immer wenn ich eine Responsive-Website erstelle, erstelle ich normalerweise zwei Menüs: 1 ausgeblendet und für Mobilgeräte verwendet und das andere als Hauptmenü angezeigt und dann ausgeblendet, um das Mobilmenü anzuzeigen. Wann immer es um SEO und Spinnen geht, die auf der Website navigieren, bekomme ich das Problem, dass ich doppelte …
Ich leite derzeit alle Nicht-HTTPS-Verbindungen zu HTTPS um und unterstütze TLS v1, TLS v1.1 und TLS v1.2. Ich habe meinen Testserver so konfiguriert, dass nur eine sehr eingeschränkte und sichere Verschlüsselungssuite und TLSv1.2 akzeptiert werden. Bei der Ausführung des SSL Labs-Tests stellte ich fest, dass in der Kompatibilitätstabelle die Crawler …
Ich habe Code gesehen, der Google daran hindert, einen Teil einer Seite zu indizieren: <p>This is a paragraph that will be indexed by Google.</p> <!--googleoff: index--> <p>This is a paragraph that will NOT be indexed by Google.</p> <!--googleon: index> Funktioniert das?
Hier ist einer meiner Kunden, der eine Aktion ausführt, nachdem er sich in seinem Konto angemeldet hat. Das eindeutige Token ist einfach eine verschlüsselte Benutzer-ID + Zeitstempel. 94.254.xxx.xxx - - [02 / Jul / 2011: 22: 25: 46 +0200] GET / some-action / unique-token-123abc HTTP / 1.1 200 410 - …
Ich habe festgestellt, dass die Google Webmaster-Tools viele blockierte Ressourcen auf meiner Website melden. Im Moment sind alle "blockierten Ressourcen" .css, .js und Bilder (.jpg, .png), die ich von Cloudfront CDN aus bediene. Ich habe viel Zeit damit verbracht, zu testen und herauszufinden, warum Google diese Dateien nicht crawlt und …
Nachdem ich eine Reihe von Bots geschrieben und die enormen Mengen an zufälligen Bots gesehen habe, die zufällig eine Site crawlen, frage ich mich als Webmaster, welche Bots es wirklich wert sind, auf eine Site gelassen zu werden. Mein erster Gedanke ist, dass das Zulassen von Bots auf der Website …
Kontext: Wir haben eine Website, die in mehreren Sprachversionen verfügbar ist. Der Inhalt ist jedoch der gleiche. Jede übersetzte Version der Site ist in einer bestimmten Subdomain verfügbar. Auf einigen Seiten <link rel="canonical" />verweisen wir bei Bedarf auf eine kanonische Version in derselben Sprache derselben Seite. Dies ist nur ein …
Ich bin heute in meinen SEO-Nachrichten auf diesen Artikel gestoßen. Es scheint zu implizieren, dass Sie Noindex:zusätzlich zu den Standardanweisungen Disallow:in robots.txt Direktiven verwenden können . Disallow: /page-one.html Noindex: /page-two.html Es scheint, als würde dies verhindern, dass Suchmaschinen Seite eins crawlen und Seite zwei indizieren. Wird diese robots.txt- Direktive von …
Wenn ich Inhalt hinter einem POST-Formular habe (in meinem Fall ein Auswahlfeld), können Googlebot oder andere Suchmaschinenspinnen den Inhalt hinter diesem Formular crawlen? Wenn ich beispielsweise 4 Übersetzungen einer Seite hätte und die Sprachauswahl ein POST-Formular für dieselbe URL wäre, das dann zur sprachspezifischen URL umgeleitet würde, könnte Googlebot dann …
Ich hatte ein paar private Dateien in einem Verzeichnis in meinem Schulordner. Sie können sehen, dass die Dateien vorhanden sind, indem Sie zu myschool.edu/myusername/myfolder gehen. Wenn Sie jedoch versuchen, über myschool.edu/myusername/myfolder/myfile.html auf die Dateien selbst zuzugreifen, wird ein 403-Fehler zurückgegeben. Und doch hat Google es irgendwie geschafft, den Inhalt dieser …
Jetzt hat Google das AJAX-Crawling-Schema abgelehnt . Sie sagen, dass sie sich nicht die Mühe machen sollen, es auf neuen Websites zu implementieren, da es nicht mehr benötigt wird, da Googlebot jetzt kein Problem damit hat, dynamische Inhalte anzusehen. Sollten wir dieser Aussage sofort vertrauen oder uns besser für eine …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.