Warum sollten diese als URLs mit unterschiedlicher Pfadkapitalisierung und nachfolgendem Schrägstrich als unterschiedlich behandelt werden?


8

Dies sind alles streng unterschiedliche URLs:

http://www.example.com/page
http://www.example.com/pAge
http://www.example.com/page/
http://www.example.com/paGE/

Ich verstehe, dass es den strengen ISO-Regeln entspricht, aber warum? Wie viele Websites gibt es tatsächlich, die tatsächlich behandelt werden pageund die Sie page/als unterschiedliche URLs besuchen können? Oder tatsächlich Großschreibung verwenden, um Inhalte zu differenzieren? Wenn sie das taten, würde ich ihnen sagen, dass sie es wahrscheinlich falsch machen.

Warum müssen wir unsere Zeit damit verschwenden, diese Regeln einzuhalten? Ist es für Google nicht ganz trivial, das herauszufinden pageund page/sind dieselbe Seite und sollten wahrscheinlich nicht als doppelter Inhalt behandelt werden?

Antworten:


10

Ich verstehe, dass es den strengen ISO-Regeln entspricht, aber warum?

Es gibt verschiedene Betriebssysteme hinter den verschiedenen Servern im Netz, und für einige von ihnen ist ein Verzeichnis oder eine Datei mit dem Namen pagenicht dasselbe wie eines mit dem Namen Page. Das Ergebnis ist , dass diejenigen , wirklich zwei verschiedene Orte sind und nicht einmal unbedingt die gleiche Art von Lage (dir / Seite). Der Webserver ist möglicherweise so konfiguriert, dass die Groß- und Kleinschreibung nicht berücksichtigt wird. Dies können Sie jedoch nicht annehmen. Daher müssen die Regeln Dinge anzunehmen , sie zu Fall kümmern , und wenn sie es nicht tun , dann was auch immer. Realistisch gesehen ist es wahrscheinlich keine gute Idee, sich auf Fallunterschiede zu verlassen , aber die Situation existiert und muss daher berücksichtigt werden, manchmal mit Dingen wie mod_speling .

Wie viele Websites gibt es tatsächlich, die Seite und Seite / als unterschiedliche URLs behandeln, die Sie besuchen können?

Sie sind unterschiedlich. Es ist nur fast immer vor dir verborgen:

  1. Wenn Sie zum example.com/foo/Webserver wechseln, wissen Sie, dass Sie zu einem Verzeichnis wechseln, und suchen dort nach einer Datei, die mit der Datei übereinstimmt, die als Verzeichnisindex erkannt wurde. So landen Sie schließlich example.com/index.htmlzum Beispiel bei.
  2. Wenn Sie zum example.com/fooServer gehen, suchen Sie tatsächlich nach einer Datei im Stammverzeichnis mit dem Namen just foo. Wenn es einen nicht findet, dann überprüft, ob es ein Verzeichnis ist benannt /foound Sie können auf # 1 nach oben.

Was Sie in # 2 als "normales" Verhalten zu lesen scheinen, ist tatsächlich ein Fallback, um einen wahrscheinlichen Fall zu behandeln.
Wie viele Dateinamen ohne Erweiterung verwenden, spielt keine Rolle. Nochmals: echtes Problem; muss berücksichtigt werden.

Wenn sie das taten, würde ich ihnen sagen, dass sie es wahrscheinlich falsch machen.

Das ist eine Meinung.
Sie können es mit verschiedenen praktischen Argumenten über die Groß- und Kleinschreibung und den Umgang mit URLs ohne Erweiterung belegen, mit denen ich nicht unbedingt einverstanden bin, aber tatsächlich wäre es falsch, dies zu sagen.


Hässliches / irritierendes Beispiel dafür, dass man sich nicht mit dem Fall herumschlägt: Es gibt eine Site, die ich verwalte, aber die IT-Mitarbeiter des Kunden verwalten den eigentlichen Server. Sie haben es so konfiguriert, dass alle example.com-Treffer auf www.example.com umgeleitet werden, aber aus irgendeinem Grund hat die Weiterleitung auch alles in Kleinbuchstaben erzwungen (mir wurde dies nicht gesagt). Die Site-Redakteure haben z. CamelCase.jpg. Ein anderer Code, den ich nicht kontrollierte, würde ohne das WWW auf diese Bilder verlinken und alle Arten von albernem Bruch verursachen, bis wir ihn suchten.
'25.


8

Keine Straftat beabsichtigt, aber Groß- und Kleinschreibung ist heute für URLs von entscheidender Bedeutung - sie werden millionenfach am Tag verwendet:

bit.ly

  1. http://bit.ly/ri2LhQ
  2. http://bit.ly/ri2LHq

Zwei sehr unterschiedliche Standorte - nur aufgrund der Groß- und Kleinschreibung möglich


3
Ratet mal, wie ich es gemacht habe? Ich nahm eine meiner URLs aus einem leicht und zufällig geänderten Fall. Ich habe 2 Versuche gebraucht, um eine eindeutige URL zu finden. In Bezug auf Ihr Beispiel, bei dem es relativ offensichtlich ist, dass jede Seite dieselbe Seite sein sollte ... kommt die kanonische oder serverbasierte 301-Umleitung ins Spiel. Sie sollten für die Leistung Ihrer URL-Struktur verantwortlich sein, nicht für das HTTP-Protokoll selbst.
Chris Kluis

5

Dies ist keine Google-Richtlinie, sondern eine Grundregel.

Aus Sicht eines Windows-Benutzers ist es schwierig, Dateinamen zu unterscheiden, bei denen zwischen Groß- und Kleinschreibung unterschieden wird. Unter Unix- / Linux-Systemen sind pAge und page jedoch nicht dieselben Dateien oder Verzeichnisse usw. Webserver.

Der abschließende Schrägstrich ist ein Konfigurationsproblem (oder eine Auswahl). Beachten Sie, dass auf den meisten Webservern der Server eine 30-fache Umleitung auf / page two / page / ausgibt, sodass eine zweite Anforderung an Ihren Server erforderlich ist.

Sie können die Groß- und Kleinschreibung Ihres Webservers unabhängig machen und ihn so konfigurieren, dass Sie Ihren eigenen Regeln entsprechen.

Aber auch hier hat es überhaupt nichts mit Google zu tun

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.