Ja, manchmal .
Es gibt zwei Dinge, die häufig vorkommen. Ihr Link funktioniert nicht mehr, daher bin ich mir in diesem Fall nicht sicher, ob es sich um ein aktuelles Szenario handelt. Daher fasse ich ihn auf einem anderen Link zusammen.
HTTP-Umleitung
Dies ist, was Sie mit Bit.ly
und anderen Diensten sehen. Sie müssen dann eine HTTP-Umleitungsantwort bereitstellen. Wenn Sie http://bit.ly/oH3410 besuchen , wird zur tatsächlichen URL weitergeleitet. Manchmal leitet eine URL zu einer anderen weiter. Sie können dies beobachten, wenn Sie die URL in http://web-sniffer.net/ eingeben oder wenn Sie verwenden [curl][1] -I http://bit.ly/oH3410
, wird ein 301 zurückgegeben, der auf einen neuen Speicherort verweist.
Um mit der HTTP-Umleitung fertig zu werden, müssen Sie nur eine HTTP-HEAD-Anforderung in einer Schleife ausführen, bis Sie in den 300er-Jahren keine Antworten mehr erhalten (hoffentlich 200). Beachten Sie, dass sie möglicherweise in einer Schleife umgeleitet werden, die niemals endet. Sie können dies mit CURL oder einem beliebigen HTTP-Tool tun.
Downloader-Seite
Dies ist, was die meisten Download-Sites verwenden. Sie klicken auf den Download-Link und gelangen auf eine Seite mit einer Reihe von Anzeigen. In ähnlicher Weise wird "Ihr Download wird in Kürze beginnen" angezeigt. [ Beispiel ]. Mit diesen können Sie versuchen, den tatsächlichen direkten Link von der URL aus zu analysieren. Dies ist jedoch site-spezifisch und wird von den meisten Sites nicht berücksichtigt, um zu verhindern, dass Sie ihn umgehen. Dies erfolgt entweder über ein meta http-equiv="refresh"
Tag in der Kopfzeile oder über JavaScript (am häufigsten). Der JS hat normalerweise einen Header-Fallback.
Es gibt jedoch eine Lösung. Wenn Sie sich die Quelle auf der Download-Seite ansehen, sehen Sie normalerweise ein <meta http-equiv="refresh">
Tag (normalerweise in einem <noscript>
Tag) mit einem Attribut URL
, das auf den tatsächlichen Download verweist. Verwenden Sie also CURL (oder ein anderes HTTP-Tool), um die Seite herunterzuladen, zu analysieren und diesen Wert zu ermitteln. Eine Site kann dies jedoch ausschließen, wenn sie wirklich unangenehm sein soll, sodass Sie JavaScript zum Herunterladen von Dateien benötigen.
Es gibt wahrscheinlich einen JavaScript-Block, der auch auf den Download verweist. Es kann verschleiert oder über eine andere URL verlinkt sein. Ihre Laufleistung kann variieren, wenn Sie versuchen, dies herauszufinden. Es kann auch einen "direkten Link" auf der Seite geben. Sie könnten ein paar Techniken ausprobieren, um das herauszufinden, aber auch dies könnte über JavaScript verschleiert werden oder sogar alles zusammen fehlen.
edit
, um die Abschriftenquelle für meine Vorgehensweise anzuzeigen.