Ein großes Manko curl
besteht darin, dass immer mehr Webseiten ihren Hauptinhalt von einer JavaScript-AJAX-Antwort malen lassen, die nach der ersten HTTP-Antwort auftritt. curl
greift diesen nachgemalten Inhalt nie auf.
Um diese Arten von Webseiten von der Befehlszeile abzurufen, habe ich mich darauf beschränkt, Skripte in Ruby zu schreiben, die den SeleniumRC dazu bringen, eine Firefox-Instanz zu starten und nach Abschluss dieser AJAX-Aufrufe den Quell-HTML-Code zurückzugeben.
Es wäre viel besser, eine schlankere Befehlszeilenlösung für diese Art von Problem zu haben. Kennt jemand welche?