Group: de.org.ccc · Group Profile · Search for mal umgekehrt archive org crawlen in de.org.ccc
Author: Lukas Graf
Date: Sep 14, 2007 13:41
...: Und jetzt will das jemand crawlen, mit Wget oder Httrack. Das Problem: ...angehen könnte? Oder wo ich sonst mal nachfragen könnte? Statt mit Proxies, ...<file>, falls diese relativ sind. Da archive.org ja netterweise <BASE HREF=...> setzt, kannst du einfach darauf greppen und hast... weil ich nach ein paar schnellen Versuchen das Gefühl habe, archive.org möchte *nicht* gecrawlt werden....
|