domingo, 1 de febrero de 2009

Manual de wget

Introducción

wget es un estupendo programa que permite automatizar procesos de descarga de un servidor HTTP o FTP. Es de línea de comandos y esta pequeña página hace un repaso de las opciones más usuales.

Opciones más comunes

Para ver las opciones del programa wget:

wget --help

Para mandar esas opciones a un fichero wget.txt:

wget --help > wget.txt

Para ver las opciones de pantalla en pantalla:

wget --help | more

Para descargar un fichero de la dirección http://www.playboy.com/virus.zip:

wget http://www.playboy.com/virus.zip

Para descargar un fichero de la dirección http://www.playboy.com/virus.zip, intentándolo un número indefinido de veces (-t 0), retomando la descarga en la próxima ejecución si se corta la conexión o se para el programa (-c), identificándose como un navegador web normal para evitar ser detectado por algunos servidores (-U "Mozilla") y no identificándose como un robot para tener acceso completo a las páginas (-erobots=off):

wget -t 0 -c -U "Mozilla" -erobots=off http://www.playboy.com/virus.zip

Para descargar completamente una página (-r) y convertir los enlaces para verla localmente (-k):

wget -t 0 -c -U "Mozilla" -erobots=off -r -k http://xxx.unizar.es

Para descargar la lista de enlaces de un fichero urls.txt:

wget -i urls.txt

Para aceptar solamente los ficheros JPG y MPG (-A *.jpg,*.mpg):

wget -t 0 -c -U "Mozilla" -erobots=off -r -k -A *.jpg,*.mpg http://www.fotos_y_videos_guarros.es

Espero que esta lista de opciones algo depravadas dé una idea de las posibilidades.

1

No hay comentarios: