Inicio > debian, libros, linux > Bajar una página web completa con wget ó httrack

Bajar una página web completa con wget ó httrack


Hace tiempo que estoy haciendo ésto, no solo porque por ahí me quedo sin internet justo en el momento que realmente necesita de ese tutorial que tanto me sirve, sino tambien para bajar libros que están en formato .html, como por ejemplo los Libros de Debian.
En fin, hay dos formas de realizar esta operación, o mejor dicho, yo voy a explicar solo dos formas de realizarlo, una es la que utilizo con frecuencia, pero la otra, que acabo de conocer pinta mejor.

Para ambos casos es recomendable crear la carpeta que va a contener los archivos que estamos descargando y luego ir a esta carpeta recién creada para empesar a realizar nuestra actividad. Lo hacemos desde nuestro gestor de archivos preferido ó como yo desde la consola:


debian:/home/nercof# mkdir nombre_carpeta
debian:/home/nercof# cd nercof@debian:~$ cd nombre_carpeta/

Ahora tenemos todo listo, manos a la obra.

  1. Con httrack

    debian:/home/nercof#apt-get install httrack
    debian:/home/nercof#httrack http://www.pagina_a_bajar
  2. Con wget
    Si no queremos instalar el programa anterior, podemos realizar la misma operación éste comando que ya nos brinda GNU/Linux.

    debian:/home/nercof# wget -rkc http://www.pagina_a_bajar

    -r: recorre recursivamente la página obteniendo toda la información.
    -k: después que termina la descarga, convierte los links del documento a rutas relativas para poder navegar con normalidad.
    -c: continua desde el punto en que quedo la descarga.

Cuando termine la operacion solo abrimos el index en nuestro navegador preferido y listo!.
Ahora no tenemos excusa de que si nos quedamos sin internet no tenemos la forma de seguir estudiando.

Para mas información sobre wget vean el man pages

Categorías:debian, libros, linux
  1. jorge
    noviembre 19, 2007 a las 3:56 am

    está bonito y simple tu tutorial, gracias, pero… podrías poner más opciones de “httrack desde consola”, ¿descarga de forma recursiva?, o sólo la pagian vista=?

    esopo

    chau, y gracias

  2. nercof
    noviembre 19, 2007 a las 1:22 pm

    1. Descarga en forma recursiva automaticamente la página que le estas pasando.
    2. La única opción que eh utilizado con httrack es “i”

    debian:/home/nercof# httrack -i http://www.pagina_a_bajar

    -i: continua desde el punto que fue interrunpida la descarga.

    Tiene infinidad de opciones este comando, con solo
    hacer debian:/home/nercof# man httrack lo vas a
    comprobar.
    Luego me pongo a ver las ortras funcionalidades, y hago un
    recuento de las que mas me interesaron.

    Saludos!

  3. Ivan Silva
    octubre 16, 2008 a las 11:36 am

    Bueno el tuto con wget, me salvaste.
    Gracias. “Ivan Ecuador,,

  4. froylan
    agosto 24, 2009 a las 8:16 pm

    Holas, excelente tutorial!!!!

    una pregunta como pongo pausa o detener la descarga en wget?

    • nercof
      agosto 24, 2009 a las 11:01 pm

      Simplemente haciendo ctrl + c

      y luego wget -c url para continuarlo.

      Podés ver el manual completo aquí

    • febrero 21, 2012 a las 3:51 pm

      Hola que tal, yo uso wget para descargar archivos muy pesados y es una chulada. Alguna vez intenté hacer un espejeo pero algo me salió mal jajajaja y pues agradezco al Necrof por estos breves, pero realmente utiiles detalles.
      Te repito que uso el wget para hacer descargas pesadas y para evitar perder la url o algo así si x alguna razón cerrara la terminal o alguna falla que bote el sistema, yo primero creo un archivo de texto plano con el siguiente contenido:
      wget -c url
      luego le doy permisos de ejecucion y así puedo pausar la descarga y volverla a comenzar con solo ejecutar ese pequeño archivito.
      Saludos!

  1. No trackbacks yet.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: