Evitando a fadiga com Python

Desde pequeno aprendi com Jaiminho à evitar a fadiga. Faz bem para a saúde.

Foi assim que resolvi desenvolver um script para baixar imagens de sites. Várias vezes gastei meu dedo, clicando com o botão direito do mouse sobre imagens e mais imagens e escolhendo “salvar como”. Agora, com o script, basta apenas informar a url da página com as imagens e todo o trabalho é feito em alguns segundos (ou minutos, dependendo do tamanho da imagem):

import urllib
import re

for img in re.findall("&lt;img .*?src=\"(.+?)\"", urllib.urlopen("http://www.uol.com.br").read()):
    arq_imagem = open(img[img.rfind(&#039;/&#039;) + 1:], &#039;wb&#039;)
    arq_imagem.write(urllib.urlopen(img).read())
    arq_imagem.close()

O legal é que o código acima pode facilmente ser convertido para baixar imagens de toda uma galeria. Por exemplo, imagine um site onde a galeria siga um padrão para urls como este:

www.exemplo.com.br/galerias/0001/imagens.html

Para baixar, por exemplo, as 100 primeiras galerias:

import urllib
import re

for galeria in range(100):
    url = "http://www.exemplo.com.br/galerias/" + ("%04d" % (galeria + 1)) + "/imagens.html"

    for img in re.findall("&lt;img .*?src=\"(.+?)\"", urllib.urlopen(url).read()):
        arq_imagem = open(img[img.rfind(&#039;/&#039;) + 1:], &#039;wb&#039;)
        arq_imagem.write(urllib.urlopen(img).read())
        arq_imagem.close()

    galeria += 1