Hola, buen día.
Voy al grano :P El primer código que les mostraré extrae las imágenes del sitio ingresado.
Mientras que el segundo extraerá los links y el nombre del link.
# Autor: JaAViEr (0x5d)
# Twitter: 0x5d
var = urllib.urlopen(raw_input("URL :: > ")).read()
url_imagenes = []
clear = ""
for imagen in re.findall("<img (.*)>",var):
if "src" in imagen.lower():
for imagenes in imagen.split():
if re.findall("src=(.*)",imagenes):
clear = imagenes[:-1].replace("src=\"","")
url_imagenes.append(clear.replace("src='",""))
print "Imágenes:"
for salida in url_imagenes:
print salida
Extractor de links:
# Autor: JaAViEr (0x5d)
# Twitter: 0x5d
var = urllib.urlopen(raw_input("URL ::>")).read()
limpiando = ""
enlaces = []
nuevos = []
for url,nombre in re.findall("<a (.*)>(.*)</a>",var):
if "href" in url.lower():
for a in url.split():
if re.findall("href=(.*)",a):
limpiando = a[:-1].replace("href=\"","")
enlaces.append("%s -> %s"%(limpiando,nombre))
for i in enlaces:
if i not in nuevos:
nuevos.append(i)
print i
Fuente original : http://rootcodes.com/python-obtener-enlaces-e-imagenes-de-una-web/ (http://rootcodes.com/python-obtener-enlaces-e-imagenes-de-una-web/)
Saludos !