Underc0de

Programación Scripting => Python => Mensaje iniciado por: JaAViEr en Diciembre 08, 2011, 09:17:23 PM

Título: [Python] Extraer enlaces e imágenes de un sitio web. - JaAViEr(0x5d)
Publicado por: JaAViEr en Diciembre 08, 2011, 09:17:23 PM
Hola, buen día.
Voy al grano :P El primer código que les mostraré extrae las imágenes del sitio ingresado.
Mientras que el segundo extraerá los links y el nombre del link.
Código (python) [Seleccionar]

# Autor: JaAViEr (0x5d)
# Twitter: 0x5d
var = urllib.urlopen(raw_input("URL :: > ")).read()
url_imagenes = []
clear = ""
for imagen in re.findall("<img (.*)>",var):
  if "src" in imagen.lower():
    for imagenes in imagen.split():
      if re.findall("src=(.*)",imagenes):
    clear = imagenes[:-1].replace("src=\"","")
    url_imagenes.append(clear.replace("src='",""))
print "Imágenes:"
for salida in url_imagenes:
  print salida

Extractor de links:
Código (python) [Seleccionar]

# Autor: JaAViEr (0x5d)
# Twitter: 0x5d
var = urllib.urlopen(raw_input("URL ::>")).read()
limpiando = ""
enlaces = []
nuevos = []
for url,nombre in re.findall("<a (.*)>(.*)</a>",var):
  if "href" in url.lower():
    for a in url.split():
      if re.findall("href=(.*)",a):
    limpiando = a[:-1].replace("href=\"","")
    enlaces.append("%s -> %s"%(limpiando,nombre))
for i in enlaces:
  if i not in nuevos:
    nuevos.append(i)
    print i

Fuente original : http://rootcodes.com/python-obtener-enlaces-e-imagenes-de-una-web/ (http://rootcodes.com/python-obtener-enlaces-e-imagenes-de-una-web/)

Saludos !