[Python] Extraer enlaces e imágenes de un sitio web. - JaAViEr(0x5d)

Iniciado por JaAViEr, Diciembre 08, 2011, 09:17:23 PM

Tema anterior - Siguiente tema

0 Miembros y 1 Visitante están viendo este tema.

Diciembre 08, 2011, 09:17:23 PM Ultima modificación: Marzo 23, 2015, 12:12:43 PM por Expermicid
Hola, buen día.
Voy al grano :P El primer código que les mostraré extrae las imágenes del sitio ingresado.
Mientras que el segundo extraerá los links y el nombre del link.
Código: python

# Autor: JaAViEr (0x5d)
# Twitter: 0x5d
var = urllib.urlopen(raw_input("URL :: > ")).read()
url_imagenes = []
clear = ""
for imagen in re.findall("<img (.*)>",var):
  if "src" in imagen.lower():
    for imagenes in imagen.split():
      if re.findall("src=(.*)",imagenes):
    clear = imagenes[:-1].replace("src=\"","")
    url_imagenes.append(clear.replace("src='",""))
print "Imágenes:"
for salida in url_imagenes:
  print salida

Extractor de links:
Código: python

# Autor: JaAViEr (0x5d)
# Twitter: 0x5d
var = urllib.urlopen(raw_input("URL ::>")).read()
limpiando = ""
enlaces = []
nuevos = []
for url,nombre in re.findall("<a (.*)>(.*)</a>",var):
  if "href" in url.lower():
    for a in url.split():
      if re.findall("href=(.*)",a):
    limpiando = a[:-1].replace("href=\"","")
    enlaces.append("%s -> %s"%(limpiando,nombre))
for i in enlaces:
  if i not in nuevos:
    nuevos.append(i)
    print i

Fuente original : No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

Saludos !
No tienes permitido ver los links. Registrarse o Entrar a mi cuenta