comment
IRC Chat
play_arrow
Este sitio utiliza cookies propias y de terceros. Si continúa navegando consideramos que acepta el uso de cookies. OK Más Información.

15 ultimas noticias de fayerwayer movil

  • 0 Respuestas
  • 1082 Vistas

0 Usuarios y 1 Visitante están viendo este tema.

Desconectado blozzter

  • *
  • Underc0der
  • Mensajes: 106
  • Actividad:
    0%
  • Reputación 0
    • Ver Perfil
    • blozzter-blz
« en: Octubre 17, 2011, 04:40:17 pm »
Esta vez mostraré una de las tantas utilidades que se pueden hacer con los módulos urllib2 y re de Python.

el módulo urllib2 sirve para trabajar con páginas web, obteniendo el código fuente de una web; mientras que re nos permite buscar ciertos patrones en ese código fuente.

tomaremos como ejemplo la web movil de fayerwayer, viendo su código fuente buscamos el modo en que se presentan las noticias, que sería de la forma:

<a class="h2" href="link_de_la_noticia">título_de_la_noticia</a>


por lo tanto la expresión regular para asociar el link y la noticia sería:
 
link, noticia = <a class=\"h2\" href=\"(.*)\">(.*)</a>
 
conociendo esto y el uso de los módulos, hacemos el script que lista las noticias y sus respectivos links:

Código: Python
  1. # rescatando noticias de fayerwayer
  2. # 15 ultimas noticias desde la version movil
  3. # by blozzter || blozzter@hotmail.com
  4.  
  5. import urllib2, re
  6.  
  7. url = "http://m.fayerwayer.com/"
  8. source = urllib2.urlopen(url).read()
  9.  
  10. links = [] # lista donde se almacenarAn los links
  11. news = [] # lista donde se almacenarAn los titulares
  12.  
  13. for linkNew, new in re.findall("<a class=\"h2\" href=\"(.*)\">(.*)</a>\n", source):
  14.     links.append(linkNew) # se agrega nuevo link
  15.     news.append(new) # se agrega nuevo titular
  16.    
  17. for i in range(15):
  18.     print 'titular: ' + news[i]
  19.     print 'link: ' + links[i]
  20.     print '-' * 30 + '\n'


saludos.
¡< blozzter >!

 

¿Te gustó el post? COMPARTILO!



Python V1.45 para el Movil

Iniciado por Snifer

Respuestas: 7
Vistas: 2309
Último mensaje Agosto 29, 2011, 06:25:45 am
por Sensei