comment
IRC Chat
play_arrow
Este sitio utiliza cookies propias y de terceros. Si continúa navegando consideramos que acepta el uso de cookies. OK Más Información.

[SOLUCIONADO] Quitar url de una expresion regular

  • 2 Respuestas
  • 1126 Vistas

0 Usuarios y 1 Visitante están viendo este tema.

Desconectado juliianc95

  • *
  • Underc0der
  • Mensajes: 61
  • Actividad:
    0%
  • Reputación 0
    • Ver Perfil
    • Email
« en: Diciembre 28, 2013, 06:58:47 pm »
Buenas amigo, enrealidad no se si esto es algo avanzado o facil pero vale la pena destacar que es para aprender algo mas.

tengo la siguiente expresion regular
Citar
Parece una verdadera "inocentada", aunque recordemos que ese día no se celebra el 28 de diciembre en los Estados Unidos. Por lo que habrá que recogerlo. Pero sin duda que suena curiosa la posibilidad de fichar a Denzel Washington para ser Linterna Verde en 'Batman Vs Superman'.

Lo que sumado a la llegada del personaje de Wonder Woman podría suponer un cambio de título para la película dirigida por Zack Snyder. ¿Nos encontramos ante la nueva 'Liga de la Justicia' saliendo directamente después de 'El Hombre de Acero'?

Por lo tanto, si Denzel Wasghinton fuera el candidato para ser Linterna Verde en 'Batman Vs Superman' (o 'La Liga de la Justicia') estaríamos ante el relevo de Ryan Reynolds, quien abandonaría la estela de adaptaciones de DC, puesto que se estaría optando por el tercer Linterna Verde de las líneas argumentales del cómic, John Stewart, en vez de Hal Jordan.

Estaremos atentos a las novedades que nos aguardan con el más que interesante proyecto de 'Batman Vs Superman'. Con su rodaje previsto para principios del próximo año 2014.

lo que quiero es quitarle todos los <a> o todos los hipervinculos que tenga este texto. para poder insertarlo en la base de datos.

gracias de antemano.
« Última modificación: Julio 25, 2014, 05:20:58 pm por blackdrake »

Desconectado ~ Yoya ~

  • *
  • Underc0der
  • Mensajes: 152
  • Actividad:
    0%
  • Reputación 0
    • Ver Perfil
    • Email
« Respuesta #1 en: Diciembre 28, 2013, 10:41:38 pm »
Si lo vas a parsear utilizando PHP, te recomiendo que no utilizes expresiones regulares para parsear HTML, te dara posibles bugs en el futuro, por experiencia te lo digo. Mejor ocupa una libreria, como esta:

PHP Simple HTML DOM Parser
Mi madre me dijo que estoy destinado a ser pobre toda la vida.
Engineering is the art of balancing the benefits and drawbacks of any approach.

Desconectado juliianc95

  • *
  • Underc0der
  • Mensajes: 61
  • Actividad:
    0%
  • Reputación 0
    • Ver Perfil
    • Email
« Respuesta #2 en: Diciembre 29, 2013, 10:21:58 am »
no yo lo parseo usando python y lo inserto a la base de datos. utilice esto
Citar
def remover_acentos(txt, codif='utf-8'):
    ''' Devolve cópia de uma str substituindo os caracteres
        acentuados pelos seus equivalentes não acentuados.
   
    ATENÇÃO: carateres gráficos não ASCII e não alfa-numéricos,
    tais como bullets, travessões, aspas assimétricas, etc.
    são simplesmente removidos!
     
    >>> remover_acentos('[ACENTUAÇÃO] ç: áàãâä! éèêë? íìĩîï, óòõôö; úùũûü.')
    '[ACENTUACAO] c: aaaaa! eeee? iiiii, ooooo; uuuuu.'
    '''
    return normalize('NFKD', txt.decode(codif)).encode('ASCII','ignore').replace('\n','')
para luego remover los acentos asi.

Código: Python
  1.             try:
  2.                 regex = "<h2>(.+?)</h2></td>"
  3.                 pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
  4.                 contenido = remover_acentos(pattern.search(htmlstring).group(1))
  5.             except:
  6.                 contenido = "-"
  7.  

me funciona en todos los demas bot que he echo pero en este no me agarra. por eso queria saber si se puede codificar desde php por que el texto yo lo tengo ya en la base de datos.

gracias de antemano.

 

¿Te gustó el post? COMPARTILO!



[SOLUCIONADO] ¿Kali Linux o Kali Linux Ligth ?

Iniciado por worq

Respuestas: 2
Vistas: 8409
Último mensaje Noviembre 21, 2017, 12:28:54 pm
por Codig0Bit
[SOLUCIONADO] Multiuploader de imagenes con mysql, hosting de imagenes con mysql

Iniciado por graphixx

Respuestas: 4
Vistas: 2298
Último mensaje Marzo 26, 2013, 05:42:58 pm
por Xt3mP
[SOLUCIONADO] ¿Como publicar un software como software libre?

Iniciado por FuriosoJack

Respuestas: 2
Vistas: 1717
Último mensaje Mayo 23, 2017, 07:24:22 am
por HATI
[SOLUCIONADO] Linux Mint, errores, errores y mas errores...

Iniciado por n1sendev

Respuestas: 12
Vistas: 3206
Último mensaje Noviembre 22, 2017, 06:50:55 am
por RuidosoBSD
[SOLUCIONADO] Ayuda urgente con Virus "Virus.Win32Sality"

Iniciado por Napsters

Respuestas: 6
Vistas: 3569
Último mensaje Junio 11, 2012, 03:38:18 am
por Satyricon