[SOLUCIONADO] Quitar url de una expresion regular

Iniciado por juliianc95, Diciembre 28, 2013, 06:58:47 PM

Tema anterior - Siguiente tema

0 Miembros y 1 Visitante están viendo este tema.

Diciembre 28, 2013, 06:58:47 PM Ultima modificación: Julio 25, 2014, 05:20:58 PM por blackdrake
Buenas amigo, enrealidad no se si esto es algo avanzado o facil pero vale la pena destacar que es para aprender algo mas.

tengo la siguiente expresion regular
Citar
Parece una verdadera "inocentada", aunque recordemos que ese día no se celebra el 28 de diciembre en los Estados Unidos. Por lo que habrá que recogerlo. Pero sin duda que suena curiosa la posibilidad de fichar a Denzel Washington para ser Linterna Verde en 'Batman Vs Superman'.

Lo que sumado a la llegada del personaje de Wonder Woman podría suponer un cambio de título para la película dirigida por Zack Snyder. ¿Nos encontramos ante la nueva 'Liga de la Justicia' saliendo directamente después de 'El Hombre de Acero'?

Por lo tanto, si Denzel Wasghinton fuera el candidato para ser Linterna Verde en 'Batman Vs Superman' (o 'La Liga de la Justicia') estaríamos ante el relevo de Ryan Reynolds, quien abandonaría la estela de adaptaciones de DC, puesto que se estaría optando por el tercer Linterna Verde de las líneas argumentales del cómic, John Stewart, en vez de Hal Jordan.

Estaremos atentos a las novedades que nos aguardan con el más que interesante proyecto de 'Batman Vs Superman'. Con su rodaje previsto para principios del próximo año 2014.

lo que quiero es quitarle todos los <a> o todos los hipervinculos que tenga este texto. para poder insertarlo en la base de datos.

gracias de antemano.

Si lo vas a parsear utilizando PHP, te recomiendo que no utilizes expresiones regulares para parsear HTML, te dara posibles bugs en el futuro, por experiencia te lo digo. Mejor ocupa una libreria, como esta:

No tienes permitido ver los links. Registrarse o Entrar a mi cuenta
Mi madre me dijo que estoy destinado a ser pobre toda la vida.
Engineering is the art of balancing the benefits and drawbacks of any approach.

no yo lo parseo usando python y lo inserto a la base de datos. utilice esto
Citar
def remover_acentos(txt, codif='utf-8'):
    ''' Devolve cópia de uma str substituindo os caracteres
        acentuados pelos seus equivalentes não acentuados.
   
    ATENÇÃO: carateres gráficos não ASCII e não alfa-numéricos,
    tais como bullets, travessões, aspas assimétricas, etc.
    são simplesmente removidos!
     
    >>> remover_acentos('[ACENTUAÇÃO] ç: áàãâä! éèêë? íìĩîï, óòõôö; úùũûü.')
    '[ACENTUACAO] c: aaaaa! eeee? iiiii, ooooo; uuuuu.'
    '''
    return normalize('NFKD', txt.decode(codif)).encode('ASCII','ignore').replace('\n','')
para luego remover los acentos asi.

Código: python

            try:
                regex = "<h2>(.+?)</h2></td>"
                pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
                contenido = remover_acentos(pattern.search(htmlstring).group(1))
            except:
                contenido = "-"


me funciona en todos los demas bot que he echo pero en este no me agarra. por eso queria saber si se puede codificar desde php por que el texto yo lo tengo ya en la base de datos.

gracias de antemano.