Menú

Mostrar Mensajes

Esta sección te permite ver todos los mensajes escritos por este usuario. Ten en cuenta que sólo puedes ver los mensajes escritos en zonas a las que tienes acceso en este momento.

Mostrar Mensajes Menú

Temas - juliianc95

#1
Dudas y pedidos generales / [SOLUCIONADO] Ayuda
Febrero 19, 2014, 07:11:24 PM
Bueno amigos, esta es mi duda.

con una expresion regular extraigo los embed de esta web
No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

pero al insertarlos en mi contenido web, NO SE REPRODUCEN. ninguno. no se por que. aqui dejo una muestra uno de los embed.

Código: html5

<embed width="100%" height="100%" wmode="transparent" allowscriptaccess="always" allowfullscreen="true" type="application/x-shockwave-flash" flashvars="plugins=http://shippuden.tv/proxy.swf&proxy.link=stv*0275d51d90396b65af40275bd706dbd6ee9d13d688ac1fcd615271318e7f83ad8fd06c8f9fafdbc39109f3190d6e126866f13a698380431d472e408861804f9056a66d48967fb2f02b67e023439591a32e409fdea56851b663cb077a59a369a387b96bc6e78adc7bd6f1c6187113f97d&proxy.noloading=false&backcolor=ffffff&screencolor=000000&proxy.image=http://shippuden.tv/poster480.png&stretching=uniform&skin=http://shippuden.tv/skin.zip&controlbar=over&abouttext=Shippuden.tv&aboutlink=http://shippuden.tv&proxy.nocachexml=true&proxy.nocacheswf=true&proxy.reloader=false&proxy.embedid=flashplayer1" src="http://shippuden.tv/player.swf" name="flashplayer1">


NOTA: uso mechanize, para conectarme a esa url, extraigo la informacion con expresiones regulares tengo ese problema, gracias de antemano.
#2
Buenas amigos bueno tengo este codigo en el .htaccess

Código: php

Options +FollowSymLinks
RewriteEngine On


RewriteRule index.php$ index.php?inicio=yes [L]
RewriteRule noticia/page/(.*)$ index.php?paginanoticias=yes&num=$1 [L]
RewriteRule estreno/page/(.*)$ index.php?paginaestrenos=yes&num=$1 [L]
RewriteRule cartelera/page/(.*)$ index.php?paginacartelera=yes&num=$1 [L]
RewriteRule pelicula/page/(.*)$ index.php?paginatodaslaspeliculas=yes&num=$1 [L]
RewriteRule estrenosdelasemana/page/(.*)$ index.php?paginaestrenosdelasemana=yes&num=$1 [L]



RewriteRule cartelera/(.*)/(.*).html$ index.php?vercartelera=yes&id=$1&titulo=$2 [L]
RewriteRule estrenosemanal/(.*)/(.*).html$ index.php?verestrenosdelasemana=yes&id=$1&titulo=$2 [L]
RewriteRule estreno/(.*)/(.*).html$ index.php?verestrenos=yes&id=$1&titulo=$2 [L]
RewriteRule pelicula/(.*)/(.*).html$ index.php?vertodaslaspeliculas=yes&id=$1&titulo=$2 [L]
RewriteRule noticia/(.*)/(.*).html$ index.php?vernoticias=yes&id=$1&titulo=$2 [L]


el problema que me muestra es el siguiente.

solo me muestra el index.php haci le de a cada una de mis pestañas. siempre me muestra ese. si elimino el .htaccess todo se corrige. que podria hacer?

gracias de antemano.
#3
Buenas tardes, tengo una duda es que si se puede ejecutar un archivo .py desde un web hosting, este lo que hace es meterse en un sitio web extraer informacion y insertarla en la base de datos. gracias de antemano.
#4
Buenas amigos tengo un proyecto y quiero ponerle un contador de visitas, quisiera un idea, yo tengo varias pero las intento y nada.

la meta es ponerlo a cada id de la tabla(+1000)

con lo del ranking es las 5 estrellitas quisiera tambien varias idea de como hacerlo.

gracias de antemano.
#5
buenas amigos. bueno tengo mucho tiempo probando con esta expresion regular (si asi se puede llamar) dado que quiero que me extraiga todos los <iframe> que tiene la pagina o todos los videos por decirlo asi.

creo que la pagina esta encryptada. o algo parecido. "de ser asi me ayudarian a desencriptarla? o explicarme como".

No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

Código: python

#!/usr/bin/env python
# Este archivo usa el encoding: utf-8
import re
import mechanize
import cookielib
import anticlon
import MySQLdb
import sys
from unicodedata import normalize
br=mechanize.Browser()
#Se crea la instancia del cookie:
j = cookielib.LWPCookieJar()
#Se define que no se maneja robots:
br.set_handle_robots(False)
#Se define el tiempo de refrescamiento:
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)
#Se define las cabeceras del navegador, en este caso se le está diciendo que el navegador es un firefox desde Linux Debian:
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; es-VE; rv:1.9.0.1)Gecko/2008071615 Debian/6.0 Firefox/9')]

def remover_acentos(txt, codif='utf-8'):
    ''' Devolve cópia de uma str substituindo os caracteres
        acentuados pelos seus equivalentes não acentuados.
   
    ATENÇÃO: carateres gráficos não ASCII e não alfa-numéricos,
    tais como bullets, travessões, aspas assimétricas, etc.
    são simplesmente removidos!
     
    >>> remover_acentos('[ACENTUAÇÃO] ç: áàãâä! éèêë? íìĩîï, óòõôö; úùũûü.')
    '[ACENTUACAO] c: aaaaa! eeee? iiiii, ooooo; uuuuu.'
    '''
    return normalize('NFKD', txt.decode(codif)).encode('ASCII','ignore').replace('\n','')


url="http://www.animeid.tv/peliculas?pag=1"
r=br.open(url)
htmlstring=br.response().read()
#print htmlstring

num=0
lol=0
for num in range(0,2):
    url="http://www.animeid.tv/peliculas?pag="+str(num)
    r=br.open(url)
    htmlstring=br.response().read()
    #print br.title()
    #print br.geturl()
    #print htmlstring 
    #//////////////////////////////////////////////////////////////////////////////////
    # Obtiene los enlaces de todos los listados y los guarda en links
    #//////////////////////////////////////////////////////////////////////////////////
    regex='<article class="item"> <a href="(.+?)"><header>'
    pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
    lista_temp = pattern.findall(htmlstring)
    url="http://www.animeid.tv"
    for u in lista_temp:
        web=url+u
        #print web
        r=br.open(web)
        htmlstring=br.response().read()
        #print htmlstring
        try:
            regex='<hgroup> <h1>(.+?)</h1>'
            pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
            titulo = remover_acentos(pattern.search(htmlstring).group(1))
        except:
            titulo = "-"
        #print titulo
        try:
            regex='<p class="sinopsis">(.+?)</p>'
            pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
            sinopsis = remover_acentos(pattern.search(htmlstring).group(1))
        except:
            sinopsis = "-"
        #print sinopsis
        try:
            regex='<ul class="tags">(.+?)</li></ul>'
            pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
            temp_var = pattern.search(htmlstring).group(1)
            regex='<li><a.+?>(.+?)</a></li>'
            pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
            genero = pattern.findall(temp_var)
            genero = remover_acentos(", ".join(genero))
        except:
            genero = "-"
        #print genero
        try:
            regex='<span class="c">(.+?)</span>'
            pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
            tipodepelicula = remover_acentos(pattern.search(htmlstring).group(1))
        except:
            tipodepelicula = "-"
        #print tipodepelicula
        try:
            regex='<span class="c e1">(.+?)</span>'
            pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
            estadodepelicula = remover_acentos(pattern.search(htmlstring).group(1))
        except:
            estadodepelicula = "-"
        #print estadodepelicula
        try:
            regex='Emitido:</strong> <span class="c">(.+?)</span>'
            pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
            emiciondepelicula = remover_acentos(pattern.search(htmlstring).group(1))
        except:
            emiciondepelicula = "-"
        #print emiciondepelicula
        try:
            regex='Episodios:</strong> <span class="c">(.+?)</span>'
            pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
            episodiosdepelicula = pattern.search(htmlstring).group(1)
        except:
            episodiosdepelicula = "-"
        #print episodiosdepelicula
        try:
            regex='Duración:</strong> <span class="c">(.+?)</span>'
            pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
            duraciondepelicula = pattern.search(htmlstring).group(1)
        except:
            duraciondepelicula = "-"
        #print duraciondepelicula
        #//////////////////////////////////////////////////////////////////////////////////
        # Obtiene los enlaces de todas las peliculas y las guarda en links
        #//////////////////////////////////////////////////////////////////////////////////
        regex='<ul id="listado">(.+?)</ul>'
        pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
        temp_var = pattern.search(htmlstring).group(1)
        regex='<li><a href="(.+?)"><strong>(.+?)</strong> <small class=".+">(.+?)</small></a></li>'
        pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
        temp_var = pattern.findall(temp_var)
        url="http://www.animeid.tv"
        for i in temp_var:
            weblistado= url+i[0]
            #print weblistado
            capitulolistado = remover_acentos(i[1])
            #print capitulolistado
            temp_var = i[2]
            regex='(.*) (.*) (.*)'
            pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
            temp_var2 = pattern.search(temp_var)
            dialistado = temp_var2.group(1)
            meslistado = temp_var2.group(2).replace('Ene','01').replace('Feb','02').replace('Mar','03').replace('Abr','04').replace('May','05').replace('Jun','06').replace('Jul','07').replace('Ago','08').replace('Sep','09').replace('Oct','10').replace('Nov','11').replace('Dic','12')
            aniolistado =  temp_var2.group(3)
            fechalistado = aniolistado + "/" + meslistado + "/" + dialistado
            #print fechalistado
            r=br.open(weblistado)
            htmlstring=br.response().read()
            print htmlstring


hay esta yo uso es mechanize. ese es el codigo.

como podran ver arriba los <iframe>(videos) son varios.

gracias de antemano
#6
Buenas amigos, tengo una duda y la queria compartir con el foro.

Sera posible la creacion de dos sitemap.txt? por que en uno coloco todos los articulos que son mas de(48.000)

y en otro coloco todas las noticias que son mas de(15.000).

de poderse crear mas de dos sitemap.txt como se le llamaria a cada uno?

gracias de antemano. y disculpen las molestias.
#7
Buenas amigos bueno cuando intento grabar una macro en mi mac me dice que no tengo instalado visual basic para aplicaciones. quisiera poder solucionar ese error. para poder hacer una macro.

pues lo necesito para el trabajo, se lo agradeceria. Gracias
#8
Buenas amigos queria preguntarles si es posible ordenar una base de datos segun la fecha.  por ejemplo hoy es 30 de diciembre.

muestra las columnas de el 30 primero las del 29 segundo y haci.

no se si me explico?
yo tengo la fecha en la base de datos como 30/12/2013 pero la mando a ordenar de forma ASC o DESC y nada no me muestra como les explico.

EDIT:
     No uses mayúsculas en el titulo
        Atte: Snifer
#9
buenas amigos bueno mi problema es que tengo un texto insertado en la base de datos con acentos. y al ponerlo en mi pagina php aparecen unos signos negros de interrogacion. se que es codificacion pero no se como resolver. he buscado en la web pero intento y intento y nada. gracias de antemano.
#10
Buenas amigo, enrealidad no se si esto es algo avanzado o facil pero vale la pena destacar que es para aprender algo mas.

tengo la siguiente expresion regular
Citar
Parece una verdadera "inocentada", aunque recordemos que ese día no se celebra el 28 de diciembre en los Estados Unidos. Por lo que habrá que recogerlo. Pero sin duda que suena curiosa la posibilidad de fichar a Denzel Washington para ser Linterna Verde en 'Batman Vs Superman'.

Lo que sumado a la llegada del personaje de Wonder Woman podría suponer un cambio de título para la película dirigida por Zack Snyder. ¿Nos encontramos ante la nueva 'Liga de la Justicia' saliendo directamente después de 'El Hombre de Acero'?

Por lo tanto, si Denzel Wasghinton fuera el candidato para ser Linterna Verde en 'Batman Vs Superman' (o 'La Liga de la Justicia') estaríamos ante el relevo de Ryan Reynolds, quien abandonaría la estela de adaptaciones de DC, puesto que se estaría optando por el tercer Linterna Verde de las líneas argumentales del cómic, John Stewart, en vez de Hal Jordan.

Estaremos atentos a las novedades que nos aguardan con el más que interesante proyecto de 'Batman Vs Superman'. Con su rodaje previsto para principios del próximo año 2014.

lo que quiero es quitarle todos los <a> o todos los hipervinculos que tenga este texto. para poder insertarlo en la base de datos.

gracias de antemano.
#11
buena amigos queria pedirles una ayuda con el efecto del scroll es mas o menos un efecto parecido a este No tienes permitido ver los links. Registrarse o Entrar a mi cuenta cuando bajas el scroll con la rueda el header no se quita. no se como se llama eso pero como siempre saber algo mas nunca esta demas.

bueno enfin lo que quiero es que al bajar el scroll el header quede y no se quite. como se ve en la url dada anteriormente.

gracias de antemano.
#12
Buenas amigos. tengo una duda. soy algo novato en esto pero creo que no esta demas preguntar.

quisiera darle a mi web un efecto como este No tienes permitido ver los links. Registrarse o Entrar a mi cuenta, que al darle click a una noticia aparece la informacion de una vez. sin necesidad de ir a otra web ni cargar nada.

gracias de antemano.
#13
buenas amigos, bueno queria saber si yo puedo cambiar el width y el height de una imagen que esta en una url, por que lo intento y lo intento y nada.

DE NO SER ASI!

podria con mechanize imagenes? o con cualquier otra extension de python?
gracias de antemano.
#14
hola amigos, bueno lo que quiero es saber cual seria la consulta sql para buscar la inicial de la letra.
Tambien como hacer para que no crear 26 paginas. sino una sola. si se puede?
gracias de antemano.
#15
Buenas amigo mi problema es el siguiente. se que en el titulo no me explique mucho. pero en vd no sabia como preguntarles.

tengo el siguiente codigo:

Código: python
try:
            regex = '<span itemprop=\"director\".+?><span itemprop=\"name\">(.+?)<\/span><\/a><\/span>'
            pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
            temp_var = re.search(pattern, htmlstring).group(0)
            regex='<span class="ac.+?>(.+?)</span>'
            pattern = re.compile(regex, re.I | re.DOTALL | re.MULTILINE)
            temp_var2 = pattern.findall(temp_var)
            for director in temp_var2:
                print director


al yo imprimir director me lo da en la pantalla de python. pero al insertarlo en la base de datos me da este error.


Código: python
Traceback (most recent call last):
  File "C:\Python27\BotSensaCine.py", line 346, in <module>
    sql = "INSERT INTO peliculas (poster,titulospain,titulo,anio,duracion,pais,estreno,idioma,director,protagonistas,distribuidora,genero,presupuesto,sinopsi,guionistas,musica,fotografia,trailer1,trailer2,tt1,tt2) VALUES (\"%s\",\"%s\",\"%s\", \"%s\", \"%s\", \"%s\",\"%s\", \"%s\", \"%s\", \"%s\",\"%s\", \"%s\", \"%s\", \"%s\",\"%s\", \"%s\", \"%s\", \"%s\", \"%s\",\"%s\", \"%s\")" %(re.escape(poster),re.escape(titulospain), re.escape(titulo), re.escape(anio), re.escape(duracion), re.escape(pais), re.escape(estreno), re.escape(idioma), re.escape(director), re.escape(protagonistas), re.escape(distribuidora) , re.escape(genero), re.escape(presupuesto), re.escape(sinopsi), re.escape(guionistas), re.escape(musica), re.escape(fotografia),re.escape(trailer1), re.escape(trailer2),re.escape(tt1), re.escape(tt2))
NameError: name 'director' is not defined



gracias de antemano.
#16
buenas amigos, queria saber como hago para insertar los datos al principio de la tabla. Por ejemplo tengo 100 datos introducidos en la tabla. al insertar otro no quiero que sea el 101, sino el 1. y el que estaba en el 100 pase al 101 y asi. no se si me explico? pero creo que el titulo lo dice todo.
#17
Buenas amigo mi pregunta es esta. tengo una base de datos asi:
Citar
id---poster---titulospain---tituloriginal---anio---duracion---pais---estreno---idioma---director---protagonistas   ---distribuidora   ---genero---presupuesto---sinopsi---guionistas---musica---fotografia   ---trailer1---trailer2---tt1---tt2

1---'No tienes permitido ver los links. Registrarse o Entrar a mi cuenta Padrino   ---The Godfather---1972---2h55min   ---20 octubre 1972   ---Ingles, Italiano, Latin---Francis Ford Coppola---Marlon Brando, Al Pacino, James Caan---Paramount Pictures Spain---Crimen, Drama---6 000 000 $---Pelicula ambientada en el Nueva York de 1945. Los ...---Francis Ford Coppola   ---   ---   ---No tienes permitido ver los links. Registrarse o Entrar a mi cuenta   COQvkUmN6H8

son miles de datos insertados en la base de datos.
bueno en el index puse el poster que es la imagen y con un hipervinculo quiero que me mande a los datos de la misma imagen. al yo darle a la imagen me manda al dato de la ultima.

lo que quiero es enlazar cada articulo con su respectiva informacion. como haria? gracias de antemano.
#18
buenas amigos este es mi problema vean:
yo cree un bot que me extrae todas las imagenes de otro sitio web.  esta es la imagen que me extrae o el codigo que extrae:
CitarNo tienes permitido ver los links. Registrarse o Entrar a mi cuenta
cuando lo veo en la base de datos aparece asi:
Citar'No tienes permitido ver los links. Registrarse o Entrar a mi cuenta'
con las contrabarras. gracias de antemano.
#19
buenas amigos. tengo una duda, es como hago un pagination.
en mi web tengo mas de mil archivos en la base de datos la idea es que salga asi

prev,1, 2, 3,4,5,next
la idea es que mientras valla por el dos ya no aparesca el uno ni el 5 sino que valla cambiando solo.
gracias de antemano.
#20

Buenas amigos, tengo una duda sobre expresiones regulares en python esta es mi duda:
Tengo un string que quiero sacar todos los h2 de hay. que metodo tendria que usar findall, search o usar grupos? un ejemplo de como quiero que quede.
Citar
Código: python
[<h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-1628/">
El Padrino
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-211083/">
One Direction: This Is Us
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-182745/">
Intocable
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-132874/">
El caballero oscuro. La leyenda renace
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-24944/">
Gladiator (El gladiador)
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-115362/">
El caballero oscuro
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-27070/">
El Señor de los Anillos: La Comunidad del Anillo
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-10568/">
Forrest Gump
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-9393/">
La lista de Schindler
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-126123/">
Toy Story 3
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-10126/">
Pulp Fiction
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-22092/">
El sexto sentido
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-6641/">
El silencio de los corderos
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-39186/">
El Señor de los Anillos: Las dos torres
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-190918/">
Django desencadenado
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-130440/">
Marvel Los Vengadores
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-13892/">
Seven
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-11736/">
Cadena perpetua
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-39187/">
El Señor de los Anillos: El retorno del Rey
</a>
</h2>, <h2 class="tt_18 d_inline">
<a class="no_underline" title="" href="/peliculas/pelicula-25801/">
Star wars: Episodio IV - Una nueva esperanza (La guerra de las galaxias)
</a>
</h2>]
[/quote]
[size=12pt]Muchas Gracias! de antemano.[/size]
[/size][/font]
#21
Dudas y pedidos generales / Ayuda con Mechanize URGENTE
Noviembre 11, 2013, 12:37:36 AM
buenas amigo tengo tiempo realizando un proyecto en el cual parseo una web de mi uso, que contiene peliculas, trailers los autores y toda la informacion de la misma. para extraer cada informacion lo hago con expresiones regulares pero no se como obtener los links de cada una de ella son aproximadamente 80 paginas y unas 2000 peliculas. bueno necesito obtenerlos de todos el metodo a usar seria un loop for pero todavia me falta. alguien que sepa sobre el tema haber si me ayuda un poco.