Menú

Mostrar Mensajes

Esta sección te permite ver todos los mensajes escritos por este usuario. Ten en cuenta que sólo puedes ver los mensajes escritos en zonas a las que tienes acceso en este momento.

Mostrar Mensajes Menú

Temas - ToracosLabs

#1
Dudas y pedidos generales / Ayuda con un web spider
Julio 16, 2016, 11:50:50 AM
 Saludos amigos programadores, otra vez acudo al foro en busca de vuestra ayuda:

En esta ocasión estoy diseñando un web spider para extraer información de esta página: No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

El problema es que al extraer con php mediante cUrl no se me carga el contenido de "Los estudiantes que vieron este curso también vieron..." que es lo que me interesa. En su lugar aparece "loading...".

¿Hay alguna manera de cargar ese contenido?, ¿o cUrl no puede extraerlo debido a que es javascript?

Gracias y espero respuestas!!!! ;)
#2
 Saludos, me encuentro centrado en la creación de contenido automático en wordpress. Actualmente utilizo la librería cUrl y preg_match en php y lo llamo a dicha función desde un programa escrito en java. Funciona correctamente, pero va demasiado lento, me gustaría acelerar el proceso.

Os pongo un ejemplo:
No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

A partir de este link me gustaría extraer el nombre de todos los cursos, moviéndome a través de la sección: Los estudiantes que vieron este curso también vieron.

Me gustaría saber con que programa lo haríais para que fuera eficiente, y que material (libros, cursos, documentación...) debo mirar para utilizarlo.

Estoy a la espera de respuestas, gracias!
#3
 Saludos, estoy programando un script en php para poder extraer todos los libros de la web No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

como los permalinks tienen los nombres de las entradas:

No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

se me ha ocurrido cambiar el ultimo número que es el ID del libro, ej:

No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

en el navegador funciona pero a la hora de hacer un file_get_contents() no funciona.

Por favor necesito ayuda. Gracias y disculpen las molestias!