recomendaciones web scraping

Iniciado por topgun1964, Junio 15, 2023, 06:32:11 PM

Tema anterior - Siguiente tema

0 Miembros y 2 Visitantes están viendo este tema.

Junio 15, 2023, 06:32:11 PM Ultima modificación: Junio 16, 2023, 03:41:18 PM por AXCESS
he visto diferentes webs que prestan servicios de web scraping o raspado web a unos precios muy elevados,que herramientas me recomendarian para empezar en el mundo del web scraping

Te dejo unas utilidades.

BeautifulSoup: Es una biblioteca de Python utilizada para extraer datos de HTML y XML. Proporciona una interfaz fácil de usar para analizar y navegar por la estructura de un documento web.

Selenium: Es una herramienta de automatización de navegadores que te permite interactuar con páginas web como lo haría un usuario real. Es útil para extraer datos de sitios web que hacen uso extensivo de JavaScript y requieren acciones más complejas, como hacer clic en botones o llenar formularios.

Scrapy: Es un framework de scraping de código abierto para Python. Proporciona una arquitectura robusta y flexible para extraer datos de sitios web de manera eficiente. Scrapy también incluye funcionalidades para el procesamiento y almacenamiento de datos.

Puppeteer: Es una biblioteca de Node.js desarrollada por Google que permite controlar un navegador Chrome o Chromium. Puede ser útil si prefieres utilizar JavaScript en lugar de Python para tu proyecto de web scraping.

Octoparse: Es una herramienta de web scraping visual que no requiere conocimientos de programación. Proporciona una interfaz gráfica para crear rastreadores y extraer datos de sitios web sin necesidad de escribir código.


Por último, te recomiendo que aprendas a manejar python, para que realices tus propios scripts para tus propósitos específicos.


Saludos

Te recomiendo dos cosas, aprender nodejs y Aqua intelij.

Saludos.
- No tienes permitido ver los links. Registrarse o Entrar a mi cuenta - No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

gracias por la info voy a probar estas herramientas