Hola underc0ders!
Hace unos meses estaba investigando para comprarme un auto usado asique para divertirme un rato hice un código que hace los siguientes pasos:
1) obtiene los datos de los autos a la venta
2) agrupa los autos en categorías (modelo no supervisado) según las características (si tiene aire acondicionado, asientos de cuero, etc)
3) hace una regresión lineal
Mi idea era encontrar los autos con mayor diferencia entre la predicción del precio del modelo lineal con el precio publicado.
Para que sea realmente útil hay que meterle un poco más de cabeza, pero por ahí sirve si alguien justo quiere ver de comprar un auto y se quiere enroscar un poco.
El código está en este repositorio: https://github.com/matiaschaud/de_ruedas_ws
En el notebook "dev.ipynb"
Configuración
En las primeras celdas podrán hacer las configuraciones necesarias:
(https://drive.google.com/file/d/1wRtAmJoH8Hz6P-Kp-KB3jG4I5AGZnEJh/view?usp=share_link)
Necesitan descargar el driver de chrome para la versión que tengan instalada (chequear en configuración) y luego googlear para descargarlo. Una vez lo tengan deberán setear en DRIVER_DIR donde descargaron el archivo.
Luego OUTPUT_DIR es para setear la ruta donde guardará los CSV con la info scrapeada
Por último un montón de parametros que sirven para filtrar: precio_min, precio_max, kilometraje_max, anio_min, anio_max y brands a scrapear.
Bueno, cualquier duda, avisen y lo vemos.
Saludos!
uh, a ver? este tema siempre me llamo la atencion, pero por "h" o por "b" nunca me puedo poner!! a chusmear se ha dicho!