Underc0de - La Casa de los Informáticos

Foros Generales => Noticias Informáticas => Mensaje iniciado por: AXCESS en Diciembre 14, 2025, 04:43:54 PM

Título: Expertos encontraron una base de datos de 16 TB sin protección
Publicado por: AXCESS en Diciembre 14, 2025, 04:43:54 PM
(https://i.postimg.cc/63sKKfz6/Leak.png) (https://postimg.cc/HJtR45fF)

Una base de datos MongoDB de 16 TB sin protección expuso aproximadamente 4.300 millones de registros profesionales, principalmente datos similares a los de LinkedIn, lo que podría facilitar ataques de ingeniería social a gran escala impulsados por inteligencia artificial.
El investigador Bob Diachenko y nexos.ai descubrieron la base de datos sin protección el 23 de noviembre de 2025, y se aseguró dos días después.

En este momento, es imposible saber quién accedió a ella previamente.

El equipo de Cybernews analizó la base de datos sin protección y encontró nueve colecciones, cuyos nombres probablemente indican el tipo de información que contienen.
A continuación, se muestran las colecciones incluidas en el conjunto de datos:

intent – 2.054.410.607 documentos (604,76 GB)

profiles – 1.135.462.992 documentos (5,85 TB)

unique_profiles – 732.412.172 documentos (5,63 TB)

people – 169.061.357 documentos (3,95 TB)

sitemap – 163.765.524 documentos (20,22 GB)

companies – 17.302.088 documentos (72,9 GB)

company_sitemap – 17.301.617 documentos (3,76 GB)

address_cache – 8.126.667 documentos (26,78 GB)

intent_archive – 2.073.723 documentos (620 MB)

(https://i0.wp.com/securityaffairs.com/wp-content/uploads/2025/12/image-25.png?resize=1536%2C1388&ssl=1)

Al menos tres colecciones expusieron casi dos mil millones de registros personales, incluyendo nombres, correos electrónicos, números de teléfono, enlaces de LinkedIn, puestos de trabajo, empleadores, historial laboral, educación, ubicaciones, habilidades, idiomas y cuentas de redes sociales. El conjunto de datos "unique_profiles" por sí solo contenía más de 732 millones de registros con URL de imágenes. Otra colección, "people", añadía métricas de enriquecimiento e ID de Apollo vinculados al ecosistema de Apollo.io, sin indicios de una brecha de seguridad en Apollo.

"Según nuestros investigadores, todos los registros dentro de una colección específica son únicos. Sin embargo, podría haber duplicados entre diferentes colecciones dentro del conjunto de datos expuesto", informó Cybernews.

"Si bien las diferentes colecciones contienen diferentes conjuntos de información, los investigadores confirmaron que al menos tres de ellas (profiles, unique_profiles y people) contenían información de identificación personal (PII)".

Cybernews informó que es difícil determinar la antigüedad de los datos de LinkedIn. Las marcas de tiempo muestran que los registros se recopilaron o actualizaron en 2025, pero algunos datos pueden ser de hace años, incluyendo posibles extracciones de grandes filtraciones de LinkedIn reivindicadas por ciberdelincuentes en 2021.

La propiedad del conjunto de datos filtrado sigue sin confirmarse.

Los investigadores encontraron indicios que sugieren una empresa de generación de leads, ya que los registros del mapa del sitio vinculaban las rutas "/people" y "/company" a su sitio web. La empresa afirma tener acceso a más de 700 millones de profesionales, una cifra que coincide con la cantidad de registros expuestos en "unique_profiles", y la base de datos dejó de estar disponible un día después de la notificación. Aun así, los investigadores no llegaron a atribuir la filtración a la empresa, señalando que la propia empresa podría haber sido víctima de una extracción de datos.

La filtración es peligrosa porque una cantidad tan masiva de datos estructurados permite ataques dirigidos, incluyendo phishing y fraude del CEO, reconocimiento corporativo y ataques a gran escala impulsados por IA. Con miles de millones de registros, los delincuentes pueden automatizar estafas personalizadas, reducir el tiempo de preparación y centrarse en objetivos de alto valor, incluyendo empleados de empresas de la lista Fortune 500.

"Los modelos de lenguaje grandes (LLM) son capaces de generar mensajes personalizados basados en la información del perfil del usuario. Con un esfuerzo adicional, se pueden enviar decenas de millones de correos electrónicos maliciosos a las víctimas, y solo se necesita un objetivo de alto valor para que toda la operación sea rentable para el atacante", concluye Cybernews.

"Conjuntos de datos tan grandes como este son un objetivo principal para los ciberdelincuentes, ya que constituyen una base sólida para el enriquecimiento de perfiles a partir de otras filtraciones de datos, lo que les permite crear una gran base de datos de información personal que, tras ser enriquecida, podría incluir contraseñas, identificadores de dispositivos, enlaces a otras redes sociales, etc. Este tipo de conjuntos de datos simplifican los ataques de ingeniería social y de robo de credenciales", explicaron nuestros investigadores.

Fuente:
CyberNews
https://cybernews.com/security/database-exposes-billions-records-linkedin-data/

Vía [compendio]:
SecurityAffairs
https://securityaffairs.com/185661/data-breach/experts-found-an-unsecured-16tb-database-containing-4-3b-professional-records.html