Underc0de - La Casa de los Informáticos

Foros Generales => Noticias Informáticas => Mensaje iniciado por: Dragora en Febrero 24, 2026, 01:02:56 PM

Título: Anthropic denuncia campañas masivas de destilación ilegal contra Claude
Publicado por: Dragora en Febrero 24, 2026, 01:02:56 PM
(https://i.imgur.com/ze9yyBY.jpeg)

La empresa de inteligencia artificial Anthropic anunció que ha identificado "campañas a escala industrial" de destilación ilegal dirigidas contra su modelo insignia, Claude, con el objetivo de extraer capacidades avanzadas para mejorar modelos competidores.

Según la compañía, tres laboratorios de IA con sede en China —DeepSeek, Moonshot AI y MiniMax— habrían generado más de 16 millones de intercambios con Claude utilizando aproximadamente 24.000 cuentas fraudulentas, violando los términos de servicio y las restricciones regionales de acceso.

Anthropic sostiene que el uso de sus servicios está prohibido en determinadas jurisdicciones debido a "riesgos legales, regulatorios y de seguridad", lo que agrava el impacto del incidente.

¿Qué es la destilación de modelos y por qué genera controversia?

La destilación en inteligencia artificial es una técnica legítima mediante la cual un modelo más pequeño se entrena utilizando las salidas generadas por un modelo más potente. Este enfoque permite reducir costes computacionales y crear versiones optimizadas.

Sin embargo, el problema surge cuando competidores utilizan modelos ajenos para acelerar su desarrollo, obteniendo capacidades avanzadas sin asumir los costes de investigación, infraestructura y entrenamiento.

CitarAnthropic afirma que este tipo de destilación ilícita no solo representa una infracción contractual, sino también un riesgo estratégico:

"Los modelos destilados ilícitamente carecen de las salvaguardas necesarias, lo que genera riesgos significativos para la seguridad nacional".

La empresa advierte que las salvaguardas incorporadas en Claude podrían perderse durante el proceso de extracción, permitiendo que capacidades sensibles se repliquen sin controles adecuados.

Riesgos de seguridad nacional y ciberoperaciones ofensivas

Uno de los aspectos más sensibles del informe es la advertencia sobre el uso potencial de estas capacidades en contextos militares o de inteligencia.

Según Anthropic, modelos obtenidos mediante destilación ilícita podrían servir como base para:


La preocupación radica en que las protecciones implementadas en modelos estadounidenses podrían eliminarse en versiones replicadas, facilitando usos maliciosos.

Detalles técnicos de las campañas de destilación

Anthropic aseguró que pudo atribuir cada campaña a un laboratorio específico mediante:


La compañía detectó que los prompts no seguían patrones de uso normales, sino que estaban diseñados deliberadamente para extraer capacidades concretas.

1. DeepSeek: enfoque en razonamiento y censura

La campaña atribuida a DeepSeek incluyó más de 150.000 intercambios centrados en:

Capacidades de razonamiento avanzado

Evaluaciones basadas en rúbricas

Generación de respuestas alternativas a consultas políticamente sensibles

Se identificaron solicitudes relacionadas con disidentes, liderazgo político y autoritarismo, buscando versiones "seguras contra censura".

2. Moonshot AI: agentes, herramientas y visión por ordenador

La campaña vinculada a Moonshot AI superó los 3,4 millones de intercambios, enfocándose en:


3. MiniMax: codificación agente a gran escala

La operación más extensa fue atribuida a MiniMax, con más de 13 millones de interacciones centradas en:


Anthropic señaló que el volumen y la estructura de los prompts evidencian una estrategia sistemática de extracción de capacidades.

Infraestructura proxy y arquitectura "Hydra"

Las campañas se apoyaron en servicios comerciales de proxy que revendían acceso a modelos de IA de vanguardia.

Según la empresa, estas redes utilizaban arquitecturas denominadas "clúster hydra", compuestas por:


En uno de los casos, una sola red gestionaba más de 20.000 cuentas simultáneamente, dificultando la detección.

Cuando una cuenta era suspendida, otra tomaba su lugar, eliminando puntos únicos de fallo y garantizando continuidad operativa.

Medidas adoptadas por Anthropic

Para mitigar la amenaza, Anthropic implementó:


Estas medidas buscan proteger la propiedad intelectual del modelo y evitar su replicación no autorizada.

Google también detecta intentos similares contra Gemini

La revelación se produce semanas después de que Google Threat Intelligence Group (GTIG) informara sobre ataques de extracción dirigidos al modelo Gemini.

Según Google, se detectaron más de 100.000 prompts diseñados para extraer capacidades de razonamiento.

CitarLa compañía aclaró que este tipo de ataques no suele afectar a los usuarios finales:

"El riesgo se concentra entre los desarrolladores de modelos y los proveedores de servicios".

Implicaciones para la industria de la inteligencia artificial

La competencia entre laboratorios de IA se intensifica a medida que los modelos avanzan en razonamiento, generación de código y autonomía agente.

La destilación ilícita plantea desafíos clave:


Además, evidencia cómo la infraestructura de proxies y redes distribuidas puede escalar ataques a millones de interacciones sin levantar sospechas inmediatas.

En fin...

El descubrimiento de campañas masivas de destilación ilegal contra Claude marca un punto de inflexión en la protección de modelos de inteligencia artificial avanzada.

Más allá del conflicto comercial, el incidente subraya la necesidad de:


A medida que la IA se convierte en un activo estratégico global, la defensa frente a la extracción ilícita de modelos será tan importante como la protección frente a ciberataques tradicionales.

La carrera por el liderazgo en IA ya no solo se libra en el entrenamiento de modelos, sino también en la protección de sus capacidades frente a adversarios cada vez más sofisticados.

Fuente: https://thehackernews.com/