Imprimir Página - Anthropic denuncia campañas masivas de destilación ilegal contra Claude

Título: Anthropic denuncia campañas masivas de destilación ilegal contra Claude
Publicado por: Dragora en Febrero 24, 2026, 01:02:56 PM

(https://i.imgur.com/ze9yyBY.jpeg)

La empresa de inteligencia artificial Anthropic anunció que ha identificado "campañas a escala industrial" de destilación ilegal dirigidas contra su modelo insignia, Claude, con el objetivo de extraer capacidades avanzadas para mejorar modelos competidores.

Según la compañía, tres laboratorios de IA con sede en China —DeepSeek, Moonshot AI y MiniMax— habrían generado más de 16 millones de intercambios con Claude utilizando aproximadamente 24.000 cuentas fraudulentas, violando los términos de servicio y las restricciones regionales de acceso.

Anthropic sostiene que el uso de sus servicios está prohibido en determinadas jurisdicciones debido a "riesgos legales, regulatorios y de seguridad", lo que agrava el impacto del incidente.

¿Qué es la destilación de modelos y por qué genera controversia?

La destilación en inteligencia artificial es una técnica legítima mediante la cual un modelo más pequeño se entrena utilizando las salidas generadas por un modelo más potente. Este enfoque permite reducir costes computacionales y crear versiones optimizadas.

Sin embargo, el problema surge cuando competidores utilizan modelos ajenos para acelerar su desarrollo, obteniendo capacidades avanzadas sin asumir los costes de investigación, infraestructura y entrenamiento.

CitarAnthropic afirma que este tipo de destilación ilícita no solo representa una infracción contractual, sino también un riesgo estratégico:

"Los modelos destilados ilícitamente carecen de las salvaguardas necesarias, lo que genera riesgos significativos para la seguridad nacional".

La empresa advierte que las salvaguardas incorporadas en Claude podrían perderse durante el proceso de extracción, permitiendo que capacidades sensibles se repliquen sin controles adecuados.

Riesgos de seguridad nacional y ciberoperaciones ofensivas

Uno de los aspectos más sensibles del informe es la advertencia sobre el uso potencial de estas capacidades en contextos militares o de inteligencia.

Según Anthropic, modelos obtenidos mediante destilación ilícita podrían servir como base para:

Operaciones cibernéticas ofensivas
Campañas de desinformación automatizadas
Vigilancia masiva
Desarrollo de sistemas de inteligencia militar

La preocupación radica en que las protecciones implementadas en modelos estadounidenses podrían eliminarse en versiones replicadas, facilitando usos maliciosos.

Detalles técnicos de las campañas de destilación

Anthropic aseguró que pudo atribuir cada campaña a un laboratorio específico mediante:

Metadatos de solicitudes
Correlación de direcciones IP
Análisis de infraestructura
Patrones de comportamiento anómalos

La compañía detectó que los prompts no seguían patrones de uso normales, sino que estaban diseñados deliberadamente para extraer capacidades concretas.

1. DeepSeek: enfoque en razonamiento y censura

La campaña atribuida a DeepSeek incluyó más de 150.000 intercambios centrados en:

Capacidades de razonamiento avanzado

Evaluaciones basadas en rúbricas

Generación de respuestas alternativas a consultas políticamente sensibles

Se identificaron solicitudes relacionadas con disidentes, liderazgo político y autoritarismo, buscando versiones "seguras contra censura".

2. Moonshot AI: agentes, herramientas y visión por ordenador

La campaña vinculada a Moonshot AI superó los 3,4 millones de intercambios, enfocándose en:

Razonamiento agente
Uso de herramientas
Capacidades de codificación
Desarrollo de agentes informáticos
Visión por ordenador

3. MiniMax: codificación agente a gran escala

La operación más extensa fue atribuida a MiniMax, con más de 13 millones de interacciones centradas en:

Capacidades de codificación avanzada
Uso automatizado de herramientas
Automatización de agentes

Anthropic señaló que el volumen y la estructura de los prompts evidencian una estrategia sistemática de extracción de capacidades.

Infraestructura proxy y arquitectura "Hydra"

Las campañas se apoyaron en servicios comerciales de proxy que revendían acceso a modelos de IA de vanguardia.

Según la empresa, estas redes utilizaban arquitecturas denominadas "clúster hydra", compuestas por:

Miles de cuentas fraudulentas
Rotación constante de credenciales
Distribución masiva del tráfico
Mezcla de tráfico legítimo con actividad maliciosa

En uno de los casos, una sola red gestionaba más de 20.000 cuentas simultáneamente, dificultando la detección.

Cuando una cuenta era suspendida, otra tomaba su lugar, eliminando puntos únicos de fallo y garantizando continuidad operativa.

Medidas adoptadas por Anthropic

Para mitigar la amenaza, Anthropic implementó:

Clasificadores avanzados para detectar patrones de destilación
Sistemas de huellas dactilares conductuales
Refuerzo de verificación en cuentas educativas y de investigación
Salvaguardas adicionales para reducir la utilidad de respuestas en procesos de extracción

Estas medidas buscan proteger la propiedad intelectual del modelo y evitar su replicación no autorizada.

Google también detecta intentos similares contra Gemini

La revelación se produce semanas después de que Google Threat Intelligence Group (GTIG) informara sobre ataques de extracción dirigidos al modelo Gemini.

Según Google, se detectaron más de 100.000 prompts diseñados para extraer capacidades de razonamiento.

CitarLa compañía aclaró que este tipo de ataques no suele afectar a los usuarios finales:

"El riesgo se concentra entre los desarrolladores de modelos y los proveedores de servicios".

Implicaciones para la industria de la inteligencia artificial

La competencia entre laboratorios de IA se intensifica a medida que los modelos avanzan en razonamiento, generación de código y autonomía agente.

La destilación ilícita plantea desafíos clave:

Protección de propiedad intelectual
Seguridad nacional
Integridad de salvaguardas éticas
Competencia tecnológica global

Además, evidencia cómo la infraestructura de proxies y redes distribuidas puede escalar ataques a millones de interacciones sin levantar sospechas inmediatas.

En fin...

El descubrimiento de campañas masivas de destilación ilegal contra Claude marca un punto de inflexión en la protección de modelos de inteligencia artificial avanzada.

Más allá del conflicto comercial, el incidente subraya la necesidad de:

Controles más estrictos en APIs de IA
Monitoreo avanzado de patrones de uso
Cooperación internacional en regulación tecnológica

A medida que la IA se convierte en un activo estratégico global, la defensa frente a la extracción ilícita de modelos será tan importante como la protección frente a ciberataques tradicionales.

La carrera por el liderazgo en IA ya no solo se libra en el entrenamiento de modelos, sino también en la protección de sus capacidades frente a adversarios cada vez más sofisticados.

Fuente: https://thehackernews.com/

Underc0de - La Casa de los Informáticos

Foros Generales => Noticias Informáticas => Mensaje iniciado por: Dragora en Febrero 24, 2026, 01:02:56 PM