Anthropic documenta cómo la IA potencia ciberataques en etapas avanzadas de intrusión ·

Un análisis de 832 cuentas baneadas entre marzo de 2025 y marzo de 2026 revela que los actores maliciosos aplican inteligencia artificial en las fases más complejas de sus operaciones, y que los marcos de evaluación de amenazas existentes ya no son suficientes.

Anthropic publicó un informe en el que analiza un año de ciberataques habilitados por inteligencia artificial y concluye que los marcos de seguridad actuales, en particular el estándar MITRE ATT&CK, tienen deficiencias estructurales para capturar los patrones de amenaza emergentes.

El estudio examina 832 cuentas suspendidas por actividad cibernética maliciosa entre marzo de 2025 y marzo de 2026, y mapea esos casos contra la base de datos MITRE ATT&CK. Parte de los resultados fueron publicados en el Reporte de Investigaciones de Brechas de Datos 2026 de Verizon (DBIR).

El riesgo se desplaza hacia el interior de los sistemas

El análisis identifica tres conclusiones principales: los actores maliciosos utilizan la IA en etapas posteriores y más complejas de sus operaciones; los ataques se vuelven más autónomos, lo que hace obsoletas las métricas tradicionales de clasificación de riesgo; y el marco MITRE ATT&CK no captura cabalmente las herramientas y actividades que hacen peligrosos a los atacantes habilitados por IA.

La actividad más común fue el uso de IA para escribir malware: 560 de las 832 cuentas estudiadas, el 67.3%, emplearon la IA para ese propósito. Un número menor (54 actores, el 6.5%) la utilizó para actividades más complejas como el movimiento lateral, es decir, la navegación profunda dentro de una red ya comprometida.

El porcentaje de actores clasificados como riesgo medio o alto pasó del 33% en el primer semestre del periodo analizado al 56% en el segundo, un incremento de aproximadamente 1.7 veces.

A lo largo del periodo, el uso de IA se desplazó desde las técnicas de acceso inicial hacia actividades ejecutadas una vez dentro del sistema. El uso de IA para descubrimiento de cuentas, identificar cuentas válidas en un entorno comprometido, creció 8.9%, mientras que el phishing asistido por IA cayó 8.6%.

La habilidad técnica ya no determina el nivel de amenaza

El informe señala que la correlación entre la destreza técnica de un actor y el número de técnicas que emplea prácticamente ha desaparecido: los actores menos capacitados usaron en promedio 16 técnicas distintas, mientras los más sofisticados utilizaron alrededor de 20. Tampoco la plataforma empleada (Claude Code, una API o una interfaz de chat) correlacionó con el nivel de riesgo.

El diferenciador más duradero es el tipo de infraestructura que los atacantes construyen alrededor del modelo: los actores de mayor riesgo diseñan arquitecturas que permiten encadenar etapas del ataque y ejecutarlas con mínima intervención humana.

MITRE ATT&CK, insuficiente ante la autonomía de los agentes

Muchos de los comportamientos que distinguen a los actores de mayor riesgo, como el uso de IA para orquestar pasos secuenciales en la cadena de ataque, tomar decisiones en tiempo real y ejecutar sin intervención humana, no están incluidos como técnicas en el marco MITRE ATT&CK.

Como caso ilustrativo, el informe cita la operación de espionaje cibernético de origen estatal que Anthropic desarticuló en noviembre de 2025, en la que un actor malicioso manipuló Claude Code para intentar infiltrar objetivos en múltiples países con mínima intervención humana. Aunque ese actor empleó 30 técnicas en 13 tácticas, comparable a muchos actores de riesgo medio, el sistema de puntuación de riesgo de Anthropic le asignó la puntuación máxima de 100.

En ese ataque, el modelo actuó como agente autónomo: ejecutó comandos, explotó vulnerabilidades, robó credenciales y tomó decisiones tácticas requiriendo solo intervención humana en momentos puntuales. No existe ningún identificador ATT&CK para ese tipo de orquestación agéntica.

Implicaciones para la defensa

Los hallazgos informaron el desarrollo de salvaguardas integradas en los modelos más capaces de Anthropic, diseñadas para detectar y bloquear actividades como el desarrollo de malware o la exfiltración masiva de datos. La empresa también indicó que está en conversaciones con MITRE para actualizar el marco ATT&CK e incorporar los comportamientos habilitados por IA documentados en el estudio.