Anthropic revela que Claude ya redacta más del 80% del código de producción y advierte que podría diseñar a su sucesor de manera autónoma ·

Anthropic Institute publicó un análisis en el que divulga datos internos sobre el grado de automatización alcanzado en sus propios procesos de desarrollo, y advierte que la capacidad de una IA para diseñar autónomamente a su sucesora, denominada automejoramiento recursivo, podría materializarse antes de que las instituciones estén preparadas para ello.

El informe, titulado When AI builds itself, presenta evidencia de benchmarks públicos y datos no publicados previamente dentro de la compañía.

Código escrito por IA

Al cierre de mayo de 2026, más del 80% del código incorporado a la base de producción de Anthropic fue generado por Claude. Antes del lanzamiento de Claude Code en febrero de 2025, esa cifra se ubicaba en el rango de un solo dígito.

El volumen de código que cada ingeniero incorpora al sistema se multiplicó ocho veces en el segundo trimestre de 2026 respecto al período 2021-2024. La compañía atribuye la aceleración a dos inflexiones: el momento en que Claude comenzó a ejecutar código en lugar de solo sugerirlo, y el punto en que los modelos empezaron a operar de forma autónoma en horizontes temporales extendidos.

Capacidades de investigación

En tareas abiertas, las de mayor complejidad, sin especificación previa del método, la tasa de éxito de Claude alcanzó el 76% en mayo de 2026, un incremento de 50 puntos porcentuales en seis meses.

En un experimento de optimización de código repetido en cada lanzamiento de modelo, Claude Opus 4 promedió una aceleración de tres veces sobre el código inicial en mayo de 2025; Claude Mythos Preview alcanzó 52 veces en abril de 2026. Un investigador humano calificado requiere entre cuatro y ocho horas para lograr cuatro veces de mejora en la misma tarea.

En abril de 2026, Anthropic publicó la primera demostración de Claude ejecutando un proyecto de investigación de extremo a extremo. Agentes basados en Claude abordaron un problema abierto de seguridad en IA y recuperaron el 97% del margen de mejora posible, frente al 23% logrado por dos investigadores humanos en una semana. El costo en cómputo fue de aproximadamente 18,000 dólares.

Tres escenarios posibles

El informe proyecta tres futuros. En el primero, la curva exponencial se aplana antes de que los sistemas alcancen autonomía plena en investigación. En el segundo, las ganancias de eficiencia continúan pero los humanos conservan la dirección estratégica, lo que permitiría que organizaciones de 100 personas realicen el trabajo de 10,000. En el tercero, los sistemas de IA adquieren capacidad para diseñar y refinar sus propios sucesores, transfiriendo el control del ritmo de desarrollo a la disponibilidad de cómputo.

Postura sobre una pausa

Anthropic señala que una desaceleración global del desarrollo sería deseable si pudiera implementarse de forma efectiva, pero advierte que una pausa unilateral solo cambiaría quién encabeza la carrera sin generar la deliberación más amplia que falta. La compañía condicionó su disposición a pausar a que otros desarrolladores en o cerca de la frontera tecnológica hicieran lo mismo de manera verificable.

El reporte concluye que Anthropic organizará conversaciones con tomadores de decisiones, investigadores, sociedad civil y otras empresas de IA en los próximos meses para abordar las preguntas que plantea el documento, y publicará los resultados.