Agentes de IA sin palabras: un paper propone que los modelos colaboren en espacio latente ·

Un grupo de investigadores de la Universidad de Illinois Urbana-Champaign, Stanford, NVIDIA y MIT presentó RecursiveMAS, un sistema multiagente que propone una forma distinta de coordinar modelos de inteligencia artificial: en lugar de hacer que los agentes conversen entre sí mediante texto, los conecta mediante representaciones internas o estados latentes.

La propuesta parte de una limitación conocida en los sistemas multiagente actuales. Cuando varios modelos colaboran, suelen hacerlo como si participaran en una conversación: un agente planifica, otro critica, otro resuelve y otro resume. Cada paso produce texto, que después debe ser leído, interpretado y utilizado por el siguiente agente. Ese mecanismo puede mejorar el razonamiento, pero también consume muchos tokens, aumenta la latencia y vuelve costosa la coordinación.

RecursiveMAS intenta mover esa colaboración a otra capa. El sistema conecta agentes heterogéneos mediante un módulo ligero llamado RecursiveLink, que permite transferir información entre modelos sin generar texto intermedio en cada ronda. Los agentes producen y refinan “pensamientos latentes”, que circulan dentro del sistema hasta que, en la ronda final, uno de ellos decodifica la respuesta textual.

Los investigadores explicaron este proceso como «un marco multiagente recursivo que concibe todo el sistema como un cálculo recursivo unificado en el espacio latente».

El resultado es una arquitectura donde la colaboración ya no ocurre principalmente en lenguaje visible, sino en una red de estados internos que se actualizan de forma recursiva.

De agentes que conversan a agentes conectados

El paper plantea que los modelos recursivos [aquellos que reutilizan varias veces la misma computación para profundizar su razonamiento] pueden extenderse del modelo individual al sistema completo de agentes.

Bajo esa lógica, cada agente deja de funcionar únicamente como un participante de una conversación y empieza a operar como una capa dentro de una arquitectura más amplia. Un modelo puede actuar como planificador, otro como crítico, otro como solucionador, otro como experto de dominio o como agente con herramientas. Pero en lugar de intercambiar mensajes escritos durante todo el proceso, comparten representaciones internas.

Los autores prueban RecursiveMAS en cuatro patrones de colaboración: un esquema secuencial con planificador, crítico y solucionador; una mezcla de especialistas en matemáticas, código y ciencia; una estructura de destilación entre experto y aprendiz; y un sistema deliberativo con un agente reflector y otro capaz de usar herramientas externas, como Python o búsqueda.

La idea central es que la colaboración entre agentes también puede escalar mediante recursión. No solo se profundiza el razonamiento de un modelo aislado, sino la coordinación del sistema entero.

Más precisión, menos tokens

Según los resultados reportados, RecursiveMAS fue evaluado en nueve benchmarks de matemáticas, ciencia, medicina, búsqueda y generación de código. En comparación con sistemas de agentes basados en texto y otros métodos de referencia, el paper afirma que logró una mejora promedio de 8.3% en precisión.

El sistema también reporta ganancias de eficiencia: entre 1.2 y 2.4 veces más velocidad de inferencia y una reducción de uso de tokens de entre 34.6% y 75.6%, dependiendo de la profundidad de recursión.

La explicación es directa: si los agentes no necesitan producir texto intermedio en cada paso, el sistema evita parte del costo asociado a decodificar, transmitir y volver a procesar respuestas escritas. La colaboración ocurre en espacio latente y el texto aparece únicamente al final.

Esa diferencia puede ser relevante para el futuro de los agentes de IA. Muchos sistemas actuales son caros y lentos porque simulan equipos de trabajo completos mediante conversaciones largas entre modelos. RecursiveMAS sugiere que una parte de esa colaboración podría comprimirse en circuitos internos más rápidos.

La eficiencia tiene un costo: menos trazabilidad

El avance, sin embargo, introduce una tensión importante. Los sistemas multiagente basados en texto son ineficientes, pero tienen una ventaja: permiten observar, al menos parcialmente, qué dijo cada agente, qué razonamiento propuso, qué crítica recibió y cómo se modificó la respuesta.

Cuando la colaboración se traslada al espacio latente, esa trazabilidad se reduce. Ya no hay necesariamente una cadena visible de argumentos intermedios, sino una circulación de representaciones internas que pueden mejorar el resultado final, pero que no son directamente legibles para una persona.

En términos prácticos, RecursiveMAS promete una coordinación más rápida y económica. En términos de auditoría, desplaza parte del proceso hacia una capa más difícil de interpretar.

Esto no significa que el sistema sea opaco por completo. Los resultados finales pueden evaluarse, compararse y medirse. Pero la colaboración interna entre agentes deja de parecerse a una conversación revisable y se aproxima más a una computación distribuida entre modelos.

Una señal sobre el futuro de los agentes

El paper no debe leerse como una tecnología lista para reemplazar los sistemas comerciales actuales, sino como una señal de investigación: la siguiente etapa de los agentes podría no consistir en hacerlos hablar más, sino en hacerlos comunicarse menos en lenguaje humano.

Durante los últimos años, gran parte de la imaginación sobre agentes de IA se ha construido alrededor de roles conversacionales: agentes que debaten, se corrigen, se asignan tareas o simulan equipos de trabajo. RecursiveMAS apunta hacia otra dirección: agentes conectados por estados internos, optimizados como un solo sistema y coordinados mediante bucles de refinamiento.

Si esta línea prospera, la colaboración entre modelos podría volverse menos visible para las personas, pero más eficiente para las máquinas.

Esa transición importa porque modifica la forma en que entendemos los sistemas de IA. Ya no se trataría solamente de modelos que responden preguntas o de agentes que intercambian mensajes, sino de arquitecturas donde distintos modelos funcionan como partes de una maquinaria cognitiva integrada.

La pregunta que deja abierta RecursiveMAS no es únicamente si los agentes pueden resolver mejor problemas complejos. También es qué ocurre cuando la colaboración entre inteligencias artificiales deja de pasar por el lenguaje visible y se desplaza hacia una capa interna que los humanos solo pueden observar por sus resultados.

De agentes que conversan a agentes conectados

Más precisión, menos tokens

La eficiencia tiene un costo: menos trazabilidad

Una señal sobre el futuro de los agentes

Entradas relacionadas

Trump plantea que el gobierno de EU tome participación en empresas de IA

Apple libera código postcuántico: la migración contra la amenaza cuántica ya llegó al sistema operativo

Cárcel por compartir deepfakes: Jalisco abre una vía penal contra el periodismo “ilegítimo”

Deja una respuesta Cancelar la respuesta