La semana pasada, OpenAI publicó uno de los resultados matemáticos más comentados en décadas: un modelo interno había refutado la conjetura de distancia unitaria de Paul Erdős, un problema abierto desde 1946. El paper tenía 125 páginas, la firma de nueve matemáticos de primer nivel, incluyendo al medallista Fields Tim Gowers, y la validación de la comunidad académica. Era, por cualquier medida, un hito genuino.
Seis días después, Anthropic respondió con algo más difícil de interpretar: su modelo interno Claude Mythos había llegado al mismo resultado. Solo. Sin internet. En un fin de semana. Y en 15 páginas.
El problema que Erdős no pudo resolver
Paul Erdős fue el matemático más prolífico del siglo XX: más de 1,500 papers, más de 500 coautores, y una práctica característica de ofrecer pequeñas recompensas monetarias por soluciones a los problemas que consideraba particularmente difíciles o interesantes. En 1946 formuló una pregunta sobre geometría discreta que parecía elemental: dado un conjunto de n puntos en el plano, ¿cuántos pares pueden estar exactamente a distancia uno entre sí?
Erdős conjeturó que la respuesta era, esencialmente, no muchos más que el propio número de puntos. La mejor cota superior conocida, demostrada por Spencer, Szemerédi y Trotter en 198, ubicaba el máximo en n elevado a 4/3. Pero durante cuarenta años nadie pudo estrechar el corredor entre ese techo y el piso que el propio Erdős conocía desde el principio. Mejorar cualquiera de los dos extremos por un factor arbitrariamente pequeño era un problema conocidamente difícil. El 20 de mayo de 2026, ese problema dejó de estar abierto.
Lo que hizo OpenAI
El modelo de OpenAI invirtió la estrategia clásica. Durante décadas, los matemáticos habían intentado encontrar mejores construcciones fijando un campo numérico y escalando la región de puntos. El modelo, en cambio, mantuvo fija la región y dejó crecer el grado del campo sin límite, una inversión conceptual que nadie había explorado sistemáticamente, y que resultó ser la llave.
La construcción usa torres de cuerpos de clases de Golod-Shafarevich, una herramienta de teoría algebraica de números bien conocida entre especialistas pero que nadie había conectado con problemas de geometría euclidiana en el plano. El resultado fue un documento de 125 páginas que Tim Gowers describió como digno de publicarse en los Annals of Mathematics sin dudarlo.
El paper fue verificado paso a paso por dos matemáticos de OpenAI y respaldado por un paper complementario de 19 páginas firmado por nueve figuras prominentes. La infraestructura de validación fue tan exhaustiva como el resultado mismo.
Lo que hizo Mythos
Levent Alpoge, investigador de Anthropic con doctorado de Princeton bajo la supervisión del medallista Fields Manjul Bhargava, publicó el resultado en X con una franqueza desarmante: después de que OpenAI anunció su resultado, hizo «lo obvio» y le pasó el problema a Mythos durante el fin de semana.
Las condiciones del experimento fueron estrictas. Múltiples instancias de Claude Code trabajaron de forma independiente, sin acceso a internet, eliminando cualquier posibilidad de que el modelo simplemente recuperara la solución publicada por OpenAI. El resultado fue un paper de 15 páginas, «Integral points on norm-one tori and the Erdős unit-distance exponent», que refuta la misma conjetura por un camino completamente distinto.
La construcción de Mythos opera sobre la teoría de unidades de campos de números: define el toro norma-uno de un campo numérico K, proyecta sus puntos enteros al plano mediante una inmersión real, y usa el criterio de Golod-Shafarevich para controlar el discriminante raíz de una torre infinita totalmente real. El teorema de puntos de red de Van der Corput convierte el rango del grupo de unidades en pares de distancia unitaria. La estimación de covolumen la resuelven las cotas de Louboutin y Zimmert.
Lo notable no es solo que Mythos llegara al mismo destino que OpenAI. Es que encontró múltiples caminos similares al de OpenAI y los descartó en favor de uno diferente. Y más notable aún: aunque ya tenía una refutación válida en la mano, el modelo se detuvo antes de dar el paso adicional que habría producido un resultado más fuerte. Según el propio Alpoge, Mythos «no podía creer su propia conclusión» frente a un problema de este calibre.
Más elegante, pero más débil
La comparación entre los dos resultados requiere precisión. El paper de Mythos es más corto y más conciso. El matemático Daniel Litt, de la Universidad de Toronto y uno de los firmantes del paper complementario de OpenAI, evaluó la prueba de Mythos como «ligeramente peor en términos absolutos» que la de OpenAI. Will Sawin, otro de los autores del paper de OpenAI, mejoró posteriormente el resultado original hasta una cota explícita de n elevado a 1.014.
El paper de Mythos no alcanza esa cota. Llega a la misma conclusión cualitativa, la conjetura de Erdős es falsa, pero con un exponente más conservador.
Lo que sí ofrece Mythos es economía argumentativa. Quince páginas contra 125 es una diferencia que cualquier matemático notará. Y el hecho de que el modelo prefiriera su propio camino sobre el de OpenAI, incluso habiéndolo encontrado, sugiere algo sobre cómo razona el sistema: no busca la solución más potente, sino la que considera más natural.
Tres sistemas, una semana, un problema de 80 años
En la misma semana, Google DeepMind anunció que AlphaProof Nexus había resuelto nueve de 353 problemas abiertos de Erdős mediante pruebas formales en Lean, el asistente de verificación matemática. Los tres sistemas usan arquitecturas radicalmente distintas: OpenAI con razonamiento en lenguaje natural, DeepMind con aprendizaje por refuerzo sobre pruebas formales, Anthropic con instancias aisladas de Claude Code.
Los tres llegaron a resultados independientes sobre el mismo corpus de problemas en la misma semana. El jefe de ciencia de alineamiento de Anthropic, Sholto Douglas, lo llamó evidencia de «un overhang serio en descubrimientos».
Mythos sigue sin estar disponible para el público. Anthropic no ha anunciado una fecha de lanzamiento. Lo que sí está disponible es el paper, publicado en el CDN de Anthropic, y la pregunta que deja abierta: si esto es lo que produce un modelo no desplegado operando durante un fin de semana, qué ocurre cuando se le da más tiempo.
La conjetura de Erdős está resuelta. El corredor entre el piso y el techo de Spencer-Szemerédi-Trotter sigue abierto. Ahora hay al menos dos sistemas que podrían intentar cerrarlo.
