Una empresa canadiense compra libros en catalán para entrenar IA y luego los destruye

Una empresa canadiense compra libros en catalán para entrenar IA y luego los destruye

Marçal Font, propietario de la librería de viejo Fènix en Badalona, lleva semanas recibiendo pedidos de una empresa canadiense que le compra ejemplares en catalán, todos de no ficción y sin salida comercial. Lo que le hizo sospechar no fue el primer pedido, sino el segundo. Y luego siete más, con un minuto de diferencia entre ellos, al parecer, comprados por un robot.

No es el único caso. Hay al menos una veintena de librerías de segunda mano en España que han vendido miles de ejemplares a esta misma compañía desde finales de abril, incluyendo tiendas que recibieron pedidos de más de mil libros, muchos descatalogados. El mismo fenómeno se está reportando en Alemania, Estados Unidos, Nueva Zelanda y Australia.

Los títulos no tienen nada de extraordinario: una edición sobre el mundo de los castellers en Granollers en los años 70, manuales técnicos de viticultura, actas de congresos de hace medio siglo, dietarios de la Guerra Civil. Libros de entre cinco y diez euros, prácticamente imposibles de encontrar, sin recorrido comercial. Justo por eso los quieren.

El muro de datos y la solución física

El objetivo, según diversas fuentes consultadas por elDiario.es, que realizó esta investigación, es entrenar modelos de inteligencia artificial antes de destruir los volúmenes y reciclar su papel. La práctica no es nueva pero sí está escalando. En enero, The Washington Post reveló que Anthropic, la empresa detrás del chatbot Claude, había ejecutado un proyecto secreto llamado «Project Panama» con el objetivo declarado internamente de «escanear y destruir todos los libros del mundo». El documento interno añadía: «No queremos que se sepa que estamos trabajando en esto.»

La estrategia responde a un problema estructural del sector: una vez que la IA consumió todo el texto disponible en internet y luego enfrentó demandas millonarias por usar repositorios piratas de libros digitales, las empresas se toparon con lo que los expertos llaman el data wall. Sin textos nuevos, inéditos y extensos, los modelos corren el riesgo de estancarse o retroalimentarse con contenido generado por la propia IA. La solución encontrada fue comprar en librerías de segunda mano de todo el mundo, especialmente ejemplares marginales de no ficción que nadie más digitalizará.

Un juez federal de Estados Unidos ya dictaminó que la práctica es legal porque el uso de los libros es «transformativo», comparando el entrenamiento del algoritmo con enseñar a escribir a estudiantes. El lomo se corta con una máquina hidráulica, las páginas se escanean a alta velocidad y el papel se envía a reciclaje.

La empresa no responde

La compañía que está comprando los libros en España se llama Zoom Books. Formalmente se dedica al reciclaje y la compraventa de libros, pero hasta hace poco tenía publicaciones en su sitio web explicando cómo comprar ejemplares de segunda mano para alimentar algoritmos de IA y destruirlos después, cumpliendo los requisitos legales para hacerlo. Esas publicaciones ya no están disponibles, aunque elDiario.es verificó su contenido consultando tres modelos de IA, que coincidieron en la descripción del contenido eliminado.

Ante las preguntas del periódico, Zoom Books negó colaborar directamente con Anthropic y se limitó a declarar: «No hacemos comentarios sobre nuestros clientes ni sobre nuestros acuerdos comerciales, que están sujetos a acuerdos de confidencialidad.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *