arXiv advierte sanciones de hasta un año por papers con errores no revisados de IA

arXiv advierte sanciones de hasta un año por papers con errores no revisados de IA

La plataforma de preprints endurece su postura frente a artículos generados con modelos de lenguaje que incluyan referencias falsas, errores evidentes o señales de que los autores no verificaron el contenido.

arXiv, uno de los repositorios de preprints científicos más importantes del mundo, endureció su advertencia contra el envío de artículos académicos que contengan errores generados por inteligencia artificial sin revisión humana.

La señal vino de Thomas G. Dietterich, profesor emérito de la Universidad Estatal de Oregon, ex presidente de AAAI y figura vinculada a la moderación de arXiv en aprendizaje automático y computación. Dietterich publicó en X que el Código de Conducta de arXiv establece que, al firmar un artículo, cada autor asume plena responsabilidad por todo su contenido, sin importar cómo haya sido generado.

El mensaje apunta directamente al uso de herramientas generativas. Según la advertencia difundida por Dietterich, si una herramienta de IA produce lenguaje inapropiado, contenido plagiado, sesgos, errores, referencias incorrectas o contenido engañoso, y ese resultado aparece dentro de un trabajo científico, la responsabilidad recae en los autores.

La parte más dura de la postura es la sanción: si una entrega contiene evidencia “incontrovertible” de que los autores no revisaron los resultados generados por un modelo de lenguaje, arXiv puede considerar que no se puede confiar en nada del artículo. La penalización mencionada es una prohibición de enviar trabajos durante un año, seguida por el requisito de que futuras entregas hayan sido aceptadas primero en una sede revisada por pares.

El problema ya no es usar IA, sino no verificarla

La advertencia no equivale a una prohibición total del uso de inteligencia artificial en la escritura científica. El punto central es otro: arXiv está marcando una línea entre usar herramientas de IA como apoyo y delegar en ellas la producción de contenido académico sin revisión rigurosa.

El caso más evidente son las referencias inventadas, uno de los problemas más conocidos de los modelos de lenguaje. Cuando un sistema genera una cita falsa, un artículo inexistente o una afirmación que parece académica pero no tiene respaldo, el error puede viajar dentro del circuito científico como si fuera conocimiento verificado.

La postura de arXiv busca cerrar esa puerta. Si un paper llega con citas alucinadas, resultados inventados, fragmentos de texto generados sin control o frases que delatan que el autor copió directamente una respuesta de IA, el problema deja de ser una falta menor de edición: se convierte en una señal de que el trabajo completo pudo no haber sido revisado.

En otras palabras, arXiv parece estar diciendo algo muy simple: la IA puede ayudar, pero no puede reemplazar la responsabilidad autoral.

Una respuesta al “AI slop” académico

La advertencia llega después de meses de preocupación por el crecimiento de contenido académico de baja calidad generado o asistido por modelos de lenguaje. En noviembre de 2025, Nature reportó que arXiv dejaría de aceptar artículos de revisión o de posición en ciencias de la computación, salvo cuando ya hubieran sido aceptados por una revista o conferencia revisada por pares. La medida buscaba responder a una ola de textos de baja calidad, muchos aparentemente generados con IA.

Ese antecedente ayuda a entender la nueva advertencia. arXiv no solo enfrenta el reto técnico de detectar contenido generado por IA, sino un problema de confianza: su valor depende de que los investigadores puedan acceder rápidamente a trabajos nuevos sin que el repositorio se llene de documentos fabricados, mal verificados o imposibles de auditar.

La tensión es especialmente fuerte porque arXiv no funciona como una revista científica tradicional. Sus trabajos no pasan por revisión por pares antes de aparecer en línea. Su papel histórico ha sido acelerar la circulación del conocimiento, no sustituir los filtros de validación científica posteriores.

Pero la IA generativa altera ese equilibrio. Antes, producir un mal paper requería tiempo. Ahora, un modelo puede fabricar en minutos un texto con formato académico, referencias aparentemente serias y una estructura convincente. El costo de producir ruido bajó drásticamente.

El autor sigue siendo el responsable

La advertencia también toca un punto cultural: la autoría científica no puede diluirse detrás de una herramienta. Si un investigador firma un artículo, no puede después justificar errores graves diciendo que los produjo ChatGPT, Claude, Gemini u otro modelo.

Este criterio ya estaba presente en políticas previas sobre IA generativa: los autores deben reportar usos significativos de herramientas sofisticadas, y siguen siendo responsables de errores, plagio, referencias incorrectas o contenido engañoso incluido en sus trabajos.

La diferencia es que ahora aparece una consecuencia disciplinaria más clara. La sanción de un año convierte la verificación de IA en una obligación práctica: no basta con confiar en que el texto “suena académico”; hay que comprobar citas, resultados, afirmaciones, datos, figuras y código.

Para la investigación científica, esto marca un cambio importante. La IA puede acelerar borradores, mejorar estilo o ayudar a organizar literatura. Pero si se usa sin controles, también puede introducir basura epistémica dentro del archivo científico.

Una frontera nueva para la publicación académica

La decisión también abre preguntas complicadas. ¿Cómo distinguir un error humano de un error generado por IA? ¿Qué cuenta como evidencia incontrovertible de falta de revisión? ¿Hasta dónde debe llegar la moderación de un repositorio abierto? ¿Y qué pasa con autores de países o instituciones con menos apoyo editorial, que usan IA para corregir idioma pero sí verifican su contenido?

Estas preguntas importan porque el riesgo no está solo en castigar “papers basura”, sino en construir reglas que no terminen penalizando usos legítimos de herramientas lingüísticas.

Aun así, el mensaje de fondo es claro: la ciencia no puede delegar su responsabilidad en una máquina. En un ecosistema donde los modelos de lenguaje pueden producir papers enteros, bibliografías falsas y resultados convincentes pero inexistentes, los repositorios científicos empiezan a tratar la falta de verificación como una amenaza directa a la confianza académica.

arXiv no está diciendo únicamente “no uses IA”. Está diciendo algo más duro para la era generativa: si firmas un paper, también firmas sus alucinaciones.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *