La inteligencia artificial suele narrarse como una irrupción. Se la presenta como una tecnología radicalmente nueva, nacida de la computación avanzada, del aprendizaje automático y de la escala inédita de los datos. Sin embargo, esa imagen de novedad absoluta oculta una genealogía más larga. Antes de convertirse en una maquinaria estadística capaz de producir texto e imagen, la IA heredó operaciones, materiales y hábitos de tecnologías anteriores. En ella sobreviven, transformadas, lógicas de composición que ya estaban presentes en la imprenta, en la fotografía y en las distintas industrias que aprendieron a organizar signos, superficies y haces de luz para volverlos culturalmente legibles.
La historia de la imagen técnica puede leerse, en ese sentido, como una historia de capas. La fotografía nunca fue una simple captura transparente de la realidad: desde sus primeras formulaciones dependió de dispositivos ópticos, emulsiones fotosensibles, tiempos de exposición, procesos químicos y, más tarde, sensores electrónicos y sistemas de procesamiento digital que traducían la luz en una superficie visible. Cada una de esas mediaciones introdujo una reinterpretación del mundo. La profundidad, la temperatura de color, las sombras, el contraste o el volumen nunca llegaron a la imagen de manera pura, sino ya filtrados por una tecnología. La inteligencia artificial no rompe del todo con esa tradición. La prolonga y la desplaza. Sus imágenes ya no se organizan solo en capas materiales o electrónicas, sino en capas latentes, estadísticas, donde la imagen deja de revelarse a partir de una inscripción luminosa del mundo y comienza a sintetizarse desde patrones previos de visibilidad.
Durante más de un siglo aprendimos a depositar confianza en imágenes cuya técnica comprendíamos solo de manera parcial. La fotografía educó una forma de ver y de creer: nos habituó a tomar como verosímil una superficie bidimensional producida por dispositivos que no reproducían la realidad tal cual, sino que la traducían mediante reglas ópticas, químicas y electrónicas. Esa confianza no surgió porque la imagen fuera transparente, sino porque adquirimos una alfabetización visual específica, suficiente para convivir con ella, pero no siempre para desmontar críticamente sus mediaciones. La irrupción de la IA vuelve visible ese desfase: produce imágenes que conservan la apariencia de congruencia fotográfica, aunque a menudo reconstruyan de manera defectuosa la luz, las sombras, los reflejos o la continuidad material de las formas.
Ese problema se vuelve aún más complejo cuando se recuerda que la fotografía no fue solo una técnica de representación, sino también una práctica social. Como advirtió Bourdieu (1965), la práctica fotográfica funcionó durante décadas como un ritual ordinario de consagración de momentos, una manufactura doméstica de emblemas que reforzaba pertenencias, jerarquías y formas de reconocimiento. No aprendimos solo a mirar imágenes: aprendimos a vivir con ellas, a usarlas como prueba, recuerdo, prestigio, duelo, celebración o evidencia de una experiencia compartida. La IA entra en ese régimen visual no desde el vacío, sino desde un archivo saturado de esas convenciones. Por eso su potencia no radica únicamente en imitar formas, sino en reactivar funciones sociales de la imagen ya sedimentadas históricamente.
I. La imagen por capas
La imagen nunca fue plana. Mucho antes de que la inteligencia artificial introdujera sus modelos generativos, la fotografía ya trabajaba mediante estratos de mediación que separaban a la imagen de una supuesta transparencia inmediata del mundo. La cámara no reproducía la realidad tal como aparecía ante el ojo desnudo: la reorganizaba. La óptica encuadraba, comprimía o expandía el espacio; la lente alteraba proporciones y profundidades; la película fotosensible registraba la luz según sus propias limitaciones materiales; el revelado decidía densidades, contrastes y matices. Incluso en su momento más “analógico”, la imagen fotográfica era ya el resultado de una cadena de operaciones. Ver una fotografía nunca fue ver simplemente lo real: fue ver una realidad técnicamente traducida.
Esta condición estratificada no desapareció con la llegada de la imagen digital. Solo cambió de régimen. Allí donde antes intervenían emulsiones, químicos y papeles sensibles, comenzaron a actuar sensores, canales de color, algoritmos de corrección, interpolaciones y compresiones. La luz dejó de inscribirse en una superficie química para ser convertida en señal, y la señal en imagen procesada. La promesa de fidelidad que acompañó a lo digital no eliminó la mediación, sino que la volvió más profunda y menos visible para el usuario común. Si la fotografía analógica imponía una distancia material entre el mundo y su imagen, la fotografía digital añadió una capa computacional que no hacía más transparente la realidad, sino más opaco el proceso por el cual la imagen llegaba a parecerse a ella.
La inteligencia artificial prolonga esta historia, pero desplaza todavía más el lugar donde ocurre la composición. En la imagen generada por IA ya no se trata únicamente de registrar la luz ni de traducirla en información digital, sino de sintetizar una imagen a partir de relaciones estadísticas entre formas previamente aprendidas. Lo que antes era una secuencia de mediaciones materiales o electrónicas se convierte ahora en una arquitectura latente. La imagen no emerge de un referente situado frente a la cámara, sino de un espacio de correlaciones, embeddings y patrones donde millones de imágenes anteriores han sido descompuestas en atributos recombinables. La capa ya no es solamente óptica ni electrónica: es matemática.
Esto no significa que la IA haya abandonado la tradición fotográfica. Más bien la radicaliza. La fotografía ya había instaurado una cultura de la imagen técnicamente construida; la IA hereda esa lógica y la empuja hacia un punto en el que la imagen puede conservar la apariencia de una inscripción del mundo sin necesitar ya haber pasado por él. En este sentido, la novedad no consiste en que la imagen se haya vuelto artificial, porque en cierta forma siempre lo fue, sino en que ahora la artificialidad se desplaza desde la superficie visible hacia una profundidad invisible de cálculo. Lo que antes se revelaba, ahora se sintetiza. Lo que antes dependía de la interacción entre luz y materia, ahora depende también de una operación estadística capaz de reconstruir la verosimilitud sin necesidad de experiencia directa.
Leer esta transformación como una historia de capas permite salir de una falsa oposición entre fotografía “real” e imagen de IA “falsa”. La cuestión no pasa por decidir en qué momento la imagen perdió su vínculo con la realidad, como si antes hubiera gozado de una pureza originaria. Pasa, más bien, por comprender que cada época organiza de manera distinta la distancia entre el mundo y su representación. La emulsión química, el sensor digital y el espacio latente no son técnicas equivalentes, pero sí participan de una misma historia: la historia de cómo la cultura visual moderna ha producido imágenes cada vez más complejas mediante mediaciones cada vez más densas. La IA no inaugura desde cero esa condición; la hace más extrema, más opaca y, por ello mismo, más difícil de leer.
II. La confianza aprendida
La crisis contemporánea de la imagen no puede entenderse solo como un problema técnico. No basta con decir que la inteligencia artificial produce imágenes falsas o que ha perfeccionado la capacidad de simular escenas inexistentes. Antes de que los modelos generativos aprendieran a fabricar rostros, paisajes o situaciones plausibles, la cultura visual moderna ya había aprendido a confiar en imágenes técnicamente mediadas. La cuestión decisiva no es, por tanto, que la IA haya introducido de pronto el artificio en la imagen, sino que ha irrumpido en una cultura que desde hace más de un siglo depositaba en las imágenes una confianza adquirida, aunque nunca del todo examinada.
Esa confianza fue histórica antes que natural. La fotografía no se impuso porque reprodujera el mundo de manera pura, sino porque logró consolidar la impresión de que mantenía con él una relación suficiente de contigüidad material. Incluso cuando el observador no comprendía del todo los mecanismos ópticos, químicos o electrónicos que intervenían en la producción de la imagen, aprendía a tratarla como una superficie digna de crédito. La cámara deformaba la perspectiva, el lente comprimía o expandía el espacio, la emulsión reinterpretaba la luz, el sensor reordenaba la información cromática, y aun así la imagen seguía siendo leída como una forma plausible de presencia. La confianza visual, entonces, no surgió de la transparencia del medio, sino de la estabilización cultural de sus mediaciones.
En este punto, la alfabetización visual de la modernidad aparece como una formación ambigua. Por un lado, desarrolló competencias prácticas para usar, conservar, compartir y reconocer imágenes en la vida cotidiana. Por otro, no siempre produjo herramientas críticas equivalentes para desmontar la técnica que las volvía posibles. A diferencia de la tradición textual, que atravesó largos procesos de escolarización, comentario, filología e interpretación, la lectura de imágenes técnicas se expandió de manera más desigual. La modernidad se volvió intensamente visual sin que eso implicara necesariamente una pedagogía visual del mismo alcance que la alfabetización letrada. Aprendimos a convivir con fotografías, pero no siempre a leerlas en la complejidad de sus mediaciones.
La inteligencia artificial se inserta justamente en esa fisura. Sus imágenes no resultan creíbles porque reproduzcan de manera perfecta la lógica de la luz, la sombra o la materialidad del mundo, sino porque se apoyan en una memoria visual previamente sedimentada por la fotografía, el cine, la publicidad y la imagen digital. La IA puede equivocarse en la dirección de una sombra, en la continuidad de un reflejo, en la densidad de una textura o en la anatomía de una mano, y aun así producir una impresión general de coherencia. Lo decisivo es que el observador no confronta esa imagen con la realidad inmediata, sino con un archivo previo de imágenes plausibles que ya ha aprendido a aceptar como parte de la experiencia visual ordinaria. La verosimilitud deja entonces de depender exclusivamente de la fidelidad al mundo y pasa a depender también de la congruencia con una cultura visual históricamente aprendida.
Esto ayuda a comprender por qué la posverdad visual no comienza estrictamente con la IA. Ya antes existían imágenes técnicamente manipuladas que circulaban como evidencia, prueba o maravilla. Sontag (1977) advirtió que la fotografía no era un acto neutral de registro, sino una forma de apropiación del mundo y de organización de la experiencia a través de imágenes. Lo que la inteligencia artificial modifica no es la existencia de esa mediación, sino su escala, su velocidad y su opacidad. La imagen ya no necesita conservar una relación física con el acontecimiento para mantener sus efectos de verdad. Puede carecer por completo de referente y seguir operando socialmente como si lo tuviera. En ese desplazamiento, la vieja confianza fotográfica no desaparece: se transforma en un hábito de credulidad visual que encuentra en la IA un nuevo soporte técnico.
El problema, por tanto, no es solamente que ahora puedan fabricarse imágenes falsas con mayor facilidad. El problema es que nuestra cultura visual nunca terminó de desarrollar una conciencia crítica proporcional a la sofisticación de los dispositivos que producían imágenes. La diferencia entre una imagen sintética y una imagen verídica no siempre se ha borrado por completo; muchas veces sigue ahí, en los reflejos mal resueltos, en las inconsistencias de la iluminación, en la causalidad visual quebrada o en la textura improbable de ciertas superficies. Pero esa diferencia ha dejado de ser socialmente legible para una parte importante de los observadores. La crisis no es solo de la imagen. Es también de las condiciones históricas bajo las cuales aprendimos a confiar en ella.
III. La imagen como práctica social
La confianza en la imagen no se forma únicamente en el plano de la percepción. No aprendemos a creer en las imágenes solo porque se parezcan al mundo, sino porque las usamos dentro de prácticas sociales que les otorgan sentido, valor y legitimidad. En este punto, la fotografía deja de aparecer como un simple dispositivo técnico y se revela como una institución cultural. Bourdieu (1965) lo vio con claridad al describir la práctica fotográfica no como un acto puramente artístico, sino como un ritual social, una manufactura doméstica de emblemas que contribuye a fijar pertenencias, solemnizar acontecimientos y reproducir la cohesión del grupo. Fotografiar no era únicamente registrar una escena: era decidir qué momento merecía ser conservado, qué vínculo merecía hacerse visible y qué versión de la vida debía adquirir forma de imagen.
Esta observación desplaza el problema de la verdad visual hacia otro terreno. La fotografía no solo ofrecía una imagen del mundo; ofrecía una imagen socialmente autorizada del mundo. Su fuerza no residía únicamente en la relación material que mantenía con la luz, sino también en su inserción en rituales cotidianos: el retrato familiar, la celebración, el viaje, la boda, la infancia, el duelo. Cada una de esas escenas no solo quedaba documentada, sino consagrada. La fotografía producía memoria, pero también jerarquía afectiva; producía archivo, pero también emblemas de pertenencia. En ese sentido, la imagen no circulaba sola. Circulaba ya envuelta en usos, valores y expectativas compartidas.
Esto permite comprender mejor lo que ocurre con la inteligencia artificial. La IA no llega a producir imágenes desde un vacío técnico ni desde una neutralidad cultural. Trabaja sobre un archivo inmenso de imágenes que ya fueron moldeadas por prácticas sociales de representación. Aprende no solo formas, colores, rostros o composiciones, sino también convenciones acerca de qué debe parecer íntimo, solemne, deseable, prestigioso, familiar o verídico. Por eso sus imágenes no resultan socialmente eficaces solo cuando imitan bien la apariencia de la realidad, sino cuando reactivan esos marcos previos de reconocimiento. La IA no sintetiza únicamente superficies visuales: sintetiza también hábitos de percepción y formas sedimentadas de valor.
Bajo esta luz, la imagen generada por IA puede pensarse como una prolongación extraña de aquella manufactura doméstica de emblemas descrita por Bourdieu (1965). La diferencia es decisiva: mientras la fotografía organizaba emblemas a partir de experiencias efectivamente vividas o, al menos, de escenas que habían pasado frente a una cámara, la IA puede producir emblemas visuales sin experiencia previa, sin acontecimiento y sin referente. Puede fabricar signos de intimidad, prestigio, recuerdo o prueba sin necesidad de que tales escenas hayan tenido lugar. Y, sin embargo, esos signos conservan una legibilidad social inmediata, porque se apoyan en convenciones visuales ya incorporadas por la cultura.
Aquí aparece una torsión importante. Si la fotografía contribuía a fijar la memoria del grupo, la IA puede comenzar a producir memorias visuales sin pasado. Si la cámara servía para dotar de imagen a una experiencia compartida, el modelo generativo puede dotar de apariencia de experiencia a algo que nunca ocurrió. La potencia de la IA no consiste entonces solo en fabricar imágenes falsas, sino en ocupar el lugar social que antes ocupaban imágenes ancladas en prácticas de reconocimiento, pertenencia o evidencia. Lo inquietante no es únicamente que una imagen mienta, sino que pueda hacerlo conservando intacta la forma social de aquello que antes parecía digno de confianza.
Por eso la crisis contemporánea de la imagen es también una mutación en la práctica social de la imagen. Durante mucho tiempo, las fotografías ayudaron a organizar lo visible dentro de una economía relativamente estable de experiencia, memoria y prueba. La IA irrumpe en esa economía no destruyéndola desde afuera, sino reproduciendo sus formas y vaciando parte de sus anclajes. Hereda la autoridad social de la imagen al mismo tiempo que debilita su relación con la experiencia vivida. En ese desplazamiento, la imagen ya no funciona solamente como huella, sino como emblema sintético: una forma visual capaz de producir efectos de verdad, afecto o pertenencia incluso cuando ya no remite a ningún acontecimiento real.
IV. La violencia renovada de la imagen
Si la fotografía enseñó a confiar en imágenes técnicamente mediadas, también enseñó algo más inquietante: que toda imagen implica una relación de poder. La cámara no solo registraba el mundo; lo recortaba, lo fijaba, lo convertía en objeto visible y apropiable. Sontag (1977) vio en la fotografía una forma de captura que nunca era del todo inocente. Fotografiar, escribió, implicaba una modalidad de apropiación simbólica del otro, una manera de volverlo imagen y, con ello, de someterlo a una circulación que ya no controlaba. La crítica era dura incluso para la era analógica: la fotografía podía embellecer, clasificar, exponer, humillar o convertir a las personas en objetos de posesión visual.
Lo que cambia con la inteligencia artificial no es la desaparición de esa violencia, sino su mutación. La imagen generativa ya no necesita una escena previa, un cuerpo presente frente a la cámara ni un acontecimiento efectivamente vivido para producir efectos similares de apropiación. Allí donde la fotografía requería al menos una relación material con el mundo, la IA puede fabricar la apariencia de esa relación sin haber pasado por ella. La captura cede el paso a la síntesis, pero la violencia no se atenúa: se vuelve más abstracta, más opaca y, en ciertos casos, más devastadora. Ya no se trata solamente de registrar a alguien sin su consentimiento, sino de producir visualmente lo que nunca ocurrió y hacer que circule como si hubiera ocurrido.
Los casos recientes vinculados con Grok, el sistema de xAI, muestran con claridad esa torsión. Reuters documentó en enero y febrero de 2026 que Grok generó y siguió generando imágenes sexualizadas no consentidas de mujeres y menores, incluso después de que X anunciara restricciones. En marzo de 2026, legisladores europeos respaldaron una propuesta para prohibir aplicaciones de IA que generen imágenes sexuales explícitas no autorizadas, incluidas las llamadas “nudification apps”, en medio del escrutinio sobre imágenes producidas con Grok. Ese mismo mes, una demanda en Estados Unidos acusó a xAI de haber facilitado la generación de material sexualizado a partir de fotos reales de adolescentes.
Leídas desde Sontag (1977), estas escenas no son un simple exceso contemporáneo, sino la radicalización de una lógica más antigua. Si fotografiar ya podía ser una forma de violación simbólica, la IA añade una capacidad nueva: desposeer visualmente a alguien de su cuerpo sin necesidad de haberlo visto en esa situación, sin contacto físico con el acontecimiento y sin límite material impuesto por la cámara. La vieja violencia de la imagen: recortar, poseer, exponer, se convierte ahora en una violencia sintética: fabricar una escena íntima inexistente y, aun así, socialmente eficaz. En lugar de apropiarse de una apariencia ya dada, el modelo la produce.
Esto modifica también el lugar del observador. La violencia de la imagen generativa no se agota en el acto de producirla; depende de una cultura visual que todavía está dispuesta a recibirla como plausible. El daño no proviene solo de la manipulación técnica, sino de que la imagen encuentra una comunidad de lectura capaz de reconocer en ella signos familiares de desnudez, intimidad, vergüenza o escándalo. En otras palabras, la IA no inventa desde cero el poder de esas imágenes: se apoya en convenciones visuales y sociales ya sedimentadas por la fotografía, la pornografía, la publicidad y la cultura digital. La violencia se vuelve más eficaz precisamente porque reutiliza formas conocidas de mirar.
Por eso el problema no puede reducirse a una discusión sobre falsedad. La imagen generada por IA no solo amenaza la verdad de lo visible; amenaza también la relación entre imagen, consentimiento y experiencia. Una fotografía podía ya invadir, apropiarse o cosificar. Pero la IA va más lejos: puede fabricar emblemas visuales de humillación, deseo o exposición sin referente previo y, pese a ello, conservar sus efectos sociales. La crítica de Sontag (1977) regresa así bajo una forma más severa. La imagen ya no es únicamente violenta porque arrebata algo del mundo. Puede serlo también porque lo suplanta y lo vuelve indistinguible de una experiencia nunca vivida.
En este punto, la crisis de confianza en la imagen revela su dimensión más oscura. No se trata solo de que la cultura contemporánea tenga dificultades para distinguir entre lo real y lo sintético. Se trata de que esa indistinción puede convertirse en un instrumento de poder sobre los cuerpos y las biografías. Si la fotografía había hecho posible una economía moderna de la memoria, la prueba y el emblema, la IA abre la puerta a una economía de la exposición sin acontecimiento: una circulación de imágenes socialmente legibles, afectivamente eficaces y materialmente inexistentes. La violencia de la imagen no desapareció con el paso de la cámara al modelo. Aprendió, simplemente, a trabajar sin mundo.
Conclusión
La imagen de inteligencia artificial no aparece sobre un vacío histórico. Surge en el punto de encuentro entre varias herencias técnicas y culturales que la preceden: la lógica compositiva de la imprenta, la organización óptica de la fotografía, la estratificación electrónica de la imagen digital y las prácticas sociales que durante más de un siglo enseñaron a producir, conservar e interpretar imágenes como formas legítimas de memoria, prueba y reconocimiento. Por eso su novedad no consiste simplemente en haber hecho posible una imagen falsa más convincente, sino en haber reunido, bajo una nueva arquitectura de cálculo, operaciones visuales que la modernidad ya había naturalizado. La IA no inventa desde cero nuestra relación con la imagen; entra en ella cuando esa relación ya estaba históricamente formada.
Esa continuidad explica también el alcance de la crisis actual. No estamos ante la simple caída de una verdad visual que antes habría permanecido intacta. La fotografía nunca fue una transparencia absoluta del mundo, sino una mediación técnica y socialmente estabilizada. Lo que ocurre ahora es otra cosa: la inteligencia artificial hereda esa confianza sedimentada y la separa cada vez más de su antiguo anclaje material. La imagen conserva la forma de la prueba, del recuerdo, del emblema o de la escena íntima, pero ya no necesita haber pasado por la experiencia para producir sus efectos. En ese desplazamiento se vuelve visible una fragilidad que venía de lejos: aprendimos a creer en imágenes complejas mucho antes de desarrollar una crítica visual capaz de seguir sus transformaciones.
Tal vez esa sea la lección más incómoda de esta nueva etapa. La posverdad visual no nace únicamente de la potencia sintética de los modelos, sino del rezago histórico de nuestra alfabetización de la imagen. Durante décadas aprendimos a vivir entre fotografías, a emocionarnos con ellas, a usarlas como archivo de la vida y como emblemas de pertenencia. Pero no aprendimos con la misma fuerza a interrogar la técnica, la práctica social y la violencia implicadas en su producción. Por eso la imagen generada por IA puede volverse tan eficaz: no solo imita formas, sino que reactiva hábitos de confianza, rituales de lectura y marcos de reconocimiento ya incorporados por la cultura. La crisis de la imagen es, en el fondo, una crisis de nuestra propia formación como observadores.
Leída desde Bourdieu (1965) y Sontag (1977), la imagen de IA aparece entonces como algo más que una innovación técnica. Es una mutación en la historia social de la imagen. Si la fotografía fue una manufactura doméstica de emblemas y, al mismo tiempo, una forma de apropiación simbólica del mundo, la IA radicaliza ambas condiciones: produce emblemas sin experiencia vivida y extiende la violencia de la imagen más allá de la cámara y del acontecimiento. Los debates recientes sobre imágenes sexuales no consentidas generadas con sistemas como Grok muestran que esta discusión ya no pertenece solo a la teoría, sino al terreno jurídico, político y cotidiano.
Quizá por eso el problema decisivo de nuestro tiempo no sea únicamente si aún podremos distinguir entre una imagen verdadera y una sintética. La pregunta más profunda es otra: qué tipo de cultura visual hemos construido para que una imagen desligada de la experiencia pueda seguir ocupando, con tanta facilidad, el lugar de la prueba, del recuerdo, de la intimidad o de la verdad. La inteligencia artificial no cayó sobre una cultura inocente. Llegó a un mundo que ya había aprendido a confiar en imágenes mediadas, ritualizadas y socialmente eficaces. Y acaso la verdadera trampa sea esa: no que la imagen haya dejado de decir la verdad, sino que nunca terminamos de aprender bajo qué condiciones estábamos dispuestos a creerle.
Referencias
Bourdieu, P. (1965). Un art moyen: Essai sur les usages sociaux de la photographie. Les Éditions de Minuit.
Foucault, M. (1982). The subject and power. Critical Inquiry, 8(4), 777–795.
Reuters. (2026, January 2). Elon Musk’s Grok AI floods X with sexualized photos of women and minors. Reuters.
Reuters. (2026, March 17). Tennessee minors sue Musk’s xAI, alleging Grok generated sexual images of them. Reuters.
Reuters. (2026, March 18). EU lawmakers support ban on AI apps generating explicit images. Reuters.
Sontag, S. (1977). On photography. Farrar, Straus and Giroux.
