Tendencias

Para alcanzar efectos visuales de alta calidad mediante IA generativa, el truco consiste en comportarse como un fotógrafo.

Creatividad y manipulación

Generar imágenes fotorrealistas de alta calidad no sucede por casualidad, requiere contar con fundamentos técnicos profundos dentro del ámbito fotográfico. 

Una cámara profesional de Fujifilm que emplea fotografía computacional para mejorar la resolución de las fotos.

Un dispositivo fotográfico de vanguardia de Fujifilm que emplea el tratamiento digital con el fin de mejorar la definición de las capturas.

Manuel R.

Una de las obras más perspicaces y perturbadoras de Fiódor Dostoievski es El doble. En este relato, el personaje principal nota con espanto que posee un duplicado idéntico a sí mismo. No obstante, los dos Goliadkin, el individuo y su imitación, presentan caracteres totalmente diferentes.

Tal como sucede en aquel libro, hemos presenciado con sorpresa en los tiempos recientes la revelación de que la fotografía cuenta con un sosias. Hay quienes la definen como fotografía generativa, ya que su base se encuentra en la inteligencia artificial que produce información. En un principio, la fotografía y este gemelo resultan parecidos. No obstante, solo hace falta fijarse bien para captar que se trata de realidades muy diversas.

Fotomontaje reproducido en 1891 en la revista L'illustration.
Fotomontaje reproducido en 1891 en la revista L'illustration.L'illustration

Llevamos bastante tiempo habituados a ciertas expresiones visuales que guardan semejanza con las fotos sin constituir auténticas capturas. La fotografía sustituyó a la pintura como el principal recurso de plasmación realista. Sin embargo, la invención imaginaria también terminó por influir en lo fotográfico. 

En una cubierta de la revista francesa L’Illustration de 1891 se aprecia un caso esclarecedor: una supuesta toma fotográfica armada con fragmentos de retratos. Una visión tan manipulada que se asemeja a las creaciones digitales de 2025.

En esa carátula contemplamos a una mujer superpuesta a un escenario ilustrado, avisando que un tren se aproxima. Los arcaicos mecanismos de prensa hacían que la fotografía no mostrase mucha nitidez en el soporte. Esa ausencia de pormenores entorpecía el descubrimiento del artificio.

La combinación de una ilustración del decorado, el recorte de una fotografía de un tren lejano y otra pieza de la mujer, con su sombra delineada en el piso, se veía como una unidad sólida en el papel. Es un fenómeno parecido al que se observa hoy con múltiples imágenes trucadas de baja calidad en WhatsApp.

Filtros de IA generativa para parecer un adolescente en TikTok
Filtros de IA generativa para parecer un adolescente en TikTok@TikTok

Resulta indudable que elaborar una composición de esta clase demandaba anteriormente habilidades especializadas y recursos disponibles para una minoría. El factor que realmente se ha transformado mediante la inteligencia artificial es la rapidez. Los procesos se han vuelto mucho más ágiles. No obstante, esta moderna producción visual continúa requiriendo saberes más profundos de lo que se cree inicialmente.

“En las películas de zombis, como 28 días después, la novedad es que los zombis de golpe corren y eso es como muy guay. TikTok ha cogido a los zombis y los ha puesto a correr”. De esta forma relataba hace un tiempo el cineasta Carlo Padial, en una entrevista, lo sucedido en las plataformas sociales tras la aparición de los tiktokers.

En redes sociales 

La IA ha dinamizado la producción de información, aunque sacrificando el nivel cualitativo.

El desarrollo de representaciones visuales mediante IA representa un avance adicional dentro de la rapidez actual de la creación audiovisual. TikTok se encuentra saturado de capturas que carecen de vínculos con lo real: escenas creadas por sistemas informáticos mediante prompts. CapCut, la conocida aplicación de edición de vídeo perteneciente a la compañía responsable de TikTok, integra progresivamente diversas funciones de IA generativa.

Sin embargo, la celeridad y la engañosa percepción de simplicidad al crear contenido con IA representan a su vez sus mayores carencias. Confiar demasiado en tales recursos es uno de los motivos por los cuales abundan las obras deficientes. Por ello, es adecuado estudiar el modo de elaborar imágenes fotorrealistas que sean complejas, o prácticamente inviables, de discernir de una foto verdadera.

Fotografía de los números de la revista experimental Lalata en 2014 (arriba) y una versión de 2025 de esa misma foto generada en parte con IA para añadir nuevos números a la colección.
Fotografía de los números de la revista vanguardista Lalata correspondientes a 2014 (arriba) al lado de una versión de 2025 de esa misma toma, creada en parte con IA para sumar más piezas a la serie.Ramón Peco

Un ejemplo real. Durante el año 2014, este redactor retrató en un estudio cada ejemplar de la revista de arte experimental Lalata. Actualmente, celebrando los 25 años de esta publicación vanguardista, quienes la coordinan consideraron oportuno renovar ese retrato grupal incorporando las ediciones que faltaban en la captura inicial. 

Efectuar de nuevo la sesión de fotos era impracticable por razones logísticas que no son relevantes. El presente ejemplo funciona como un ensayo ideal para analizar el potencial de las creaciones fotorrealistas utilizando sistemas de IA.

Zona de la foto de Lalata en la que se más elementos se han añadido con IA.
Zona de la foto de Lalata en la que se más elementos se han añadido con IA.Ramón Peco

Diseñar una instrucción desde el comienzo para alcanzar ese montaje supuso, simplemente, un derroche de tiempo. Definir con exactitud algo tan particular como números específicos de una revista integrados en forma de lata es casi inalcanzable. En esta situación, la IA debía asumir una tarea distinta.

Puesto que se contaba con retratos verídicos de los modelos recientes ante un fondo claro, el camino más práctico fue usar un software de retoque fotográfico basado en IA generativa, como Photoshop. Se incorporaron a la creación de 2014 los botes que no estaban presentes. Empleamos la IA de Adobe dentro de la herramienta para perfeccionar los tonos, el brillo y las superficies.

La aplicación de Photoshop, o de cualquier software con IA integrada, resulta fundamental ya que las ediciones más realistas no se apoyan solo en la creación de imágenes. Funciones como Content-Aware, introducida hace tiempo, examinan los píxeles cercanos para suprimir elementos no deseados en una fotografía de manera sumamente eficiente.

Actualmente Photoshop dispone de una utilidad semejante que integra material producido por IA si el efecto no es el deseado. Pese a ello, a menudo se da la situación inversa: la IA generativa se muestra menos eficaz que la IA “clásica” al abordar pormenores visuales concretos. No consiste en descartar las metodologías de trabajo, sino en ir sumando capas.

Fotografía para generar un promp tomada con un teléfono Vivo X300 Pro.
Fotografía para generar un promp tomada con un teléfono Vivo X300 Pro.Ramón Peco

Al integrar ambos procedimientos, la edición fotográfica clásica y la composición mediante IA, resultó factible observar una representación bastante creíble del retrato familiar perteneciente a la publicación Lalata. Ni siquiera Vericta, una herramienta española para detectar capturas creadas con IA, consiguió detectar la falsificación.

En este momento resulta oportuno abordar el prompting, o lo que es lo mismo, la elaboración de representaciones visuales a través de palabras. Producir una estampa persuasiva partiendo de la nada no se trata simplemente de solicitar algo a una IA, sino de recrear en la mente la técnica de fotografía que el sistema pretende imitar.

Fotografía generada con ChatGPT empleando un prompt muy depurado teniendo en cuenta los valores manuales de una fotografía real y otros elementos, como la luz.
Representación generada con ChatGPT empleando una indicación muy sofisticada que contempla los requisitos técnicos de una toma real y variados elementos, como la iluminación.Ramón Peco

Es fundamental aplicar un enfoque fotográfico auténtico al detallar el entorno, la lente seleccionada, la proximidad del equipo, la iluminación, el tiempo de exposición o el rango de enfoque, con el fin de minimizar las probabilidades de que la IA produzca distorsiones visuales atípicas.

Un excelente generador de instrucciones para producir representaciones fotorrealistas resulta ser, de hecho, un experto en el ámbito fotográfico. Si se carece de dicha formación anterior, las fallas y las contradicciones surgen de manera inmediata.

Si en un texto previo acerca de la identificación de imágenes artificiales se empleó un terminal con una elevada carga de IA en su óptica, como el Honor Magic 8 Pro, en esta oportunidad se ha usado un Vivo X300 Pro, uno de los dispositivos que captura la realidad con mayor fidelidad mediante su equipo fotográfico.

La fotografía fue tomada utilizando ajustes manuales, prescindiendo de filtros cromáticos o ediciones artísticas. Incluso se incluyeron fallos leves de forma intencionada en la composición. Posteriormente se empleó una técnica llamativa: solicitar a ChatGPT y a Gemini una descripción detallada de la toma.

El Vivo X300 Pro cuenta con todo lo necesario para captar imágenes muy puras, sin apenas intervención de algoritmos.
El Vivo X300 Pro cuenta con los componentes necesarios para capturar imágenes de gran claridad, reduciendo al máximo la intervención de sistemas de procesamiento.Ramón Peco

Los parámetros de toma del Vivo X300 Pro obtenidos de los metadatos se integraron en la instrucción. Resulta oportuno avisar que las IAs acostumbran a procesar erróneamente los datos EXIF genuinos que vienen con cada fotografía en el archivo, por lo cual la labor demanda seguimiento. Mediante dicha referencia se procuró regenerar la imagen.

En este espacio se exhiben la imagen auténtica y la variante producida por IA de una estación de servicio desierta. Aunque la instrucción es detallada, el secreto se halla en un fragmento que para los profanos en el ámbito fotográfico puede parecer casi ininteligible:

Imágenes fotorrealistas

Entender los principios de la fotografía es esencial para la creación de un prompt.

“La foto se capturó en modo manual usando un teléfono Vivo X300 Pro, concretamemente la cámara con sensor de aproximadamente 1/1,3 pulgadas, objetivo de 7 mm (equivalente a 24 mm en formato completo) y abertura f/1,6. Se estableció la velocidad de obturación en torno a 1/3500 s, ISO 64, balance de blancos automático, sin filtros ni procesado creativo, con la cámara situada a unos 30 metros del punto de enfoque (los surtidores de la gasolinera). Escena iluminada por luz diurna clara, cielo soleado del 31 de enero en España a las cuatro de la tarde”.

Relatar una situación simulando un parte de grabación limita el efecto obtenido. La IA no capta la existencia física, sino que distingue esquemas de probabilidad ligados a esos elementos. Una consigna exitosa no narra una estampa: especifica las circunstancias en las que esa toma pudo haberse realizado.

La herramienta español Vericta puede detectar fotos creadas con IA.
La herramienta español Vericta puede detectar fotos creadas con IA.Guyana Guardian

A esto se añade un elemento esencial adicional: la falta de perfección. Las capturas más creíbles no resultan ser las más llamativas, sino aquellas más ordinarias. Incorporar desenfoques sutiles, sombras marcadas con fallos, composiciones inclinadas o personas recortadas de manera tosca disminuye la posibilidad de que el sistema idealice la toma. Incluso una luminaria fragmentada o un árbol con ramas incompletas resultan de utilidad.

De forma contradictoria, cuanto más se intenta alcanzar la perfección visual con IA generativa, resulta más sencillo que surjan errores técnicos, proporciones irreales o superficies demasiado pulidas. Producir representaciones verosímiles se asemeja más a la captura fotográfica condicionada que a la creación artística sin barreras.

Aquello se vincula de forma directa con las fronteras actuales de los mecanismos de hallazgo. Tal como indica la letrada Georgina Viaplana, CEO y cofundadora de Lawwwing, firma detrás del detector Vericta, “nuestro sistema analiza la imagen a nivel global, obteniendo una señal media de autenticidad o falsedad. Cuando una imagen es mayoritariamente real y solo se ha modificado una zona pequeña, el resultado puede seguir clasificándose como real”.

No consiste únicamente en la presencia de IA, sino en la relevancia de tal modificación en la totalidad de la obra. El examen por áreas es viable técnicamente, aunque, según indica Viaplana, “cuanto más granular es el análisis, mayor es el riesgo de falsos positivos”, resulta conflictivo para bastantes usuarios. De cualquier modo, estos entornos mixtos representan actualmente una de las mayores prioridades de estudio experimental.

Imagen creada con IA en la que se ve a Trump mostrando un mapa de una América que se ha anexionado Groenlandia, Canadá y Venezuela
Imagen creada a través de inteligencia artificial en la cual se muestra a Trump presentando un mapa de una América que ha integrado a Groenlandia, Canadá y Venezuela.@realDonaldTrump

Las aplicaciones prácticas de dichas herramientas se distancian de la discusión estética. Vericta colabora con compañías de seguros para identificar engaños en imágenes que documentan accidentes leves; con sitios de venta online para prevenir reembolsos ilícitos; con administradores de desembolsos empresariales frente a recibos creados mediante IA; con empresas de reparto donde se finge el deterioro de los alimentos; o con organismos de verificación de datos. En entornos operativos, el índice de precisión oscila entre el 95 y el 98,5 por ciento, implicando gastos de evaluación de solo unos pocos céntimos por cada fotografía.

La base del dispositivo no se halla en los metadatos, que pueden suprimirse o alterarse con sencillez, sino en los rastros imperceptibles que genera la IA generativa. “Cuando una imagen se crea o se modifica mediante IA, los modelos dejan artefactos a nivel de píxel que no existen en la fotografía tradicional”, aclara Viaplana. No consiste en una marca singular, sino en una serie de modelos fluctuantes.

Manipulación

Las representaciones visuales cuya detección resulta más compleja no son aquellas producidas totalmente por máquinas.

Retomando el planteamiento inicial, lo anterior fortalece una noción inquietante tanto para los seguidores como para los críticos de la IA: las capturas más complejas de distinguir no son las producidas totalmente por computadoras, sino aquellas donde la inteligencia artificial funciona como un instrumento adicional dentro de los procesos de edición fotográfica convencionales.

Al igual que en El doble de Dostoievski, el dilema auténtico no es la existencia de la copia, sino su capacidad de ser confundida con la fuente original. En el presente, tal como en 1891, una actuación sutil y técnicamente sólida es suficiente para desdibujar la línea que separa lo real de lo artificial. 

La distinción radica en que hoy en día albergamos la fantasía de que dicha mediación se encuentra disponible para casi todo el mundo. Tal fenómeno ocurrió previamente con los dispositivos digitales iniciales, pues al visualizar la imagen de inmediato, creímos que capturar fotos resultaba más sencillo. Sin embargo, aquello no era más que un espejismo.

Etiquetas