La sensación del momento en generación y modificación de imágenes es Gemini Flash 2.5 Image, también conocido como Nano Banana. Cualquier cosa que le pidas te la puede generar o modificar a tu gusto (siempre que no te metas en política, religión u otros temas delicados). Su diferencia con respecto a los demás modelos de lenguaje generativos es la consistencia: solo modifica lo que le digas y el resto lo deja igual.
Esta consistencia, vista desde los ojos humanos, es muy difícil de conseguir mediante IA, y por eso Google ha reinventado la forma en que genera imágenes. Nano Banana tiene un sistema de control de coherencia que vigila constantemente si el modelo está generando lo que le pide el prompt, para que no estropee lo que no debe modificar.
La hegemonía de Nano Banana parece que toca a su fin, al menos según las pruebas internas del nuevo competidor, desconocido hasta ahora en los países occidentales. Se trata de Seedream 4.0, creado por ByteDance, la empresa responsable de TikTok.
Nano Banana vs Seedream 4.0: ¿quién dará mejor resultado?
Nos hemos propuesto crear una imagen de Elon Musk leyendo la sección Neo de Guyana Guardian. Para ello, hemos buscado una foto de un hombre sentado en su escritorio, medio girado para sonreír a la cámara, y con un ordenador en el espacio de trabajo, al que pondremos una captura de Neo.
Usando el mismo prompt para ambas IAs, le hemos pedido que cambie el hombre de la imagen por Elon Musk (también le proporcionamos la foto). Además, le pedimos que integre la captura de pantalla de Neo en el ordenador que aparece en la imagen. Vamos a dar primero el resultado que nos ha dado Seedream 4.0.
Elon Musk es un fan de Neo, según Seedream 4.0.
Veamos qué resultado nos ha dado Gemini, con su Nano Banana. La petición que le hemos hecho es exactamente la misma, a partir de las tres imágenes proporcionadas: “Intercambia la cara del hombre sentado la silla con la foto de la otra persona. En la pantalla del ordenador, coloca la captura de pantalla proporcionada”.
Imagen generada mediante Nano Banana de Gemini.
Así es: Elon Musk está bloqueado en Gemini (Neo, de momento, parece que no). A pesar de no decir el nombre del magnate en ningún sitio, la IA de Google lo ha reconocido a partir de la foto y no lo ha puesto en su edición fotográfica. Pese a que hemos realizado un segundo intento, la respuesta ha sido todavía más tajante:
Elon Musk, bloqueado por Gemini.
En el caso de Seedream 4.0, cuando le pusimos un primer intento de prompt con el nombre de Elon Musk, la respuesta también fue negativa “Este prompt no es apto”. En cambio, cuando le pusimos la foto sin decirle quién es esa persona, generó la imagen sin problema.
De todos modos, se puede apreciar que la calidad tampoco es absolutamente perfecta en ninguno de los dos resultados, a juzgar por la integración de la captura en la pantalla del ordenador de la foto. En cualquier caso, la IA generativa basada en modelos de consistencia ha llegado para quedarse y supone un importante salto cualitativo. Se puede acceder a Seedream a través de FluxPro.ai y, en una versión más limitada, en seedream.pro.

