Google lanzó su nuevo modelo de generación de imágenes con inteligencia artificial (IA), Nano Banana 2 (Gemini 3.1 Flash Image), que ofrece capacidades de razonamiento y alta precisión para generar imágenes profesionales, con una velocidad “ultrarrápida”.

Tras el lanzamiento de Nano Banana Pro en noviembre del año pasado, que permite generar imágenes con máxima precisión factual, la compañía presentó este nuevo modelo, enfocado en ofrecer resultados más rápidos, pero con seguimiento preciso de instrucciones.

Nano Banana 2, es decir, Gemini 3.1 Flash Image, es su modelo de última generación, diseñado para reducir drásticamente la brecha entre velocidad y fidelidad visual. Ofrece iluminación más vibrante, texturas variadas, detalles más nítidos y calidad realista de hasta 4K.

El gigante tecnológico informó en su blog que Nano Banana 2 lleva “la inteligencia de alta velocidad de Gemini Flash a la generación visual”, lo que permite editar fotografías o generar imágenes de forma ágil.

Precisión, razonamiento y edición avanzada

Para crear imágenes, el modelo extrae información de la base de conocimiento del mundo real de Gemini y se apoya en datos en tiempo real de la Búsqueda web, lo que le permite representar temas con mayor precisión.

También mejora el renderizado y la traducción de texto, lo que facilita generar texto legible y preciso para maquetas de marketing o tarjetas de felicitación, por ejemplo, e incluso localizar y traducir texto dentro de una fotografía.

Google aseguró que mejoró la consistencia del sujeto: el modelo puede mantener el parecido de hasta cinco personajes y la fidelidad de hasta 14 objetos en un solo flujo de trabajo, lo que permite crear distintas narrativas sin alterar la apariencia en los resultados.

Asimismo, garantiza seguimiento preciso de instrucciones, es decir, se ajusta estrictamente a las peticiones de los usuarios y capta los matices de la idea para que la imagen generada sea lo más fiel posible a lo solicitado.

Nano Banana 2 también genera imágenes en distintas relaciones de aspecto y resoluciones, según las necesidades del usuario, desde 512 píxeles hasta 4K.

Transparencia y trazabilidad en contenido generado con IA

Con este modelo, Google subrayó que continúa impulsando su tecnología de marca de agua SynthID, junto con las credenciales de contenido C2PA, en imágenes creadas con IA. Así, informa a los usuarios no solo si se utilizó IA, sino cómo se hizo. Adelantó que la verificación C2PA se incorporará pronto a la aplicación de Gemini.

Google indicó que Nano Banana 2 ya está disponible en sus productos, incluida la aplicación Gemini, donde sustituirá a Nano Banana Pro en los modelos Rápido, Pensamiento y Pro —excepto para suscriptores de Google AI Pro y Ultra, que conservarán acceso para tareas especializadas—.

El modelo también estará disponible en la Búsqueda, a través del Modo IA y Lens, en la aplicación de Google y en navegadores móviles y de escritorio, así como en AI Studio + API, Google Cloud, Flow y Google Ads.

Gemini y la competencia en el mercado de generación visual

Gemini es la familia de modelos de IA de Google presentada en diciembre de 2023 como sucesora de Bard y basada en arquitecturas multimodales capaces de procesar texto, imagen, audio y código.

La línea “Flash” se caracteriza por priorizar baja latencia y costos reducidos frente a versiones más robustas como Pro o Ultra. En materia de generación visual, Google compite en un mercado donde también participan modelos como DALL·E (OpenAI), Midjourney y Stable Diffusion, cuyo uso se ha expandido de forma significativa en sectores como publicidad, comercio electrónico y diseño digital.

De acuerdo con datos de la consultora Gartner, el 60% de los equipos de marketing globales ya incorporaban herramientas de IA generativa en 2024 para producción de contenidos visuales.

En cuanto a la trazabilidad, SynthID —presentada por Google DeepMind en 2023— inserta marcas de agua digitales imperceptibles directamente en los píxeles de la imagen generada por IA, permitiendo su identificación incluso tras ediciones moderadas.

Por su parte, la iniciativa C2PA (Coalition for Content Provenance and Authenticity) es un estándar abierto respaldado por empresas como Adobe, Microsoft y la BBC, que permite adjuntar metadatos verificables sobre el origen y modificaciones de un contenido digital. La integración de estas credenciales busca responder a regulaciones emergentes sobre transparencia en IA, como las contempladas en la Ley de Inteligencia Artificial de la Unión Europea aprobada en 2024, que exige identificar claramente el contenido sintético.

