Gemini Omni: qué es y qué se puede hacer con la nueva herramienta de IA de Google

Gemini Omni es la nueva inteligencia artificial de Google capaz de crear y editar videos usando texto, imágenes y audio.

Google anunció la nueva herramienta de Inteligencia Artificial
Google anunció la nueva herramienta de Inteligencia ArtificialCaptura de pantalla

Gemini Omni es la nueva herramienta de inteligencia artificial de Google enfocada en la creación y edición de video mediante instrucciones simples. La compañía presentó esta tecnología durante el evento Google I/O 2026, donde explicó que el sistema fue diseñado para entender texto, imágenes, audio y clips de video al mismo tiempo, con el objetivo de generar contenido mucho más realista y fácil de producir para cualquier usuario.

A diferencia de otros modelos que solo crean videos desde texto, Gemini Omni puede combinar varias fuentes de información en una sola producción. Además, la plataforma también permite editar videos existentes, generar escenas nuevas y crear avatares digitales personalizados para redes sociales como YouTube Shorts.

Google presentó sus actualizaciones
Google presentó sus actualizacionesAFP

¿Qué es Gemini Omni?

Google define a Gemini Omni como un modelo “nativamente multimodal”. Esto significa que puede recibir distintos tipos de contenido de entrada, como fotografías, texto, audio y video, para después generar resultados mucho más completos y precisos.

La empresa explicó durante la presentación:

“Gemini Omni es nuestro nuevo modelo capaz de generar muestras en cualquier modalidad de salida a partir de cualquier dato de entrada. Empezamos con resultados de video y, con el tiempo, habilitaremos imágenes y texto. Este nuevo modelo combina la inteligencia de Gemini con nuestros modelos generativos de contenido multimedia, un gran salto en la comprensión del mundo. Ahora, lanzamos el primer modelo de la familia Omni: Gemini Omni Flash”.

Captura de pantalla

En esta primera etapa, la herramienta se enfoca principalmente en la generación de video, aunque Google adelantó que más adelante también podrá crear imágenes y audio con la misma tecnología.

Gemini Omni Flash ya está disponible

La compañía confirmó que el primer integrante de esta familia de inteligencia artificial es Gemini Omni Flash, una versión que ya puede utilizarse desde la aplicación Gemini, Google Flow y YouTube Shorts.

Google también informó que el acceso inicial será para usuarios mayores de 18 años con planes Google AI Plus, Pro y Ultra. Sin embargo, algunas funciones llegarán gratuitamente a YouTube Shorts en los próximos meses.

Google anunció la nueva herramienta de Inteligencia Artificial
Captura de pantalla

Además, desarrolladores y empresas podrán utilizar la tecnología mediante APIs que se liberarán en las próximas semanas.

¿Qué puede hacer Gemini Omni?

Una de las principales novedades de esta herramienta es la variedad de funciones que integra dentro de un mismo sistema. Google asegura que el objetivo es facilitar la creación de contenido audiovisual sin depender de programas complejos de edición.

Crear videos usando texto, imágenes y audio

Con Gemini Omni, los usuarios podrán generar videos utilizando diferentes tipos de archivos al mismo tiempo. La IA será capaz de interpretar instrucciones escritas, fotografías de referencia, música y clips previos para construir escenas completas.

Captura de pantalla

Por ejemplo, una persona puede pedirle al sistema que genere un video de alguien caminando por un parque, añadir imágenes reales del lugar, elegir cómo debe verse la ropa del personaje y acompañar todo con un audio específico.

Edición avanzada de video con inteligencia artificial

Otra de las funciones más importantes es la edición de videos existentes. Gemini Omni no solo crea contenido desde cero, también puede modificar grabaciones hechas con celular o clips generados previamente con IA.

Entre las opciones de edición que mostró Google se encuentran:

Captura de pantalla

Cambiar ángulos y escenas

La inteligencia artificial puede modificar la posición de la cámara, reorganizar secuencias y generar nuevas tomas manteniendo la continuidad visual.

Agregar personajes o elementos

El sistema permite añadir nuevos objetos, personas o detalles dentro de una escena sin perder realismo.

Captura de pantalla

Extender videos automáticamente

Gemini Omni puede crear nuevas partes de un video manteniendo la misma historia, iluminación y estilo visual del material original.

Gemini Omni también podrá crear avatares

Otra de las novedades presentadas por Google es la función Avatar. Esta herramienta permitirá generar videos utilizando la voz, apariencia y estilo del usuario sin necesidad de grabarse frente a la cámara.

La empresa señaló que esta opción estará integrada en YouTube Shorts y facilitará la creación de contenido vertical para redes sociales.

Captura de pantalla

Con un simple texto, los usuarios podrán pedirle a la IA que genere videos personalizados manteniendo continuidad entre escenas y reproduciendo características físicas similares a las de la persona.

La diferencia entre Gemini Omni y Veo

Google confirmó que Gemini Omni reemplazará a Veo dentro de la app de Gemini. Aunque ambas herramientas están enfocadas en video, Omni añade capacidades más avanzadas gracias a la integración del ecosistema Gemini.

Según la compañía, el nuevo modelo entiende mejor el lenguaje natural y puede utilizar información contextual para generar escenas más precisas.

Además, otro de los avances importantes está relacionado con el texto dentro de los videos. Google asegura que Gemini Omni puede generar carteles, subtítulos y elementos escritos con mayor precisión y realismo.

PJG