El modelo Omni de Gemini promete IA capaz de crear “lo que sea” a partir de cualquier tipo de consignas

Google acaba de anunciar su nuevo modelo de IA, Gemini Omni, que afirma que “podrá crear lo que sea a partir de cualquier consigna”, en su conferencia anual de desarrollo I/O del martes.

La compañía dijo que el modelo comenzará ofreciendo solo generación y edición de video, y en su sitio web Google afirma que será como “Nano Banana, pero para video” en referencia al modelo de imágenes que la compañía lanzó el año pasado.

Gemini Omni Flash, primer modelo de la familia Omni, puede editar videos existentes y generar nuevos, utilizando consignas en lenguaje común. Ya está disponible para probarlo en la app Gemini, Google Flow AI studio y YouTube Shorts.

“Con Omni puedes combinar imágenes, audio, video y texto como consigna y generar videos de alta calidad basados en el conocimiento de Gemini del mundo real. También puedes editar tus videos por medio de la conversación”, escribió en un posteo de blog Koray Kavukcuoglu, ejecutivo de tecnología de Google DeepMind.

Al igual que con Nano Banana, los usuarios podrán editar sobre ediciones con conversación natural. El modelo está diseñado para que los personajes y entornos se mantengan consistentes en cada edición y usará su conocimiento del mundo real incluyendo la historia, la biología, la física y la lógica narrativa para hacer clips que tengan sentido.

La compañía posteó ejemplos de lo que puede hacer el modelo en su sitio web.

En uno de los ejemplos, Google comienza con un video de un hombre que toca un espejo. El modelo luego crea varias versiones del clip basándose en consignas de texto como “hacer que el espejo tenga ondas como si fuera líquido” y “todo el entorno se convierte en arte voxel 3D” al tocar el espejo.

En otro ejemplo se ve la capacidad de audio del modelo, cuando el video sincroniza las luces de las ventanas de un edificio de apartamentos con el ritmo de una pista tecno.

El modelo pudo crear incluso una breve explicación del plegado de proteínas, al estilo de los videos con plastilina.

Pero así como sucede con otros modelos de IA para crear videos e imágenes, hay una lógica preocupación ante el abuso, como información falsa o deepfakes.

Google dice que desarrolló el modelo con información de sus equipos internos de seguridad y responsabilidad. Además, pasó por varias evaluaciones como las pruebas con especialistas externos al equipo de desarrollo para asegurar que sigue las políticas de seguridad y produce los resultados deseados. También se llevaron a cabo revisiones de ética y seguridad antes del lanzamiento.

Google afirma también que el contenido creado o editado con Omni tendrá una marca de agua digital SynthID invisible que hará que resulte más fácil verificar si el contenido se generó utilizando el modelo.

El modelo Omni de Gemini promete IA capaz de crear “lo que sea” a partir de cualquier tipo de consignas

Lo último

Si la materia oscura no existe, la física habría estado persiguiendo una sombra durante medio siglo. Un nuevo estudio reabre una de las preguntas más incómodas del cosmos

La ráfaga de radio más brillante jamás detectada llegó desde una galaxia demasiado tranquila. Los astrónomos la ubicaron con precisión, pero su origen sigue sin encajar

Creíamos vivir en un universo que se alejaba de todo para siempre. Ahora un modelo dice que el cosmos podría estar preparando su regreso hacia un único punto final

Brasil vs Noruega en directo gratis: dónde ver el Mundial 2026 online desde cualquier lugar

Newton la vio como una fuerza y Einstein como la curvatura del espacio-tiempo. Un físico ahora propone una tercera opción: la gravedad como compresión de datos

Parecía una ventana imposible hacia el pasado de la humanidad. El caso de la familia Ulas terminó revelando una verdad más compleja sobre caminar, aprender y sobrevivir

El impacto ocurrió hace 11 millones de años, pero su cicatriz desapareció del mapa. Unos vidrios naturales en Australia acaban de recuperar ese cataclismo olvidado

Científicos lograron que dos átomos de silicio “hablen” a distancia dentro de un chip. El avance acerca la computación cuántica al mismo material que usan nuestros procesadores

Artículos relacionados

El modelo Omni de Gemini promete IA capaz de crear “lo que sea” a partir de cualquier tipo de consignas

Si la materia oscura no existe, la física habría estado persiguiendo una sombra durante medio siglo. Un nuevo estudio reabre una de las preguntas más incómodas del cosmos

La ráfaga de radio más brillante jamás detectada llegó desde una galaxia demasiado tranquila. Los astrónomos la ubicaron con precisión, pero su origen sigue sin encajar

Creíamos vivir en un universo que se alejaba de todo para siempre. Ahora un modelo dice que el cosmos podría estar preparando su regreso hacia un único punto final

Brasil vs Noruega en directo gratis: dónde ver el Mundial 2026 online desde cualquier lugar

Newton la vio como una fuerza y Einstein como la curvatura del espacio-tiempo. Un físico ahora propone una tercera opción: la gravedad como compresión de datos

Parecía una ventana imposible hacia el pasado de la humanidad. El caso de la familia Ulas terminó revelando una verdad más compleja sobre caminar, aprender y sobrevivir

El impacto ocurrió hace 11 millones de años, pero su cicatriz desapareció del mapa. Unos vidrios naturales en Australia acaban de recuperar ese cataclismo olvidado

Científicos lograron que dos átomos de silicio “hablen” a distancia dentro de un chip. El avance acerca la computación cuántica al mismo material que usan nuestros procesadores

Artículos relacionados

En los Pirineos hay un espejo de 1.830 m² que concentra 10.000 soles en un punto de 40 cm y alcanza 3.500°C: así funciona el horno solar más potente del mundo

España ya prueba tecnologías capaces de convertir pensamientos en acciones: del habla perdida a exoesqueletos controlados con la mente

El supuesto “iPhone de Elon Musk” aparece en escena: SpaceX habría mostrado un prototipo con IA de xAI

Cuidado con los anuncios de X: una campaña falsa está usando publicidad para instalar malware en Mac

El rival de Starlink ya tiene masa crítica: Amazon prepara el lanzamiento comercial de Leo

La empresa detrás de Claude quiere crear sus propios medicamentos con IA: la apuesta que incomoda a la industria farmacéutica