Saltar al contenido
Tecnología

Whisk: la nueva IA de Google que crea videos a partir de imágenes

Google Labs ha presentado Whisk, una innovadora inteligencia artificial que permite generar videos personalizados usando imágenes propias o generadas con IA
Por

Tiempo de lectura 2 minutos

Comentarios (1)

Google continúa ampliando los límites de la inteligencia artificial con el lanzamiento de Whisk, una herramienta experimental que transforma imágenes en videos creativos y personalizados. A diferencia de otras plataformas que solo responden a comandos textuales, Whisk combina imágenes y descripciones para ofrecer resultados más detallados y ajustados a las preferencias del usuario.

Cómo funciona Whisk paso a paso

Google Whisk
© YouTube – Google

Whisk trabaja en tres etapas principales, permitiendo a los usuarios personalizar cada aspecto del video:

  1. Sujeto del video:
    • Subir una imagen propia.
    • Generar una imagen con IA desde la plataforma.
    • Seleccionar una imagen del banco de opciones disponibles.
  2. Escena y estilo:
    Los usuarios deben ingresar una descripción textual para definir la narrativa o los elementos del video.
  3. Ajustes y refinamiento:
    Si el resultado no cumple las expectativas, Whisk ofrece la opción ‘Refine’, donde se pueden realizar ajustes ingresando una nueva descripción con los cambios deseados.

Una vez finalizada la creación, los usuarios pueden descargar el video directamente pulsando el ícono de descarga.

Cómo acceder a Whisk

De acuerdo con Infobae, por ahora, Whisk está disponible únicamente en Estados Unidos. Para acceder a la herramienta, es necesario:

  1. Iniciar sesión con una cuenta personal de Google.
  2. Ingresar a través de la página oficial: Google Labs Whisk.

Una herramienta creativa, no un editor tradicional

Según Thomas Iljic y Nicole Brichtova, responsables del proyecto en Google Labs, Whisk fue diseñado para ofrecer una exploración visual rápida más que ediciones perfectas. La idea es permitir a los usuarios probar múltiples opciones creativas y trabajar de manera ágil en diferentes ideas.

“Se trata de explorar ideas de formas nuevas y creativas, permitiéndote generar y descargar las versiones que más te gusten”, afirmaron.

No obstante, los desarrolladores advierten que Whisk aún está en fase experimental y que los resultados pueden no coincidir completamente con las expectativas del usuario.

Gemini 2.0: la IA avanzada detrás de Whisk

Whisk utiliza modelos avanzados como Gemini 2.0, la última versión de la inteligencia artificial de Google, que destaca por su capacidad de procesar múltiples tareas simultáneamente.

Gemini 2.0 no solo organiza información, sino que también la hace útil, integrando generación de imágenes, video y audio en tiempo real. Entre sus características destacan:

  • Admisión de entradas multimodales (texto, imágenes, video y audio).
  • Capacidad para generar resultados en diferentes formatos, como resúmenes, gráficos y presentaciones.
  • Interacción con herramientas externas y ejecución de programas.

Según Sundar Pichai, CEO de Google, Gemini 2.0 representa un avance hacia una IA más autónoma y eficiente, ideal para tareas complejas como resumir videos educativos y crear contenido visual interactivo.

Un futuro prometedor para la creación audiovisual

Con Whisk, Google no solo facilita la creación de contenido visual, sino que también impulsa la exploración creativa mediante herramientas de IA generativa. A medida que la plataforma se perfeccione, promete convertirse en un recurso clave para artistas, creadores de contenido y profesionales, permitiendo generar videos de manera rápida y personalizada.

Por ahora, Whisk representa una muestra del potencial de Gemini 2.0 y de cómo la inteligencia artificial está revolucionando la producción de contenido multimedia.

Compartir esta historia

Artículos relacionados