¿Cómo funciona Whisk, la nueva IA de Google para crear imágenes con imágenes?

whisk google

Google continúa su apuesta por la inteligencia artificial aplicada a la creación de contenido visual con el lanzamiento de nuevas herramientas y la actualización de modelos existentes. Estas actualizaciones, que incluyen Whisk, Veo 2 e Imagen 3, buscan facilitar la generación de imágenes y videos, ofreciendo a los usuarios mayor control y flexibilidad en el proceso

Whisk, una herramienta experimental disponible a través de Google Labs, introduce un nuevo paradigma en la generación de imágenes. En lugar de utilizar texto como prompt, Whisk permite a los usuarios combinar y remezclar imágenes existentes para crear nuevas imágenes.

El proceso es simple; el usuario sube imágenes que representen el tema, la escena y el estilo que desea. Whisk, utilizando Imagen 3 y Gemini, analiza estas imágenes, extrae información sobre sus características y genera una descripción detallada. Esta descripción se utiliza como base para crear una nueva imagen que combina los elementos de las imágenes de entrada.

Según Google, Whisk ofrece una interfaz intuitiva que permite a los usuarios experimentar con diferentes combinaciones de imágenes y ajustar parámetros para obtener el resultado deseado. La herramienta está pensada para cualquier persona que desee crear imágenes de forma rápida y sencilla, sin necesidad de conocimientos técnicos avanzados.

Te puede interesar: “¿Por qué son tan importantes las abejas?” y otras preguntas que definieron las búsquedas de los colombianos en Google en 2024

En tanto a las novedades de Veo 2, la nueva versión del modelo de generación de video de Google, introduce mejoras significativas en la calidad y el realismo de las creaciones. Veo 2 tiene una mayor comprensión de la física, el movimiento y la expresión humana, lo que se traduce en videos con mayor detalle y precisión.

Además de la calidad visual, Veo 2 ofrece mayor control sobre el proceso creativo. Los usuarios pueden especificar el género cinematográfico, el tipo de lente, los efectos visuales y la resolución del video. Veo 2 incluso puede interpretar instrucciones sobre la composición de la escena, como ángulos de cámara y profundidad de campo.

Y finalmente, sobre Imagen 3, el modelo de generación de imágenes de Google, también se ha actualizado. La nueva versión ofrece mayor precisión en la reproducción de estilos artísticos y detalles. Imagen 3 puede generar imágenes con mayor fidelidad a las indicaciones del usuario, reproduciendo con precisión elementos como la iluminación, la textura y la composición.

¿Ya se puede utilizar?

Whisk se encuentra en fase experimental y está disponible en Estados Unidos a través de Google Labs. Imagen 3 está disponible globalmente en ImageFX en más de 100 países. Veo 2 se está implementando gradualmente a través de VideoFX, YouTube y Vertex AI.

Google continúa investigando y desarrollando nuevas tecnologías de IA para la creación de contenido visual. Estas herramientas no solo buscan facilitar la generación de imágenes y videos, sino también ampliar las posibilidades creativas de los usuarios, permitiéndoles expresar sus ideas de formas innovadoras.

Las herramientas de IA para la creación visual tienen el potencial de transformar la forma en que se produce contenido. Estas herramientas pueden acelerar el proceso creativo, reducir costos y permitir que personas sin habilidades técnicas creen imágenes y videos de alta calidad.

Sin embargo, es importante tener en cuenta las implicaciones éticas del uso de estas tecnologías. La posibilidad de generar contenido realista plantea preocupaciones sobre la desinformación y la manipulación. Es fundamental que las empresas desarrolladoras implementen medidas de seguridad y promuevan el uso responsable de estas herramientas.

Imagen: Google

Digna Irene Urrea

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

Archivos