La internet está dividida por la presentación oficial de SORA, la nueva inteligencia artificial de Open AI (la compañía detrás de ChatGPT). Y la razón es bastante sencilla: la compañía ha diseñado un modelo capaz de crear videos utilizando indicaciones por texto que llegan a niveles de realismo que no esperábamos hasta dentro de al menos un par de años.
¿Qué es Sora?
Es el nombre de un modelo de inteligencia artificial enfocado en la creación de video utilizando texto. Piensen en la misma manera en la que opera ChatGPT, pero con la posibilidad de crear cualquier tipo de video de manera realista.
¿Por qué razón la Internet está fascinada con Sora?
Porque hasta el momento la creación de videos utilizando IA era bastante mediocre, en especial al utilizar indicaciones por texto. Hace un año, por ejemplo, se viralizó un video que se creó utilizando IA con la indicación de ‘Will Smith comiendo espagueti’. El resultado dejaba ver la enorme distancia que tenían estos modelos y la dificultad de crear videos solo con descripciones de texto.
Pero SORA ha dado un salto gigante. El modelo de OpenAI es capaz de crear videos bastantes realistas con instrucciones detalladas. Por ejemplo, en una de las demos que presentó la compañía su instrucción en texto fue “una mujer elegante caminando en Japón durante la noche.
¿Tienen fallas los videos?
Sí. De hecho, un ojo bien entrenado puede notar dónde el modelo tiene mayores problemas. Por ejemplo, los personajes de fondo se suelen mover con una física extraña y la IA todavía tiene algunos problemas en recrear velocidad combinada con movimiento que se vea bien.
Sora también tiene problemas con los objetos en colisión, usualmente con dos masas chocando y creando resultados extraños como es la duplicación de objetos o partes del cuerpo que se mueven en direcciones diferentes.
También hay otras limitaciones importantes, como que estos videos no cuentan con pistas de audio (recrear el sonido encima de las imágenes es un salto generacional importante).
¿Quiere decir que no estamos en peligro de perder nuestro trabajo?
No de manera inmediata, pero hay algunas aplicaciones interesantes para Sora. La más inmediata, es que puede ayudar a crear videos de relleno para bancos como Shutterstock. Muchas compañías requieren clips genéricos para sus materiales. Sora puede ayudar a crear este tipo de imágenes en tan solo segundos y por un costo mucho menor que el que supondría tener un videografo, un experto en drones, un editor, un director…
¿Y qué pasa si quiero pedir un video del presidente Gustavo Petro entrando a un motel?
Es poco probable que Sora cumpla con esta solicitud. OpenAI aclaró que está trabajando en restricciones para impedir que Sora pueda cumplir con solicitudes que le pidan el imitar el parecido de figuras públicas o de propiedades intelectuales protegidas.
Esto no significa que Sora no implique algunos peligros. Por ejemplo, puede resultar más fácil el crear un falso bombardeo en un pueblo rural y luego editarlo en una publicación asegurando que el ejercito nacional está bombardeando una zona civil. Todos los videos creados con la IA de OpenAI cuentan con una marca de agua, pero no hay que tener mucha imaginación para pensar en cómo sortear este problema.
¿Cómo puedo acceder a Sora?
Por ahora Sora solo está cerrada a un ‘equipo rojo’ dedicado a encontrar errores, así como un número limitado de usuarios. Por ahora no hay una fecha para que esté abierto para más usuarios o compañías.
Imágenes: OpenAI