In this photo illustration, a video created by Open AI's newly released text-to-video "Sora" tool plays on a monitor in Washington, DC on February 16, 2024. OpenAI, the creator of ChatGPT and image generator DALL-E, said it was testing "Sora," which would allow users to create realistic videos with a simple prompt. The Microsoft-backed company said the new platform was currently being tested but released a few videos of what it said was already possible, with the accompanying input made to generate the video. (Photo by Drew Angerer / AFP)
Lo que sabemos de Sora, el nuevo generador de videos de OpenAI
01:08 - Fuente: CNN

(CNN) – OpenAI, líder en inteligencia artificial, presentó un nuevo modelo de inteligencia artificial llamado Sora que, según afirma, puede crear videos “realistas” e “imaginativos” de 60 segundos a partir de indicaciones de texto rápidas.

En una publicación del miércoles en su blog, la compañía dijo que Sora es capaz de generar videos de hasta 60 segundos de duración a partir de instrucciones de texto, con la capacidad de mostrar escenas con múltiples personajes, tipos específicos de movimientos y detalles de fondo.

“El modelo comprende no sólo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico”, decía la publicación.

OpenAI dijo que tiene la intención de entrenar modelos de inteligencia artificial (IA) para que puedan “ayudar a las personas a resolver problemas que requieren interacción en el mundo real”.

Este es el último paso de la compañía detrás del chatbot viral ChatGPT, para impulsar la inteligencia artificial generativa. Aunque los “modelos multimodales” no son nuevos y ya existen modelos de texto a video, lo que los distingue en este caso es la longitud y la precisión que OpenAI afirma que tiene Sora, según Reece Hayden, analista senior de la firma de investigación de mercado ABI Research.

Hayden dijo que este tipo de modelos de IA podrían tener un gran impacto en los mercados de entretenimiento digital con la transmisión de nuevos contenidos personalizados a través de canales.

“Un caso de uso obvio es el de la televisión; creando escenas cortas que apoyen las narrativas”, dijo Hayden. “El modelo todavía es limitado, pero muestra la dirección del mercado”.

Al mismo tiempo, OpenAI dijo que Sora todavía es un trabajo en progreso con claras “debilidades”, particularmente cuando se trata de detalles espaciales de un mensaje (mezclando izquierda y derecha) y causa y efecto. Dio el ejemplo de crear un video de alguien dándole un mordisco a una galleta pero sin que quede la marca del mordisco inmediatamente después.

Por ahora, los mensajes de OpenAI siguen centrados en la seguridad. La compañía dijo que planea trabajar con un equipo de expertos para probar el último modelo y observar de cerca varias áreas, incluida la desinformación, los contenidos que incitan al odio y la parcialidad. La compañía dijo que también está creando herramientas para ayudar a detectar información engañosa.

Sora se pondrá primero a disposición de los profesores de ciberseguridad, llamados “equipos rojos”, quienes evaluarán el producto en busca de daños o riesgos. También se dará acceso a una serie de artistas visuales, diseñadores y cineastas para recabar sus opiniones sobre cómo podrían utilizarlo los profesionales creativos.

La última actualización llega mientras OpenAI continúa avanzando con ChatGPT.

A principios de esta semana, la empresa dijo que está probando una función en la que los usuarios pueden controlar la memoria de ChatGPT, lo que les permite pedir a la plataforma que recuerde los chats para hacer futuras conversaciones más personalizadas o decirle que olvide lo que se discutió anteriormente.