La empresa OpenAI, uno de los líderes en inteligencia artificial generativa, presentó su modelo ‘Sora’ que acepta instrucciones en texto y las convierte en escenas de video, realistas, con múltiples caracteres y movimientos específicos.
Según la firma, establecida en 2015 y dirigida por Sam Altman, que ha desarrollado ChatGPT y el generador de imágenes fijas DALL-E, ‘Sora’ es capaz de crear “escenas complejas con detalles del componente principal y el trasfondo”.
La compañía también indicó que su modelo puede “entender cómo existen los objetos en el mundo físico” y tiene la capacidad de “interpretar acertadamente las instrucciones y de generar caracteres convincentes que expresan emociones vibrantes”.
Modelo aún en análisis
‘Sora’ es el término en japones para “cielo” y la compañía todavía no la ha puesto a disposición del público porque sigue analizándola para comprender los peligros del sistema, según indicó el diario The New York Times.
En cambio OpenAI compartió la tecnología con un pequeño grupo de académicos y otros investigadores externos cuya tarea es detectar las maneras en las cuales ‘Sora’ podría usarse con fines maliciosos.
Creación de mundos
La firma indica que ‘Sora’ permite la creación de muchos mundos, con escenas realistas o fantásticas, tridimensionales, con movimientos fluidos, y aún en las escenas que no existen en el mundo real, el modelo aplica las reglas físicas correctas.
De este modo, OpenAI, que revolucionó el emergente sector de los servicios de IA regenerativa, dispondrá de un conjunto de servicios que van desde la generación de texto, imagen estática y video.