OpenAI lanza Sora, una revolucionaria herramienta de vídeo con inteligencia artificial

Si bien la fascinación por ChatGPT y los modelos de lenguaje de inteligencia artificial generativa aún no ha pasado, OpenAI acaba de presentar una herramienta de creación de videos deslumbrante y revolucionaria llamada Sora. Con él, basta con dar una descripción de lo que quieres ver en pantalla y ahí está el clip, creado por inteligencia artificial. Algunos están más logrados que otros, a veces tienen ese estilo de videojuego que los diferencia de la realidad, pero todos son sorprendentes.

El CEO de OpenAI, Sam Altman, hizo el anuncio del lanzamiento en la red social, que en poco tiempo se ha visto inundada de nuevas creaciones. Vídeos realistas, futuristas, alocados, de dibujos animados… Los vídeos incluyen todo tipo de creaciones automáticas creadas con inteligencia artificial generativa. Sora es capaz de producir vídeos completos de una sola vez o ampliar los vídeos generados para hacerlos más largos.

en las pruebas mostrado por Altman y tu compañía ves escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. El modelo entiende no sólo lo que el usuario ha pedido en la solicitud, sino también cómo existen esas cosas en el mundo físico, según OpenAI. El modelo tiene un profundo conocimiento del lenguaje, lo que le permite interpretar señales con precisión y generar personajes convincentes que expresan emociones vibrantes, explica la empresa.

«Aquí está Sora, nuestro modelo de generación de videos», escribió Altman. “Ofrecemos acceso a un número limitado de creadores”, añadió, antes de pedir a sus seguidores que le hicieran sugerencias para crear nuevos vídeos, además de las muestras que ya había ofrecido en su web.

Las instrucciones pueden ser más o menos detalladas. Uno de los ejemplos que ofrece OpenAI responde a la siguiente descripción: “Una mujer elegante camina por una calle de Tokio llena de cálidos neón brillantes y animada señalización urbana. Lleva una chaqueta de cuero negra, un vestido largo rojo, botas negras y un bolso negro. Lleva gafas de sol y lápiz labial rojo. Camina con confianza y descuido. La calle está mojada y refleja, creando un efecto espejo de las luces de colores. Muchos peatones caminan por allí”. Y el resultado es sorprendente (arriba).

Otro señala: “Tráiler de una película sobre las aventuras de un astronauta de 30 años con un casco de motocicleta tejido de lana roja, cielo azul, desierto salado, estilo cinematográfico, filmado en película de 35 mm, colores brillantes”. (abajo).

Además de poder generar un vídeo únicamente a partir de instrucciones de texto, el modelo es capaz de tomar una imagen fija existente y generar un vídeo a partir de ella, animando el contenido de la imagen con precisión y atención a los pequeños detalles. El modelo también puede tomar un vídeo existente y ampliarlo o completar los fotogramas faltantes.

Puedes preguntar por contenido, estilo y dar todo tipo de instrucciones. Altman ha ido publicando nuevos vídeos solicitados por los tuiteros, demostrando que los resultados son inmediatos. Sora también puede crear múltiples tomas dentro de un solo video generado manteniendo con precisión los personajes y el estilo visual.

“Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción en el mundo real”, explica OpenAI al presentar la nueva herramienta de conversión de texto. al vídeo. «Sora puede generar vídeos de hasta un minuto de duración manteniendo la calidad visual y la fidelidad a la entrada del usuario», añade.

Por ahora, la herramienta se ha puesto a disposición de los denominados equipos rojos. Los integrantes de estos equipos intentan cuestionar un producto o servicio, llevarlo al límite, ponerlo a prueba y encontrar sus fallos como si fueran enemigos de la empresa. Aquí tienen la misión específica de evaluar áreas críticas en busca de posibles daños o riesgos. Entre ellos se encuentran expertos en áreas como desinformación, contenido que incita al odio y prejuicios.

Open AI también brinda acceso a una variedad de artistas visuales, diseñadores y cineastas para brindar comentarios sobre cómo mejorar el modelo para hacerlo más útil para los profesionales creativos.

«Estamos compartiendo el progreso de nuestra investigación con anticipación para comenzar a trabajar con personas fuera de OpenAI y recibir sus comentarios, así como para darle al público una idea de las capacidades de IA que están en el horizonte». explica la empresa.

Defectos a pulir

La propia firma de inteligencia artificial reconoce que Sora todavía tiene algunos fallos muy evidentes. Es posible que tenga dificultades para simular con precisión la física de una escena compleja y que no comprenda casos específicos de causa y efecto. Pone como ejemplo que una persona puede morder una galleta, pero es posible que la galleta no tenga la marca del mordisco.

El modelo también puede confundir los detalles espaciales de una señal, por ejemplo, confundiendo izquierda y derecha, y puede tener problemas con descripciones precisas de eventos que tienen lugar a lo largo del tiempo, como seguir una trayectoria de cámara específica.

Antes de poner la herramienta a disposición del público, OpenAI promete tomar algunas precauciones. Entre ellos está tener en cuenta las indicaciones de los equipos rojos. Además, está creando herramientas para ayudar a detectar contenido engañoso, con detectores que pueden saber cuándo Sora ha generado un vídeo. También ha desarrollado potentes clasificadores de imágenes que se utilizan para revisar los fotogramas de todos los vídeos generados y garantizar que cumplen con sus políticas de uso antes de mostrárselos al usuario.

Además, reutilizará los métodos de seguridad que creó para sus productos que utilizan DALL-E 3. Por ejemplo, el clasificador de texto verificará y rechazará solicitudes de ingreso de texto que violen sus políticas de uso, como aquellas que solicitan violencia extrema, contenido de imágenes sexuales. , imágenes que inciten al odio, imágenes de personajes famosos o propiedad intelectual de terceros.

“Nos comunicaremos con formuladores de políticas, educadores y artistas de todo el mundo para escuchar sus inquietudes e identificar casos de uso positivos para esta nueva tecnología. A pesar de investigaciones y pruebas exhaustivas, no podemos predecir todas las formas beneficiosas en que las personas utilizarán nuestra tecnología, ni todas las formas en que abusarán de ella. Por eso creemos que aprender del uso en el mundo real es un componente fundamental para crear y lanzar sistemas de IA cada vez más seguros con el tiempo”, concluye OpenAI.

puedes seguir EL PAÍS Tecnología en Facebook y X o regístrate aquí para recibir nuestra boletín semanal.

Más información

OpenAI lanza Sora, una revolucionaria herramienta de vídeo con inteligencia artificial | Tecnología

Defectos a pulir

Rodrigo Benítez

Entrada siguiente

Futbolista hondureño fue detectado con cáncer y pide ayuda económica

Destacados

Entretenimiento

Top Esta semana

Repaso de la historia de Woody y Buzz antes del estreno de Toy Story 5

Mundial 2026 detiene rodaje de The Last of Us temporada 3

El significado detrás del estilo de Azzedine Alaïa

Guía completa sobre tejidos sostenibles

Mapa del Sitio

Chief Editor

Johny Watshon

Quick Links

Defectos a pulir

Rodrigo Benítez

Puede que te guste

Destacados

Entretenimiento

Top Esta semana

Mapa del Sitio

Chief Editor

Johny Watshon

Quick Links