BLUFFANTAvec Sora, regardez ce qu’OpenAI fait d’une simple ligne de texte

Avec Sora, OpenAI transforme vos textes en vidéos plus vraies que nature

BLUFFANTLe service n’est pas encore ouvert au grand public mais des créateurs peuvent le tester
Sora est la dernière trouvaille de l'éditeur de ChatGPT, OpenAI
Sora est la dernière trouvaille de l'éditeur de ChatGPT, OpenAI - CFOTO/Sipa USA/SIPA / SIPA
20 Minutes avec AFP

20 Minutes avec AFP

«Crée-moi une vidéo au rendu réaliste de deux bateaux pirates s’affrontant dans une tasse de café ». Quelques mots, qui n’ont pas pris plus de vingt secondes à écrire et que Sora, le nouveau service d’OpenAI, sait désormais transformer en une vidéo de près d’une minute.

L’éditeur de ChatGPT et du générateur d’images DALL-E, a dévoilé jeudi ce nouvel outil, capable de créer des vidéos réalistes à partir d’une simple saisie de texte. Si vous doutez de l’importance de l’annonce, jetez un œil au résultat du « prompt », la commande rédigée en tête d’article :

L’accès à ce contenu a été bloqué afin de respecter votre choix de consentement

En cliquant sur« J’accepte », vous acceptez le dépôt de cookies par des services externes et aurez ainsi accès aux contenus de nos partenaires.

Plus d’informations sur la pagePolitique de gestion des cookies

S’appuyant sur les recherches menées pour les précédents programmes d’OpenAI, DALL-E et GPT, cette nouvelle plateforme est encore en cours de test. Le programme peut générer des vidéos d’une durée maximale d’une minute « tout en maintenant une qualité visuelle et respectant la demande de l’utilisateur », a indiqué OpenAI sur son site Internet.

Sora permet aussi de créer une vidéo à partir d’une image fixe, assure le géant de l’intelligence artificielle, ou d’allonger des vidéos existantes. Sam Altman, le patron d’OpenAI, a déclaré sur le réseau social X que sa société allait « offrir à un nombre limité de créateurs l’accès » à ce nouvel outil, dans le cadre d’une phase expérimentale.

Il a également incité les utilisateurs à faire des propositions pour générer des vidéos, dont il a quelques instants plus tard diffusé les plus pertinentes sur la plateforme. On peut ainsi voir deux chiens en train de s’ébattre dans la neige à la montagne, un canard-dragon s’envoler devant un magnifique coucher de soleil, avec sur le dos un hamster.

Défauts

OpenAI a prévenu que le « modèle actuel » de la plateforme présentait « des défauts » avec une confusion entre la gauche et la droite ou l’incapacité à maintenir une continuité visuelle durant toute la vidéo.

« Par exemple, une personne peut prendre une bouchée d’un biscuit, mais après, le biscuit peut ne pas avoir de trace de morsure », explique l’éditeur.

Enjeux de sécurité

En dévoilant ce nouvel outil, la compagnie a affirmé que la question de la sécurité constituait un enjeu essentiel et que des tests seraient organisés avec des utilisateurs à qui l’on demanderait par exemple de tenter de créer des contenus inappropriés, afin de mieux définir les limites de la plateforme.

« Nous allons engager des décideurs politiques, des éducateurs et des artistes à travers le monde pour comprendre leurs préoccupations et identifier les cas positifs d’utilisation de cette nouvelle technologie », a indiqué OpenAI. Mieux vaut ne pas traîner, au rythme où progresse l’IA générative, ces questions risquent d’être très vite obsolètes.