La semaine dernière, OpenAI, société déjà à la base de DALL-E (un modèle capable de générer des images à partir de requêtes textuelles) et de ChatGPT (un chatbot fonctionnant sur base d’intelligence artificielle), annonçait le lancement prochain de Sora, un modèle capable cette fois-ci de produire des vidéos sur base d’une description texte. Une révolution ? Pas fondamentalement, puisqu’il existait déjà plusieurs outils permettant de faire ce type de chose. Par contre, dire que la qualité des vidéos produites par Sora a laissé tout le monde bouche bée serait un euphémisme…
Comment est-ce que cela fonctionne ? Imaginez avoir besoin d’une vidéo de quelques secondes présentant deux chiens en train d’enregistrer un podcast sur flanc de montagne. Sora pourrait vous fournir cette vidéo. OpenAI annonce que son modèle est actuellement capable de produire des vidéos d’une minute. Si l’outil n’est pas encore accessible à tout le monde, on peut se douter que cela va se faire graduellement et que ce n’est qu’une question de semaines avant que tout à chacun y ait accès. Avec quelles conséquences ?
La première est bien sûr la question des deepfake. Déjà à l’origine de quelques escroqueries, les modèles utilisant l’intelligence artificielle ont le défaut de permettre à des personnes mal intentionnées de produire de fausses photos de vraies personnes, de simuler la voix de n’importe qui ou presque et, à présent, de créer des vidéos de tout ce qui serait inimaginable. Il ne va pas falloir attendre longtemps avant qu’il ne faille se poser la question de ce qui est vrai ou non, sur les réseaux sociaux et ailleurs.
L’autre problématique est l’effet que risque d’avoir l’avènement de ces outils sur les métiers créatifs. Déjà, les nouvelles versions de Photoshop dopées à l’IA permettent aujourd’hui de modifier des photos pour obtenir une prise de vue plus proche de celle que l’on souhaite sans avoir besoin de refaire appel à un photographe. Des outils comme DALL-E, Midjourney ou Firefly permettent de créer la couverture de votre prochain magazine, sans avoir besoin de faire appel à un graphiste. Et si votre prochaine vidéo pouvait être réalisée sans vidéaste ou société de production dédiée ?
Difficile de se forger un avis tant que le modèle reste sagement gardé derrière un mur. Se baser uniquement sur les exemples fournis par OpenAI serait potentiellement trompeur. La création d’images par intelligence artificielle est déjà utilisée depuis plusieurs mois et il reste suffisamment de défaut pour qu’elle ne fasse pas mouche à tous les coups. Difficile d’imaginer que, pour quelque chose d’aussi complexe que de la vidéo, ce soit le cas avant quelque temps.
Néanmoins, on le sait, la technologie avance vite. Comme ChatGPT avant lui, Sora ne part pas de rien et utilise une quantité massive de données pour s’entraîner, utilisant par exemple les bases de données de Shutterstock, pour s’alimenter en exemple et pouvoir en produire des variations. Et c’est peut-être la première chose à garder à l’esprit : pour l’instant, ce ne sont potentiellement que des variations. Une vidéo d’un oiseau créé par Sora ? Il existe certainement plusieurs dizaines de vidéo du même oiseau sur lesquelles l’IA a pu se baser.
Il faut donc rester prudent sur ce que va entraîner à long terme l’arrivée d’outils comme Sora (la fin du cinéma traditionnel ???). Il y a par contre plusieurs cas d’usage que l’on peut déjà prédire. Pour retravailler une vidéo existante par exemple : besoin de supprimer une voiture ou un passant sur un plan ? Facile ! Ou de remplacer cet acteur gênant du film qui est sur le point de sortir ? Plus besoin de refilmer ses scènes !
Si on peut facilement concevoir que Sora soit utilisé pour créer facilement des storyboards ou des mood boards en amont de projets pour faciliter leur réalisation, on peut aussi penser à l’après : remettre à jour d’anciennes vidéos, voir d’anciens films, pour les mettre au goût du jour ou changer leur style, comme l’expérimente déjà Insta360 avec ses caméras.
Je ne vais pas condamner Sora d’entrée de jeu. Comme souvent, ce n’est pas l’outil qui est bon ou mauvais, c’est l’usage qui en est fait. On pourrait par contre se poser la question de l’utilisation des ressources naturelles qu’entraîne l’usage de ces outils, bien loin de la sobriété énergétique qui devrait être la nôtre aujourd’hui. Les géants de la Tech auraient dit que le risque de désinformation qui accompagne l’intelligence artificielle est plus grand que celui des changements climatiques. Vu comme c’est parti, les deux vont peut-être aller de pair…