Que signifie Sora d'OpenAI pour vous ? Des experts africains en IA répondent à 6 questions brûlantes sur le modèle texte-vidéo

·
17 février 2024
·
5 min read

Si vous pensiez que l'innovation en matière d'IA allait trop vite, OpenAI vient de doubler la vitesse en annonce Sora, son modèle texte-vidéo, et les résultats sont terriblement bons.

Ce n'est qu'en décembre 2022 qu'OpenAI a choqué le monde avec ChatGPT, un modèle d'IA qui a marqué un tournant dans l'innovation en matière d'IA. Et à peine un an plus tard, l’entreprise complète ce chiffre avec quelque chose d’incroyable.

Les vidéos publiées parallèlement à l’annonce sur X ont choqué les gens. Sam Altman, PDG d'OpenAI, a même demandé aux gens d'envoyer des invites pour tester Sora. "Ne vous retenez pas sur les détails ou les difficultés", a-t-il déclaré.

Et même si Sora représente une avancée incroyable pour l’OpenAI et l’innovation en matière d’IA, qu’est-ce que cela signifie pour l’Afrique ? Voici les réponses à 11 questions sur Sora.

Publicité

1.   Qu’est-ce que Sora ?

Sora est un modèle texte-vidéo d'OpenAI. Selon les déclarations officielles, le modèle est en train d'être entraîné pour « simuler le monde physique en mouvement ».

Sora peut générer des vidéos d'une minute en fonction d'une invite qui lui a été donnée. Il y a échantillons vidéo sur le site Web OpenAI qui semblent précis par rapport aux invites. Altman a également publié des vidéos générées par les invites de personnes sur les réseaux sociaux.

Selon OpenAI, Sora peut générer des scènes complexes avec des personnages complexes. Il peut le faire parce qu'il ne comprend pas seulement ce que veut l'utilisateur, il comprend également comment ces choses existent dans le monde réel.

2. Comment fonctionne Sora ?

Comme ChatGPT, Sora utilise également des transformateurs – en les considérant comme une sorte de cerveau IA – pour comprendre le contexte.

Sora s'appuie également sur les recherches effectuées pour DALL-E, le modèle de génération d'images d'OpenAI. Il a également été formé avec différentes images et vidéos. Il utilise ce qu'on appelle une « technique de recaptionnement » pour générer des vidéos basées sur les données qu'il a été entraînées.

Soyez le plus intelligent de la pièce

Rejoignez les 30,000 5 abonnés qui reçoivent Techpoint Digest, un tour d'horizon hebdomadaire et quotidien amusant de XNUMX minutes des événements technologiques africains et mondiaux, directement dans votre boîte de réception, des heures avant tout le monde.
Abonnement au résumé

Essayez-le, vous pouvez vous désinscrire à tout moment. Politique de confidentialité.

3. Que peut faire Sora d'autre ?

Bien que Sora puisse transformer du texte en vidéos, il peut également générer des vidéos à partir d'images. Par exemple, vous pouvez lui envoyer une photo de votre chien et il l'animera dans une vidéo.

Fait intéressant, il peut également générer des vidéos à partir d’autres vidéos. OpenAI indique qu'il peut "prendre une vidéo existante et l'étendre ou remplir les images manquantes".

4.  Puis-je utiliser Sora maintenant ?

Non, vous ne pouvez pas utiliser Sora maintenant. Bien qu'il ait été annoncé publiquement, il est encore en phase de red-teaming. Cela signifie que des experts en désinformation, en contenu haineux et en préjugés testent toujours le modèle.

Le modèle sera également ouvert à certains artistes visuels, designers et cinéastes afin qu'ils puissent donner leur avis à OpenAI sur la manière dont le modèle peut être utile aux créateurs.

Que signifie Sora d’OpenAI pour l’Afrique ?

Olumide Okubadejo, chercheur scientifique en IA et chef de produit chez Sabi estime que Sora est un exploit incroyable basé sur la difficulté de créer du texte en vidéo.

Dr Olumide Okubadejo
Dr Olumide Okubadejo

"Tout ce qui implique de traduire des modalités statiques comme le texte en modalités de séries temporelles comme la vidéo ou le son est toujours complexe. Le faire à une échelle où vous pouvez commercialiser à un moment donné est incroyable", dit-il.

Olayinka Omolere, chef de produit dans une startup d'IA en phase de démarrage, est également impressionné par Sora, mais il craint que cela n'enlève des parts de marché aux autres startups d'IA qui se concentrent sur l'utilisation de l'IA pour créer des vidéos.

Certaines de ces startups sont Runway qui a levé 141 millions de dollars en juin, Synthesia qui a levé 90 millions de dollars en juillet 2023 et Pika qui a levé 30 millions de dollars en décembre 2023.

Mais comment Sora affecte-t-il les Africains et l’Afrique ?

5.  Quel impact Sora aura-t-il sur les emplois dans l’industrie créative en Afrique ?

Omolere estime que l’impact ne sera pas bon car cela pourrait réduire le nombre d’emplois créatifs.

Il dit qu'au lieu d'embaucher des mannequins africains et une équipe de production pour une publicité, une entreprise pourrait simplement rédiger une invite et embaucher des monteurs vidéo pour ajouter la marque de l'entreprise, ce qui rendrait le processus 10 fois moins cher.

Okubadejo a cependant un point de vue légèrement différent. Bien qu'il soit d'accord sur le fait que certains projets à petit budget pourraient éliminer le besoin de certaines personnes, il estime que Sora sera davantage une intégration dans le flux de travail actuel.

"Les créateurs et générateurs de contenu deviendront bien meilleurs dans ce domaine car ils disposent désormais d'un outil qui a réduit le temps de bout en bout de leurs processus créatifs."

6. Comment les individus et les organisations peuvent-ils s’adapter à ces changements ?

Okubadejo suggère qu’une façon de s’adapter aux nouvelles innovations en matière d’IA est de les considérer comme un moyen de réduire l’efficacité du temps.

Et pour les individus ou les organisations qui réalisent des vidéos d'une minute, Omolere conseille d'apprendre comment fonctionne Sora, de découvrir ses limites et de trouver un moyen de l'utiliser pour compléter leurs compétences.

7. Comment pouvons-nous empêcher la propagation de fausses nouvelles et de désinformations avec Sora ?

Les vidéos générées par Sora semblent très crédibles et réalistes, ce qui signifie que de mauvais acteurs pourraient les utiliser comme moyen de désinformer et de diffuser de fausses nouvelles.

OpenAI y a pensé, c'est pourquoi ils prévoient d'inclure quelque chose appelé Métadonnées C2PA cela permettrait aux gens de savoir si une vidéo a été générée par Sora.

Cependant, dit Omolere, très peu de gens peuvent déterminer si une vidéo contient des métadonnées CP2A et une vidéo aurait probablement fait le tour du monde 10 fois avant que nous sachions qu'elle est générée par l'IA.

Et même si OpenAI dit que vous pouvez utiliser des sites comme Identifiants de contenu pour vérifier si une image ou une vidéo est générée par l'IA, les métadonnées peuvent facilement être supprimées. En fait, le téléchargement sur certains sites de médias sociaux supprime automatiquement les métadonnées.

Okubadejo a ajouté que c’est là que les politiques en matière d’IA devraient intervenir, mais que malheureusement, les politiques rattrapent toujours l’innovation.

8. Sora peut-il aider à l'éducation et au développement des compétences ?

Okubadejo dit oui. "Pour les personnes qui apprennent visuellement, nous disposons désormais d'un outil qui peut véritablement contribuer à démocratiser l'éducation, de la génération de contenu à la génération de vidéos."

9. Quels sont les obstacles à l’adoption de Sora en Afrique ?

Les obstacles évidents à l’adoption de la technologie en Afrique sont l’accès à un bon Internet, à l’électricité et à l’accès aux appareils, mais Okubadejo pense que cela va au-delà.

"Nous sommes des gens très traditionnels, nous sommes connectés aux émotions et aux éléments de tout ce qui a été construit, et nous pourrions avoir du mal avec des productions que nous ne pouvons pas connecter à l'histoire qui se cache derrière."

11. Comment le gouvernement peut-il réglementer l’adoption de Sora pour garantir des résultats positifs ?  

Alors que la réglementation gouvernementale rattrape toujours l’innovation, Omolere estime que ce n’est pas le moment de se précipiter.

"Mieux vaut une approche attentive et patiente qu'une réglementation impulsive", dit-il.

Il pense que les gouvernements africains devraient prêter attention à tout ce qui se passe dans le domaine de l’IA, contribuer au débat et comprendre comment ces technologies affectent les entreprises, la société, l’emploi et la vie quotidienne.

Okubadejo pense également que les gouvernements doivent commencer à réfléchir à leurs politiques maintenant et pas plus tard. En tant que créateur d’outils d’IA, il souligne à quelle vitesse le monde évolue et pourquoi les gouvernements ont besoin de la participation de tous pour élaborer des politiques.

Les politiques sont importantes à mesure que l’IA devient effrayante. Ce article d'un GPT-4 affrontant un Techpoint Afrique Le journaliste montre à quel point l'IA s'améliore.

Cependant, nous devons également réfléchir aux moyens de faire de l’Afrique non seulement un consommateur de technologie mais aussi un innovateur. Malheureusement, les experts en IA affirment que la technologie n’a même pas commencé à explorer dans des endroits comme le Nigéria


Vous avez un pourboire? Nos journalistes sont prêts à creuser plus profondément. S'il vous plaît partager vos idées et informations et aidez-nous à découvrir les histoires qui comptent.

C'est un geek, un ventouse pour Blockchain et un amateur de technologie polyvalent. Retrouvez-moi sur Twitter @BoluAbiodun1.
C'est un geek, un ventouse pour Blockchain et un amateur de technologie polyvalent. Retrouvez-moi sur Twitter @BoluAbiodun1.
Abonnez-vous à Techpoint Digest
Rejoignez des milliers d'abonnés pour recevoir notre tour d'horizon hebdomadaire et quotidien de 5 minutes des événements technologiques africains et mondiaux, directement dans votre boîte de réception, des heures avant tout le monde.
Il s'agit d'un tour d'horizon quotidien de 5 minutes des événements technologiques africains et mondiaux, envoyé directement dans votre boîte de réception, entre 5 h et 7 h (WAT) tous les jours de la semaine ! 
Abonnement au résumé

Essayez-le, vous pouvez vous désinscrire à tout moment. Politique de confidentialité.

C'est un geek, un ventouse pour Blockchain et un amateur de technologie polyvalent. Retrouvez-moi sur Twitter @BoluAbiodun1.

Autres histoires

43b, Emina Cres, Allen, Ikeja.

 Techpremier Media Limited. Tous les droits sont réservés
loupe