Fermer

avril 25, 2024

AI Unicorn dévoile les avatars les plus « émotionnellement expressifs » du marché

AI Unicorn dévoile les avatars les plus « émotionnellement expressifs » du marché



Une startup britannique a dévoilé aujourd’hui de nouveaux humains IA qui brouillent la frontière entre le virtuel et le réel. Synthesia appelle les êtres numériques des « avatars expressifs ». Ils promettent les expressions émotionnelles les plus réalistes du marché.

Générés par un modèle d’IA formé sur des images d’acteurs réels, les avatars sont conçus pour la création vidéo. Les utilisateurs saisissent simplement une invite de texte et les humains synthétiques les lisent sur un écran.

Les rendus photoréalistes sont certainement impressionnants. Mais ce qui les rend uniques, c’est leur capacité à transmettre des sentiments humains.

En utilisant une technique appelée « prédiction automatique des sentiments », les modèles d’IA de Synthesia déduisent les émotions contenues dans le texte. Cela détermine le ton de la voix, le langage corporel et l’expression du visage de l’avatar.

« Il s’agit sans aucun doute de la première itération d’avatars capables d’exprimer des émotions et de comprendre le sentiment du contenu », a déclaré Victor Riparbe, PDG et co-fondateur de Synthesia.

Les avatars seront également toujours générer des résultats entièrement nouveaux et uniques. Donnez-leur deux fois le même script et ils répondront avec deux performances différentes.. Selon les mots de Synthesia, ils sont passés de « rendus numériques » à des « acteurs numériques ».

Lors d’une démonstration de produit lundi, TNW a pu revoir ses talents d’acteur.

Les avatars IA montent sur scène

Aux yeux de cet humble critique, les avatars de Synthesia sont les meilleurs acteurs GenAI jamais joués à l’écran.

La combinaison de visages photoréalistes, de gestes émotionnels, de voix expressives et de mouvements synchronisés apporte un nouveau niveau de réalisme sur le marché.

Compte tenu d’un scénario optimiste, les avatars ont affiché un sourire et un ton énergique. Lorsqu’on leur donnait des répliques plus tristes, ils offraient une inflexion sombre et un discours plus lent.

Mais leurs performances n’ont toujours pas échappé aux critiques. vallée étrange. Leur principal défaut est une tendance à exagérer légèrement leurs émotions. En tant qu’acteurs, ils sont plus proches des stars du feuilleton D-list que des lauréats des Oscars.

Un autre inconvénient est que leurs mouvements se limitent à la tête, au visage et aux épaules. Tant que cela restera le cas, ils ne constitueront probablement qu’une menace pour les lecteurs de nouvelles.

Malgré ces limitations, les avatars ont le potentiel pour débloquer de nouvelles applications.

Prêt pour de nouveaux rôles

Synthesia, qui a atteint le statut de licorne l’année dernière après avoir levé 90 millions de dollars (84 millions d’euros) pour une valorisation de 1 milliard de dollars (932 millions d’euros), affirme que 55 000 entreprises, dont la moitié du Fortune 100 – sont déjà clients. Ils utilisent généralement la plateforme pour créer des vidéos à des fins de formation, de présentations, de marketing et de service client.

Avec les nouveaux avatars intégrés, Synthesia prévoit d’élargir les cas d’utilisation. Les vidéos promotionnelles pourraient donner un regain d’énergie. Les avatars du support client pourraient ajouter une touche conviviale. Les prestataires de soins de santé pourraient faire preuve d’empathie lors de présentations sur des sujets sensibles. Toutes ces émotions sont certes artificielles, mais elles deviennent de plus en plus réalistes.

Le réalisme ajouté crée cependant des risques. En tant qu’avatars devenant de plus en plus impossibles à distinguer des vrais humains, leur capacité à diffuser de la désinformation augmente.

La synthèse a déjà été exploitée à cette fin. Le les startups la technologie a déjà été utilisée pour produire de fausses nouvelles dans Chine, Venezuelaet le Mali.

En réponse, Synthesia a interdit les comptes, introduit de nouvelles règles et amélioré ses défenses numériques.

Plus de 60 formes de contenu sont désormais interdites ou restreintes. Une combinaison de filtres technologiques et de surveillance humaine assure la modération, les nouveaux clients sont examinés et la plateforme est régulièrement vérifié. Plus de 10 % de l’entreprise est consacrée à des travaux liés à la confiance et à la sécurité, a déclaré Synthesia.

Alors que le monde se prépare à les plus grandes élections de l’histoire de l’humanité, les inquiétudes concernant les deepfakes augmentent. Cependant, jusqu’à présent, les humains numériques n’ont pas été à la hauteur de leurs attentes. menace supposée.

Préparation pour des pièces plus grandes

Au siège londonien de Synthesia, les avatars envisagent des rôles plus légitimes. Leurs dernières performances ne sont qu’un « premier aperçu de ce dont ce modèle est capable ». » dit Riparbe. Il s’attend à « une amélioration par 10 » de leurs capacités cette année.

À terme, Synthesia prévoit de numériser l’intégralité de l’expérience de travail. La startup envisage IA des avatars parcourent les bureaux en 3D, communiquent avec des humains virtuels, nous présentent de nouveaux collègues, trouvent des salles de réunion et du personnel enseignant dans l’espace de travail.

Mais dans un avenir plus proche, réparation a une cible précise en vue.

« L’objectif interne pour la fin de l’année est que nous puissions produire une Keynote Apple de quelqu’un marchant et parlant et que cela semble tout à fait réel », a-t-il déclaré.

Cela pourrait alarmer un acteur en herbe en particulier. Tim Cook, vos jours sur scène pourraient être comptés.




Source link