Les clones d’IA génèrent des émotions humaines, les Deepfakes de Synthesia semblent réels

Est-ce un humain qui parle derrière la caméra ou un clone de l’IA ? Une innovation surprenante d’une startup licorne soutenu par Nvidia il est presque impossible de faire la différence.
La startup d’IA Synthesia, qui a atteint le statut de licorne valorisée en milliards de dollars l’année dernière, a publié jeudi une nouvelle technologie appelée Expressive Avatars ; les premiers clones numériques d’IA au monde capables de produire des expressions faciales humaines et le bon ton de voix à partir de messages écrits.
La technologie commence par un avatar IA, qui peut être personnalisé pour refléter de vrais visages.
Crédit photo : Synthésie
L’IA crée une copie numérique d’une personne sur la base d’images enregistrées via sa webcam ou sur un studio certifié. Il peut également cloner la voix de la personne pour l’infuser dans sa ressemblance numérique.
Ceux qui hésitent à créer un avatar IA qui prend leur visage et leur voix peuvent opter pour l’un des plus de 160 avatars IA préchargés que Synthesia a dans sa base de données.
En rapport: « C’est un problème sérieux » : M. Beast dénonce les Deepfakes de l’IA
Une fois qu’un utilisateur crée ou sélectionne un avatar IA, il ne lui reste plus qu’à faire une chose : écrire ce qu’il veut que son moi numérique dise.
Dans une démo vue par CNBC, un utilisateur a écrit « Je suis heureux. Je suis triste. Je suis frustré. » et a demandé au clone numérique généré par l’IA de lire le texte. L’avatar transmettait des expressions faciales et un ton associés au bonheur lorsqu’il prononçait le texte « Je suis heureux » et changeait son inflexion de manière appropriée lorsqu’il disait « Je suis frustré ». Le ton correspondait aux mots.
Avec un clone d’IA et une invite écrite, un utilisateur gratuit peut générer 36 minutes de vidéos personnalisées dans plus de 120 langues chaque année. Forfaits payants allez jusqu’à 67 $ par mois pour jusqu’à 360 minutes de vidéo par an ou des minutes de vidéo illimitées pour les entreprises qui optent pour un forfait entreprise.
Synthesia est une startup que les grandes entreprises utilisent en coulisses. Zoom, Xerox, Microsoft et Reuters utilisent tous en interne les programmes de Synthesia. Le PDG de Synthesia, Victor Riparbelli, a déclaré au Revue technologique du MIT que 56 % des entreprises Fortune 100 utilisaient cette technologie.
Synthesia commercialise cette technologie comme un moyen de créer des avatars numériques expressifs pour les formations et présentations en entreprise. Par exemple, les concepteurs de Zoom ont créé des vidéos de formation à la vente dans Synthesia en 90 % moins de temps qu’il n’en fallait à des êtres humains pour créer les vidéos.
En rapport: JPMorgan affirme que son logiciel de flux de trésorerie IA a réduit le travail humain de près de 90 %
« Les experts en la matière de Zoom n’ont plus besoin de s’enregistrer, ce qui libère 15 à 20 heures chaque mois pour travailler sur leur travail réel », indique le site Web de Synthesia. lit.
Pourtant, la capacité de créer des deepfakes effrayants, ou une IA qui clone et manipule des voix, des ressemblances ou d’autres aspects d’un être humain sans sa permission, peut conduire à une mauvaise utilisation.
Le mois dernier, le Tennessee est devenu le premier État américain adopter une loi protéger les professionnels de l’industrie musicale contre les deepfakes.
Source link