Fermer

avril 2, 2024

Moteur vocal de démonstration OpenAI, mais pas prêt pour une diffusion à grande échelle

Moteur vocal de démonstration OpenAI, mais pas prêt pour une diffusion à grande échelle


Les deepfakes audio, ou l’audio généré par l’IA qui usurpe l’identité de quelqu’un, ne sont pas nouveaux – et c’est la raison pour laquelle OpenAI, la société qui a introduit les chatbots IA au grand public, hésite à publier sa dernière offre.

OpenAI a annoncé vendredi qu’elle avait choisi de prévisualiser, mais pas de diffuser à grande échelle, le générateur vocal réaliste de synthèse vocale, Voice Engine, en raison du « potentiel d’utilisation abusive de la voix synthétique ».

Dans un article de blogla société a décrit la capacité de Voice Engine à prendre un échantillon de 15 secondes de la voix d’une personne et à l’imiter de manière émotionnelle et réaliste selon les instructions d’une saisie de texte.

« Si vous disposez de la bonne configuration audio, il s’agit essentiellement d’une voix de calibre humain », Jeff Harris, responsable produit chez OpenAI, dit Bloomberg. « C’est une qualité technique assez impressionnante. »

En rapport: Les escroqueries Deepfake deviennent si sophistiquées qu’elles pourraient commencer à se faire passer pour votre patron et vos collègues

OpenAI teste Voice Engine en privé depuis son développement il y a plus d’un an et a identifié qu’il peut être « utilisé à bon escient » dans son article de blog.

Dans une application présentée en avant-première par la société, Voice Engine prend en charge les personnes non verbales en donnant des voix distinctes dans de nombreuses langues. Livoxune application de communication alternative, a déjà commencé à utiliser cette technologie à cette fin, selon OpenAI.

Voice Engine pourrait également traduire des vidéos et des podcasts dans d’autres langues et fournir une aide à la lecture aux enfants et aux non-lecteurs avec du contenu audio.

En rapport: Le Tennessee vient d’adopter une nouvelle loi pour protéger les musiciens d’une menace croissante de l’IA

OpenAI a souligné son Sécurité de l’IA et engagements volontaires politiques lorsqu’il expose les raisons pour lesquelles il prévisualise et ne publie pas Voice Engine au public. L’avant-première visait à présenter les capacités de Voice Engine tout en soulignant « la nécessité de renforcer la résilience sociétale face aux défis posés par des modèles génératifs toujours plus convaincants », a déclaré la société.

Les voix synthétiques ont suscité l’intérêt du monde des startups, la société de clonage de voix IA ElevenLabs étant évaluée à 1,1 milliard de dollars en 2017. Janvier après son lancement en version bêta il y a seulement environ un an. La technologie a également été critiquée pour le nouveau pouvoir qu’elle confère aux cybercriminels, qui peuvent l’utiliser pour se faire passer pour des personnes ou accéder à des fonds via services bancaires vocaux.

OpenAI en avant-première Générateur vidéo IA appelé Sora le mois dernier qui crée des vidéos réalistes à partir d’invites.

En rapport: « C’est un problème sérieux » : M. Beast critique l’IA Deepfake




Source link