Fermer

septembre 27, 2023

ChatGPT pourra bientôt voir, parler et entendre

ChatGPT pourra bientôt voir, parler et entendre


Alors que ChatGPT continue de changer le paysage du travail créatif, pour le meilleur ou pour le pire, une nouvelle mise à jour de la technologie pourrait permettre au robot de faire bien plus que simplement écrire des mots.

Open AI, la société qui possède et exploite ChatGPT, a annoncé lundi ce son bot pourra bientôt analyser des photos et avoir des conversations audio.

Les utilisateurs peuvent télécharger des photos d’une scène ou d’un objet, puis demander à ChatGPT de parler de ce qu’il voit et de poser des questions sur ce que les photos impliquent grâce à la reconnaissance d’images.

En rapport: ChatGPT : qu’est-ce que c’est et comment ça marche ?

Grâce à ses capacités vocales, ChatGPT imitera les voix et créera de la parole après avoir écouté « quelques secondes seulement » de quelqu’un qui parle.

Open AI a averti que cela pourrait, bien sûr, entraîner « la possibilité pour des acteurs malveillants de se faire passer pour des personnalités publiques ou de commettre une fraude ». Cependant, la société affirme que ChatGPT ne parlera qu’avec les voix déjà présentes dans le système et préalablement approuvées par la société.

« Nous commençons à déployer de nouvelles fonctionnalités vocales et d’image dans ChatGPT. Elles offrent un nouveau type d’interface plus intuitif en vous permettant d’avoir une conversation vocale ou de montrer à ChatGPT de quoi vous parlez », a déclaré Open AI dans un communiqué. libérer.

En rapport: La véritable menace de ChatGPT n’est pas l’outil lui-même

Spotify utilise l’IA pour les traductions de podcasts

Spotify est utilisant déjà la nouvelle technologie, a annoncé la société cette semaine pour sa fonctionnalité de traduction vocale, qui permettra de traduire des podcasts longs dans d’autres langues tout en utilisant la voix et les inflexions vocales du podcasteur d’origine.

« Cet outil développé par Spotify exploite les dernières innovations, dont la nouvelle technologie de génération de voix d’OpenAI, pour correspondre au style de l’orateur d’origine, créant ainsi une expérience d’écoute plus authentique, plus personnelle et plus naturelle que le doublage traditionnel », a expliqué la société. dans un communiqué.

Open AI a déclaré que les fonctionnalités de voix et d’image commenceraient à être déployées auprès des utilisateurs de ChatGPT Plus et Enterprise dans les deux prochaines semaines.




Source link