Fermer

novembre 15, 2024

DeepL franchit la « prochaine frontière » en matière de traduction IA avec DeepL Voice

DeepL franchit la « prochaine frontière » en matière de traduction IA avec DeepL Voice



Allemand technologie chéri DeepL a (enfin) lancé un service de voix-texte. Il s’appelle DeepL Voice et transforme l’audio des conversations en direct ou vidéo en texte traduit.

Les utilisateurs de DeepL peuvent désormais écouter les personnes parlant une langue qu’ils ne comprennent pas et la traduire automatiquement dans une langue qu’ils maîtrisent, en temps réel. La nouvelle fonctionnalité actuellement prend en charge l’anglais, l’allemand, le japonais, le coréen, le suédois, le néerlandais, le français, le turc, le polonais, le portugais, le russe, l’espagnol et l’italien.

Ce qui rend le lancement de DeepL Voice passionnant, c’est qu’il fonctionne sur les mêmes réseaux neuronaux que l’offre texte-texte de l’entreprise, qu’il réclamations est le «le meilleur du monde» IA traducteur.

En tant que personne qui vient d’emménager dans un pays étranger, j’ai hâte d’essayer un traducteur voix-texte qui pourrait réellement fonctionner. Tous ceux que j’ai essayés jusqu’à présent ne sont pas en temps réel – il y a un décalage qui les rend plutôt inutiles – et la qualité de la traduction est plutôt médiocre.

Pour les conversations en face à face, vous pouvez lancer DeepL Voice sur votre mobile et le placer entre vous et l’autre interlocuteur. Il affiche ensuite votre conversation afin que chaque personne puisse suivre facilement les traductions sur un seul appareil.

Vous pouvez également intégrer DeepL Voice dans Microsoft Teams et organiser des vidéoconférences malgré les barrières linguistiques. Le texte traduit apparaît dans une barre latérale sous forme de légendes. Reste à savoir si DeepL Voice sera bientôt disponible sur des plateformes comme Zoom ou Google Meet.

« La prochaine frontière »

Bien qu’il s’agisse de la première offre de ce type de DeepL, il est peu probable que ce soit la dernière. Fondateur et PDG de DeepL, Jarek Kutylowski appelé traduction vocale en temps réel le « prochaine frontière »pour l’entreprise.

« DeepL est déjà un leader en matière de traduction écrite, mais la traduction vocale en temps réel est une toute autre histoire », a déclaré le fondateur et PDG de DeepL, Jarek Kutylowski.

« Lorsque vous traduisez un discours, vous êtes confronté à des saisies incomplètes, des problèmes de prononciation, de latence et bien plus encore, qui peuvent tous conduire à des traductions inexactes et à une mauvaise expérience utilisateur.

« Donc nous avons construit une solution qui prendrait en compte ces éléments dès le départ et permettrait aux entreprises de supprimer les barrières linguistiques en leur permettant de communiquer dans plusieurs langues selon les besoins », a déclaré Kutylowski.

La qualité sera probablement le facteur de différenciation de DeepL Voice par rapport aux innombrables autres fournisseurs de traductions voix-texte.

D’un point de vue technologique, le succès de DeepL réside dans l’architecture de ses réseaux neuronaux, la contribution des éditeurs humains et les données de formation. Mais Kutylowski estime également disposer d’un avantage clé par rapport à ses concurrents : la concentration.

« La concentration est toujours une chose importante », Kutylowski dit précédemment TNO. « La traduction n’est pas le cœur de métier de Google ; c’est l’un des 100 travaux annexes. Il en va de même si vous considérez les LLM et les OpenAI de ce monde comme nos concurrents ; la traduction n’est qu’une chose de ce qu’ils font et leur GPU fait une tonne de choses différentes. Nous nous concentrons sur un domaine particulier.

En mai, DeepL a atteint une valorisation de 2 milliards de dollars après avoir obtenu un nouveau investissement de 300 millions de dollars (277 M€). Il couvre 32 langues et compte plus de 100 000 utilisateurs professionnels.




Source link