Site icon Blog ARC Optimizer

Comment les outils de dictée IA ont changé ma façon de travailler (et lesquels en valent la peine)

Comment les outils de dictée IA ont changé ma façon de travailler (et lesquels en valent la peine)


En tant que responsable de l’ingénierie chez Buffer, j’écris beaucoup : messages Slack, propositions, code, documentation et commentaires. Et à mesure que les outils d’IA sont devenus partie intégrante de mon flux de travail, je me suis retrouvé à écrire encore plus.

J’ai toujours été lent à taper et je pense mieux en parlant qu’en écrivant. Cela n’a jamais semblé être une grande limitation auparavant, mais avec les outils d’IA, j’ai commencé à le ressentir de plus en plus. Je gardais les invites courtes même si je savais que je devais ajouter plus de détails, car tout taper me semblait fastidieux.

Ensuite, j’ai essayé la fonctionnalité vocale de ChatGPT et quelque chose a cliqué. Je pourrais inclure tout le contexte et les nuances que j’ignorerais normalement. Je voulais cette expérience partout, pas seulement dans une seule application.

Ainsi, au cours de la dernière année, j’ai testé quatre outils de synthèse vocale basés sur l’IA dans mon flux de travail quotidien. Ils diffèrent beaucoup en termes de vitesse, de précision et de fonctionnalités. Lisez la suite pour en savoir plus sur la façon dont j’ai utilisé chaque outil, combien ils coûtent et comment j’intègre la dictée dans mon flux de travail.

SuperWhisper : puissant mais nécessite d’être peaufiné

Forfait gratuit : 15 minutes de dictée par mois

Forfait payant : 8,49 $ par mois

Pendant plus d’un an, j’ai utilisé Supermurmure et en était très content. C’est un outil solide avec beaucoup de personnalisation – vous pouvez configurer différents modèles d’IA, invites personnalisées et modes pour différentes applications, de sorte qu’il applique différents préréglages dans Slack par rapport à un IDE de codage, par exemple.

L’abonnement était abordable, à moins de 10 dollars par mois, et pendant un certain temps, il a assez bien fonctionné. Mais j’ai rencontré deux problèmes. La précision n’était pas excellente pour mon accent (je ne suis pas anglophone) et j’avais souvent besoin de faire de lourdes modifications après avoir dicté, notamment avec des termes techniques. C’était également assez lent : je dictais quelque chose et j’attendais ensuite qu’il soit traité, ce qui interrompait mon flux.

J’ai réalisé que je ne voulais pas d’un outil avec lequel je devais bricoler et personnaliser énormément. Je voulais quelque chose qui fonctionnait mieux dès la sortie de la boîte. C’est ce qui m’a poussé à essayer d’autres options.

VoiceInk : un moyen à faible engagement d’essayer la dictée

Paiement unique de 25 $

J’ai essayé Encre vocale ensuite, sur la base de la recommandation d’un coéquipier. Il s’agit d’un achat unique de 25 $ et c’est open source, que j’aime soutenir.

L’expérience utilisateur est intelligente : elle s’intègre directement dans l’encoche macOS. Il est également entièrement local, donc tout le traitement s’effectue sur votre appareil, ce qui est excellent du point de vue de la confidentialité. Il dispose de quelques options de personnalisation et est nettement plus rapide que SuperWhisper.

Pour mes besoins, la précision n’était toujours pas au rendez-vous avec mon accent et mon style de parole, c’est pourquoi j’ai continué à chercher. Mais si vous débutez avec les outils de dictée et que vous souhaitez expérimenter sans engagement d’abonnement, c’est un choix très solide. Le prix le rend à faible risque, et pour une utilisation occasionnelle ou si vous avez des besoins de précision différents des miens, cela pourrait très bien fonctionner. De nombreuses personnes chez Buffer utilisent VoiceInk.

Wispr Flow : rapide, riche en fonctionnalités et raffiné

Forfait gratuit : jusqu’à 2 000 mots par semaine

Forfait payant : 15 $ par mois

Flux Wispr est l’outil que j’utilise actuellement.

C’est nettement plus cher que les options précédentes, mais la précision est nettement meilleure. Il détecte les termes techniques de manière fiable et enregistre automatiquement les mots que j’ai corrigés, afin de s’améliorer avec le temps.

La plus grande différence est la vitesse. Il traite votre audio pendant que vous parlez, de sorte que la transcription apparaît presque immédiatement après avoir terminé. Cela a transformé mon flux de travail : je peux rester dans le flux et changer de contexte beaucoup moins fréquemment.

Il gère également plusieurs langues de manière fluide, ce que de nombreux autres outils ne font pas. J’ai parfois besoin de basculer entre l’anglais et l’ukrainien (ma langue maternelle), et Wispr Flow gère cela sans aucun problème.

À 15 $/mois, c’est l’option la plus chère que j’ai testée, mais ses performances et sa fiabilité en valent la peine pour un usage professionnel quotidien.

Willow Voice : grande qualité, mais moins de fonctionnalités

Forfait gratuit : jusqu’à 2 000 mots par semaine

Forfait payant : 15 $ par mois

Voix de saule Son prix est similaire à celui de Wispr Flow et présente bon nombre des mêmes avantages : il est assez rapide et a une assez bonne précision. Pour mes cas d’utilisation particuliers, il était légèrement plus lent et légèrement moins fiable que Wispr Flow, mais pas de loin.

On a l’impression qu’ils sont un peu plus anciens en tant qu’entreprise, et certaines fonctionnalités auxquelles je m’attendais n’étaient pas encore là. Je le surveille, mais j’ai opté pour Wispr Flow car il était légèrement meilleur dans la plupart des aspects qui comptaient pour moi.

Outil Prix Plate-forme Vitesse Précision
Supermurmure 8 $/mois  Mac OS + iOS Moyen * Moyen *
Encre vocale 25 $ une fois  Mac OS + iOS Moyen * Moyen *
Flux Wispr 15 $/mois  Mac OS + iOS
Fenêtres
Androïde Très rapide Haut
Voix de saule 15 $/mois  Mac OS + iOS Très rapide Haut

✏️ Une chose à noter: pour des outils comme Superwhisper et VoiceInk qui s’exécutent localement, la vitesse dépend du modèle d’IA que vous choisissez. Les modèles plus grands ont tendance à être plus précis mais plus lents à traiter.

Comment j’utilise la dictée dans la pratique

La dictée est rapidement devenue un élément quotidien de mon travail. Voici comment cela s’est manifesté dans mon travail pratique :

Invite de l’IA

Pour la plupart, j’ai arrêté de taper des invites d’IA lorsque j’utilise des agents d’IA pour le codage ou dans les interfaces de discussion. Cela a été le plus gros déblocage et un gain de temps pour moi.

Cela a également rendu mes invites plus nuancées et détaillées par rapport au moment où je les tape, ce qui a amélioré les résultats de l’IA. Lorsque je tape, j’ai tendance à rester bref par commodité. Lorsque je dicte, je fournis naturellement plus de contexte et d’explications.

Décharges cérébrales et prise de notes

Lorsque j’ai quelque chose en tête, je le dicte généralement rapidement pour sauvegarder le contexte et y revenir plus tard. Il peut s’agir d’idées de projets, de réflexions après des réunions ou de problèmes auxquels je réfléchis.

Je n’essaie pas de créer une écriture raffinée dans ces moments-là, je capture simplement des pensées dans un format que je peux revisiter. La vitesse de la dictée rend cela pratique, contrairement à la frappe au clavier.

Messages et réponses rapides

Je dicte parfois aussi des messages plus courts*,*, bien que cela varie. La dictée fonctionne particulièrement bien pour les explications plus longues où je dois fournir un contexte. Pour les réponses très courtes ou les messages comportant de nombreux formats et liens, la saisie est généralement encore plus rapide.

Flux de travail personnalisés

J’ai également développé des workflows spécifiques autour de la dictée. J’ai quelques commandes AI personnalisées dans Raycast qui traitent la dictée puis la formatent de différentes manières.

Un cas d’utilisation que j’ai trouvé particulièrement utile est celui des entretiens. Nous avons mené une campagne de recrutement chez Buffer, j’ai donc fait beaucoup d’entretiens. Après un entretien, j’ai une commande AI dans Granola où je dicte mes pensées et mes impressions, et cela les structure sous forme de commentaires écrits pour les notes internes. Cela a considérablement rationalisé ce processus.

Réflexions et recommandations

J’ai beaucoup appris tout au long de ce processus. Voici quelques réflexions et recommandations si vous débutez dans la dictée ou si vous recherchez un nouvel outil :

  • La vitesse a un impact beaucoup plus important sur la convivialité que prévu. Ces quelques secondes d’attente pour le traitement s’additionnent rapidement et interrompent votre flux d’une manière qui n’est pas immédiatement évidente jusqu’à ce que vous utilisiez un outil plus rapide.
  • Je traite généralement les choses en en parlant. Les outils de dictée m’aident à réfléchir aux problèmes et à trouver les bons mots beaucoup plus rapidement que la saisie au clavier. Si vous êtes quelqu’un qui pense à voix haute, cela pourrait également transformer votre flux de travail.
  • Il ne s’agit pas de remplacer complètement la saisie. Différents contextes nécessitent différents outils. J’ai trouvé que la dictée était la plus utile pour les interactions avec l’IA, capturant rapidement les pensées et les explications plus longues. Pour des réponses rapides, du texte formaté ou une édition collaborative, la saisie reste souvent plus efficace.
  • Si vous souhaitez essayer des outils de dictée, je vous recommande de commencer par VoiceInk, étant donné le faible engagement. Si vous l’utilisez régulièrement et que les limitations deviennent frustrantes, Wispr Flow vaut pour moi l’investissement pour un usage professionnel quotidien.

Si vous essayez l’un de ces outils ou conseils, j’aimerais avoir de vos nouvelles. N’hésitez pas à nous contacter LinkedIn.

PS Ce post a été, en grande partie, dicté 😉




Source link
Quitter la version mobile