3 choses que j'ai apprises Designing For Voice
À propos de l'auteur
Will se concentre sur la création de solutions significatives pour les marques grâce à des produits et des expériences attrayantes. Voulant plonger dans n'importe quel problème, son travail a traversé …
En savoir plus sur William …
Partout dans le monde, il y a des gens qui sont incapables d'effectuer facilement les tâches quotidiennes. Heureusement, les développeurs et les concepteurs peuvent aider en expérimentant la technologie vocale qui leur permet de réaliser des tâches que d'autres peuvent prendre pour acquises.
L'itération actuelle des assistants numériques à commande vocale a encore du mal à s'intégrer de manière aussi transparente que les trois grands acteurs d'Amazon, Google et Apple. Un rapport publié en par Voicelabs indique qu'il y a seulement 3% de chances qu'un utilisateur soit actif la deuxième semaine après avoir téléchargé une application vocale et 62% des compétences d'Alexa
En tant que concepteurs, nous avons une réelle opportunité de donner un sens précieux à ces assistants, mais nous essayons toujours de déterminer où la technologie peut apporter de réels avantages à l’utilisateur. Pour beaucoup, entreprendre un projet d'interface vocale (VUI) peut être un peu comme entrer dans l'inconnu . Il y a peu d'histoires de réussite pour les concepteurs ou les ingénieurs, en particulier dans des contextes qui illustrent comment cette technologie naissante pourrait aider les gens à s'épanouir de nouvelles manières.
Experimenting with speechSynthesis possibilité d'activer la voix de votre site Web dans deux directions: écouter vos utilisateurs via l'interface SpeechRecognition
et leur renvoyer via l'interface speechSynthesis
. Tout cela se fait via une API JavaScript, ce qui facilite les tests de support. Lire l'article →
SpeechRecognition
et leur renvoyer via l'interface speechSynthesis
. Tout cela se fait via une API JavaScript, ce qui facilite les tests de support. Lire l'article → Dans le cadre de Big Life Fix de la BBC2, des équipes d'inventeurs ont créé de nouvelles solutions pour les personnes dans le besoin. assistant contrôlé pour une femme appelée Susan. Susan vit avec une forme progressive de sclérose en plaques depuis plus de 20 ans et est maintenant incapable de réaliser ses tâches quotidiennes facilement. Avec les soignants à temps plein, elle compte sur les autres pour la laver et l'habiller, et elle n'est pas en mesure de changer de chaîne sans aide.
Bien que la technologie vocale semblait offrir le meilleur moyen de surmonter les difficultés physiques de Susan, Susan n'a jamais utilisé de smartphone, la propulser directement dans une interaction avec un assistant vocal ne serait jamais facile - nous avons dû réfléchir intelligemment pour l'aider à apprendre à communiquer avec une technologie incroyablement étrangère.
Le résultat pour Susan est un assistant à commande vocale hautement personnalisé qui lui permet désormais d'effectuer des tâches quotidiennes avec la liberté que d'autres considèrent comme acquise. appel téléphonique à la famille, écouter de la musique. Construit comme une version améliorée de la technologie Amazon Alexa sur leur appareil Echo Dot, l'assistant vocal de Susan impliquait également une personnalisation physique alors que nous imprimions en 3D un boîtier sous la forme de son animal préféré, un hibou.
solution pour Susan, mon équipe et moi avons découvert des dizaines de subtilités associées à la conception vocale de manière plus inclusive et accessible. Bien qu'il s'agisse d'un projet unique, il y avait trois points clés à retenir applicables à tout projet VUI.
1. Make It Personal
La technologie fonctionne. Il ne s'agit pas seulement d'attendre que la puissance de calcul augmente en fonction des attentes de l'utilisateur. Nous avons constaté que la détection, la reconnaissance et la synthèse vocales de chacun des périphériques étaient beaucoup plus puissantes que prévu. Et ce n'est pas comme s'il y avait un manque de choix. Il y a plus de 30 000 compétences Alexa sur Amazon, avec une moyenne de 50 nouvelles par jour. Les compétences sont des fonctionnalités spécifiques qui permettent aux concepteurs et aux développeurs de créer une expérience vocale plus personnalisée lors de l'utilisation d'appareils tels que Amazon Echo Dot. Ils fonctionnent comme une application dans l'App Store sur votre smartphone, vous permettant de personnaliser votre assistant vocal comme vous le souhaitez .
Cependant, représente un obstacle majeur à accès. Les compétences doivent être ajoutées via l'application plutôt que par l'appareil, ce qui annule souvent les avantages d'une interface utilisateur vocale et brise le flux de conversation (sans parler de l'exclusion de ceux qui ne peuvent / ne veulent pas utiliser un smartphone). Cela rend le processus maladroit et décousu au mieux, isolant complètement au pire. Même une fois qu'une compétence est installée, aucune visibilité sur les compétences et une période d'interaction limitée n'entraînent un manque de confiance et d'anxiété. peut-il faire ce que je veux? Comment puis-je lui parler? Est-ce qu'il m'a entendu? Alors, comment construisez-vous cette connexion et cette confiance?
Pour Susan, cela signifiait éliminer le superflu et présenter une sélection organisée de fonctionnalités de base. En personnalisant le contenu en fonction des comportements et des exigences uniques, nous avons présenté une clarté indispensable et une expérience plus significative. Susan voulait effectuer des tâches clés: répondre au téléphone, passer un appel, changer de chaîne de télévision, écouter de la musique, etc. En apprenant à comprendre elle et ses besoins, nous avons créé un assistant qui s'est toujours senti pertinent et utile . C'était un processus assez manuel, mais il y a une énorme opportunité pour l'apprentissage automatique et l'IA ici. Si chaque assistant vocal pouvait offrir un élément de personnalisation, cela pourrait rendre l'expérience plus pertinente pour tout le monde.
Comme nous concevions pour un individu, nous pouvions facilement adapter les éléments physiques du produit à Susan. Cela signifiait concevoir - puis imprimer en 3D - un diffuseur de lumière en forme de hibou (son animal préféré et quelque chose qui avait un sens significatif pour elle). Le hibou a agi comme une manifestation visuelle de la technologie et lui a donné quelque chose à parler et à projeter. C'est son guide qui lui a permis d'accéder aux compétences qu'elle souhaitait, comme écouter de la musique. Comme cela lui était personnel, a rendu la technologie potentiellement intimidante et intimidante beaucoup plus accessible et familière .

La technologie humanisante aide à la rendre plus accessible: le hibou personnalisé de Susan brille en réponse à sa voix, lui faisant savoir qu'elle est entendue et comprise. ( Grand aperçu )
Bien qu'un boîtier imprimé 3D entièrement personnalisé ne soit pas une option pour chaque projet VUI, il existe une opportunité de créer un dispositif plus pertinent avec lequel les gens peuvent communiquer, en particulier si leurs besoins ou leur utilisation sont très spécifiques. Par exemple, vous pourriez parler de votre épicerie à un éclairage à commande vocale concernant votre éclairage domestique et votre réfrigérateur.
2. Pensez aux possibilités audio
Actuellement, l'utilisateur effectue tous les travaux lourds. Avec un modèle mental obscurci et sans prise en main de la technologie, nous sommes obligés d'imaginer notre point de terminaison souhaité et de travailler en arrière à travers les commandes nécessaires. Mis à part les tâches les plus simples (régler une minuterie pendant 5 minutes, jouer à Abba sur Spotify, etc.), cela est extrêmement difficile, surtout si vous souffrez de «moments brumeux», ce que Susan nous a expliqué - difficulté à trouver les mots justes.
Lorsque Apple utilisait des éléments visuels skeuomorphes pour ses premières applications iPhone, l'utilisateur avait acquis des points de référence précieux et familiers, permettant son utilisation et sa méthode d'interaction. Ce n’est qu’une fois que le modèle mental est devenu plus établi qu’ils ont eu la liberté de s’éloigner de cette représentation littérale pour devenir leur interface utilisateur plate.
Lors de la conception de notre interface utilisateur graphique, nous avons décidé de navigation web. C'est un outil familier qui requiert moins de traitement cognitif de la part de l'utilisateur et nous a permis d'incorporer des méthodes de repérage qui ne débouchaient pas sur le début si les choses tournaient mal. Susan a trouvé verbalisant ce qu'elle voulait, dans le temps imparti par les assistants numériques actuels, une expérience stressante et souvent désagréable. souvent aggravé par un message d'erreur de l'appareil à la fin. Plutôt que d’attendre qu’elle donne une commande explicite telle que "Alexa, joue Abba à partir de ma playlist Spotify", nous avons décidé de créer un outil de menu guidé qui pourrait l’aider à démarrer lentement et à devenir plus précis sur ce qu’Alexa voulait faire. 19659005] Le hibou de Susan lui propose maintenant une liste d'options comme «Jouer de la musique» ou «Regarder quelque chose». Si elle choisit de la musique, elle devient plus précise à mesure qu'elle progresse dans chaque porte de décision. écouter; dans le cas d'Abba, elle sélectionnerait «musique des années 60», ce qui permet à Susan de naviguer plus facilement vers le résultat souhaité et à un rythme qui lui convient. Pendant ce temps, le hibou brillait et répondait à sa voix, lui faisant savoir qu'elle était entendue et comprise.

L'assistante vocale de Susan lui redonne une certaine indépendance, qu'elle soit capable de téléphoner à sa famille ou simplement d'écouter de la musique. ( Grand aperçu )
3. Il y a plus à faire que les voix
Les composants non lexicaux de la communication verbale donnent beaucoup de sens à une conversation. Certains peuvent être reproduits par la voix synthétisée (intonation, hauteur et vitesse d'expression, bruits d'hésitation, pour n'en nommer que quelques-uns), mais beaucoup ne le peuvent pas (comme l'expression gestuelle et faciale). Les éléments tangibles du produit doivent remplacer ces repères visuels traditionnels pour que l’interaction soit légèrement naturelle.
Premièrement, lorsque quelqu'un interagit avec un produit conçu pour reproduire des comportements humains, les composants visuels sont interprétés par les notions préconçues du monde (inhérentes et acquises) et affectent leurs réactions émotionnelles. Si quelque chose a l'air imposant et froid, vous êtes moins enclin à engager une conversation qu'avec quelque chose qui a l'air mignon et câlin.
Dans notre cas, la technologie étant si étrangère à l'utilisateur, il se sent aussi familier et invitant que possible - un hibou. Ce faisant, nous espérions éliminer les sentiments d’anxiété et de frustration que nous avions connus avec d’autres produits. Nous avons également amplifié le côté visuel - il y a une couleur pour un état de repos - une lueur douce, presque comme respirer, mais quand Susan dit le sillage, la lumière change pour se réveiller et écouter
Apple, par exemple, dispose d’un écran couleur sur son Homepod, qui offre un niveau plus élevé de nuance à leur interaction et à leur visualisation. L'ajout d'une expérience visuelle peut sembler contre-intuitif, mais les visualisations peuvent être très utiles pour l'utilisateur.
Conclusion
Bien qu'appliqués à un cas d'utilisation individuel, ces apprentissages de haut niveau peuvent aider n'importe quel projet offre. Personnaliser le contenu (dans la mesure du possible) apporte une clarté indispensable et un système de navigation logique et relatif réduit la charge cognitive. Enfin, ne sous-estiment pas l'importance des composants visuels ; Quand ils sont bien faits, ils fournissent non seulement des indices de conversation fondamentaux, mais ils donnent le ton à toute l'interaction.
Pour ceux qui cherchent à expérimenter la voix, Amazon présente des dizaines de milliers de compétences et Uber, ainsi que ceux créés par d'autres concepteurs et développeurs innovants. Le kit de compétences Alexa (ASK) regroupe des API, des outils, de la documentation et des exemples de code en libre-service qui vous permettent d'ajouter facilement des compétences à Alexa et de créer vos propres solutions. Vous vous demandez si la voix a même du sens? Voici quelques considérations avant de commencer.
(ra, il)
Source link