Pour les personnes qui bégaient, la commodité de la technologie de l'assistant vocal reste hors de portée

0
103

Crédits: CC0 Public Domain

Avez-vous déjà l'impression que vos assistants vocaux – que ce soit Siri, Alexa ou Google – ne vous comprennent pas? Vous pouvez répéter votre question un peu plus lentement, un peu plus fort, mais vous obtiendrez finalement les informations que vous demandiez dans les tons agréables mais sans vie de votre assistant à commande vocale.

Mais que faire si parler à votre technicien à domicile n'était pas une option? C'est la question à laquelle sont confrontés bon nombre des 3 millions de personnes aux États-Unis qui bégaient, ainsi que les milliers d'autres qui ont des troubles de la parole non limités au bégaiement, et beaucoup se sentent exclus.

"Quand ce truc a commencé à sortir, j'en avais fini", a déclaré Jacquelyn Joyce Revere, une scénariste de Los Angeles qui bégaie. "À LA, j'ai besoin de GPS tout le temps, donc cela semblait être un moyen plus pratique de vivre la vie que je veux vivre."

Revere a déclaré que depuis 2011, elle avait essayé d'utiliser Siri sur iPhone et Apple Watch, et Alexa via un Amazon Fire Stick. Bien qu'elle continue d'essayer d'utiliser ces assistants vocaux, ses tentatives la laissent souvent déçue.

"Chaque fois que j'essaie de l'utiliser, c'est un autre clou dans le cercueil, un autre rappel que cette technologie n'a pas été faite pour moi", a déclaré Revere.

Mais ce n'est pas seulement Alexa et ses amis

Les frustrations de Revere ne se limitent pas aux assistants vocaux. Les interfaces téléphoniques automatisées posent également des problèmes. Par exemple, elle a dit qu'il n'est pas rare qu'elle passe jusqu'à 40 minutes en attente, mais qu'elle soit interrompue d'un appel par un opérateur de machine lorsqu'elle ne parvient pas à prononcer un mot.

Selon Jane Fraser, présidente de la Fondation du bégaiement, les interfaces téléphoniques sont un problème courant au sein de la communauté du bégaiement depuis des années. Elle a déclaré que la Fondation du bégaiement reçoit des centaines de courriels à la recherche d'aide sur la façon de les traiter, tandis que les nouvelles technologies ont aidé de vieux problèmes à faire surface de nouvelles façons.

"La technologie globale a aidé les gens qui bégaient, mais quand vous essayez de lui dire ce que vous voulez, vous obtenez la même expérience au téléphone avec une machine ou une autre personne – les deux raccrochent", a déclaré Fraser.

Différents types de bégaiement sont entendus par les assistants vocaux de différentes manières. Certaines de ces formes de bégaiement comprennent des prolongations, où les sons sont étirés; répétitions, lorsque les locuteurs répètent des sons ou des mots; et les blocs, qui sont les pauses qui se produisent lorsqu'un locuteur ne parvient pas à prononcer un mot. Fraser a déclaré que les personnes qui bégaient avec des blocs ont souvent le plus de problèmes avec les assistants vocaux et les interfaces téléphoniques activées par la voix.

"S'il n'y a pas de voix, il n'y a rien à entendre par l'assistant vocal, donc cela s'arrête ou s'interrompt", a déclaré Fraser.

Revere bégaie souvent avec des blocs, et elle a dit qu'ils confondent les assistants vocaux plus que tout autre type de bégaiement.

"Si j'ai un bloc, ils se ferment complètement", a déclaré Revere, bien qu'elle ait également noté qu'Alexa était un peu plus patiente que Siri.

Tayler Enyart, un parajuriste d'Elk Grove, en Californie, est un autre utilisateur d'Alexa et Siri qui bégaie en blocs. Comme Revere, elle a du mal à utiliser cette technologie et se sent exclue à cause de cela.

"L'utilisation de ces technologies n'est pas facile pour moi", a déclaré Enyart. "Je les ai tous essayés, mais ils m'ont tous interrompu. C'est vraiment frustrant, alors j'essaie juste de les éviter. Une partie de moi se sent vraiment laissée de côté, mais une autre partie est comme," J'y suis habitué. ""

Comment Big Tech réagit

Apple, Amazon et Google ont tous leurs propres moyens de fournir l'accessibilité aux personnes qui bégaient ou qui ont d'autres troubles de la parole. Amazon et Apple ont publié des fonctionnalités qui permettent aux utilisateurs de taper des commandes sur Alexa ou Siri, telles que Tap to Alexa avec Echo Show, ou Tapez vers Siri avec iOS 11 en 2018.

Google met constamment à jour son assistant Google avec de nouveaux échantillons de voix pour mieux comprendre les personnes avec des accents ou des troubles de la parole. Et en 2019, la société a annoncé un projet de recherche appelé Project Euphonia, dont l'objectif est de créer à terme un modèle de reconnaissance capable de comprendre les personnes souffrant de troubles de la parole sur toutes les plateformes informatiques.

Le projet, qui a été inspiré par des patients SLA, vise à collecter suffisamment d'échantillons audio pour créer un modèle sonore capable de prédire et de comprendre les schémas vocaux altérés.

"Il y a une révolution en cours dans la façon dont les gens utilisent la voix pour interagir avec les ordinateurs, mais certaines personnes sont laissées pour compte", a déclaré Michael Brenner, professeur de mathématiques appliquées à Harvard et l'un des chercheurs du projet Euphonia.

Selon Brenner, le plus grand défi du projet Euphonia est le manque de données. Parce que la technologie de reconnaissance vocale est formée pour entendre la parole standard, Project Euphonia a besoin d'échantillons audio de parole altérée pour former les ordinateurs afin de pouvoir également la comprendre. Idéalement, le projet Euphonia aurait accès à des dizaines de millions d'échantillons audio, créant un modèle statistique qui peut prédire et comprendre les sons de la parole altérée, mais c'est une norme impossible.

"Nous ne voulons pas trop promettre parce que nous ne savons pas ce qui est possible, mais nous voulons aider les gens", a déclaré Brenner. "Il serait idéal d'avoir suffisamment d'échantillons pour avoir un modèle général, mais nous ne le faisons pas. Nous voulons savoir comment faire les choses qui sont utiles avec le discours que nous avons."

Erich Reiter est un ingénieur en reconnaissance vocale et un orthophoniste qui a aidé à développer Siri lorsqu'il travaillait pour Nuance Communications. Il est parfaitement conscient des échecs de la technologie de reconnaissance vocale pour les personnes souffrant de troubles de la parole depuis 2012.

Cette année-là, un accident de plongée en eau peu profonde a laissé l'un des amis de Reiter tétraplégique, et il ne pouvait communiquer que par le biais d'un appareil de communication augmentative et alternative (AAC), semblable à ce qu'utilisait le physicien théoricien anglais Stephen Hawking. Selon Reiter, il faudrait trois minutes à son ami pour dire quelque chose d'aussi simple que "j'ai besoin d'eau".

Cette expérience a inspiré Reiter à retourner à l'école pour devenir orthophoniste et éventuellement créer une technologie de reconnaissance vocale qui aide les personnes qui bégaient.

Reiter est maintenant l'un des fondateurs de Say-IT Labs, une start-up basée à Bruxelles qui fabrique des jeux vidéo destinés à aider les personnes qui bégaient à pratiquer des techniques d'élocution efficaces. Leur objectif, selon Reiter, est de rendre l'orthophonie plus accessible.

"Si vous voyez une école SLP, il y a de fortes chances qu'ils aient une charge d'environ 60 à 80 étudiants", a déclaré Reiter. "Cela ne leur donne pas assez de temps pour travailler sur de réels progrès."

Say-IT Labs travaille actuellement sur un jeu appelé Fluency Friends, où les joueurs contrôlent des personnages de dessins animés colorés à travers des obstacles perfides. Seulement au lieu d'un joystick ou d'un clavier, le jeu invitera les joueurs avec des mots ou des phrases qu'ils doivent dire pour se déplacer dans le niveau.

Semblable au projet Euphonia, Say-IT Labs a besoin de données pour créer un modèle acoustique pour le jeu qui comprend la parole bégayée. Jusqu'à présent, selon Reiter, son équipe a recueilli des échantillons de 50 participants.

Contrairement au projet Euphonia, cependant, Say-IT Labs nécessite beaucoup moins de données pour travailler car le son de la parole bégayée est moins variable que la parole altérée trouvée chez les patients souffrant de troubles neurologiques, selon Reiter.

"J'espère que le type de technologie que nous créons nous permettra d'aider à éduquer les SLP et les personnes qui bégaient, au lieu d'aider seulement 50 personnes (grâce à la thérapie conventionnelle)", a déclaré Reiter. "Pour le 1% de la population qui bégaie, ce serait un cadeau d'en atteindre 1000".

Malgré les efforts pour aider, les assistants vocaux restent inaccessibles pour de nombreuses personnes qui bégaient. Hannah Arnold est une réceptionniste dentaire de Kent, Washington, qui a essayé pour la première fois d'utiliser Siri et Alexa en 2013. Ses premières tentatives sont venues un peu anxieusement, car elle n'était pas sûre de la façon dont les machines réagiraient à son bégaiement.

"J'ai des problèmes avec Ws. Il me faut du temps pour les dire", a expliqué Arnold. "Donc Siri m'interrompait toujours quand j'essayais de dire:" Hé, Siri, quel temps va-t-il faire aujourd'hui? ""

Aujourd'hui, Arnold utilise rarement des assistants vocaux, mais elle voit comment ils pourraient facilement améliorer sa vie. Par exemple, au lieu d'avoir à taper sur l'écran de son Apple Watch ou à demander des instructions dans sa voiture, elle pourrait simplement demander à Siri à la place.

«C'est assez difficile parce que j'ai l'impression que la reconnaissance vocale — et parler à d'autres technologies — se développe”, a déclaré Arnold. "Mais avec les progrès des nouvelles technologies, j'espère que nous aurons plus d'accommodements."


Pourquoi Amazon, Google et Apple veulent vous enregistrer


(c) 2020 États-Unis aujourd'hui

Distribué par Tribune Content Agency, LLC.

Citation:
                                                 Pour les personnes qui bégaient, la commodité de la technologie de l'assistant vocal reste hors de portée (2020, 7 janvier)
                                                 récupéré le 7 janvier 2020
                                                 depuis https://techxplore.com/news/2020-01-people-stutter-convenience-voice-technology.html

Ce document est soumis au droit d'auteur. Hormis toute utilisation équitable aux fins d'études ou de recherches privées, aucune
                                            une partie peut être reproduite sans l'autorisation écrite. Le contenu est fourni seulement pour information.

Les offres de produits Hi-tech en rapport avec cet article

Laisser un commentaire