Gadgets
Alexa, Siri et Cortana enregistrent-ils vos conversations privées?
Les haut-parleurs intelligents agissent comme nos assistants personnels, offrant un moyen mains libres d'obtenir des informations, de contrôler nos maisons et de gérer nos horaires. Et comme tout bon assistant, ils sont toujours à l'écoute.
Chaque appareil possède un "mot de réveil" qui le déclenche pour commencer l'enregistrement, le traitement et la transmission de ce qu'il entend.
"Alexa, est-ce qu'il va pleuvoir?"
"OK Google, rappelle-moi d'appeler ma maman demain midi."
"Hey Siri, joue 'Toxic' de Brittany Spears."
Mais à quelle fréquence ces appareils se réveillent-ils accidentellement? Enregistre-t-il nos conversations privées et les envoie-t-il vers un stockage cloud? Nos informations personnelles sont-elles en sécurité?
La bonne nouvelle, c'est qu'ils n'enregistrent pas tout le temps, explique David Choffnes, professeur agrégé d'informatique au Northeastern. Et lorsqu'ils sont activés accidentellement, les enregistrements sont généralement courts.
"Mais cela ne signifie pas qu'il n'y a pas lieu de s'inquiéter", dit-il.
Dans une étude récente, Choffnes et ses collègues ont cherché à déterminer à quelle fréquence et pendant combien de temps ces orateurs pourraient se réveiller et nous enregistrer. Et parce que le fonctionnement interne de ces appareils sont des informations propriétaires, la meilleure façon de les tester était de les regarder écouter les conversations. Beaucoup de conversations.
Les chercheurs ont configuré des haut-parleurs intelligents de différents types avec la montre ultime: 134 heures d'audio d'une douzaine d'émissions Netflix populaires, y compris "Gilmore Girls", "Narcos", "The West Wing" et "Dear White People". Une vidéo de la scène (sept haut-parleurs intelligents écoutant attentivement un haut-parleur régulier) a suivi les activations en fonction du voyant de chaque haut-parleur.
Les chercheurs ont comparé la lumière avec le trafic du routeur, indiquant que des enregistrements étaient envoyés sur Internet, et ont également vérifié le journal d'activation basé sur le cloud fourni par Amazon et Google pour leurs appareils respectifs.
"Nous avons dû créer beaucoup d'infrastructures et faire quelque chose d'un peu fou", explique Choffnes. "Mais cela nous a permis d'exposer les appareils à une semaine de dialogue, sans que cela m'impose à moi et à Daniel Dubois [a research scientist at Northeastern] et d'autres membres de l'équipe assis dans une pièce en train de discuter en suivant un script. "
L'utilisation d'émissions de télévision a également fourni une plus grande diversité de locuteurs – chaque émission peut avoir dix personnages ou plus parlant, avec une variété d'âges, d'accents et parfois de langues.
Le spectacle qui a causé le plus de mauvaises activations, 6,21 pour 10 000 mots parlés, était Narcos. Ces activations semblaient se produire principalement lors de dialogues en espagnol ou en anglais fortement accentué, ce qui soulève une préoccupation supplémentaire: ces appareils sont-ils désactivés plus fréquemment et empiètent-ils sur la confidentialité des personnes qui parlent plusieurs langues ou qui n'ont pas de " accent américain typique?
"C'est un domaine dans lequel nous voulons vraiment nous pencher", déclare Choffnes. "Nous avons essayé de sélectionner une très large gamme d'émissions dans notre étude, mais nous n'avons pas fait le genre de tests supplémentaires et d'analyses rigoureuses pour pouvoir démêler ces impacts et comment il pourrait y avoir un comportement inégal de l'appareil vers certains groupes. de personnes."
Les résultats variaient en fonction de chaque locuteur, certains se désactivant à un rythme de presque une fois par heure, soit 1,43 fois pour 10 000 mots prononcés. Bien que ces activations soient généralement de courte durée, pour plusieurs appareils, 10% de leurs erreurs d'activation durent 10 secondes ou plus.
Parfois, il était clair pourquoi l'orateur avait fait une erreur. Des phrases comme "Je suis désolé" ou "Hé, comment vous sentez-vous?" pourrait être confondu avec "Hey Siri"; "coach principal" et "cornichon" sonnent assez comme "Echo" pour déclencher l'appareil d'Amazon.
Mais d'autres activations semblaient presque aléatoires.
"Il y a beaucoup de ces cas où un appareil se réveille et nous ne savons pas pourquoi, et ils ne sont pas reproductibles", dit Choffnes. "Et cela signifie que chez vous, dans votre travail, où que se trouvent ces appareils, il y a tout un tas de choses aléatoires qui les feront se réveiller et enregistrer de l'audio. Et cela peut être un problème si vous voulez vraiment assurez-vous qu'ils n'enregistrent pas alors qu'ils ne devraient pas. "
Il ne semble pas que quiconque puisse glaner beaucoup à partir d'un clip audio de 10 secondes, mais nous ne parlons pas d'un seul enregistrement. Chaque extrait de conversation est stocké dans le cloud, ce qui pourrait représenter un risque de confidentialité important au fil du temps, dit Choffnes.
Même si ces informations ne sont pas accessibles à un tiers malveillant, les entreprises qui fabriquent des haut-parleurs intelligents utilisent les fichiers audio pour améliorer leur logiciel de reconnaissance vocale, en payant des entrepreneurs pour transcrire ce qui est dit.
"Beaucoup d'entre nous, quand nous pensons être chez nous, nous pensons que c'est un espace privé où nous pouvons avoir des conversations qui ne sont pas destinées à être partagées", dit Choffnes. "Et maintenant, nous avons tous ces appareils avec des microphones qui pourraient prendre ces conversations et les partager."
Lorsque les assistants vocaux écoutent alors qu'ils ne devraient pas
moniotrlab.ccis.neu.edu/smart-… eakers-study-pets20 /
Citation:
Alexa, Siri et Cortana enregistrent-ils vos conversations privées? (2020, 15 juillet)
récupéré le 16 juillet 2020
depuis https://techxplore.com/news/2020-07-alexa-siri-cortana-private-conversations.html
Ce document est soumis au droit d'auteur. Hormis toute utilisation équitable aux fins d'études ou de recherches privées, aucune
une partie peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.
Sommaire