Google introduit la traduction vocale étendue en temps réel

0
7

Crédit: Google

Google a annoncé une nouvelle fonctionnalité de transcription en temps réel pour son application gratuite Translate pour les téléphones Android. Une version IOS est prévue pour l'avenir, indique la société.

Cette fonctionnalité permettra aux utilisateurs d'obtenir des traductions instantanées de textes de discours, conférences ou monologues en cours dans l'une des huit langues, y compris l'anglais.

Actuellement, Translate ne permet la conversion que d'extraits de discours relativement courts.

Les seules exigences sont d'avoir un seul haut-parleur parlant à la fois dans une pièce calme (d'autres voix ou bruits diminueront la précision) et une connexion Internet, nécessaire pour l'interaction avec les unités de traitement de tenseur basées sur le cloud de Google.

Le déploiement commence aujourd'hui (18 mars) et devrait être disponible pour tous les utilisateurs d'ici la fin de la semaine sur le Play Store de Google.

En mode conversation, l'application permet aux utilisateurs d'avoir une conversation de va-et-vient avec une personne parlant une langue différente.

Outre l'anglais, des traductions sont disponibles en français, allemand, hindi, portugais, russe, espagnol et thaï.

L'application fonctionnera également avec les lectures audio préenregistrées. Mais Google dit que la traduction numérique directe à partir des fichiers audio téléchargés n'est pas encore disponible.

L'annonce de cette semaine rappelle à quel point nous avons fait des progrès depuis les premiers jours de la reconnaissance vocale numérique. Les Laboratoires Bell ont lancé leur système futuriste "Audrey" en 1952 qui reconnaissait les chiffres parlés 0-9. Un pas de géant a été franchi une décennie plus tard lorsque IBM a présenté la "Shoebox" à l'Exposition universelle de 1962 – il pouvait reconnaître un énorme 16 mots.





Pendant cinq ans dans les années 1970, la reconnaissance vocale a reçu un énorme coup de pouce de l'armée américaine. Le ministère de la Défense a soutenu des projets de recherche massifs dans la reconnaissance vocale, y compris l'initiative "Harpy" Speech Understanding Research (SUR) de Carnegie-Mellon, qui a construit un vocabulaire de reconnaissance de plus de 1 011 mots. Ce programme a notamment introduit le concept de modèles de prononciation et de probabilité pour la première fois, améliorant considérablement la capacité de reconnaître des modes de parole distincts.

Les années 1980 ont apporté des progrès toujours plus importants dans la détection des mots, les chercheurs appliquant la théorie des probabilités aux sons inconnus. Le programme du géant technologique IBM a étendu la reconnaissance à 5 000 mots. Mais on se souviendra peut-être de la décennie pour l'introduction de la première poupée parlante au monde, «Julie», qui comprenait la parole. Une campagne publicitaire a déclaré: "Enfin, la poupée qui vous comprend."

Dragon a apporté la reconnaissance vocale aux masses dans les années 1990, avec son premier produit de consommation largement précis mais toujours buggé au prix de "seulement" 9 000 $. À la fin de la décennie, le programme Dragon NaturallySpeaking considérablement amélioré, qui pour la première fois ne nécessitait pas de pause entre chaque mot prononcé, était disponible pour les consommateurs pour environ 700 $.

Aujourd'hui, nous avons Siri et Alexa et d'autres applications mobiles gratuites et à faible coût qui nous permettent de demander un itinéraire, de commander de la nourriture, d'acheter des articles ménagers et de taper du texte parlé dans des e-mails et des documents de traitement de texte, qui ont tous étendu la reconnaissance vocale à des points inimaginables il n'y a pas trop d'années.

Avec les dernières avancées disponibles pour des millions d'utilisateurs d'appareils portables, Harpy, Audrey et Julie resteraient sans voix.


Hé, Google, sois mon traducteur espagnol


Plus d'information:
www.blog.google/products/trans… e / transcribe-speech /

© 2020 Science X Network

Citation:
                                                 Google introduit la traduction vocale étendue en temps réel (2020, 18 mars)
                                                 récupéré le 18 mars 2020
                                                 depuis https://techxplore.com/news/2020-03-google-real-time-voice.html

Ce document est soumis au droit d'auteur. Hormis toute utilisation équitable aux fins d'études ou de recherches privées, aucun
                                            une partie peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.

Les offres de produits Hi-tech en rapport avec cet article

Laisser un commentaire