Il y a peu de chances que quiconque ait réussi à éviter les services d’appels vidéo ou vocaux qui reposent sur des connexions Internet à ce stade, en grande partie grâce à la pandémie mondiale.
Il y a une chance encore plus mince que ces appels aient été entièrement exempts d’abandons, de problèmes, de latence et d’autres artefacts perturbateurs, mais les dernières avancées de la division IA de Google devraient aider sur ce front.
Tel que publié dans le blog Google AI, un nouveau codec audio appelé Lyra a été développé par l’équipe, visant spécifiquement à compresser la parole à un débit binaire inférieur.
À seulement 3 kbps (c’est kilomorceaux par seconde), Lyra utilise des données nettement plus faibles que le codec le plus largement utilisé à l’heure actuelle – l’Open-source Opus, qui « obtient une qualité vocale transparente, indiscernable de l’original » à 32 kbps mais peut être exploité à des débits inférieurs.
En fait, dans les études de Google, il a été constaté que le codec Opus fonctionnant à 8 kbps était moins préférable que Lyra à 3 kbps, ce qui représente une réduction de 60% de la bande passante.
Sommaire
Google Duo
Dans le billet de blog, Google AI a annoncé qu’il « déploie actuellement Lyra [in Google Duo] pour améliorer la qualité et la fiabilité des appels audio sur les connexions à très faible bande passante « .
Ainsi, si vous êtes un utilisateur de Google Duo sur Android ou iOS et que vous souffrez de connexions Internet médiocres ou incohérentes, vous pourriez bientôt voir une amélioration significative de la qualité et de la stabilité des appels.
Il n’y a pas de mention spécifique du moment où le codec sera largement disponible, mais il est probable qu’il s’agisse d’une mise à jour en coulisse, il se peut donc qu’il n’arrive pas en grande pompe lorsqu’il atterrira.
L’IA et l’avenir
Les progrès de Lyra sont provoqués par la combinaison de Google AI de la technologie de codec existante et des «progrès de l’apprentissage automatique avec des modèles formés sur des milliers d’heures de données». Ces données incluent des locuteurs dans plus de 70 langues, disponibles gratuitement dans des bibliothèques open source, afin de garantir leur application universelle.
Le blog lui-même plonge beaucoup plus profondément dans les détails de la façon dont cet apprentissage automatique a permis la nouvelle technologie, ainsi que l’utilisation d’extraits audio pour démontrer la différence entre l’audio d’origine, Lyra et d’autres codecs à différents débits binaires.
L’équipe prévoit de continuer à optimiser Lyra, en améliorant sa qualité et sa fiabilité dans l’espoir qu’elle sera adoptée en dehors de l’application Google Duo. Cela signifiera probablement que d’autres applications et services de VOIP et de vidéoconférence bénéficieront du codec à l’avenir.
De plus, le message indique également que l’équipe « commence également à rechercher comment ces technologies peuvent conduire à un codec audio polyvalent à faible débit », ce qui pourrait signifier que des cas d’utilisation non vocale tels que la musique et d’autres sons pourraient voir les mêmes améliorations.