Connectez-vous avec nous

Gadgets

Instagram apprend à l’IA à reconnaître les chambres

L’image illustre l’approche multimodale proposée pour la reconnaissance de scènes vidéo : Les descripteurs visuels et sonores d’une vidéo sont extraits, traités et fusionnés pour classer la scène représentée dans l’un des neuf environnements intérieurs différents. Crédit : Estefanía Talavera Martínez

Il n’est pas difficile pour les humains de reconnaître un environnement intérieur, mais apprendre à un système d’intelligence artificielle (IA) à distinguer un bureau d’une bibliothèque l’est. Les systèmes d’intelligence artificielle sont généralement formés à l’utilisation d’images uniquement, et la reconnaissance d’un espace par la simple observation d’objets peut facilement échouer. C’est pourquoi l’informaticienne Estefanía Talavera Martínez a ajouté une nouvelle modalité de données, l’audio/le son, au matériel pédagogique que le système d’IA examine. Elle a ainsi obtenu un taux de réussite élevé dans la reconnaissance des espaces intérieurs et un nouvel ensemble de données de vidéos du monde réel à utiliser pour la recherche. Ses travaux ont été publiés dans la revue Informatique neuronale et applications le 22 janvier.

Estefanía Talavera Martínez s’intéresse au développement d’algorithmes pour l’analyse automatique du comportement humain. Dans ses travaux précédents, elle s’est appuyée sur les flux de photos recueillies par des caméras portables pour comprendre le comportement quotidien des gens. Ces images ont d’abord été analysées à l’aide de systèmes d’IA. Faire de même avec les vidéos est une prochaine étape, qui offre davantage d’applications. « Cela pourrait également être utilisé pour aider les robots à trouver où ils se trouvent, ou pour surveiller les personnes âgées, par exemple », explique Talavera Martínez. Toutefois, cela nécessite un système automatisé capable d’identifier les espaces intérieurs.

Discours

Les précédentes tentatives pour apprendre à l’IA à reconnaître les espaces intérieurs n’ont pas été très fructueuses. « L’une des raisons en est que la plupart des systèmes sont entraînés en utilisant une seule modalité, généralement la reconnaissance d’objets dans une pièce. » Par conséquent, Talavera Martínez a décidé d’entraîner son système à l’aide d’une deuxième modalité : les textes transcrits de la parole enregistrée dans les vidéos.

Elle a utilisé des vidéos du monde réel provenant d’Instagram pour entraîner son système d’IA. Pour ce faire, elle a utilisé les images et la parole. Les textes parlés ont été transcrits à l’aide du logiciel standard de reconnaissance vocale de Google. Talavera Martínez et son étudiante en master de l’époque, Andreea Glavan, ont essayé différentes approches pour combiner les informations provenant des images et du son, afin de trouver celle qui produirait le meilleur résultat. Ils ont ainsi mis au point un système capable de reconnaître les vidéos de neuf types différents d’espaces intérieurs avec une précision de 70 %, ce qui est supérieur à ce que les systèmes publiés précédemment ont réussi à faire. « Les tests que nous avons effectués ont confirmé que l’utilisation de cette combinaison permettait d’obtenir de meilleures performances que l’entraînement du système à l’aide d’images ou de textes uniquement », explique M. Talavera Martínez.

Comportement

En outre, le projet de recherche a produit un ensemble de données de 3 788 vidéos Instagram décrivant neuf scènes d’intérieur. De même, une sélection de 900 vidéos YouTube a été utilisée pour confirmer les résultats du programme d’entraînement. « Nous avons mis ces deux ensembles de données à la disposition du public, ce qui constitue une première. »

Talavera Martínez aimerait utiliser le nouveau système d’IA pour analyser davantage le comportement humain à partir de vidéos : « Elles contiennent beaucoup d’informations, à la fois en tant qu’images individuelles et en tant que séquences. Fait important, notre nouveau système serait capable de reconnaître le type d’environnement dans lequel les images ont été réalisées. »

Outre l’étude du comportement, le système pourrait être utilisé, par exemple, pour surveiller les patients en mettant l’accent sur le vieillissement sain. Il pourrait également être utilisé pour identifier les expériences positives à revivre par les gens. « Nous savons que les gens ont souvent une vision très subjective de leur propre vie. Notre système pourrait leur fournir un enregistrement et une analyse objectifs. »


Facebook annonce une IA qui apprend à partir de vidéos


Plus d’informations :
Andreea Glavan et al, InstaIndoor et l’apprentissage profond multimodal pour la reconnaissance de scènes intérieures, Informatique neuronale et applications (2022). DOI: 10.1007/s00521-021-06781-2

Fourni par
Université de Groningue

Citation:
Instagram apprend à l’IA à reconnaître les chambres (2022, 26 janvier).
récupéré le 2 février 2022
à partir de https://techxplore.com/news/2022-01-instagram-ai-rooms.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune
partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni à titre d’information uniquement.


Continuer la lecture
Cliquez pour commenter

Laissez un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

ARTICLES POPULAIRES