Des chercheurs de Fujitsu et du MIT Center for Brains, Minds and Machines (CBMM) ont franchi une « étape importante » dans la quête pour renforcer la précision de modèles d’IA chargé de la reconnaissance d’images.
Comme décrit dans un nouveau document présenté à NeurIPS 2021, les collaborateurs ont développé une méthode de calcul qui reflète le cerveau humain pour permettre à l’IA de reconnaître des informations qui n’existent pas dans ses données d’entraînement (également appelées données hors distribution, ou ODD).
Bien que l’IA soit déjà utilisée pour la reconnaissance d’images dans divers contextes (par exemple l’analyse de radiographies médicales), les performances des modèles actuels sont très sensibles à l’environnement. L’importance de l’IA capable de reconnaître l’ODD est que la précision est maintenue dans des conditions imparfaites – par exemple, lorsque la perspective ou le niveau de lumière diffère des images sur lesquelles le modèle a été formé.
Sommaire
Améliorer la précision de l’IA
Le MIT et Fujitsu ont réussi cet exploit en se divisant en profondeur les réseaux de neurones (DNN) en modules, chacun étant responsable de la reconnaissance d’un attribut différent, tel que la forme ou la couleur, qui est similaire à la façon dont le cerveau humain traite les informations visuelles.
Selon les tests effectués par rapport au benchmark CLEVR-CoGenT, les modèles d’IA utilisant cette technique sont les plus précis jamais vus à ce jour en matière de reconnaissance d’images.
« Cette réalisation marque une étape majeure pour le développement futur de la technologie d’IA qui pourrait fournir un nouvel outil pour les modèles de formation qui peuvent répondre de manière flexible à différentes situations et reconnaître même les données inconnues qui diffèrent considérablement des données de formation d’origine avec une grande précision, et nous regardons avec impatience les opportunités passionnantes du monde réel qu’elle ouvre », a déclaré le Dr Seishi Okamoto, membre de Fujitsu.
Le Dr Tomaso Poggio, professeur au département des sciences du cerveau et des sciences cognitives du MIT, affirme que les principes de calcul inspirés des neurosciences ont également le potentiel de surmonter des problèmes tels que le biais des bases de données.
« Il existe un écart important entre les DNN et les humains lorsqu’ils sont évalués dans des conditions hors distribution, ce qui compromet gravement les applications d’IA, en particulier en termes de sécurité et d’équité. Les résultats obtenus jusqu’à présent dans ce programme de recherche sont une bonne étape [towards addressing these kinds of issues], » il a dit.
À l’avenir, Fujitsu et le CBMM affirment qu’ils tenteront d’affiner davantage leurs découvertes dans le but de développer des modèles d’IA capables de porter des jugements flexibles, en vue de les mettre en œuvre dans des domaines tels que la fabrication et les soins médicaux.