Connectez-vous avec nous

Internet

Repérer la désinformation en ligne via l'intelligence artificielle

Crédit: iStock / champja

Nous vivons à une époque où trop d’informations – un flot incessant de mises à jour de statut, de mémos, de relogements, d’infographies, de citations et de hashtags parcourent chaque jour nos flux de médias sociaux controverse.

Le problème, c’est que le navigateur / utilisateur de médias sociaux en ligne moyen n’a ni le temps ni les moyens d’enquêter sur la légitimité ou la provenance de tout ce qui apparaît dans leurs flux. Et c’est cette vulnérabilité que des générateurs de contenu moins scrupuleux exploitent pour répandre des informations erronées, avec des résultats qui peuvent aller d’un léger embarras sur le visage à des conséquences carrément bouleversantes ou potentiellement mortelles.

Pour William Wang, informaticien à l'UC Santa Barbara, ce marasme chaotique est un terrain fertile pour l'exploration. Wang pense que les techniques d'apprentissage approfondi, lorsqu'elles sont déployées sur le réseau de textes et d'hyperliens de publications en ligne et d'articles de nouvelles, peuvent nous aider à surmonter certains des problèmes de pensée critique. Ce concept est au cœur de son projet triennal intitulé «Dynamo: modélisation dynamique multicanaux de la désinformation».

"La question est donc, étant donné un message, comment pourriez-vous comprendre si cela est spécifiquement trompeur ou s'il s'agit d'un message authentique", a déclaré Wang, "et, compte tenu de la structure du réseau, pouvez-vous identifier la propagation de la désinformation et comment va-t-il en être différent par rapport aux articles standard ou non standard? "

Une grande commande

C'est un défi de taille, en particulier dans le domaine des médias sociaux, qui a nivelé le terrain de jeu entre les sites Web d'actualités légitimes et établis et les sites douteux qui s'efforcent de paraître officiels ou de faire appel aux émotions d'un utilisateur avant de pouvoir prendre du recul et remettre en question la source. de leurs informations.

Cependant, grâce au traitement du langage naturel – spécialité de Wang – le texte de ces articles et articles peut être utilisé pour révéler des informations sur leurs créateurs et leurs propagateurs, tels que leurs affiliations, leurs idéologies et leurs incitations à afficher, ainsi que sur le public ciblé . L'algorithme parcourt des millions d'articles de nouvelles postés par des utilisateurs anonymisés sur des plateformes telles que Twitter et Reddit et examine les titres, le contenu et les liens des articles. Le but est d’avoir une idée non seulement des entités qui les sous-tendent, mais aussi de leurs modèles de diffusion à travers le réseau.

"Beaucoup d'entre nous prenons les sites Web pour acquis et retweetent ou diffusent de manière désinvolte les informations erronées. C'est ainsi que les informations sont propagées, mises en cascade et diffusées de manière virale", a déclaré Wang. "Certaines des questions les plus importantes que nous posons sont les suivantes: quels sont les modèles? Quelles sont les incitations?"

Pour le savoir, lui et son équipe ont proposé un mécanisme d’apprentissage qui explique pourquoi certaines histoires sont republiées ou retweetées, en plus de déterminer si le contenu lui-même est vrai ou faux. En cours de route, a-t-il ajouté, ils pourraient déterminer qui est impliqué dans la propagation de la désinformation et quels modèles pourraient se dégager de ce processus. Les images feront également partie du jeu de données, a-t-il ajouté.

Par la suite, les chercheurs prévoient d’intégrer d’autres aspects de leurs travaux à des informations erronées, tels que clickbait, qui utilise des titres accrocheurs, souvent sensationnels, pour amener les lecteurs à cliquer sur un lien qui les renvoie au mieux à un site Web louche ou, au pire, vole leur contenu. information.

"Clickbait est principalement des articles de qualité médiocre pouvant contenir beaucoup de désinformation et de fausses informations car ils doivent exagérer", a déclaré Wang. Avec l'informatique Ph.D. étudiant Jiawei Wu, l’équipe a mis au point une méthode appelée «co-formation renforcée», qui utilise un système efficace d’étiquetage de quelques centaines d’articles, qui sont ensuite utilisés pour former un classifieur d’apprentissage automatique afin d’étiqueter ce qu’elle pense être un clickbait dans une énorme million de données.

"Ensuite, nous prenons ces instances nouvellement étiquetées et recyclons le classificateur", a déclaré Wang. "Ce processus itératif nous permet de collecter plus de données d'étiquettes au fil du temps", a-t-il ajouté, ce qui permet d'affiner la précision de l'outil.

Utiliser l'intelligence artificielle pour comprendre et trouver des modèles dans le raz-de-marée de texte que nous nous envoyons tous les jours nous donnerait un aperçu de la manière dont nous propagons, intentionnellement ou non, la désinformation.

"C'est vraiment la beauté du traitement du langage naturel et de l'apprentissage automatique", a déclaré Wang. "Nous avons une énorme quantité de données dans différents formats, et la question est de savoir comment transformer des données non structurées en connaissances structurées. C'est l'un des objectifs de l'apprentissage en profondeur et de la science des données."


Des chercheurs collaborent sur une méthode pour expliquer aux utilisateurs de «fausses nouvelles»


Fourni par
                                                                                                    Université de Californie

Citation:
                                                 Repérer la désinformation en ligne via l'intelligence artificielle (8 août 2019)
                                                 récupéré le 8 août 2019
                                                 sur https://techxplore.com/news/2019-08-misinformation-online-artificial-intelligence.html

Ce document est soumis au droit d'auteur. Mis à part toute utilisation équitable à des fins d’étude ou de recherche privée, aucun
                                            partie peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.

Les offres de produits Hi-tech en rapport avec cet article

Continuer la lecture
Cliquez pour commenter

Laissez un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

ARTICLES POPULAIRES