Connectez-vous avec nous

Internet

Comment un algorithme peut nous aider à détecter de fausses nouvelles

Pour tenter de résoudre le problème croissant des fausses nouvelles en ligne, un algorithme permettant d'identifier les modèles de langage peut aider à distinguer les articles de presse factuels des articles de presse inexacts. Crédit: Shutterstock

Avez-vous déjà lu quelque chose en ligne et l'avez-vous partagé entre vos réseaux, seulement pour découvrir que c'était faux?

En tant qu’ingénieur logiciel et linguiste informaticien qui passe la majeure partie de son travail et même ses heures de loisirs devant un écran d’ordinateur, je suis préoccupé par ce que je lis en ligne. À l'ère des médias sociaux, nous sommes nombreux à consommer des sources d'information peu fiables. Nous sommes exposés à un flux d'informations sauvage sur nos réseaux sociaux, surtout si nous passons beaucoup de temps à analyser les publications aléatoires de nos amis sur Twitter et Facebook.

Mes collègues et moi au Discourse Processing Lab de l’Université Simon Fraser ont mené des recherches sur les caractéristiques linguistiques des fausses informations.

Les effets de fausses nouvelles

Une étude réalisée au Royaume-Uni a révélé qu'environ les deux tiers des adultes interrogés lisaient régulièrement des nouvelles sur Facebook et que la moitié d'entre eux avaient déjà cru croire à une fausse nouvelle. Une autre étude, menée par des chercheurs du Massachusetts Institute of Technology, s'est concentrée sur les aspects cognitifs de l'exposition à de fausses informations et a révélé qu'en moyenne, les lecteurs de nouvelles croient qu'un titre faux est au moins 20% du temps.

Les fausses histoires se propagent maintenant 10 fois plus vite que les vraies nouvelles et le problème des fausses nouvelles menace sérieusement notre société.

Par exemple, lors des élections américaines de 2016, un nombre incroyable de citoyens américains ont cru et partagé un complot manifestement faux affirmant qu'Hilary Clinton était liée à un réseau de trafic d'êtres humains à court d'une pizzeria. Le propriétaire du restaurant a reçu des menaces de mort et un croyant s'est présenté au restaurant avec une arme à feu. Cela — et un certain nombre d'autres fausses nouvelles distribuées pendant la saison électorale — a eu un impact indéniable sur les votes des gens.

Il est souvent difficile de trouver l'origine d'une histoire après que des groupes partisans, des bots des médias sociaux et des amis d'amis l'ont partagée des milliers de fois. Les sites Web factuels tels que Snopes et Buzzfeed ne peuvent traiter qu’une petite partie des rumeurs les plus populaires.

La technologie derrière Internet et les médias sociaux a permis cette propagation de la désinformation; Peut-être qu'il est temps de demander ce que cette technologie a à offrir pour résoudre le problème.


Dans une interview, Hilary Clinton discute de «Pizzagate» et du problème des fausses informations en ligne.

Cadeaux en style d'écriture

Les récents progrès de l’apprentissage automatique ont permis aux ordinateurs d’accomplir instantanément des tâches qui auraient pris beaucoup plus de temps aux humains. Par exemple, certains programmes informatiques aident la police à identifier des visages criminels en quelques secondes. Ce type d'intelligence artificielle entraîne des algorithmes permettant de classer, de détecter et de prendre des décisions.

Lorsque l'apprentissage automatique est appliqué au traitement du langage naturel, il est possible de créer des systèmes de classification de texte reconnaissant un type de texte d'un autre.

Au cours des dernières années, les scientifiques du traitement du langage naturel sont devenus plus actifs dans la construction d'algorithmes permettant de détecter les informations erronées; Cela nous aide à comprendre les caractéristiques des fausses nouvelles et à développer une technologie pour aider les lecteurs.

Une approche trouve des sources d’information pertinentes, attribue à chaque source un score de crédibilité, puis les intègre pour confirmer ou infirmer une revendication donnée. Cette approche dépend en grande partie de la recherche de la source d’actualité d’origine et de l’évaluation de sa crédibilité en fonction de divers facteurs.

Une deuxième approche examine le style d'écriture d'un article de presse plutôt que son origine. Les caractéristiques linguistiques d'un écrit peuvent nous en apprendre beaucoup sur les auteurs et leurs motivations. Par exemple, des mots et des phrases spécifiques ont tendance à être plus fréquents dans un texte trompeur que dans un texte écrit honnêtement.

Repérer de fausses nouvelles

Notre recherche identifie les caractéristiques linguistiques permettant de détecter les fausses nouvelles à l'aide de la technologie d'apprentissage automatique et de traitement du langage naturel. Notre analyse d'une vaste collection d'articles d'actualité vérifiés par des faits sur une variété de sujets montre qu'en moyenne, les faux articles d'actualité utilisent davantage d'expressions courantes dans les discours de haine, ainsi que des mots liés au sexe, à la mort et à l'anxiété. Les nouvelles authentiques, en revanche, contiennent une plus grande proportion de mots liés au travail (affaires) et à l'argent (économie).

Cela suggère qu'une approche stylistique combinée à un apprentissage automatique pourrait être utile pour détecter des informations suspectes.

Notre faux détecteur de nouvelles est construit sur la base de caractéristiques linguistiques extraites d’un grand nombre d’articles de nouvelles. Cela prend un morceau de texte et montre à quel point il est similaire aux fausses nouvelles et aux vraies nouvelles qu’il a vues auparavant. (Essaye le!)

Cependant, le principal défi consiste à mettre en place un système capable de gérer la grande variété de sujets d'actualité et le changement rapide de titres en ligne, car les algorithmes informatiques tirent parti des exemples et si ces échantillons ne sont pas suffisamment représentatifs des actualités en ligne, les prédictions du modèle ne pas être fiable.

Une option consiste à demander à des experts humains de collecter et d’étiqueter une grande quantité d’articles de presse faux et réels. Ces données permettent à un algorithme d’apprentissage automatique de trouver des caractéristiques communes à chaque collection, quelles que soient les autres variétés. En fin de compte, l’algorithme sera en mesure de faire la distinction entre des articles de presse réels et faux jamais vus auparavant.


Des chercheurs collaborent sur une méthode pour expliquer aux utilisateurs de «fausses nouvelles»


Plus d'information:
Discourse Processing Lab: fake-news.research.sfu.ca/

Gordon Pennycook et al. Paresseux, pas partial: la susceptibilité à la fausse nouvelle partisane s’explique mieux par un manque de raisonnement que par un raisonnement motivé, Cognition (2018). DOI: 10.1016 / j.cognition.2018.06.011

Martin Flintham et al. Tomber pour de fausses nouvelles, Actes de la conférence 2018 de la CHI sur les facteurs humains dans les systèmes informatiques – CHI '18 (2018). DOI: 10.1145 / 3173574.3173950

Fatemeh Torabi Asr et al. Big Data et données de qualité pour la détection de fausses nouvelles et de fausses informations, Big Data & Société (2019). DOI: 10.1177 / 2053951719843310

Fourni par
                                                                                                    La conversation


Cet article est republié de The Conversation sous une licence Creative Commons. Lire l'article original.La conversation "width =" 1 "height =" 1 "style =" border: none! Important; boîte-ombre: aucune! important; marge: 0! important; hauteur maximale: 1px! important; max-width: 1px! important; min-height: 1px! important; min-width: 1px! important; opacité: 0! important; contour: aucun! important; rembourrage: 0! important; texte-ombre: aucun! important

Citation:
                                                 Le langage le trahit: comment un algorithme peut nous aider à détecter de fausses nouvelles (15 août 2019)
                                                 récupéré le 15 août 2019
                                                 sur https://techxplore.com/news/2019-08-language-algorithm-fake-news.html

Ce document est soumis au droit d'auteur. Mis à part toute utilisation équitable à des fins d’étude ou de recherche privée, aucun
                                            partie peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.

Les offres de produits Hi-tech en rapport avec cet article

Continuer la lecture
Cliquez pour commenter

Laissez un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

ARTICLES POPULAIRES