Internet
Le site Web «CoronaCheck» lutte contre la propagation de la désinformation
Les chercheurs de Cornell ont développé un système automatisé qui utilise l'apprentissage automatique, l'analyse des données et la rétroaction humaine pour vérifier automatiquement les affirmations statistiques sur le nouveau coronavirus.
«CoronaCheck», basé sur les recherches en cours d'Immanuel Trummer, professeur adjoint d'informatique, lancé à l'international en mars et a déjà été utilisé plus de 9 600 fois. La base de données, désormais disponible en anglais, français et italien, vérifie les allégations sur la propagation du COVID-19 sur la base de sources fiables telles que l'Organisation mondiale de la santé et les Centers for Disease Control and Prevention.
"Il y a beaucoup trop de désinformation sur le coronavirus sur le Web – c'est assez ahurissant, en fait", a déclaré Trummer. "Certaines de ces allégations de désinformation sont inoffensives, mais d'autres – des choses comme" manger de l'argent guérit le coronavirus "- peuvent être dangereuses."
Le système CoronaCheck est une collaboration entre l'équipe de Trummer, comprenant les doctorants Georgios Karagiannis et Saehan Jo, et l'équipe de Paolo Papotti à Eurecom, une école d'ingénieurs à Biot, en France.
En raison du volume considérable de mauvaises informations sur Internet – et de la vitesse à laquelle plus de désinformation est produite et diffusée – il est impossible pour les humains de résoudre le problème en effectuant des vérifications manuelles des faits seules. Même les approches automatisées courantes, qui tentent généralement de mapper de nouvelles revendications aux vérifications de faits existantes, ne peuvent pas être menées de manière réaliste à une échelle suffisamment grande pour s'attaquer à la portée de la désinformation, a déclaré Trummer.
"Nous avons essayé d'automatiser l'ensemble du processus, des données brutes au texte que nous voulons vérifier", a déclaré Trummer.
CoronaCheck adapte "Scrutinizer", un système développé par Trummer avec Eurecom pour l'Agence internationale de l'énergie à Paris, une organisation non gouvernementale, pour aider les vérificateurs des faits humains à traduire les résumés de texte en équations que l'ordinateur peut comprendre et résoudre. Pour ce faire, Scrutinizer utilise l'apprentissage automatique et le traitement du langage naturel – une branche de l'intelligence artificielle visant à déchiffrer le langage humain – ainsi que de grands ensembles de données qui aident le système à comprendre comment aborder chaque nouvelle revendication, et les commentaires des utilisateurs humains.
"Les ordinateurs ont du mal à comprendre le langage naturel", a-t-il déclaré. "Nous ne pouvons pas demander directement à l'ordinateur de vérifier si une réclamation dans une phrase est correcte ou non. Nous devons donc essentiellement traduire la réclamation de notre langue dans un langage de requête que l'ordinateur comprend."
Par exemple, si quelqu'un tape que le nombre de cas de coronavirus est plus élevé en France qu'en Italie, le système utilise une sorte de processus d'élimination pour affiner les équations possibles pour représenter ce texte. Il s'appuie sur ses jeux de données pour créer une expression mathématique qui peut comparer la demande aux faits.
Ensuite, sur la base de l'expérience, le système détermine les meilleures sources pour vérifier la réclamation, en s'appuyant sur des données publiques fiables compilées quotidiennement par l'Université Johns Hopkins. Le modèle d'apprentissage automatique du système peut également s'améliorer au fil du temps, en apprenant à reconnaître de nouveaux types de revendications en fonction des commentaires des utilisateurs.
"Il y a énormément de désinformation et l'ensemble des affirmations que les gens vérifient est assez diversifié", a déclaré Trummer. "Pour une revendication donnée, il existe un très grand nombre d'expressions de requête possibles, et notre objectif est de trouver la bonne."
L'interface de base de données s'appuie sur le travail connexe de Trummer, y compris AggChecker, le premier outil pour vérifier automatiquement les résumés textuels des ensembles de données en interrogeant une base de données relationnelle. AggChecker a été présenté à la conférence annuelle du groupe d'intérêt spécial sur la gestion des données de l'Association for Computing Machinery en 2019.
Son équipe a également développé une "base anti-connaissances" des erreurs factuelles courantes de Wikipedia en collaboration avec Google NYC. La recherche derrière CoronaCheck a été financée en partie par un Google Faculty Research Award.
Google renforce la prise en charge de la vérification des faits sur les coronavirus
CoronaCheck: coronacheck.eurecom.fr/en
AggChecker: en-cs-dbgroup.coecis.cornell.edu/
Citation:
Le site Internet 'CoronaCheck' combat la propagation de la désinformation (2020, 3 avril)
récupéré le 3 avril 2020
sur https://techxplore.com/news/2020-04-coronacheck-website-combats-misinformation.html
Ce document est soumis au droit d'auteur. Hormis toute utilisation équitable aux fins d'études ou de recherches privées, aucun
une partie peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.
Sommaire