Une nouvelle approche scientifique réduit les biais dans les données d’entraînement pour un meilleur apprentissage automatique

0
10
  • Bumblebee nouvelles chaussures de football pour enfants chaussures d'entraînement pour garçons dans le grand garçon ongles longs cassés TF jeunes gar
    soldes livraison gratuite Variété de styles
  • Asupermall - Remplacement Nouvelle Mise A Niveau 1.75Mm Filament Extrudeuse D'Entrainement D'Alimentation Kit Avec 0.4Mm Buse Tete D'Impression Du
    Fonctionnalites: Compatible pour Creality Ender 3, imprimante 3D Ender 3 Pro. L'extrusion a distance du bras de commande pour l'alimentation en fil est plus precise. Le couple requis pour le moteur pas a pas par extrusion est plus faible, ce qui reduit les risques de defaillance lors du colmatage et du ravitaillement en carburant. Compatible avec plusieurs types de consommables, tels que le TPU flexible. Changement de filament commode. Avec son mecanisme d'extrusion tout en metal et son kit original, votre imprimante offre encore plus de possibilites. Vous pouvez choisir l'extrusion a courte portee ou l'extrusion a distance a tout moment. Il est tres facile a desassembler car il s'agit d'une suite complete qui n'affectera en rien les fonctions d'origine de votre imprimante. Caracteristiques: Materiau principal: Aluminium / acier Taille de la buse: 0.4mm Consommables d'adaptation: filament de 1,75 mm Modeles concernes: pour Creality Ender 3, Ender 3 Pro Poids de l'article: 573g /

Gautam Thakur dirige une équipe de chercheurs de l’ORNL qui ont développé une nouvelle méthode scientifique pour identifier les biais dans les annotateurs de données humaines afin de garantir des entrées de données de haute qualité pour les applications d’apprentissage automatique. Crédit : Carlos Jones/ORNL, US Dept. of Energy

Alors que les entreprises et les décideurs se tournent de plus en plus vers l’apprentissage automatique pour donner un sens à de grandes quantités de données, il devient essentiel de garantir la qualité des données de formation utilisées dans les problèmes d’apprentissage automatique. Ces données sont codées et étiquetées par des annotateurs de données humains, souvent embauchés sur des plateformes de crowdsourcing en ligne, ce qui fait craindre que les annotateurs de données introduisent par inadvertance des biais dans le processus, réduisant finalement la crédibilité de la sortie de l’application d’apprentissage automatique.

Une équipe de scientifiques dirigée par Gautam Thakur du Oak Ridge National Laboratory a développé une nouvelle méthode scientifique pour détecter les biais des annotateurs de données humaines, garantissant des entrées de données de haute qualité pour les tâches d’apprentissage automatique. Les chercheurs ont également conçu une plate-forme en ligne appelée ThirdEye qui permet d’intensifier le processus de dépistage.

Les résultats de l’équipe ont été publiés dans le Résultats de l’Association for Computational Linguistics : ACL-IJCNLP 2021.

“Nous avons créé une méthode très systématique et très scientifique pour trouver de bons annotateurs de données”, a déclaré Thakur. “Cette approche indispensable améliorera les résultats et le réalisme des décisions d’apprentissage automatique concernant l’opinion publique, les récits en ligne et la perception des messages.”

Le vote sur le Brexit à l’automne 2016 a permis à Thakur et à ses collègues Dasha Herrmannova, Bryan Eaton et Jordan Burdette et à leurs collaborateurs Janna Caspersen et Rodney “RJ” Mosquito de tester leur méthode. Ils ont étudié comment cinq mesures communes d’attitude et de connaissances pourraient être combinées pour créer un profil anonymisé d’annotateurs de données susceptibles d’étiqueter les données utilisées pour les applications d’apprentissage automatique de la manière la plus précise et la plus exempte de biais possible. Ils ont testé 100 annotateurs de données potentiels de 26 pays en utilisant plusieurs milliers de publications sur les réseaux sociaux à partir de 2019.

« Dites que vous voulez utiliser l’apprentissage automatique pour détecter de quoi les gens parlent. Dans le cas de notre étude, parlent-ils du Brexit d’une manière positive ou négative ? rester dans l’UE parce que leurs préjugés nuisent à leurs performances ? » dit Thakur. “Les annotateurs de données qui peuvent mettre de côté leurs propres croyances fourniront des étiquettes de données plus précises, et nos recherches aident à les trouver.”

La conception à méthodes mixtes des chercheurs filtre les annotateurs de données avec des mesures qualitatives – l’échelle de racisme symbolique 2000, le questionnaire sur les fondements moraux, le test des antécédents des médias sociaux, le test de connaissance du Brexit et les mesures démographiques – pour développer une compréhension de leurs attitudes et croyances. Ils ont ensuite effectué des analyses statistiques sur les annotateurs d’étiquettes attribués aux publications sur les réseaux sociaux contre un expert en la matière ayant une connaissance approfondie du Brexit et du climat géopolitique de la Grande-Bretagne et un spécialiste des sciences sociales expert en langage incendiaire et en propagande en ligne.

Thakur souligne que la méthode de l’équipe est évolutive de deux manières. Premièrement, il traverse des domaines, impactant la qualité des données pour les problèmes d’apprentissage automatique liés aux décisions en matière de transport, de climat et de robotique, en plus des soins de santé et des récits géopolitiques pertinents pour la sécurité nationale. Deuxièmement, ThirdEye, la plate-forme Web interactive open source de l’équipe, intensifie la mesure des attitudes et des croyances, permettant le profilage de groupes plus importants d’annotateurs de données potentiels et une identification plus rapide des meilleures embauches.

“Cette recherche indique fortement que la morale, les préjugés et la connaissance préalable du récit en question des annotateurs de données ont un impact significatif sur la qualité des données étiquetées et, par conséquent, sur les performances des modèles d’apprentissage automatique”, a déclaré Thakur. “Les projets d’apprentissage automatique qui s’appuient sur des données étiquetées pour comprendre les récits doivent évaluer qualitativement la vision du monde de leurs annotateurs de données s’ils veulent faire des déclarations définitives sur leurs résultats.”


Les applications d’apprentissage automatique ont besoin de moins de données que prévu


Plus d’information:
Gautam Thakur et al, A Mixed-Method Design Approach for Empirically Based Selection of Unbiased Data Annotators, Résultats de l’Association for Computational Linguistics : ACL-IJCNLP 2021 (2021). DOI : 10.18653/v1/2021.findings-acl.169

Fourni par le Laboratoire national d’Oak Ridge

Citation: Une nouvelle approche scientifique réduit les biais dans les données de formation pour un meilleur apprentissage automatique (2021, 1er septembre) extrait le 2 septembre 2021 de https://techxplore.com/news/2021-09-scientific-approach-bias-machine.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.


Les offres de produits Hi-tech en rapport avec cet article

  • HAPPYSHOPPING ecran de 1,65 pouces BT 5.0 Montre intelligente Smart Fitness Tracker Tracker d'activite Montre Smart Fitness Watch IP67 etanche Donnees de sante
    Fonctionnalit¨¦s: [Moniteur en temps r¨¦el]: surveillance en temps r¨¦el 24 heures sur 24 de la fr¨¦quence cardiaque, de la pression art¨¦rielle, de l'oxyg¨¨ne dans le sang, des conseils scientifiques et des exercices sains, de la d¨¦tection de la temp¨¦rature, des avertissements de temp¨¦ratures ¨¦lev¨¦es et basses. [Mode sport multiple]: mesurez plus pr¨¦cis¨¦ment la consommation de calories et les changements de fr¨¦quence cardiaque et de tension art¨¦rielle, vous permettant de faire de l'exercice de mani¨¨re plus scientifique. [Longue dur¨¦e de vie de la batterie]: batterie au lithium 240 mAh int¨¦gr¨¦e, autonomie en veille jusqu'¨¤ 30 jours, temps de travail jusqu'¨¤ 10 jours, la lecture de musique peut durer 12 heures. [Chargement USB]: Facile ¨¤ charger, 1 heure pour une charge compl¨¨te, ne vous inqui¨¦tez pas de manquer d'¨¦lectricit¨¦ lorsque vous voyagez ¨¤ l'ext¨¦rieur ou pour affaires. [Rappel des informations de synchronisation]: synchronisation des donn¨¦es dans le
  • Sonoff - Controleur d'entrainement intelligent de lumiere de ventilateur de plafond IFan03 avec fonction RF 433 MHz sans telecommande
    Aperçu: iFan03, la nouvelle version de iFan02, plus stable dans la performance, ce qui est un ventilateur de plafond Wi-Fi et contrôleur de lumière pris en charge pour contrôler le ventilateur de plafond avec la lumière en utilisant votre téléphone où que vous soyez. La commande vocale est conçu pour vous faire ordonnez facilement iFn03 pour allumer ou éteindre le ventilateur et la lumière, pas besoin de toute opération manuelle. Appuyer pour contrôler le ventilateur de plafond avec la lumière de votre téléphone où que vous soyez et quand vous voulez. Horaire pour elle pour allumer et éteindre à jour ou la nuit, ou à tout moment pendant la journée, et il activer ou désactiver automatiquement. Les scènes présentent dans l'application vous permet de contrôler un ou plusieurs périphériques Sonoff, rapidement et en même temps avec un seul robinet. Fonctionnalités: * Télécommander le ventilateur de plafond et des lumières sur votre téléphone. * Prend en charge le contrôle vocal, compatible

Laisser un commentaire