Internet
Exploration des données avec des traits d'union: amélioration de la reconnaissance des entités nommées
L'exploration de données et l'extraction de connaissances à partir de sources disparates sont des mégadonnées, des grandes entreprises. Mais, comment le logiciel de recherche gère-t-il les entités qui sont mentionnées lorsque seule une partie de leur nom est utilisée ou qu'un nom est séparé par un trait d'union alors qu'il ne l'est normalement pas? Recherche publiée dans le Journal international des systèmes intelligents d'information et de base de données révèle les détails d'une nouvelle approche pour améliorer la reconnaissance et la désambiguïsation des entités nommées dans les titres des actualités.
Jayendra Barua et Rajdeep Niyogi du Département d'informatique et d'ingénierie de l'Indian Institute of Technology, à Roorkee, Uttarakhand, Inde, expliquent que leur approche d'une telle analyse des titres d'actualité s'appuie sur un algorithme formé qui a été enseigné à supprimez les tirets et complétez les noms incomplets pour lever toute ambiguïté.
L'évaluation par l'équipe de leur nouvelle approche montre qu'elle fonctionne avec une précision d'environ 10% supérieure à celle des systèmes conventionnels et pourrait ainsi améliorer la récupération automatisée des actualités associées à des entreprises, organisations, événements, personnalités publiques et autres entités d'intérêt pour ces fouilles de données. les nouvelles. Le système fonctionne bien avec les flux d'actualités, tels que le type de flux RSS généré par les sites Web régulièrement mis à jour. Les titres de ces sources peuvent généralement être plus longs que les titres de journaux conventionnels, mais ils sont néanmoins succincts, avec généralement dix mots ou moins. Chaque mot peut alors être important dans un contexte d'exploration de données et donc la désambiguïsation est critique.
L'évaluation des sources d'information peut aider à limiter la propagation de la désinformation
Jayendra Barua et al. Amélioration de la reconnaissance et de la désambiguïsation des entités nommées dans les titres des actualités, Journal international des systèmes intelligents d'information et de base de données (2020). DOI: 10.1504 / IJIIDS.2019.104530
Citation:
Exploration de données avec des traits d'union: amélioration de la reconnaissance des entités nommées (2020, 22 janvier)
récupéré le 22 janvier 2020
depuis https://techxplore.com/news/2020-01-hyphenated-headlines-entity-recognition.html
Ce document est soumis au droit d'auteur. Hormis toute utilisation équitable aux fins d'études ou de recherches privées, aucun
une partie peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.
Sommaire