Connectez-vous avec nous

Internet

Exploration des données avec des traits d'union: amélioration de la reconnaissance des entités nommées

Crédits: CC0 Public Domain

L'exploration de données et l'extraction de connaissances à partir de sources disparates sont des mégadonnées, des grandes entreprises. Mais, comment le logiciel de recherche gère-t-il les entités qui sont mentionnées lorsque seule une partie de leur nom est utilisée ou qu'un nom est séparé par un trait d'union alors qu'il ne l'est normalement pas? Recherche publiée dans le Journal international des systèmes intelligents d'information et de base de données révèle les détails d'une nouvelle approche pour améliorer la reconnaissance et la désambiguïsation des entités nommées dans les titres des actualités.

Jayendra Barua et Rajdeep Niyogi du Département d'informatique et d'ingénierie de l'Indian Institute of Technology, à Roorkee, Uttarakhand, Inde, expliquent que leur approche d'une telle analyse des titres d'actualité s'appuie sur un algorithme formé qui a été enseigné à supprimez les tirets et complétez les noms incomplets pour lever toute ambiguïté.

L'évaluation par l'équipe de leur nouvelle approche montre qu'elle fonctionne avec une précision d'environ 10% supérieure à celle des systèmes conventionnels et pourrait ainsi améliorer la récupération automatisée des actualités associées à des entreprises, organisations, événements, personnalités publiques et autres entités d'intérêt pour ces fouilles de données. les nouvelles. Le système fonctionne bien avec les flux d'actualités, tels que le type de flux RSS généré par les sites Web régulièrement mis à jour. Les titres de ces sources peuvent généralement être plus longs que les titres de journaux conventionnels, mais ils sont néanmoins succincts, avec généralement dix mots ou moins. Chaque mot peut alors être important dans un contexte d'exploration de données et donc la désambiguïsation est critique.


L'évaluation des sources d'information peut aider à limiter la propagation de la désinformation


Plus d'information:
Jayendra Barua et al. Amélioration de la reconnaissance et de la désambiguïsation des entités nommées dans les titres des actualités, Journal international des systèmes intelligents d'information et de base de données (2020). DOI: 10.1504 / IJIIDS.2019.104530

Citation:
                                                 Exploration de données avec des traits d'union: amélioration de la reconnaissance des entités nommées (2020, 22 janvier)
                                                 récupéré le 22 janvier 2020
                                                 depuis https://techxplore.com/news/2020-01-hyphenated-headlines-entity-recognition.html

Ce document est soumis au droit d'auteur. Hormis toute utilisation équitable aux fins d'études ou de recherches privées, aucun
                                            une partie peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.

Les offres de produits Hi-tech en rapport avec cet article

Continuer la lecture
Cliquez pour commenter

Laissez un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

ARTICLES POPULAIRES