Connectez-vous avec nous

Internet

Google Scholar rend les documents non en anglais invisibles

Résultats de l’étude: le graphique montre comment les articles écrits dans des langues autres que l’anglais apparaissent au-dessus de la position 900 dans le classement Google Scholar. Crédit: Universitat Pompeu Fabra – Barcelone

La visibilité des articles scientifiques et des articles de conférence est conditionnée à leur facilité de recherche dans les moteurs de recherche universitaires, en particulier Google Scholar. Pour améliorer cette visibilité, l’optimisation des moteurs de recherche (SEO) a été appliquée ces dernières années aux moteurs de recherche académiques afin d’optimiser les documents et, ainsi, de s’assurer qu’ils sont mieux classés dans les pages de recherche (c’est-à-dire l’optimisation des moteurs de recherche académiques ou ASEO).

Recherches récentes, publiées dans Internet du futur, a découvert si la langue du document est un facteur impliqué dans l’algorithme de tri des résultats de recherche sur Google Scholar. Les auteurs de l’étude sont Cristòfol Rovira, Lluís Codina et Carlos Lopezosa, membres du Département de la communication de l’UPF.

« Pour mettre en œuvre cette optimisation, nous devons approfondir notre compréhension de l’algorithme de classement de pertinence de Google Scholar, afin que, sur la base de ces connaissances, nous puissions mettre en évidence ou améliorer les caractéristiques que les documents académiques présentent déjà et qui sont prises en compte par l’algorithme », déclare Rovira, premier auteur de l’étude. Pour éviter les pratiques frauduleuses, Google Scholar n’explique pas cet algorithme et, par conséquent, ce type de recherche devient nécessaire.

Pour l’étude, les auteurs ont appliqué une méthodologie de recherche en ingénierie inverse basée sur une analyse statistique utilisant le coefficient de corrélation de Spearman. Trois types de recherche différents ont été effectués, donnant un échantillon de 45 recherches avec chacune 1 000 résultats (45 000 documents): par auteur, par année et par mot-clé.

Les articles de qualité avec des centaines de citations sont traités de manière discriminatoire

Les résultats montrent que lorsqu’une recherche est effectuée sur Google Scholar avec des résultats dans différentes langues, la grande majorité (90%) des documents dans des langues autres que l’anglais sont systématiquement relégués à des positions qui les rendent totalement invisibles. Ces documents sont presque toujours placés à des positions supérieures à 900, même s’il s’agit d’articles de qualité avec des centaines de citations. Ainsi, on peut affirmer que Google Scholar discrimine les documents non rédigés en anglais dans les recherches avec des résultats multilingues.

Une méconnaissance de ce facteur pourrait être préjudiciable aux chercheurs du monde non anglophone, leur faisant croire qu’il n’y a pas de littérature dans leur langue nationale lorsqu’ils effectuent des recherches avec des résultats multilingues.

« C’est particulièrement le cas dans les recherches les plus fréquentes, c’est-à-dire celles effectuées par année. Néanmoins, cela peut également se produire lors de recherches utilisant certains mots clés identiques dans les langues du monde entier, notamment les marques, les composés chimiques, les produits industriels acronymes, médicaments et maladies, le COVID-19 étant l’exemple le plus récent », révèlent les auteurs de l’étude.

Et ils ajoutent « de plus, si l’on considère les résultats de cette étude du point de vue de l’ASEO, il est plus qu’évident que tant que ce biais n’est pas résolu, les chances d’être classé dans une recherche multilingue Google Scholar augmentent remarquablement si les chercheurs optent pour publication en anglais. « 

Graphique des résultats de l’étude

Le nuage de points ci-dessus résume les résultats de la recherche. Il y a 45 000 points, un par document. Les points gris représentent les documents écrits en anglais, les autres langues en rouge et le bleu montre les positions médianes.

Le graphique montre comment les articles rédigés dans des langues autres que l’anglais apparaissent au-dessus de la 900e position dans le classement Google Scholar. Il en est ainsi même pour les documents de qualité qui ont des centaines de citations et qui sont bien placés dans le classement du nombre de citations.

Les cas les plus frappants sont les points rouges situés dans le coin inférieur droit. Ils correspondent à des documents rédigés dans des langues autres que l’anglais qui sont classés par nombre de citations inférieur à 100 et ont un classement Google Scholar supérieur à 900. Cela signifie qu’ils reçoivent tous plus d’un millier de citations et apparaissent dans Google Scholar aux mêmes positions que les documents en anglais cité quelques dizaines de fois.


Combien d’articles scientifiques y a-t-il sur le Web? Au moins 114 millions, selon le professeur


Plus d’information:
Cristòfol Rovira et al, Language Bias in the Google Scholar Ranking Algorithm, Internet du futur (2021). DOI: 10.3390 / fi13020031

Image fournie par Universitat Pompeu Fabra – Barcelone

Citation: Google Scholar rend les documents non en anglais invisibles (2021, 10 février) récupéré le 10 février 2021 sur https://techxplore.com/news/2021-02-google-scholar-documents-english-invisible.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.


Les offres de produits Hi-tech en rapport avec cet article

Continuer la lecture
Cliquez pour commenter

Laissez un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

ARTICLES POPULAIRES