Internet
Plus d’intimité, mais des problèmes persistent
En mars 2021, Google a annoncé qu’il mettait fin à la prise en charge des cookies tiers et qu’il passait à «un premier site Web plus privé». Même si le mouvement était attendu au sein de l’industrie et par les universitaires, il y a encore de la confusion sur le nouveau modèle et du cynisme quant à savoir s’il constitue vraiment le type de révolution de la confidentialité en ligne que Google prétend.
Pour évaluer cela, nous devons comprendre ce nouveau modèle et ce qui est en train de changer. L’approche actuelle de la technologie publicitaire (adtech) est celle dans laquelle les sociétés de plate-forme nous offrent un service «gratuit» en échange de nos données. Les données sont collectées via des cookies tiers téléchargés sur nos appareils, qui permettent à un navigateur d’enregistrer notre activité sur Internet. Ceci est utilisé pour créer des profils et prédire notre sensibilité à des campagnes publicitaires spécifiques.
Les progrès récents ont permis aux annonceurs numériques d’utiliser le deep learning, une forme d’intelligence artificielle (IA) dans laquelle les humains ne définissent pas les paramètres. Bien que plus puissant, cela reste cohérent avec l’ancien modèle, reposant sur la collecte et le stockage de nos données pour former des modèles et faire des prédictions. Les plans de Google vont plus loin encore.
Brevets et plans
Toutes les entreprises ont leur sauce secrète, et Google est plus secret que la plupart. Cependant, les brevets peuvent révéler une partie de ce qu’ils font. Après une exploration des brevets de Google, nous avons trouvé le brevet américain US10885549B1, « Publicité ciblée utilisant l’analyse temporelle des données spécifiques à l’utilisateur »: un brevet pour un système qui prédit l’efficacité des publicités basées sur les « données temporelles » d’un utilisateur, des instantanés de ce l’utilisateur effectue à un moment donné au lieu d’une collecte de données de masse sans discernement sur une période plus longue.
Nous pouvons également faire des inférences en examinant les travaux d’autres organisations. Une recherche financée par la société adtech Bidtellect a démontré que les données utilisateur historiques à long terme ne sont pas nécessaires pour générer des prévisions précises. Ils ont utilisé l’apprentissage en profondeur pour modéliser les intérêts des utilisateurs à partir de données temporelles.
Parallèlement à la publicité contextuelle, qui affiche des publicités en fonction du contenu du site Web sur lequel elles apparaissent, cela pourrait conduire à une publicité plus respectueuse de la vie privée. Et sans stocker des informations personnellement identifiables, cette approche serait conforme aux lois progressistes comme le règlement général sur la protection des données (RGPD) de l’Union européenne.
Google a également publié des informations via le Google Privacy Sandbox (GPS), un ensemble de propositions publiques visant à restructurer l’adtech. Au cœur se trouvent les Federated Learning Cohorts (FLoCs), un système d’IA décentralisé déployé par les derniers navigateurs. Comme l’explique le blog Google AI, l’apprentissage fédéré diffère des techniques traditionnelles d’apprentissage automatique qui collectent et traitent les données de manière centralisée. Au lieu de cela, un modèle d’apprentissage en profondeur est téléchargé temporairement sur un appareil, où il s’entraîne sur nos données, avant de revenir au serveur en tant que modèle mis à jour à combiner avec d’autres.
Avec les FLoC, le modèle d’apprentissage en profondeur sera téléchargé sur les navigateurs Google Chrome et analysera les données du navigateur local. Il trie ensuite l’utilisateur dans une «cohorte», un groupe de quelques milliers d’utilisateurs partageant un ensemble de traits identifiés par le modèle. Il fait une copie cryptée de lui-même, supprime l’original et renvoie la copie cryptée à Google, ne laissant qu’un numéro de cohorte. Étant donné que chaque cohorte contient des milliers d’utilisateurs, Google soutient que l’individu devient pratiquement non identifiable.
Cohortes et préoccupations
Dans ce nouveau modèle, les annonceurs ne sélectionnent pas les caractéristiques individuelles à cibler, mais font plutôt de la publicité auprès d’une cohorte donnée, comme l’explique la page Github de Google. Bien que les FLoC puissent sembler moins efficaces que la collecte de nos données individuelles, Google affirme qu’ils réalisent «95% des conversions par dollar dépensé par rapport à la publicité basée sur les cookies».
Le processus d’enchères pour les annonces se déroulera également sur le navigateur, en utilisant un autre système nommé « Turtledove ». Bientôt, Google adtech fonctionnera de cette manière, contenu dans un navigateur Web, faisant des prévisions publicitaires constantes basées sur nos actions les plus récentes, sans collecter ni stocker d’informations personnellement identifiables.
Nous voyons trois préoccupations principales. Premièrement, ce n’est qu’une partie d’une image beaucoup plus grande de l’IA que Google construit sur Internet. Grâce à Google Analytics, par exemple, Google continue d’utiliser les données obtenues à partir des cookies individuels à la première personne basés sur des sites Web pour former des modèles d’apprentissage automatique et potentiellement créer des profils individuels.
Deuxièmement, la manière dont une organisation parvient à nous «connaître» importe-t-elle? Ou est-ce le fait qu’il le sait? Google nous redonne une confidentialité des données individuelles légalement acceptable, mais il intensifie sa capacité à nous connaître et à commercialiser notre activité en ligne. La vie privée est-elle le droit de contrôler nos données individuelles, ou pour l’essence de nous-mêmes de rester inconnue sans consentement?
Le dernier problème concerne l’IA. Les limites, les préjugés et l’injustice autour de l’IA font désormais l’objet d’un large débat. Nous devons comprendre comment les outils d’apprentissage profond dans les FLoC nous regroupent en cohortes, attribuent des qualités aux cohortes et ce que ces qualités représentent. Sinon, comme tous les systèmes de commercialisation précédents, les FLoC pourraient enraciner davantage les inégalités et les divisions socio-économiques.
Google supprime les cookies tiers, mais la publicité ciblée invasive continuera à vivre
Fourni par The Conversation
Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lisez l’article original.
Citation: Révolution publicitaire de l’IA de Google: plus de confidentialité, mais des problèmes persistent (2021, 2 avril) récupéré le 2 avril 2021 sur https://techxplore.com/news/2021-04-google-ai-advertising-revolution-privacy.html
Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.
Sommaire