Plateformes de contenus

Terminologies autour des algorithmes de recommandation des plateformes de contenus numériques

Publié le

Qu’est-ce qu’une plateforme numérique ? Un algorithme ? Un algorithme de recommandation ? Dans le cadre de la publication de son étude sur la capacité à informer des algorithmes de recommandation, le Conseil supérieur de l’audiovisuel (CSA), propose un glossaire des terminologies autour des algorithmes de recommandation des plateformes de contenus.

A lire : Pourquoi et comment le CSA a réalisé une étude sur l’un des algorithmes de recommandations de YouTube


Algorithme

Un algorithme est une suite finie d’opérations ou d’instructions, déterminée de manière non ambiguë et permettant de résoudre un problème ou d’obtenir un résultat. Dans le monde numérique, les algorithmes permettent de combiner des informations pour résoudre un problème et produire des résultats (simulation, anticipation, recommandation, comparaison,…). Pour qu'un algorithme puisse être mis en œuvre par un ordinateur, il faut qu'il soit exprimé dans un langage informatique. (Source : Commission nationale de l’informatique et des libertés CNIL).

La notion de « problème » s’entend ici dans le sens très large d’une tâche à effectuer, comme trier des objets, assigner des ressources, transmettre des informations, traduire un texte, etc. L’algorithme reçoit des données en entrée, par exemple la liste des objets à trier, la description des ressources à assigner, celle des besoins à satisfaire, les informations à transmettre et l’adresse du destinataire, ou encore le texte à traduire, et il produit en sortie d’autres données, par exemple la liste des objets triés, les associations ressources-besoins, un compte-rendu de transmission, la traduction du texte soumis en entrée, etc.

Les algorithmes, programmés sous la forme de logiciels informatiques, sont omniprésents dans le monde numérique. Ils sont les compléments nécessaires des données, leur fonction première étant de trier, d’organiser, de traiter et de présenter les données, de transformer celles-ci de matière première brute en produit élaboré, afin qu’elles puissent répondre aux besoins des utilisateurs. 

Les emplois d’algorithmes dans le monde actuel sont nombreux : institutions financières, prédiction des trafics (routier, maritime, aérien), analyse d’images médicales, etc.

>> A lire aussi : Rapport du CSA lab – Le rôle des données et des algorithmes dans l’accès aux contenus

 

Approches algorithmiques basées sur le contenu

Pour les recommandations basées sur le contenu, l’ensemble des algorithmes dits de « classement ou de référencement », prennent d’abord en compte les contenus et les similarités entre ces contenus (sujet, titre, mots-clés, chaînes, etc.). L’approche algorithmique est centrée sur le contenu lui-même et non pas sur l’utilisateur.

Les algorithmes basés sur les contenus sont largement employés par les sites de la presse en ligne notamment, car ils permettent de proposer aux lecteurs des points de vue et des angles d’articles en lien avec l’article précédemment consulté.


Approches algorithmiques basées sur le contenu et l’utilisateur

L’approche algorithmique va au-delà des fonctions de tri des algorithmes basées sur le contenu en personnalisant la mise en avant des contenus en fonction du profil et des préférences de l’utilisateur. Le rôle de l’algorithme consiste alors à mettre en correspondance (« matching ») les attributs des contenus et ceux de l’utilisateur.

Cette utilisation des données de consommation de l’utilisateur est appelée « filtrage collaboratif » et se décline en deux méthodes. Le filtrage collaboratif « passif » ne fait pas appel à l’utilisateur, ce dernier n’étant pas directement consulté sur ses opinions ou préférences. A l’inverse, le filtrage collaboratif « actif » tient compte d’éléments renseignés par l’utilisateur.

Par exemple, le réseau social Facebook utilise un filtrage collaboratif passif : il collecte « en arrière-plan » les informations et interactions des utilisateurs et en déduit leurs goûts et préférences.

 

Algorithme de recommandation

Les algorithmes de recommandation facilitent la recherche et l’extraction des informations pertinentes pour l’utilisateur. Lorsqu’un système veut proposer des informations intéressantes pour l’utilisateur, il doit être en mesure d’en prédire la pertinence et l’intérêt.

Les plateformes numériques suggèrent des contenus en recourant à des algorithmes de recommandation. Exemple : lorsqu’on effectue une recherche sur le moteur de recherche Google, un ensemble d’algorithmes détermine l’importance des contenus indexés qui seront affichés et donc proposés à l’utilisateur. Sur un réseau social (Facebook, Twitter, Instagram, etc.), un ensemble d’algorithmes décident du contenu à afficher sur le fil d’actualité en fonction des diverses informations telles que les goûts ou les réactions de l'utilisateur, les derniers contenus proposés, etc.

Cette technique informatique, les systèmes de recommandation, est intégrée dans de nombreux domaines. Les principaux critères régissant ces algorithmes sont : les préférences et historique de consommation de l’utilisateur, les caractéristiques des contenus (source, durée), leur succès (nombre de vues, partages, commentaires), etc.

Pour proposer des contenus intéressants à l’utilisateur, il est nécessaire de collecter les informations sur son comportement. Ainsi, à titre d’exemple, sont observés les statuts et les articles partagés sur Facebook, les produits achetés ou consultés sur Amazon, les morceaux de musique et les playlists sur Spotify ou encore les films et les séries regardées sur Netflix.

 

Lecture automatique de vidéos

La fonctionnalité de lecture automatique de vidéos consiste à lancer automatiquement une vidéo à la fin de la lecture de la précédente, sans qu’aucune action ne soit requise de la part de l’utilisateur. Sur la plateforme YouTube par exemple, à la fin de chaque vidéo, un compte à rebours apparaît indiquant le nom de la vidéo suivante et son lancement prochain.

 

Chaînes YouTube

Pour mettre en ligne des vidéos sur la plateforme YouTube, il est nécessaire de s’inscrire et de créer sa « chaîne ». La page d’une chaîne contient un encart de présentation et concentre toutes les vidéos publiées par le créateur. Les contenus vidéos postés peuvent y être hiérarchisés ou rassemblés en listes de lecture (playlist) sur un sujet ou thématique. Amateurs et professionnels peuvent posséder leur chaîne sur YouTube. Les utilisateurs (avec ou sans chaîne) ont la possibilité de s’abonner à une chaîne afin d’être alertés des dernières vidéos postées par le créateur.  

 

Règlement Général de Protection des Données (RGPD)

Le règlement général sur la protection des données (RGPD) est un texte réglementaire européen qui encadre le traitement des données de manière égalitaire sur tout le territoire de l’Union Européenne. Il est entré en vigueur le 24 mai 2016 et est en application le 25 mai 2018.

Le RGPD s’inscrit dans la continuité de la Loi française Informatique et Libertés de 1978 établissant des règles sur la collecte et l’utilisation des données sur le territoire français. Il a été conçu autour de 3 objectifs : renforcer les droits des personnes, responsabiliser les acteurs traitant des données, crédibiliser la régulation grâce à une coopération renforcée entre les autorités de protection des données.

Toutes les entreprises qui gèrent des traitements de données à caractère personnel seront dans l’obligation d’être en conformité avec le RGPD.

Ce texte réglementaire européen impose désormais aux plateformes de contenus d’expliquer leurs politiques de traitements de données.