Comment Facebook classe les publications du fil d’actualité ?

Facebook a publié un article qui explique le fonctionnement de l’algorithme de classement Facebook du fil d’actualité.

Comment Facebook classe les publications du fil d’actualité ?

Par rapport au brevet de l’algorithme du fil d’actualité de Facebook, les deux documents expliquent en grande partie comment Facebook classe les publications dans le fil d’actualité.


Machine learning et classement


L’algorithme du fil d’actualité de Facebook est un système de classement de l’apprentissage automatique.

Ce n’est donc pas seulement un algorithme. Il s’agit d’une combinaison d’algorithmes multiples qui fonctionnent ensemble en différentes phases.


Certaines parties de l’algorithme font des choses différentes, comme la sélection des publications « candidates » à afficher dans le fil d’actualité d’une personne, l’élimination des messages avec désinformation ou clickbait, la création de listes d’amis avec lesquels une personne interagit, des sujets avec lesquels la personne a tendance à engager et ensuite l’utilisation de tous ces facteurs pour classer (ou non classer) les publications dans un fil d’actualité Facebook.

Toutes ces différentes couches sont appliquées afin de prédire ce qu’un membre de Facebook va trouver pertinent pour lui.

Le but des algorithmes Facebook est de classer les publications qui s’affichent dans le fil d’actualité, l’ordre dans lequel elles se trouvent et de sélectionner les publications qu’un membre de Facebook est susceptible d’être intéressé et d'interagir avec.


Ce ne sont pas seulement quelques signaux qui sont considérés. Facebook déclare qu’il utilise des milliers de signaux.

D’après Facebook :

Pour chaque personne sur Facebook, il y a des milliers de signaux que nous devons évaluer pour déterminer ce que cette personne pourrait trouver le plus pertinent... pour prédire ce que chacun de ces utilisateurs veut voir dans son fil... »



Signaux de classement du fil d’actualité Facebook


Caractéristiques d’un post Facebook


Un des signaux de classement dont Facebook discute, ce sont les « caractéristiques » d’une publication.

Facebook utilise une fonctionnalité ou la qualité d’une publication et détermine si c’est le genre de chose qu’un utilisateur a tendance à plus interagir avec.

Par exemple, si un post est accompagné d’une image colorée et qu’un membre a un historique d’interaction avec des messages avec des images colorées, alors cela va être classé plus haut.

Si un post est accompagné d’une vidéo et que c’est ce qu’un membre de Facebook aime interagir avec, alors cela va être classé plus haut pour ce membre.

Si le post a une image, une vidéo, si les amis d’un utilisateur sont identifiés (tagués) dans la publication, ces caractéristiques et d’autres d’un post sont utilisés comme un facteur de classement pour déterminer si un message va être montré à un utilisateur et à quel point il va être classé dans le fil d’actualité.


Facebook a utilisé l’exemple d’un utilisateur fictif appelé "Juan" pour illustrer le facteur de classement des caractéristiques.

Voici ce que Facebook a dit sur le facteur de classement Facebook des caractéristiques :

Nous pouvons utiliser les caractéristiques d’une publication, comme qui est tagué sur une photo et quand elle a été postée, pour prédire si Juan pourrait l’aimer.

Par exemple, si Juan a tendance à interagir souvent avec les posts de Saanvi (par exemple, le partage ou les commentaires) et que sa vidéo en cours d’exécution est très récente, il y a une forte probabilité que Juan aimera son post.

Si Juan a engagé avec plus de contenu vidéo que de photos dans le passé, le type de prédiction pour la photo de Wei de son épagneul cocker pourrait être assez faible.

Dans ce cas, notre algorithme de classement classerait la vidéo en cours d’exécution de Saanvi plus haut que la photo du chien de Wei parce qu’il prédit une probabilité plus élevée que Juan l’aimerait.



La date est un facteur de ranking sur Facebook


L’exemple de Facebook qui a été noté ci-dessus illustre également comment la date de publication, sous la forme de la façon dont quelque chose a été postée récemment, peut également être utilisée comme un facteur de classement.

Ce qui est intéressant à propos de l’exemple de la fiction « Juan » est que Facebook a mentionné que “quand une publication a été faite" est un facteur de classement.

Nous pouvons utiliser les caractéristiques d’un post, comme qui est identifié sur une photo et quand il a été posté, pour prédire si Juan pourrait l’aimer.


Cet aspect de la date en tant que facteur de classement coïncide avec un brevet de Facebook relativement récent qui indique que la façon dont quelque chose a été publiée récemment peut être utilisée comme un facteur de classement.

Le brevet du fil d’actualité Facebook est appelé “Sélection et présentation d’actualités identifiant le contenu externe aux utilisateurs du système du réseau social.”

Voici ce que dit le brevet du fil d’actualité Facebook :

... Les news peuvent être classées en fonction des données chronologiques associées aux interactions avec les news, de sorte que les news les plus récemment partagées ont un classement plus élevé.


Cela semble confirmer la valeur de l’affichage du même post plus d’une fois au cours d’une journée. Il peut atteindre différentes personnes à travers les périodes de temps et ceux qui interagissent avec le post peuvent l’aider à être montré à leurs amis, etc.


Engagement et centres d’intérêt


Un autre facteur de classement consiste à prédire si un utilisateur sera susceptible d’être intéressé ou d’engager avec une publication. Facebook utilise un certain nombre de signaux pour faire cette prédiction. L’article est clair sur ce point :

... Le système détermine quels posts s’affichent dans votre fil d’actualité, et dans quel ordre, en prédisant ce qui vous intéresse le plus ou avec lequel vous vous engagez avec.


Et certains de ces facteurs que Facebook utilise sont des signaux de posts passés et les personnes avec lesquelles l’utilisateur a interagi. Facebook utilise ces interactions passées pour l’aider à prédire avec quoi un utilisateur interagira à l’avenir.

D’après Facebook :

Ces prédictions sont fondées sur une variété de facteurs, y compris ce que vous avez suivi, aimé ou engagé récemment avec.


Facebook utilise des modèles d’apprentissage automatique (machine learning) pour prédire chacune de ces différentes choses. Il existe un modèle qui prédit le contenu qu’un utilisateur aimera, un autre modèle qui prédit quel message l’utilisateur commentera.

Chacune de ces formes d’engagement reçoit un classement et est classée par la suite.


Pour résumer, le processus de ranking commence par l’identification des posts candidats à classer, à partir d’un pool de posts qui ont été publiés depuis la dernière connexion de l’utilisateur.

L’étape suivante consiste à attribuer des scores de classement à chaque post.


C’est ainsi que Facebook l’explique en utilisant un exemple d’un utilisateur fictif nommé Juan :

Ensuite, le système doit marquer chaque post pour une variété de facteurs, tels que le type de post, la similitude avec d’autres éléments, et combien le post correspond à ce que Juan a tendance à interagir avec.

Pour calculer cela pour plus de 1000 posts, pour chacun des milliards d’utilisateurs - tous en temps réel - nous utilisons ces modèles pour toutes les stories candidates en parallèle sur plusieurs machines, appelées prédicteurs.



Les signaux de ranking sont personnalisés pour l’utilisateur Facebook


Un aperçu intéressant des facteurs de classement sur Facebook est qu’ils sont pondérés différemment d’un utilisateur à l’autre.

Pondérés a un sens pour quand un signal de classement est plus important qu’un autre signal de classement.

Ce que Facebook a révélé, c’est que pour une personne, la prédiction qu’il « aimerait » une publication pourrait avoir une influence plus forte au cas où ce post est classé.

Pour un autre utilisateur, la prédiction que l’utilisateur commentera un post reçoit un poids de classement plus fort.

Facebook a aussi partagé ceci :

Ensuite, c’est la passe de la notation principale, où la plupart de la personnalisation se produit.

Ici, un score pour chaque story est calculé indépendamment, puis les 500 posts sont mis dans l’ordre par score.

Pour certains, le score peut être plus élevé pour les “Likes” que pour les commentaires, vu que certaines personnes aiment plus s’exprimer par Like que de commenter.

Toute action d’une personne qui engage rarement (par exemple, une prédiction de Like qui est très proche de zéro) obtient automatiquement un rôle minimal dans le classement, comme la valeur prévue est très faible.


Ce que cela signifie, c’est que pour qu’une publication soit un succès, elle doit inspirer différentes formes d’engagement de chaque utilisateur.


Caractéristiques contextuelles pour la diversité du fil d’actualité


La dernière étape du processus de classement consiste à assurer la diversité du type de contenu qui est affiché dans le fil d’actualité.

De cette façon, le fil d’actualité de l’utilisateur ne devient pas répétitif.


Multiples facteurs personnalisés de classement Facebook


Facebook n’a pas dressé la liste complète de tous les facteurs de classement utilisés pour classer les publications dans un fil d’actualité.

Mais il a donné une idée, un aperçu de la façon dont le processus de classement se déroule et quels types de comportement sont priorisés.

Nous avons également appris que les signaux de classement sont dynamiques et peuvent être pondérés différemment selon la personne.

Source : Searchenginejournal