Comment Google sait quel contenu appartient à un même auteur ?

Google utilise une technique appelée "réconciliation" ou rapprochement pour comprendre quand le contenu sur le web appartient à un même auteur.

Comment Google sait quel contenu appartient à un même auteur ?

John Mueller de chez Google décrit une technique appelée "réconciliation'' qui est utilisée pour reconnaître quand différents contenus à travers le web appartiennent au même auteur.

Ce sujet est discuté lors du hangout Google Search Central SEO enregistré le 23 avril 2021.

Un propriétaire de site demande à John Mueller ce qui est le plus important à inclure sur la page à propos d’un auteur entre des liens vers des profils de médias sociaux ou une adresse e-mail.


Cette question incite John Mueller à expliquer comment Google est en mesure de reconnaître l’entité derrière les pages d’auteur en fonction d’un certain nombre de facteurs différents.


John Mueller s’explique sur la reconnaissance des auteurs


La réponse courte à la question est la suivante :

Il est préférable de pointer un lien vers un profil de médias sociaux sur une page d’auteur.


À tout le moins, quel que soit ce que l’auteur choisit de lier sur sa page, il doit s’assurer qu’il est cohérent à travers le web.

L’idée est de réconcilier tous les signaux avec un lieu central, comme un profil de médias sociaux.

Si un auteur est constamment lié à son compte Twitter, par exemple, cela aidera Google à reconnaître qu’il est la même entité derrière plusieurs pages d’auteur.

Voici comment John Mueller le dit dans la vidéo :

Essentiellement, ce que je vois de notre côté, c’est, quand il s’agit de choses comme les pages d’auteur, ou des informations sur l’auteur, ou des informations sur les entités en général derrière un site Web, un article, ou quelque chose, - ce qui se passe, c’est qu’il y a nos systèmes qui essaient de reconnaître qui c’est, ce que cette entité est, et nous le faisons sur la base d’un certain nombre de facteurs différents.

Et cela inclut des choses comme des liens vers des pages de profil par exemple, ou des informations visibles que nous pouvons trouver sur ces pages elles-mêmes.

Donc, ma recommandation ici serait d’avoir au moins un lien vers un lieu commun, ou un peu comme un lieu central, où vous dites que tout se rassemble pour cet auteur.

Ce qui pourrait être quelque chose comme une page de profil de réseau social, par exemple, et l’utiliser à travers les différentes pages d’auteur que vous avez lorsque vous écrivez, de sorte que lorsque nos systèmes regardent un article et ils voient une page d’auteur associée à cela, ils peuvent reconnaître que c’est le même auteur que la personne qui a écrit autre chose.

Et nous pouvons en quelque sorte regrouper cela par entité, et nous le faisons sur la base peut-être de ce profil commun de réseautage social qui est là.


John Mueller fait référence à l’authorship, une forme de balisage de données structurées retirée depuis, à l’époque de feu Google+.

En 2016, le même John Mueller déclarait que “sans authorship, Google ne peut pas savoir qui est l’auteur de l’article”.

Ceux qui sont nouveaux dans le domaine du référencement peuvent ne pas être familiers avec l’authorship. Autrement dit, c’est le balisage qui pourrait être utilisé pour dire à Google qui est l’auteur d’un morceau de contenu.

Google a même affiché la photo d’un auteur dans les résultats de recherche à un moment donné, mais c’est de l’histoire ancienne.

Et John Mueller de poursuivre aujourd’hui :

Il y a longtemps, nous avions l’annotation rel ="author “, et tous les SEOs plus anciens s’en souviennent maintenant, mais c’est quelque chose essentiellement où nous essayions d’utiliser des données structurées pour appliquer explicitement cela ...

Les annotations rel="author” ne sont plus utilisées chez Google depuis un bon moment maintenant, mais nous essayons de comprendre qui est l’entité derrière une page d’auteur.

Et pour beaucoup d’auteurs, il est assez clair qu’il y a un nom et il est très évident que ce seul nom est associé à cette seule personne.


John Mueller continue ensuite à reconnaître des situations plus compliquées où plusieurs personnes du même nom ont toutes des pages à leur sujet sur le web.

Sans lien vers un emplacement central, comme un profil de médias sociaux, Google peut supposer que différents auteurs avec des noms identiques sont la même personne.

Pour les autres, cela peut être un peu plus compliqué. Comme moi, par exemple, John Mueller. Si vous me cherchez, vous trouverez des pages Wikipedia, des restaurants barbecue, des groupes, toutes sortes de gens qui s’appellent John Mueller.

Et si, sur mon site, je ne précise pas qui je suis réellement, alors il pourrait arriver que nos systèmes regardent ma page et disent : "Oh, c’est ce gars qui dirige ce restaurant barbecue. Et tout à coup, je suis associé à un restaurant barbecue, qui pourrait être un mouvement vers le haut, je ne sais pas."

Mais ces choses subtiles nous permettent de reconnaître plus facilement qui est réellement derrière quelque chose. Nous appelons cela la réconciliation quand il s’agit de données structurées, en quelque sorte de reconnaître lesquelles de ces entités sont ensemble.


Source : Searchenginejournal