Google dit comment il classe les résultats et empêche le spam évident

Google a publié un nouvel épisode de podcast où John Mueller, Gary Illyes, Martin Splitt et un invité de l’équipe de qualité de la recherche Google nommé Dewey ont parlé de la façon dont la société de recherche s’attaque au spam des résultats de recherche et comment Google classe les résultats de recherche.

Google dit comment il classe les résultats et empêche le spam évident

En substance, Google dit de ne pas vous concentrer sur un ou deux signaux spécifiques, mais améliorez globalement votre site.


Comment Google classe les résultats de recherche


Il est toujours intéressant d’écouter un représentant de Google parler du fonctionnement de Google Search.

Et dans ce dernier épisode, Gary Illyes de chez Google est allé plus loin sur la façon dont Google classe ses résultats de recherche.

La version courte est que Google propose d’abord une courte liste, disons environ 1.000 résultats, pour une requête donnée. Cette liste est générée en fonction de si la requête et le contenu d’une page sont pertinents et d’actualité.

Une fois la liste générée, Google applique alors beaucoup de ses signaux et facteurs de classement à cette liste plus courte. Gary Illyes a dit que c’est là que « la magie » se produit.



Ainsi, dans la deuxième partie du podcast Search Off The Record publié ce matin, Gary Illyes de Google a expliqué comment Google classe.

En bref, il a déclaré que Google réduit d’abord les pages qui peuvent se classer pour une requête spécifique à une courte liste, disons d’environ 1.000 pages. Ensuite, la magie se produit lorsque Google appliquera des signaux de classement ou comme il l’appelle des « signaux magiques » à cette liste réduite.

C’est à ce niveau que la véritable magie du classement Google s'opère, a déclaré Gary.


Initialement, pour créer la liste réduite, Google examine l’actualité et la pertinence en fonction de la requête et du contenu de la page.

Ensuite, Gary a expliqué qu’ils utilisent une méthode pour créer une liste d’ordre inverse, écarte ensuite ce qu'il ne peut pas répertorier et il arrive à la liste de 1.000.

Cette liste est créée mais ils n’en ont pas fini avec le classement là-bas, avec la liste réduite de 1.000 résultats. Il a dit que dans cette liste réduite, c’est là que « la magie » est, les « signaux magiques que nous appliquons toujours sur l’ensemble des résultats pour les rendre meilleurs pour la requête de l’utilisateur ».

Un exemple est RankBrain, comme un signal magique, mais il a également mentionné le coup de pouce HTTPS comme un autre.


Donc, en bref, Google réduit le nombre maximum de pages qu’il peut renvoyer pour une requête, puis l’algorithme de classement et les algorithmes magiques fonctionnent dans cet ensemble réduit.

Ensuite, Gary entre dans la façon dont ils classent ces listes réduites de pages :

Maintenant le classement est basé sur le nombre. Fondamentalement, pour chaque résultat, nous attribuerons un nombre et nous calculerons ce nombre en utilisant les signaux que nous avons collectés lors de l’indexation, ainsi que les autres signaux.


Et Gary Illyes d’ajouter par la suite :

Les signaux magiques ou algorithmes magiques que nous utilisons comme RankBrain, ce qu’ils font est de multiplier les nombres que nous attribuons à chaque résultat par un nombre.

Comme par exemple, s’ils veulent promouvoir un résultat parce qu’il a été déterminé qu’il y aurait un meilleur résultat pour le biscuit à la noix de coco au citron, alors disons que cela multiplierait le score du résultat par 2.

En gros, doubler son score, ce qui signifie qu’il monterait plus haut dans l’ensemble des résultats.

Si nous voulions supprimer un résultat de l’ensemble pour une raison quelconque, nous pourrions multiplier son score par 0. Parce qu’alors, cela va transformer le score en 0 et puis comme un score avec 0, pourquoi présenteriez-vous cela ?


Gary a ensuite déclaré qu’il est très peu probable qu’une page ait le même score. Il a ajouté que c’est là que le boost HTTPS, qui est un signal magique, mais c’est juste un bris d’égalité et c’est « un petit, minuscule boost ».

Les coups de pouce ne réorganiseraient pas les résultats à moins qu’il n’y ait égalité, mais seulement s’il y a égalité, sinon ce ne serait pas le cas.



Prévention du spam et apprentissage automatique par Google


Avant que Google ne parle de la façon dont il classe les résultats de recherche, Dewey, de l’équipe de la qualité de la recherche, a parlé des mesures préventives de spam.

Une chose qu’il a dite, c’est que Google utilise des modèles de machine learning pour traiter le spam le plus évident. Je suppose que cela ne devrait surprendre personne, mais c’était agréable d’entendre Google confirmer cela.

Dewey de chez Google a déclaré :

Google utilise un modèle d’apprentissage automatique très efficace et complet qui a essentiellement pris en charge la plupart des spams évidents.


Ce modèle d’apprentissage automatique permet à l’équipe de la qualité de la recherche Google de se concentrer sur « un travail plus important », a-t-il déclaré.

Un travail plus important pourrait être autour du spam par piratage, des escroqueries en ligne et d’autres problèmes que les modèles d’apprentissage automatique ne captent pas.

Les modèles d’apprentissage automatique de Google ont des années et des années de données qu’il utilise pour améliorer ses méthodes de prévention du spam et de recherche et il semble que Google soit très confiant de ses capacités.

Bref, comme dit plus haut, il est toujours intéressant d’écouter les représentants de Google parler de Search.

La façon dont ils parlent de la recherche peut nous indiquer ce qui compte vraiment avec les classements.

Comme la façon dont Dewey de Google disait que, souvent, il est triste de voir les référenceur SEO se concentrer sur une seule métrique, souvent une métrique externe que Google n’utilise même pas, au lieu de se concentrer sur la création de meilleures fonctionnalités, d’un contenu de qualité et d’une meilleure expérience utilisateur globale pour vos utilisateurs.

Google a des centaines de signaux de classement, donc se concentrer sur un ou deux ne vous donne probablement pas les meilleures chances de bien vous classer dans la recherche Google.

Source : Searchengineland