RankBrain : 1er signal de classement sur Google utilisant l'intelligence artificielle

L'intelligence artificielle avec RankBrain fait désormais partie du traitement et du classement des résultats de recherche sur Google.

Google RankBrain

En effet, l'intelligence artificielle via l'apprentissage automatique (machine learning) gère maintenant une bonne partie des requêtes de recherche sur Google.

C’est ce que nous apprend en substance Greg Corrado, Senior Research Scientist chez Google, lors d’une interview accordée au site Bloomberg.

RankBrain serait donc à ce jour le troisième plus important signal parmi les algorithmes de recherche que Google utilise pour déterminer quel contenu afficher aux utilisateurs dans les résultats de recherche. On n'en saura rien sur les deux premiers facteurs importants. Mais, je parie que les backlinks en font partie, d'où le très redouté Penguin.

Ainsi, parmi plus de 200 signaux de classement, RankBrain est devenu, en peu de temps, l'un des plus puissants. Et nous n'en avions jamais entendu parler jusqu'à présent. Et pour cause.

Lancé en catimini depuis le début de l’année 2015, il est de facto désormais le premier signal connu de ranking sur Google à être basé sur l’intelligence artificielle.

Alors, qu’est-ce que c’est exactement ? A part le fait d’être le premier signal de ranking à se servir de l'intelligence artificielle.

C’est quoi RankBrain ?


RankBrain est un algorithme de classement basé sur l'intelligence artificielle qu'utilise Google afin d'afficher les meilleurs résultats de recherche, en particulier pour les 15% de requêtes de recherche quotidiennes que Google n'a jamais vues auparavant. Et ce n'est qu'un début, à mon avis.

Notons tout de même que 15% sur 3,5 milliards de requêtes effectuées chaque jour sur Google (à raison de 100 milliards par mois), cela représente 525 millions de requêtes traitées chaque jour par RankBrain. Toutes langues confondues. Et c’est déjà énorme !

L'article de Bloomberg le décrit en termes plus simples comme suit :
“RankBrain utilise l'intelligence artificielle pour traduire de grandes quantités de textes en entités mathématiques — appelés vecteurs — que l'ordinateur peut comprendre. Si RankBrain voit un mot ou expression avec lequel il n'est pas familier, la machine peut faire une supposition quant à quel mot ou expression pourrait avoir une signification similaire et filtrer le résultat par conséquent, en le rendant plus efficace pour gérer les requêtes de recherche jamais vues auparavant.”
En d’autres termes, RankBrain aide Google à mieux comprendre les entités au sein de la requête et leur relation à d'autres entités que Google connaît déjà. Et il aide aussi Google à comprendre quel contenu est réellement pertinent pour les utilisateurs en intégrant les interactions sur ses pages de résultats (ce qu'il fait déjà via le taux de clics).

Ainsi, par exemple, si un même résultat est beaucoup cliqué dans les résultats d’une requête courte connue et que ce même résultat l’est aussi alors qu’il est affiché dans les résultats d’une requête de la longue traîne, alors RankBrain conclura que cette requête de la longue traîne est similaire à la requête courte généralement connue.

Et donc, dorénavant, pour cette requête de la longue traîne inconnue jusqu’alors, il affichera les résultats de la requête courte connue.

Déjà en 2010, Google avait publié ce document (vous y apprendrez beaucoup sur ce qui se passe aujourd’hui) dans lequel il parlait d’utiliser les logs des données des clics sur ses pages de résultats pour entraîner ou former ses machines à relier les requêtes plutôt que de chercher à savoir si les requêtes sont pertinentes (requêtes jamais vues).

Et dans ce document, en partenariat avec d'autres chercheurs, Google Research de Zurich dit ceci :
"Notre objectif n’est pas de susciter des jugements sur la pertinence des clics de l'utilisateur, mais plutôt de relier les requêtes en s’intéressant aux résultats de recherche communément cliqués. L'hypothèse est que les deux requêtes soient liées si elles conduisent aux clics des utilisateurs sur les mêmes documents pour une grande quantité de documents."
Tout y est, tout est dit, depuis 2010 !

Il faut noter que les 15% de requêtes quotidiennes inconnues à ce jour de Google Search sont quasiment toutes des requêtes de la longue traîne. Toutefois, RankBrain serait aussi utilisé sur d’autres types de requêtes (...on a very large fraction of queries, dit le Tweet ci-dessous). Des requêtes sans doute courtes.

Et qui sait, RankBrain pourrait à la longue intervenir sur toutes les requêtes sur Google... et remplacer Hummingbird.


Jack Clark, qui est le journaliste de Bloomberg qui a interviewé Greg Corrado de chez Google, a aussi déclaré ce qui suit :
“RankBrain fait partie des centaines de signaux qui entrent dans un algorithme qui détermine quels résultats apparaissent sur une page de résultats de recherche Google et où ils sont classés. En quelques mois, après son déploiement, RankBrain est devenu le troisième signal important contribuant au résultat d'une requête de recherche.”
Comparativement à Google Hummingbird qui est l’actuel algorithme de classement de Google Search qui répond aux requêtes en essayant de déterminer l’intention de l’utilisateur derrière sa requête, Rankbrain va bien au-delà en interprétant et en réécrivant ou reformulant la requête à l’aide de l’intelligence artificielle via le machine learning (apprentissage automatique).

À la suite de cela, on peut s’attendre à ce que la capacité de Google à comprendre l’intention de l’utilisateur continuera à considérablement s’améliorer et nous pouvons nous attendre à voir plus de requêtes directement répondues par des fonctionnalités telles que la Box Answer des réponses directes et peut-être à l’intérieur de la zone de saisie de la requête elle-même (test en cours). Mobile-First oblige...

RankBrain est donc un effort pour produire la meilleure requête précise pour chaque entité de recherche Google. Il semble être un effort pour améliorer la recherche de l'entité en proposant des résultats probables à partir de ses propres connaissances.

Pour la petite histoire, il faut retenir que RankBrain fait partie de l'algorithme global Hummingbird ou Colibri parce que l'article de Bloomberg indique clairement que RankBrain ne gère pas toutes les recherches, comme le ferait l'algorithme global. Pour l'instant...

Et précisons qu'Hummingbird contient également d'autres filtres ou algorithmes dont les noms sont familiers pour ceux qui exercent dans le domaine du référencement, tels que Panda qui pénalise le contenu de faible qualité, Penguin qui lutte contre les liens factices, Payday conçu pour lutter contre les requêtes spammy, ou encore Pigeon visant à améliorer les résultats locaux, Mobile-Friendly, et Pirate destiné à lutter contre la contrefaçon en ligne.

Pas d’apprentissage en continu


Alors que RankBrain utilise l’intelligence artificielle via le machine-learning, on pouvait donc s’attendre à ce que son apprentissage automatique soit continu.

Gary Illyes de chez Google a été interrogé quant à savoir si RankBrain apprenait de lui-même sans interruption. Selon sa réponse via le Tweet ci-dessous, ce n’est pas encore le cas.


Ce que va confirmer Jack Clark, l’interviewer de Bloomberg qui a recueilli les propos de Greg Corrado, dans le Tweet ci-dessus en disant que “RankBrain nécessite d’être périodiquement mis à jour, sans pour autant être capable d’évoluer tout seul à la volée avec chaque requête de recherche”.

Mais, à l'avenir, il devrait apprendre en continu, à la volée et en temps réel. Ce qui risque d'être déstabilisant pour le SEO, surtout lorsque Panda et Penguin tourneront eux aussi pleinement en temps réel et en continu.

Par conséquent, pour l'instant, RankBrain sera mis à jour ou actualisé en fonction des besoins.

Google va en effet continuer à expérimenter et tester de nouveaux modèles, et va faire des mises à jour dès que le modèle suivant va s’avérer meilleur que l’existant. Cela pourrait être sur l'actualisation des données stockées ou le développement de nouvelles architectures neuronales du net.

Pour conclure, et selon Gary Illyes, les ingénieurs de Google ont été très surpris par les performances de RankBrain. Ce qui veut dire qu’il marche très bien. Nous y reviendrons...