Bing Search divulgue 5 infos sur son algo de référencement

Bing de Microsoft a publié une description de sa capacité de recherche avancée. Son article tourne autour d'un exercice de recherche d'un code dans Bing Search qui devrait permettre aux programmeurs de trouver des extraits de code.

Bing Search divulgue 5 infos de son algo de ranking

Ce qui rend son article intéressant est qu'il décrit diverses capacités surprenantes concernant la technologie de Bing et fournit des indices quant à ce que Bing est capable de faire.

Compte tenu de la façon dont Bing demeure encore mystérieux pour la communauté SEO, c’est une opportunité de savoir maintenant comment Bing fonctionne pour classer les sites Web.


1. Bing utilise le traitement du langage naturel


Bing utilise le traitement du langage naturel afin d'aider à comprendre l'intention des utilisateurs.

Le traitement du langage naturel est une branche de l'intelligence artificielle qui cherche à comprendre les modèles de langage humain naturel.


C’est quoi le traitement du langage naturel ?


Dans son document PDF de 273 pages sur le traitement du langage naturel , Microsoft déclare qu'il s'agit de la connaissance du langage (la phonétique, la sémantique, la morphologie, etc.), mais aussi de la classification des textes et de la compréhension de la lecture des machines et de la réponse aux questions, et plus encore.

C'est ainsi que le post de Bing décrit utiliser le traitement du langage naturel pour interpréter la saisie humaine du code (requête, ndlr).

L'objectif est d'identifier l'intention de l'utilisateur, de la transformer en quelque chose que le moteur de recherche peut comprendre :

Pour atteindre ce niveau de précision pour la détection de l'intention des requêtes, les pipelines de traitement du langage naturel de Bing pour les développeurs tirent parti des modèles trouvés dans les données de formation provenant de requêtes de développeurs collectées au fil des ans, contenant des termes et du texte couramment utilisés et la structure typique pour les requêtes de codage.

Comme vous pouvez le voir, dans cette utilisation particulière, le traitement du langage naturel consiste simplement à interpréter les requêtes de recherche humaine en les comparant aux modèles trouvés dans les requêtes de recherche précédentes.

Le traitement du langage naturel est plus que cela et il est très probable que Bing (ainsi que Google) incorpore la gamme complète du traitement du langage naturel (la sémantique, la morphologie, etc).


2. Bing utilise des signaux de clics pour améliorer la précision


D’après Bing :

Le système exploite également une multitude de signaux des clics pour améliorer davantage la précision.


Il s'agit vraisemblablement d'une référence à l'utilisation de modèles de clics pour déterminer ce qu'un utilisateur veut dire lorsqu'il tape une requête de recherche particulière.

Si un modèle est cohérent, un moteur de recherche peut savoir avec confiance qu'un modèle particulier signifie telle chose spécifique.

Si le motif de clic est moins cohérent, il s'agit d'un signal indiquant que la requête de recherche est ambiguë. C'est à ce moment que vous voyez des pages de résultats des moteurs de recherche (SERPs) avec différents types de sites.


3. Bing utilise les upvotes pour classer les réponses des Forums


Il s'agit d'une admission fascinante sur la façon dont le processus de classement fonctionne pour Bing..

Le post de Bing révèle que lors du classement des réponses pour les questions liées au codage (exemple utilisé ici), il va récupérer des pages de codage des forums. Afin de classer ces pages, Bing déclare qu'il considère les upvotes (votes positifs) et les downvotes (votes négatifs) comme des signaux pour la précision de la réponse.

Voici ce que Bing a révélé à propos de son algorithme :

“... Le système extrait ensuite les meilleurs échantillons de code correspondant à des sites populaires, autoritaires et bien modérés comme StackOverflow, GitHub, w3schools, MSDN, Tutorialpoints, etc., en tenant compte des aspects tels que la fidélité de l'API et le langage de programmation correspondent, les nombres de votes pour (upvotes) et votes contre (downvotes), l'exhaustivité de la solution, et plus encore.

4. Bing et la modération comme un signal de confiance ?


Le post de Bing met aussi en évidence la modération efficace comme un signal positif utilisé pour le classement :

... à partir de... des sites bien modérés...


C'est un indice intéressant sur la façon dont l'algorithme de Bing classe le contenu généré par l'utilisateur. Dans la citation ci-dessus, Bing admet qu'il tient compte de la façon dont un site est “bien modéré”.

Reste maintenant à savoir comment Bing détermine-t-il le niveau de modération dans une communauté de Forum ?

Les niveaux de spam pourraient être une mesure. De même, l’absence ou non d'obscénités ou de certaines phrases d'un troll pourraient être des signaux d'un forum bien modéré.


5. Popularité et autorité des réponses


Bing cite la popularité et l'autorité en tant que signaux de confiance :

... des sites populaires, autoritaires......

Le contexte de l'énoncé ci-dessus est d'extraire des réponses des forums dans une recherche d'extraits de code.

Il peut ne pas être exact d'extraire un sens de ce contexte et de l'appliquer à un autre contexte, comme des requêtes de recherche régulières.

Néanmoins, il est utile en tant qu'information, car il nous donne une idée de ce que Bing est capable de rechercher afin de classer un site pour une requête de recherche.

Dans ce cas, et dans ce contexte, Bing cherche à classer les sites qui ont des signaux de popularité et d'autorité.

C'est là qu'on se heurte à la boîte noire (black box) de Bing. Une boîte noire est un euphémisme utilisé dans l'industrie du SEO pour décrire une partie d'un algorithme qui est caché, non découvert et inconnu.

Si l'on était à spéculer, nous pourrions dire que les mesures populaires telles que les signaux de médias sociaux, les liens, et le nombre d'utilisateurs pourraient envoyer des signaux de popularité et d'autorité.

Mais on ne sait pas vraiment.


Il est important de comprendre Bing


Les référenceurs SEO se sont toujours sentis plus à l'aise avec Google que Bing. Ce sentiment de confort découle de la compréhension que les liens aident un site à bien se classer sur Google.

Il est discutable que ce confort est un faux sentiment de familiarité. Google Search a beaucoup changé au cours des dix dernières années.

Bing Search a cependant toujours été un mystère.

D’après l’avis de Searchenginejournal, basé sur les sujets généralement couverts par les documents de recherche de Microsoft, Bing semble être moins dépendant des liens et plus axé sur la compréhension de l'intention des utilisateurs et le contenu lui-même.

Bing Search est également résistant au spamming des liens dans ses pages de résultats, puisque le référencement Bing peut dépendre moins des liens que Google.

C'est cette influence réduite des backlinks qui différencie le référencement Bing de celui de Google.

C’est sans doute ce qui expliquerait que, par le passé, certains sites bien classés dans les pages de résultats de Google ne font pas toujours aussi bien sur Bing Search.

Évidemment, Google rattrape aujourd’hui la capacité de Bing à comprendre le langage naturel et la sémantique du contenu.

Mais, Google et Bing recherchent leur propre chemin vers un même but : une meilleure expérience utilisateur et des résultats pertinents sur leurs pages de résultats.