Comment fonctionne le moteur Google pour afficher les résultats - 1/3

Dans un effort de démystification de la façon dont il exécute son moteur de recherche, Google a invité CNBC à participer à une réunion interne au cours de laquelle les responsables de la recherche ont discuté pour savoir si, oui ou non, ils devaient approuver un changement particulier : s'il faut mettre des images à côté de certains types de résultats de recherche.

Comment fonctionne Google Search pour afficher les résultats ? 1/3

Le changement proposé était minime et hyper-spécifique, et la décision de Google était dirigée par les données. En fin de compte, la réunion a révélé à la fois la grande complexité et la simplicité incrémentielle de la façon dont Google forme son produit de recherche.

Voici, en 3 parties (avec des titres différents), le récit de cette réunion interne au coeur de l'équipe Search de Google que relate le site CNBC.

Les gens qui exécutent une recherche via Google Search s’attendent à ce que celui-ci leur retourne des résultats pertinents.

Mais, ils croient parfois qu'il “comprend” (comme un humain) leur requête, comme quand ils tapent, par exemple, "Film Volleyball Island " et que Google fournit des résultats au sujet d’autres choses.

Certes il s’agit de cas rares, mais nous avons parfois vu des captures d’écran de résultats de recherche surprenants ou inappropriés sur les réseaux sociaux. C’est à dire que cela arrive.

Ainsi, le moteur de recherche n'aurait aucune idée de ce que ces mots signifient : il est simplement à la recherche de pages où ces mots, leurs synonymes, ou même des fautes d'orthographe communes apparaissent, pour afficher les plus pertinentes d’entre elles.

Les programmes Google, connus sous le nom de robots Web (crawlers), parcourent l'Internet pour recueillir des informations à partir de centaines de milliards de pages.

Google stocke ensuite ces données dans un index massif, en constante évolution, en prenant note des signaux comme la fraîcheur et là où la page a été créée.

Lorsque vous entrez quelque chose dans la barre de recherche, elle est alimentée par un ensemble de règles et de processus appelé par hasard “Algorithme” de recherche de Google. Ce processus compare votre requête à l'information dans l'index et décide quelles pages placer en haut, le tout en une fraction de seconde.

L’un des facteurs de classement qui a permis à Google de s'imposer dans la recherche internet quand il a été lancé il y a 20 ans est “PageRank”, nommé ainsi pour faire référence à son co-fondateur Larry Page.

PageRank juge la pertinence d'une page Web par le nombre d'autres liens qui pointent vers lui. L'idée est que si beaucoup de gens sur le Web trouvent une page assez utile pour lui envoyer un lien, c'est qu’elle est probablement plus pertinente qu'une page que tout le monde ignore.

PageRank est toujours un facteur que l'algorithme de Google utilise aujourd'hui, mais il y a plus de 200 autres critères de référencement Google.

Google ne révèle pas intentionnellement tous les facteurs utilisés dans son système de classement, en partie parce qu'il ne veut pas que les gens essaient d'utiliser cette information pour compromettre ou contourner le système.

Car, il y a beaucoup de trafic et d'argent en jeu pour qui apparaît tout en haut des résultats de recherche.

Ce secret aide également Google à rester en avance sur les concurrents potentiels.

Suite de cet article : Comment Google décide de modifier son algorithme de recherche 2/3.