Googlebot commence à explorer les sites avec le protocole HTTP/2

Initialement annoncé en Septembre 2020, Google vient de mettre à jour sa page de développeur pour faire savoir que Googlebot peut maintenant crawler avec le protocole HTTP/2.

Googlebot commence à explorer les sites avec le protocole HTTP/2

Google a mis à jour sa page de support Googlebot pour refléter que Google est maintenant en mesure d’essayer de télécharger des pages via le dernier protocole HTTP/2 à partir de Novembre 2020.

La page des développeurs Googlebot a été mise à jour le 12 novembre 2020 pour refléter ce changement.

Ainsi, le changement est maintenant officiellement entré en vigueur.


D’après Google :

En général, Googlebot crawle sur HTTP/1.1. Toutefois, à partir de Novembre 2020, Googlebot peut explorer les sites qui peuvent en bénéficier sur HTTP/2 s’il est pris en charge par le site.



Pourquoi HTTP/2 Network Protocol ?


HTTP/2 est actuellement le dernier protocole réseau. Il permet un transfert de données plus rapide et plus efficace entre un serveur et un navigateur (ou Googlebot).

Ce que fait HTTP/2 est de réduire le temps qu’il faut pour qu’une page Web soit livrée d’un navigateur à un serveur. HTTP/2 réduit également les frais généraux (overhead) en compressant les champs d’en-tête HTTP.

En vertu du protocole réseau précédent (HTTP/1), plusieurs flux devraient être téléchargés en parallèle car une seule demande à la fois était activée sous l’ancienne version HTTP/1.

Avec HTTP/2, Googlebot et les navigateurs peuvent profiter de la nouvelle qualité « multiplexée ». Cela signifie que plusieurs ressources peuvent être téléchargées dans un flux à partir d’une connexion au lieu d’avoir à demander plusieurs flux à partir de plusieurs connexions pour télécharger la même page Web.


Selon une page de FAQ officielle d’IETF sur Github

HTTP/1.x a un problème appelé « blocage de la tête de ligne », où effectivement une seule demande peut être en suspens sur une connexion à la fois.

... Le multiplexage résout ces problèmes en permettant à plusieurs messages de demande et de réponse d’être traités en même temps; il est même possible d’entremêler des parties d’un message avec un autre sur le fil.

Cela permet à un client d’utiliser une seule connexion par origine pour charger une page.


Les fonctionnalités de HTTP/2 signifient moins de congestion du serveur et économisent les ressources du serveur.

Minimiser la pression sur les ressources du serveur est bon pour les sites Web. Parfois, non seulement Googlebot, mais beaucoup d’autres bots peuvent explorer un site en même temps.

Le résultat est que le site commence à répondre d’une manière lente parce que tant de ressources serveur sont utilisés. Ce qui est mauvais pour les utilisateurs qui essaient de voir les pages Web et mauvais pour l’éditeur si Googlebot ne peut pas explorer un site Web parce que le serveur est étiré à la limite par des “robots voyous” comme les scrapers et les hackers.

D’après Google :

... à partir de novembre 2020, Googlebot peut explorer les sites qui peuvent en bénéficier sur HTTP/2 s’il est pris en charge par le site.

Cela peut sauvegarder des ressources informatiques (par exemple, CPU, RAM) pour le site et Googlebot, sinon cela n’affecte pas l’indexation ou le classement de votre site. 



Votre site est-il admissible à l’exploration HTTP/2 ?


De nombreux sites doivent être prêts pour l’exploration HTTP/2.

Il est facile de le découvrir, vous pouvez vérifier si votre serveur est qualifié avec cet outil de vérification HTTP/2.


Il est facile de le découvrir, vous pouvez vérifier si votre serveur est qualifié avec cet outil de vérification HTTP/2.



La capacité de Googlebot à crawler à l’aide du protocole HTTP/2 est une excellente nouvelle pour les éditeurs. Cela réduira la charge du serveur et facilitera l’exploration des sites par Googlebot.

Source : Searchenginejournal