130 Mille milliards de pages ont été indexées par Google

Le nombre des pages indexées par Google a fait un véritable bond en  un peu plus de 3 années. Comme si Googlebot, le robot d’exploration et d’indexation de Google, était tout d’un coup devenu plus "vorace" qu’auparavant.

130 Mille milliards de pages dans l'index de Google

En effet, Google vient de mettre à jour sa page “How Search Works” ou "Comment fonctionne la recherche" pour changer le nombre de pages actuellement indexées.

Un nombre qui passe de 30 mille milliards en Mars 2013 à 130 mille milliards en Novembre 2016.

Soit 100 mille milliards de pages indexées de plus en moins de 4 ans !

Comme vous le voyez sur la page How Search Works, Google précise bien 130 mille milliards de documents individuels. C’est à croire qu’en moins de 4 ans, Google a pu accéder et indexer des documents auxquels il n’avait pas accès.

C’est sans doute le fruit de sa communication lancée en Janvier 2014 et qui stipulait qu’il était interdit d’interdire l’accès à tous les documents à Googlebot.

En Janvier 2015, soit une année plus tard, Google en remettait une couche pour menacer les propriétaires de sites qui bloquaient l’exploration de certaines partie de leurs sites.

De ce point de vue, la peur du “gendarme Google” a pu produire ses effets, ouvrant très grand l’accès à la très grande majorité des documents sur le Web. Surtout lorsqu’il a commencé en Juillet 2015 à envoyer des notifications aux Webmasters pour leur signaler qu’ils bloquent l’accès à certaines parties de leurs sites via leurs fichiers robots.txt.

Mais, comme l’indique Google sur la page How Search Works, les 130 mille milliards de documents individuels incluent aussi les textes issus de millions de livres provenant de bibliothèques et autres partenaires.



En effet, en Octobre 2015, une décision de justice américaine reconnaissait le droit à Google de scanner tous les livres qu’il veut. Ceci pourrait aussi expliquer ce grand bond dans le nombre de documents indexés par Google.

A cela, il faut ajouter l’explosion de la vidéo, des photos partagées, du podcast, des Tweets auxquels il a accès, les informations de géolocalisation via Street View, sans oublier les documents textes et autres PDF ou encore les feuilles de calcul, etc… Nous produisons tous beaucoup plus de contenus depuis ces dernières années.

Toutefois, il s’agit ici de l’index desktop, en principe. Il n’est pas vraiment sûr qu’on ait ce même nombre avec l’index mobile-first que vient de lancer Google.

Bref, tout ceci pour dire que pour classer sa page Web dans le Top 10 des résultats de recherche de Google, ce sera de moins en moins facile. Plus il y aura de documents individuels, plus les places vont coûter plus chères.

Et ceci pourrait aussi expliquer pourquoi on peut avoir du mal à bien classer sa page Web : le trop grand nombre de choix pour Google pour une seule requête d’internaute.