Comment Google découvre-t-il un contenu qui n'a pas de backlinks ?

John Mueller, webmaster trends analyst chez Google, a récemment expliqué comment Googlebot trouve des contenus quand il n'y a pas de backlinks pointant vers eux.

Comment Google découvre un contenu n’ayant aucun backlink ?

Ce sujet a été soulevé dans un thread sur Reddit par un webmaster qui a posé la question suivante :

Comment Googlebot trouve-t-il un site si personne ne relie le site, et qu'il n'a pas été soumis via Google Search Console ?

Et de rappeler qu’en 2017, le même John Mueller avait publié le Tweet ci-dessous :



S'il n'y a pas de liens, nous ne trouverons pas l'URL, robotisée ou pas.

En réponse, Mueller dit qu'il est «difficile» de déterminer exactement comment ces sites sont trouvés par Google. Voici quelques possibilités qu’il élabore :

  • Les parties tierces qui suivent les enregistrements de domaine (avec des liens)

  • Les backlinks accidentels causés par des fautes de frappe dans l'URL

  • Les barres d'outils qui relient au contenu connexe

  • Le CMS peut avoir généré un fichier Sitemap du site ou un flux RSS/Atom

Si vous ne voulez absolument pas qu'un site ou un contenu soit trouvé, John Mueller dit d'utiliser le tag “noindex”.

Mais, ne supposez pas que les moteurs de recherche ne trouveront pas un site simplement parce qu'il n'a pas été promu ou lié.

John Mueller a également formulé des recommandations à l'intention des propriétaires de sites qui souhaitent faire le contraire en lançant un nouveau site ayant un impact maximal :

Si vous voulez lancer quelque chose de nouveau avec un “bang” (en supposant que c'est ce que vous essayez de faire avec un nouveau domaine inconnu), une idée pourrait être d'utiliser l'outil de suppression du site pour cacher le site dans la recherche, puis d'annuler cette demande lorsque vous le mettez en ligne.

Ce qui permet à Google d’indexer le contenu à l'avance, mais l'empêche d'être montré dans la recherche.

La méthode ci-dessus est plus rapide que de passer du noindex au contenu indexable pour la recherche, mais il n'y a aucune garantie qu'il ne sera pas trouvé par les moteurs de recherche autres que Google.

Votre seule option pour garantir qu'un site ne sera pas trouvé par les robots est d'utiliser une balise noindex.

Source