C'est quoi le contenu dupliqué pour Google ?

Le contenu dupliqué ou contenu en double est aussi l’un des sujets récurrents du référencement Web abordés par les SEO.

Qu'est-ce que Google entend par contenu dupliqué ou en double ?

Et ce, en raison du fait qu’il existe différentes sortes de contenus en double dont certains peuvent être pénalisés par Google et d’autres pas.

Le dernier Hangout de John Mueller sur le “duplicate content” a apporté un certain nombre d’éclaircissements, ou plutôt confirmé ce qu'on savait plus ou moins, qui méritent qu’on s’y attardent tout de même un peu.

Par définition, et selon Google, par contenu dupliqué, il entend généralement des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires. À l'origine, la plupart de ces contenus ne sont pas malveillants.

Cependant, dans certains cas, le contenu est délibérément dupliqué entre les domaines afin de manipuler le classement du site par les moteurs de recherche ou d'augmenter le trafic. Ce type de pratique trompeuse peut avoir, selon Google, des effets négatifs sur la navigation de l'internaute qui voit quasiment le même contenu se répéter dans un ensemble de résultats de recherche.

En conséquence, le référencement du site peut être affecté, ou le site peut être retiré définitivement de l'index Google, auquel cas il ne s'affichera plus dans les résultats de recherche.

Alors, voici quelques précisions de John Mueller :

  • Le contenu dupliqué touche à peu près tous les sites web, quelle que soit leur taille.

  • Selon John Mueller, le contenu en double, c’est un même contenu sur un même site. C’est aussi un même contenu avec un même chemin d’accès dans des URLs avec et sans WWW.

  • N’est pas un contenu dupliqué un contenu traduit ou adapté à partir d’une autre langue (ce n’est pas une raison pour ne pas citer la source). Il en est de même avec différentes pages ayant un même titre et/ou une même description, ainsi que le contenu dans les applications.

  • John Mueller confirme ce qu’avait déjà dit Gary Illyes en Mars 2015, à savoir que le contenu dupliqué n’est pas en soi une cause de pénalité.

  • Les contenus dupliqués sont une perte de temps de stockage et de ressources serveurs.

  • Si une page est dupliquée, Google ne conserve qu’une seule copie.

  • Un contenu dupliqué pour 2 localisations dans deux pays différents n’est pas une cause de pénalité.

  • Le contenu dupliqué dans les résultats de recherche crée de la confusion chez les utilisateurs. C’est pourquoi Google ne choisit de n’afficher qu’une seule version, l'originale.

La pénalité de contenu dupliqué est donc un mythe.


Comment gérer les contenus dupliqués



Selon Google, les mesures suivantes vous permettent de résoudre les problèmes de contenu en double de manière proactive et de vous assurer que les visiteurs accèdent au contenu que vous souhaitez leur présenter.




  • Utilisez les redirections 301 : si vous avez restructuré votre site, utilisez des redirections 301 ("RedirectPermanent") dans votre fichier .htaccess pour rediriger efficacement les internautes, Googlebot et les autres robots d'exploration.

  • Soyez cohérent : soyez cohérent dans votre système de liens internes. Par exemple, n'établissez pas de lien vers http://www.example.com/page/, http://www.example.com/page ni http://www.example.com/page/index.htm.

  • Utilisez des domaines de premier niveau : pour aider Google à présenter la version la plus appropriée d'un document, utilisez dans la mesure du possible des domaines de premier niveau pour gérer du contenu spécifique à un pays donné.

    Google peut supposer que le site ”http://www.example.de”, par exemple, présente du contenu destiné à l'Allemagne, par rapport à “http://www.example.com/de” ou http://de.example.com.

  • Soyez prudent en diffusant votre contenu : si vous publiez votre contenu sur d'autres sites (Guest blogging), Google affichera systématiquement la version jugée la plus appropriée pour les internautes pour chaque recherche donnée, qui pourra correspondre ou non à celle que vous préférez.

    Cependant, il est utile de s'assurer que chaque site sur lequel votre contenu est diffusé (notamment en guest blogging) inclut un lien renvoyant vers votre article original.

  • Utilisez Search Console pour indiquer à Google comment indexer votre site : vous pouvez indiquer à Google votre domaine favori (par exemple, http://www.example.com ou http://example.com).

  • Limitez les répétitions : par exemple, au lieu d'inclure un avis de copyright au bas de chaque page, insérez un bref récapitulatif, puis établissez un lien vers une page plus détaillée. Par ailleurs, vous pouvez utiliser l'outil de gestion des paramètres pour définir la manière dont Google doit traiter les paramètres d'URL.

  • Évitez la publication de pages incomplètes : les internautes n'apprécient pas les pages "vides", évitez donc les espaces réservés dans la mesure du possible. Utilisez la balise Meta noindex pour bloquer leur indexation.

  • Apprenez à maîtriser votre système de gestion de contenu : vérifiez que vous maîtrisez l'affichage du contenu sur votre site Web. Les blogs, forums et systèmes associés affichent souvent le même contenu dans des formats divers.

  • Limitez les contenus similaires : si de nombreuses pages de votre site sont similaires, développez chacune d'entre elles ou regroupez-les pour n'en faire qu'une seule.

  • Il n'est pas recommandé de bloquer l'accès des robots d'exploration au contenu en double de votre site Web, que ce soit à l'aide d'un fichier robots.txt ou d'autres méthodes.

    Il est préférable de permettre aux moteurs de recherche d'explorer ces URL, mais marquez celles-ci comme des doubles à l'aide de l'élément link rel="canonical", de l'outil de gestion des paramètres d'URL ou des redirections 301.

  • Dans le cas où le contenu en double nous conduit à explorer excessivement votre site Web, vous pouvez également régler les paramètres de la vitesse d'exploration dans Search Console.

En conclusion, sachez que le contenu en double n'entraîne pas de conséquences négatives particulières pour votre site sauf si l'objectif semble être de tromper et de manipuler les résultats des moteurs de recherche.

Cependant, si Google estime qu'il s'agit de pratiques trompeuses, il retirera votre site de ses pages de résultats de recherche.

Si votre site a été retiré des résultats de recherche, après avoir apporté les modifications nécessaires et vous être assuré que votre site respectait ses consignes SEO, envoyez une demande de réexamen à Google.