Pirater la 1ère page de résultats de Google ? C'est possible...

Première page de résultats.
Nous avons souvent lu des articles de webmasters se plaignant de la duplication de leur contenu et dont la copie était mieux classée que l'original sur Google.

C'est ce qu'a voulu vérifier Dan Petrovic, expert SEO, en effectuant des tests de vols de contenu.

Dan Petrovic a donc rédigé un article pour expliquer comment il est parvenu à pirater Google en lui faisant afficher en première page de résultats des copies de contenus en lieu et place des originaux.

Dan Petrovic explique le fonctionnement de Google

Dan explique avant tout, selon lui, comment fonctionne Google pour afficher les résultats de recherche :

“Google’s algorithm prevents duplicate content displaying in search results and everything is fine until you find yourself on the wrong end of the duplication scale. From time to time a larger, more authoritative site will overtake smaller websites’ position in the rankings for their own content. Read on to find out how exactly this happens.”
“When there are two identical documents on the web, Google will pick the one with higher PageRank and use it in results. It will also forward any links from any perceived ’duplicate’ towards the selected ‘main’ document.”

En d'autre termes : En principe, l'algorithme de Google évite d'afficher des contenus dupliqués sur les pages de résultats et tout va ainsi bien jusqu'à ce que vous soyez vous-même victime d'un contenu dupliqué. De temps à autre, un site plus important, ayant donc plus d'Autorité que vous (pagerank), occupera le positionnement d'un petit site avec le propre contenu dudit petit site.

En fait, lorsqu'il y a deux documents identiques sur le Net, Google accorde plus de crédit au site ayant un PageRank élevé et l'affiche en priorité dans ses résultats. De plus, Google fera suivre tout le jus de tous les backlinks reçus par tous les contenus dupliqués vers le contenu qu'il aura retenu dans ses SERPs.

Les tests effectués par Dan Petrovic

Quatre sites vont être des victimes volontaires (ayant donné leur accord) du testeur. Je vous présente les 3 cas suivants de ce test :

Cas de MarketBizz

  • Le 26 octobre 2012, Dan Petrovic a d'abord créé un sous-domaine sur son propre site. Ensuite, il a copié le code source HTML et les images de la page "ReferentieEN.htm" de Marketbizz.nl pour créer une page dans son nouveau sous-domaine en lui donnant le même nom de page "ReferentieEN.htm". Les 2 pages étant totalement identiques, il a plussé (+1) sa nouvelle page créée et a fait pointé un lien depuis son blog.

  • Le 30 octobre 2012, soit 4 jours plus tard, il avait réussi a "piraté" la  page de résultats de Google. Non seulement son nouveau sous-domaine (URL) créé pour le test a remplacé la page copiée sur Google, mais en plus, en lançant la commande info:suivi de l'URL de la page copiée, le résultat affiché par Google est celui de la page de Dan Petrovic (rob.dejanseo.com.au/ReferentieEN.htm) et non l'originale de Marketbizz.nl. Pire, le PageRank de la page originale copiée qui était égal à 1 a été remplacé par le PageRank "0" de la nouvelle page créée par Dan. En faisant des recherches en utilisant des bouts de phrases qui existent de façon identique dans les 2 pages, c'est celle de Dan Petrovic qui s'affiche.

Le contenu dupliqué remplace le contenu original sur Google

Cas de Dumb SEO Questions

  • Le 30 octobre 2012, Petrovic copie le code source HTML d'une page de Dumbseoquestions.com afin de tester l'Authorship dans un contexte de contenu dupliqué. Mais, cette fois-ci, sans copié les images. Donc, juste le texte brut collé dans une page en sous-domaine aussi.
     
  • Le 1er novembre 2012, c'est à dire le jour suivant, la page originale de Dumbseoquestions.com a été remplacée par la nouvelle page créée par Petrovic, faisant du coup de la page originale une page dupliquée. Conclusion : l'Authorship ne peut rien faire contre le vol de contenu.

Le cas de Shop Safe

Toujours selon la même méthode, un sous-domaine est créé et un contenu de Shopsafe est copié afin de créer une nouvelle page dans le nouveau sous-domaine afin de tester cette fois-ci la balise rel="canonical". Laquelle balise a été supprimée dans la nouvelle page créée.

La nouvelle page n'a pas pu remplacer la page originale dans les SERPs en faisant la commande info: !

Les observations de Dan Petrovic

Lorsqu'une page dupliquée est créée et qu'elle provient d'un site d'Autorité, à PageRank élevé, elle va remplacer la page originale sur Google.

De plus, tous les liens et tous les signaux sociaux pointant vers tous les autres contenus dupliqués, y compris vers la page originale, seront attribués par Google au contenu dupliqué retenu par lui sur ses SERPs. Petrovic conclut en recommandant de se protéger d'un vol de contenu en utilisant :
  • L'attribut "rel="canonical" sur toutes vos pages web.
     
  • L'Authorship de Google.
     
  • Des URLs absolus pour vos liens internes.
     
  • CopyScape et Google Alertes pour surveillez vos contenus afin de vite réagir.
Vous l'aurez compris, pirater la première page de résultats est possible mais vraiment pas recommandé. En cas de SpamReport contre votre site, vous risquez d'être blacklisté.

Mise à jour du lundi 19 octobre 2012

L'auteur du test de piratage de la page de résultats, Dan Petrovic, a reçu un email d'alerte de Google pour lui signifier qu'il a du contenu dupliqué sur son site et l'inviter à y apporter les corrections qui s'imposent. Et ce, avant d'envoyer une requête de reconsidération à Google.

Je ne sais pas si c'est le buzz autour de cet article qui a amené Google a vite réagir ou si c'est son algorithme qui a détecté la supercherie. Qu'en pensez-vous ?

Email d'alerte envoyé par Google à Dan Petrovic - source : Dejanseo.com
Bien référencer son site internet sur Google
Bien référencer son site internet sur Google