Le brevet de Google pour détecter le spam sur WordPress et les réseaux sociaux

La lutte contre le spam pourrait à nouveau s’amplifier du côté de chez Google même si on ne connaît pas encore le remplaçant de Matt Cutts à la tête de l’équipe en charge du spamming.

Google crée un détecteur de spam

Google vient effet de déposer un brevet qui devrait lui permettre de cibler le spam à travers les réseaux sociaux et d'autres systèmes de gestion de contenus (CMS).

Un brevet qui, selon Bill Slawski qui le révèle, commence par définir ce qui pourrait être considéré comme étant un spam. Et ce, afin de mieux justifier la solution qu’il propose :

"Le spam est un problème endémique à travers l'Internet. Le spam (par exemple, les messages d’emails indésirables ou non sollicités) est généralement constitué de messages identiques envoyés à plusieurs destinataires qui ne les ont pas demandés.

Alors que le spam est généralement considéré dans le contexte de l'e-mail, il se répand aussi sur les réseaux sociaux. Un spammeur pouvant tenter de cibler des utilisateurs au hasard pour l’aider à monétiser son activité.

Le spammeur produit un grand nombre de messages identiques ou quasi identiques. Cela peut être fait par courriel, sur des pages de service en ligne ou via des commentaires sur un blog ou un réseau social. Un aspect pertinent qui caractérise le spammeur est la couverture ou le prétexte.

Plus le nombre d'utilisateurs uniques qui découvrent un spam-post est élevé, plus grand sera le pourcentage de conversions, et donc de monétisation…

Certains réseaux sociaux permettent un affichage public des posts. Un utilisateur peut commenter ces posts publics. Mais, les spammeurs peuvent également commenter ces mêmes posts publics”.

Et Google de d'être plus précis dans la présentation de son brevet anti-spam :

“Ce brevet vise spécifiquement le spam dans les réseaux sociaux et leurs fonctionnalités uniques. Il nous dit qu'elle est l'approche d'une fonctionnalité d'un réseau social pour trouver et identifier les contenus populaires partagés au sein de ce réseau social. Ce qui permet aux posts populaires d’être visibles par les autres membres du réseau social et leur permet d'afficher ces messages tendances.

Les supposés Spammeurs profitent donc du nombre élevé de vues que vont générer les commentaires de ces posts”.


Schema du fonctionnement du détecteur de spam de Google - Image via Seobythesea.com

Comment détecter le spam social


Le brevet de Google propose donc une approche de la détection du spam sur un réseau social. Il y arriverait en incluant un détecteur de spam qui comprend des modules tels qu'un générateur d'empreintes digitales, un module de comparaison et un module de réponse, afin qu'une fois que le spam est trouvé et identifié, il peut répondre convenablement.

Le module d'empreintes digitales saisit les caractéristiques du spam vu ailleurs. Le module de comparaison peut être utilisé pour identifier cette empreinte dans les commentaires laissés dans un réseau social. Et Google de préciser :

“L'empreinte digitale est comparée aux autres empreintes digitales précédemment générées et stockées. Si l’empreinte digitale correspond à toute autre empreinte précédemment stockée, le post est considéré comme étant un spam et traité en conséquence. Si l'empreinte ne correspond à aucune empreinte stockée précédemment, le post est affiché dans le réseau social.”

Le brevet anti-spam de Google nous dit aussi quels sont les avantages qu’il apporte :

  • Le détecteur de spam empêche les commentaires qui sont des spams d’être publiés dans un réseau social (comme le ferait le plugin “Askimet”).

  • Le détecteur de spam peut être utilisé avec d’autres signaux pour améliorer la précision de l’identification du spam.

  • Le détecteur de spam peut être utilisé sur n'importe quel contenu généré par l'utilisateur, y compris avec ou à l’aide de logiciels de création CMS afin de réduire ou éliminer le spam.


En effet, le brevet nous dit que son utilisation n'est pas limitée qu’aux réseaux sociaux uniquement, mais qu’ill peut être utilisé plus largement pour d'autres types de contenus générés par l'utilisateur. Google précisant :

“Alors que la présente communication sera maintenant décrite dans le cadre d'un réseau social, il devrait être entendu que les principes de la présente communication pourraient être appliqués à n'importe quel service qui recueille et publie des contenus générés par les utilisateurs.

Par exemple, des systèmes tiers (plugins,
NDLR) qui acceptent des archivages, messages, commentaires, conseils, critiques, commentaires dans des blogs WordPress, etc. peuvent utiliser le détecteur de spam décrit ci-dessous.”

Le détecteur de spam agit donc :

  • Pour empêcher la publication ou la transmission des posts dans les réseaux sociaux.

  • Pour supprimer les utilisateurs abusifs des réseaux sociaux.

  • Pour empêcher la publication de contenus dupliqués.


Les utilisateurs reconnus comme ayant des comportements abusifs (publier plusieurs fois le même commentaire en peu de temps, par exemple) dans les réseaux sociaux pourront être complètement et automatiquement bannis par le détecteur de spam.

Bon, pour l’instant, il s’agit d’un brevet, mais un brevet tel quel signifie que le détecteur de spam existe déjà. C’est pourquoi Google le protège à travers ce brevet.

Au moins une chose est sûre, c’est qu’il sera d’abord appliqué sur Blogger, Youtube et Google+. Et sans doute dans les blogs WordPress que Google a nommément cité dans son brevet.