25 Milliards de pages spammy détectées chaque jour par Google

Google a publié son rapport webspam annuel qui chiffre les résultats des efforts de lutte contre le spam de Google en 2019.

25 Milliards de pages spammy détectées chaque jour par Google

Les efforts de Google pour éloigner le spam des résultats de recherche sont détaillés dans le rapport webspam annuel de l’entreprise.

Selon le rapport 2019, (rapport 2018, ici) plus de 99% des résultats de recherche de Google sont sans aucun spam, et la société compte continuer à déployer de grands moyens et efforts pour le garder ainsi.

Google nous apprend dans ce rapport, par exemple, que l’équipe webspam de Google découvre chaque jour 25 milliards de pages spammy qui sont filtrées à partir de l’indice des résultats de recherche de Google.


Avez-vous déjà regardé votre dossier de spam e-mail? C’est ainsi que les résultats de recherche pourraient ressembler sans les mesures que nous prenons pour lutter contre le spam de recherche.

Notre message d’aujourd’hui se penche sur la façon dont nous travaillons pour garder le spam hors des résultats de recherche de Google https://www.blog.google/products/search/how-we-keep-spam-out-of-search/

Voici d’autres chiffres saillants du rapport webspam de Google, qui montrent les efforts de l’entreprise pour rester en avance sur les spammeurs en 2019 et les années à venir.


Comment Google a combattu le Webspam en 2019


Google a reçu près de 230.000 signalements de spam de recherche en 2019, et a été en mesure de prendre des mesures contre 82% des signalements qu’il a traités.

L’entreprise attribue cela en partie à l’amélioration des capacités de lutte contre le spam de ses systèmes d’apprentissage automatique, qui ont été une priorité absolue pour 2019.

Nos solutions de machine learning, combinées à notre capacité d’application manuelle éprouvée, ont joué un rôle déterminant dans l’identification et la prévention des résultats spammy aux utilisateurs.



Victoires de Google dans sa lutte contre le spam


Les efforts de la lutte contre le spam de Google ont réussi à tenir à distance les spams générés par les utilisateurs, qui ont été réduits de 80% en 2018 et n’ont pas augmenté en 2019.

Le spam de lien reste populaire, mais Google s’améliore pour le détecter. En outre, Google a confirmé que les liens payants et les échanges de liens sont encore moins efficaces maintenant.

Plus de 90% des spams de liens ont été pris par nos systèmes, et des techniques telles que des liens payants ou des échanges de liens ont été rendues moins efficaces.

Google note les progrès qu’il a réalisés pour lutter contre les sites de spammage avec du contenu auto-généré et copié. Ces sites s’engagent généralement dans des comportements qui agacent ou nuisent aux internautes-chercheurs.

Les exemples incluent des sites avec des éléments trompeurs tels que des faux boutons, des annonces interstitielles écrasantes, des redirections suspectes et des logiciels malveillants.

Google a pu réduire de plus de 60% l’impact sur les utilisateurs de Google Search de ce type de spam en 2019 par rapport à 2018.


Sensibilisation des Webmasters


Enfin, Google vante ses efforts de sensibilisation du webmaster en ce qui concerne la lutte contre le spam.

Lorsque Google détecte le spam, il alerte le propriétaire du site via Search Console. En 2019, Google a envoyé plus de 90 millions de messages aux propriétaires de sites Web.

Ces messages ont été envoyés pour faire connaître aux propriétaires du site tout problème ou problème susceptible d’affecter l’apparence de leur site dans les résultats de recherche.

Sur l’ensemble des 90 millions de messages, environ 4,3 millions étaient liés à des actions manuelles résultant de violations des Consignes au Webmaster de Google.


L’importance de la lutte contre le spam


Pour coïncider avec ce rapport, Danny Sullivan de Google a écrit un article de blog séparé pour discuter des raisons pour lesquelles garder le spam hors des résultats de recherche est si important. 

Sans nos systèmes et nos équipes de lutte contre le spam, la qualité de la recherche serait réduite, il serait beaucoup plus difficile de trouver des informations utiles en qui vous pouvez avoir confiance.

Avec des pages de faible qualité qui poursuivent leur chemin en spammant dans les meilleurs résultats, plus il y a des chances que les gens pourraient être trompés par de faux sites essayant de voler des informations personnelles ou infecter leurs ordinateurs avec des logiciels malveillants.

Ce que vous pouvez retenir de tout cela, c’est que servir des résultats de recherche de haute qualité, c'est aussi autant lutter contre le spam que développer d’algorithmes complexes.

Et ça, Google Search tient à le faire savoir et à le rappeler chaque année.

Sources : Google (1, 2