Google Actualités peut ignorer le Timestamp de votre sitemap pour éviter les abus


Stacie Chan de l’équipe de Google News a répondu à un post sur le forum d’aide de Google Actualités pour indiquer qu’il arrive parfois que Google ignore le fichier Sitemap XML des éditeurs.

Google News

Elle répondait ainsi à l'éditeur d’un site appartenant à un grand média américain (Washington Post) qui se plaint de constater que Google News affiche souvent des dates de publication qui sont antérieures aux dates de publication originales.

Par exemple, sur un article qu'un éditeur déclare avoir publié le 11 Janvier 2016, Google Actualités peut indiquer comme date dans les résultats de recherche “Il y a 2 jours” alors que nous sommes le 11 Janvier 2016.

Alors Stacie Chan de chez Google explique ce qui suit :


“C’est vraiment étrange. J’ai vérifié le fichier logs de notre crawler, et il indique que la première fois que nous avons découvert cet article, c’était le 11 Janvier 2016 à 12:37:30.

Mais gardez à l'esprit que nous n'utilisons pas nécessairement le timestamp afin d’éviter les abus.

Nous avons vu des cas où les éditeurs changent l'horodatage dans le Sitemap Google News du site pour essayer de tromper le système.

Cet horodatage correspond d’abord au moment où nos robots découvrent l’article.”
En effet, il existe des cas où de grands éditeurs tels que USA Today et BBC, que cite Barry Schwartz ici, trompaient Google Actualités, en faisant croire qu’une actualité est récente, en mettant à jour les horodateurs (timestamps) de leurs articles. Même d’un jour, voire deux.

Ce qui leur permettait d’être à nouveau cités dans Google Actualités pendant deux à trois jours supplémentaires, quand l’actualité était vraiment chaude.

Si vous avez créé un sitemap pour Google Actualités, l'entrée correspondant à cet article doit comporter une balise <publication_date>. Chaque URL doit comporter la date de publication de l'article au format W3C

Pour rappel, Google demande de lui communiquer la date de la première parution de l'article sur votre site d’actualités. Si le sitemap ne comporte aucune date pour l'article, celui-ci ne sera pas inclus dans Google Actualités et un message d'erreur “Date introuvable” ou “Date trop éloignée” s'affichera dans Search Console.

Notez cependant que la date et l'heure qui s'affichent dans Google Actualités correspondent à la date d'exploration de l'article qui peut être différente de la date de publication.