Suite à des plaintes concernant la baisse de la qualité des résultats de recherche, Google modifie ses algorithmes afin de mieux trier les spams et les contenus automatisés. L'entreprise affirme que les mises à jour de classement qui seront introduites en mai "empêcheront les contenus de mauvaise qualité d'apparaître dans les recherches". Il convient de souligner que Google affirme que son moteur sera mieux à même de trier les contenus automatisés actuels (c'est-à-dire générés par l'IA), qui sont plus difficiles à détecter.
Google dit intégrer dans la nouvelle mise à jour les enseignements tirés d'une optimisation algorithmique réalisée en 2022 afin de "réduire les contenus non utiles et non originaux". L'entreprise affirme que ces changements permettront de diriger davantage de trafic vers "des sites utiles et de qualité". Avec les mises à jour d'il y a deux ans, Google estime que la mise à jour réduira le spam et les résultats de recherche non originaux de 40 %.
"Cette mise à jour inclut l'affinement de certains de nos systèmes de classement centraux afin de nous aider à mieux comprendre si les pages web ne sont pas utiles, si elles offrent une mauvaise expérience utilisateur ou si elles donnent l'impression d'avoir été créées pour les moteurs de recherche et non pour les humains", a écrit Elizabeth Tucker, directrice de la gestion des produits Google. "Cela pourrait inclure des pages qui ont été créées principalement pour des recherches très spécifiques".
Google semble viser le spam SEO généré par l'IA avec ses indications sur l'abus de contenu à grande échelle. L'entreprise affirme qu'elle s'attaque de plus en plus au problème croissant des sites Web qui génèrent des déchets d'articles automatisés (ainsi qu'au spam à l'ancienne généré par l'homme).
"De nos jours, les méthodes de création de contenu sont plus sophistiquées et il n'est pas toujours évident de savoir si le contenu a été créé de manière purement automatisée", a déclaré Tucker. Google affirme que les changements "nous permettront de lutter contre davantage de types de contenus qui ont peu ou pas de valeur et qui sont créés à grande échelle, comme les pages qui prétendent avoir des réponses à des requêtes de recherche populaires, mais qui ne fournissent pas de contenu utile".
Les fermes de contenu générées par l'IA, qui créent des contenus de toutes pièces pour déjouer le système, constituent un problème croissant. Même si les sites qui ne spamment que ce type de contenu peuvent être plus faciles à identifier, il sera intéressant de voir si des scénarios dans lesquels des médias autrefois sérieux expérimentent le spam généré par l'IA sont concernés (CNET et Sports Illustrated en sont des exemples récents).
Une autre modification de l'algorithme portera sur la pratique selon laquelle des sites web par ailleurs sérieux hébergent des contenus de moindre qualité provenant de tiers afin de tirer profit de la bonne réputation du site. Google cite l'exemple d'un site éducatif qui héberge une évaluation d'un crédit sur salaire par un tiers. "Nous considérons désormais comme du spam les contenus de tiers créés principalement à des fins de classement et sans contrôle strict du propriétaire du site", écrit Tucker.
Enfin, les mises à jour de Google devraient également permettre de mieux repérer les domaines expirés qui ont été achetés par des tiers et transformés en moulins à clics. Le moteur de recherche commencera à traiter ces sites comme des spams.
Les améliorations ne seront pas immédiatement perceptibles, Google accordant aux propriétaires de sites web un délai de deux mois pour s'adapter. Les modifications du moteur de recherche entreront en vigueur le 5 mai.