La recherche sur le Web est devenue de pire en pire au cours des dernières années et, plus récemment, les articles de spam générés par l'IA ont contribué à ce problème. Google tente maintenant de résoudre ce problème, avec une mise à jour déployée dans la recherche Google qui vise à réduire les problèmes de « mauvaise qualité ». résultats.
La capacité généralisée des outils d’IA générative a permis aux sites de publier des centaines, voire des milliers d’articles par jour, inondant les résultats de recherche sur le Web sur des sujets populaires. Il est désormais assez courant de tomber sur des articles rédigés (au moins partiellement) par l’IA dans les résultats de recherche, dont beaucoup contiennent des erreurs factuelles et une surveillance minimale de la part d’un écrivain humain. Google a déjà déclaré qu'il autorisait le contenu généré par l'IA dans les résultats de recherche, mais que tous les articles étaient soumis aux mêmes normes de qualité et que le contenu spam serait rejeté. Cependant, la recherche Google est toujours inondée de spam généré par l'IA.
Les algorithmes de recherche Google ont désormais été mis à jour pour réduire les résultats de mauvaise qualité et non originaux. La société a déclaré dans un article de blog : « Aujourd'hui, les méthodes de création de contenu à grande échelle sont plus sophistiquées, et il n'est pas toujours aussi clair si le contenu est créé uniquement par l'automatisation. Pour mieux lutter contre ces techniques, nous renforçons notre politique afin de nous concentrer sur ce comportement abusif : produire du contenu à grande échelle pour améliorer le classement dans les recherches – qu'il s'agisse d'automatisation, d'humains ou d'une combinaison. Cela nous permettra d'agir sur davantage de types de contenu avec peu ou pas de valeur créée à grande échelle, comme les pages qui prétendent avoir des réponses aux recherches populaires mais ne parviennent pas à fournir un contenu utile.
Reste à voir si ces changements auront un effet suffisant. Les sites Web de spam peuvent simplement réduire leur production pour empêcher la détection, ou ils peuvent essayer d'autres solutions de contournement. Cela ne concerne pas non plus directement le contenu généré par l'IA contenant des erreurs factuelles ou simplement des informations généralement inutiles – plus difficiles à détecter automatiquement, et Google ne semble pas prendre d'actions manuelles assez souvent. Les propres tests de l'entreprise indiquent une réduction de 40 % du contenu de mauvaise qualité.
Google tente également de prendre des mesures contre “l'abus de réputation de site”, où les sites publient du contenu tiers très différent de leur contenu habituel, afin que le tiers puisse bénéficier de la réputation et du classement existants de ce site dans la recherche sur le Web. Google a déclaré : « Par exemple, un tiers pourrait publier des avis sur les prêts sur salaire sur un site Web éducatif de confiance afin de bénéficier des avantages de classement du site. Un tel contenu bien classé dans la recherche peut dérouter ou induire en erreur les visiteurs qui peuvent avoir des attentes très différentes concernant le contenu d'un site Web donné. La société considère également désormais comme du spam les domaines expirés et réutilisés publiant du contenu de mauvaise qualité.
La détection améliorée du spam est déployée dans le cadre de la mise à jour principale de Google de mars 2024 pour la recherche. Le changement concernant l'abus de réputation de site entrera en vigueur le 5 mai 2024.
Source : Google
Leave a Reply
You must be logged in to post a comment.