Appuyez sur ÉCHAP pour fermer

Intelligence Artificielle
3 min de lecture

35 % des nouveaux sites utilisent l’IA pour leur contenu

Partager :

35 % des nouveaux sites utilisent l’IA pour leur contenu Une étude d Internet Archive révèle que 35 % des sites créés en mai 2025 présentent un contenu généré ou fortement assisté par l IA.

Selon Internet Archive, le contenu généré par IA représentait 35 % des sites nouvellement publiés en mai 2025, soit une part croissante de l’écosystème web. Cette progression pose la question de la diversité sémantique et de l objectivité des informations disponibles en ligne.

Ce que montre l’étude et comment elle a été conduite

Pour estimer l impact, les chercheurs ont extrait le texte des sites nouvellement créés et archivés par la Wayback Machine. Ils ont ensuite testé plusieurs outils de détection du contenu généré par IA et retenu Pangram v3 pour sa capacité à traiter plusieurs langues et le HTML. L outil revendique une précision élevée mais n a pas encore fait l objet d une évaluation indépendante.

Selon les auteurs, à la mi 2025 environ 35 % des sites web nouvellement publiés étaient classés comme générés par IA ou créés avec l aide de l IA, contre zéro avant le lancement de ChatGPT fin 2022.

Le résultat le plus surprenant a été que notre hypothèse de la dégradation de la vérité n a pas été confirmée, mais l IA pourrait augmenter discrètement le volume des affirmations invérifiables.

Ce que cela change pour le web et la vérification des faits

Les chercheurs notent une contraction sémantique et un glissement vers des contenus plus positifs, sans nécessairement accroître les fausses informations. Ils soulignent que l augmentation des contenus genAI ne se traduit pas automatiquement par une hausse des erreurs factuelles selon leurs tests sur les données d Internet Archive.

  • Contrainte sémantique : une réduction de la variété des sujets et expressions utilisées.
  • Ton plus positif : une tendance vers des formulations optimistes dans les textes.

Limites et ce qu on ignore encore

Le cadre repose sur un outil de détection unique et sur des données archivées. Sa précision élevée n est pas vérifiée par des chercheurs indépendants, et l échantillon des sites analysés peut influencer les résultats. Des questions restent ouvertes sur l effet à long terme sur la fiabilité de l information et sur l apparition d affirmations invérifiables qui échappent aux systèmes de vérification actuels.

Pour terminer

En résumé, l IA modifie le paysage du Web sans produire une révolution immédiate de la vérité. La vigilance reste de mise et les futures analyses devront clarifier l impact réel sur la diversité et la véracité des contenus.

Score SEO
75/100