Appuyez sur ÉCHAP pour fermer

Intelligence Artificielle
3 min de lecture

Claude Code corrige le coup de mou d'Anthropic et Opus 4.7

Partager :

Claude Code corrige le coup de mou d'Anthropic et Opus 4. 7 Anthropic corrige les failles de Claude Code après un coup de mou impliquant Opus 4. 7 et le cache des prompts, avec des mesures et des garanties à venir. Le coup de mou attribué à Claude Code a été plus qu'une impression.

Le coup de mou attribué à Claude Code a été plus qu'une impression. Anthropic a identifié des défaillances et publié des correctifs, aboutissant à la version v2.1.116 le 20 avril pour stabiliser le système. L’entreprise précise que Claude Agent SDK et Claude Cowork ont aussi été touchés, sans impacter l’API ni la couche d’inférence.

Dégradation et diagnostic d'Anthropic

Entre fin mars et mi-avril, des utilisateurs ont signalé une dégradation du service: des réponses plus rapides mais moins approfondies et une impression de lenteur ou d’interface figée dans certains cas. Le premier souci remonte au 4 mars, un mois après le lancement d’Opus 4.6: le niveau de raisonnement par défaut est passé de « high » à « medium » afin d’accélérer les réponses et de réduire la consommation de tokens. Avant ce changement, le modèle prenait plus de temps pour réfléchir et utilisait plus de tokens, mais produisait des réponses plus solides.

Le constat initial a été que la modification, bien que rapide, entraînait parfois des latences importantes et une impression de flux interrompu. Le 7 avril, Anthropic a rétabli « high effort » et appliqué un nouveau palier « xhigh effort » avec Opus 4.7 pour tenter d’améliorer la profondeur des réponses.

Un bug de mise en cache et ses effets

Le 26 mars, l’activation du prompt caching visait à réduire les tokens et accélérer la reprise de session après une période d’inactivité. Cependant, l’implémentation a conduit à la suppression de chaque nouveau message après un seuil d’inactivité, plutôt que de supprimer le raisonnement ancien. Résultat: oublis de contexte, répétitions et choix d’outils incohérents. Le système repartait presque de zéro à chaque prompt, augmentant la consommation de tokens et donnant l’impression que les quotas fondaient rapidement.

Le diagnostic a nécessité plus d’une semaine et a été corrigé le 10 avril. Anecdote intéressante: Opus 4.7 a détecté le bug alors que Opus 4.6 n’avait rien repéré.

Limitations et ajustements d’Opus 4.7

Afin d’éviter des réponses trop longues, Anthropic a initialement restreint les sorties à 100 mots et les échanges entre appels d’outils à 25 mots. Cette mesure visait à limiter la consommation de tokens, mais elle limitait aussi la capacité du modèle à « penser en profondeur ». Introduite le 16 avril, la consigne a été retirée quatre jours plus tard, afin de rétablir un fonctionnement plus fluide.

Ce qui change et les garanties futures

Pour prévenir de nouveaux incidents, Anthropic s’engage à utiliser plus fréquemment la version publique de Claude Code et à réaliser des analyses détaillées des effets des changements. Des outils pour réaliser des audits et suivre les modifications ont été développés, et des tests seront effectués à chaque évolution du système de prompts. Les quotas d’usage ont été réinitialisés pour tous les abonnés et un compte X dédié, @ClaudeDevs, a été créé pour expliquer les décisions produit et les justifications. Des fils de discussion GitHub seront également exploités pour communiquer les éventuels correctifs techniques.

Pour terminer

Au final, ce retour d’expérience illustre l’importance de l’équilibre entre rapidité et perspicacité dans les modèles IA. Les corrections démontrent une approche itérative et transparente face aux limites techniques, avec une volonté manifeste de stabiliser Claude Code tout en clarifiant les choix de produit.

Score SEO
78/100