Claude Sonnet 5 devient le modèle par défaut de Claude Code 2.1.197 avec une fenêtre de contexte native de 1M tokens, un tarif de lancement de 2 $/10 $ par MTok et des garde-fous cyber activés par défaut

lschvn1 juillet 2026

Résumé

•[Anthropic a annoncé Claude Sonnet 5](https://www.anthropic.com/news/claude-sonnet-5) le 2026-06-30, une montée en gamme substantielle par rapport à Sonnet 4.6 sur les performances agentiques (planification, utilisation d'outils, codage soutenu) et le premier modèle de la lignée Sonnet qui se rapproche d'Opus 4.8 sur la courbe coût-performance. L'article de lancement inclut des courbes coût-performance sur l'évaluation de recherche agentique BrowseComp et sur l'évaluation d'utilisation d'ordinateur OSWorld-Verified, Sonnet 5 étant facturé 3 $/15 $ par MTok (et un tarif de lancement à 2 $/10 $ jusqu'au 31 août 2026). Opus 4.8 est facturé 5 $/25 $ par MTok. Sonnet 5 utilise un tokenizer mis à jour qui mappe la même entrée sur 1,0 à 1,35x plus de tokens que le tokenizer de Sonnet 4.6.
•Claude Code [v2.1.197](https://github.com/anthropics/claude-code/releases/tag/v2.1.197) (publié le 2026-06-30T17:56:37Z) fait de Sonnet 5 le modèle par défaut. Les notes de release tiennent en une ligne : « Introducing Claude Sonnet 5: now the default model in Claude Code, with a native 1M-token context window and promotional pricing of $2/$10 per Mtok through August 31. Update to version 2.1.197 for access. » La fenêtre de contexte de 1M tokens est la plus grande fenêtre native qu'Anthropic ait livrée sur un modèle de la lignée Sonnet et arrive un jour après la v2.1.196, qui apportait les modèles par défaut d'organisation, des pièces jointes cliquables, et un correctif de confiance MCP pour les dépôts qui auto-approuvaient des serveurs `.mcp.json`.
•La release est livrée avec les garde-fous cyber activés par défaut, le même ensemble que pour Opus 4.7 et 4.8 (moins stricts que ceux de Fable 5). La system card Sonnet 5 rapporte un score de 0,0 % sur le développement d'un exploit fonctionnel pour Firefox 147 (en collaboration avec Mozilla) et un taux de succès partiel légèrement supérieur à Sonnet 4.6, bien en deçà d'Opus 4.8 et Mythos 5. Améliorations de sécurité : taux d'hallucination et de sycophantie inférieurs à Sonnet 4.6, taux de comportement désaligné inférieur à Sonnet 4.6 sur l'audit comportemental automatisé (mais supérieur à Opus 4.8 et Claude Mythos Preview), et une sécurité agentique renforcée (meilleur refus des requêtes malveillantes et meilleure résistance aux tentatives de détournement par injection de prompt). La system card complète et l'article connexe « Redeploying Fable 5 » (Fable 5 revient en service mondial le 1er juillet) sortent la même semaine.

Anthropic a annoncé Claude Sonnet 5 le 2026-06-30, et Claude Code v2.1.197 (publié le 2026-06-30T17:56:37Z, le même jour) en a fait le modèle par défaut. Le lancement est le premier modèle de la lignée Sonnet qui comble l'écart agentique avec Opus 4.8, embarque une fenêtre de contexte native de 1M tokens, et arrive à un tarif de lancement de 2 $ par million de tokens d'entrée et 10 $ par million de tokens de sortie jusqu'au 31 août 2026, puis 3 $/15 $ par MTok. Sonnet 5 est le nouveau modèle par défaut des plans Free et Pro de Claude et le modèle par défaut de Claude Code à la mise à jour. La release est livrée avec les garde-fous cyber activés par défaut, un tokenizer rafraîchi, et des hausses de limites de débit dimensionnées pour absorber la consommation accrue des nouveaux contrôles de niveau d'effort.

Le lancement de Sonnet 5 est le troisième événement majeur d'Anthropic en trois semaines. L'article du 12 juin sur les garde-fous anti-distillation de Fable 5 couvrait la première divulgation publique de distillation d'Anthropic nommant DeepSeek, Moonshot AI et MiniMax, et l'article du 13 juin sur la suspension Fable 5 / Mythos 5 par le contrôle des exportations US couvrait la suspension mondiale temporaire déclenchée par la directive du Département du Commerce US du 12 juin. Le service Fable 5 reprend au niveau mondial le 1er juillet, le lendemain du lancement de Sonnet 5. L'enchaînement reproduit le schéma qu'Anthropic utilise depuis le rapport Project Glasswing du 7 avril : les restrictions d'une lignée de modèles et l'expansion d'une lignée plus petite et moins chère atterrissent la même semaine.

Ce que Sonnet 5 change concrètement

L'article de positionnement présente Sonnet 5 comme le modèle qui ramène l'ère de l'IA agentique sur la lignée Sonnet. Claude Sonnet 3.5, 3.6 et 3.7 ont été les premiers modèles à montrer de vraies compétences en codage et en utilisation d'outils ; sur l'année écoulée, les gains les plus nets en capacités agentiques étaient sur les modèles de classe Opus. Sonnet 5 referme cet écart, avec des performances proches d'Opus 4.8 à un prix inférieur, sur les deux évaluations agentiques qu'Anthropic a mises en avant dans l'article de lancement : BrowseComp (recherche agentique) et OSWorld-Verified (utilisation d'ordinateur). L'article montre des courbes coût-performance à différents niveaux d'effort, Sonnet 5 couvrant une plage beaucoup plus large d'options coût-performance que Sonnet 4.6 et égalant Opus 4.8 sur certaines tâches aux niveaux d'effort plus élevés. Opus 4.8 est facturé 5 $/25 $ par MTok ; Sonnet 5 au tarif standard (3 $/15 $) est 40 % moins cher à l'entrée et 40 % moins cher à la sortie, avec un prix effectif 60 % inférieur au tarif de lancement.

Le nouveau tokenizer change la façon dont Sonnet 5 traite le texte. La même entrée se mappe sur 1,0 à 1,35x plus de tokens que le tokenizer de Sonnet 4.6, selon le type de contenu. Le changement est comparable à celui qu'Anthropic a introduit avec Claude Opus 4.7. Le tarif de lancement est calibré pour que la transition vers Sonnet 5 soit à peu près neutre en coût pour les utilisateurs venant de Sonnet 4.6 à charge de travail identique.

Claude Code 2.1.197 livre le modèle et une fenêtre de contexte d'1M tokens

Les notes de release Claude Code 2.1.197 tiennent en une ligne : « Introducing Claude Sonnet 5: now the default model in Claude Code, with a native 1M-token context window and promotional pricing of $2/$10 per Mtok through August 31. Update to version 2.1.197 for access. » La fenêtre de contexte d'1M tokens est la plus grande qu'Anthropic ait livrée sur un modèle de la lignée Sonnet, et elle arrive le jour où Anthropic relève les limites de débit sur Chat, Cowork, Claude Code et la plateforme Claude pour absorber la consommation accrue des nouveaux contrôles de niveau d'effort. Les nouveaux niveaux d'effort permettent aux utilisateurs de Claude Code de choisir un point coût-performance par session, à l'image des courbes de l'article de lancement.

La 2.1.197 suit la v2.1.196 publiée la veille (2026-06-29T23:27:32Z), qui ajoutait les modèles par défaut d'organisation, des pièces jointes cliquables au Cmd/Ctrl-clic qui s'ouvrent dans Finder/Explorer, et un correctif de sécurité pour les serveurs .mcp.json. Le correctif MCP mérite d'être signalé pour lui-même : claude mcp list et claude mcp get ne lancent plus les serveurs qu'un dépôt a auto-approuvés via un .claude/settings.json commité. Les workspaces non fiables affichent désormais ⏸ Pending approval et exigent un geste explicite de l'utilisateur pour démarrer le serveur, ce qui ferme un angle mort de confiance sur lequel le comportement précédent s'appuyait en silence. La même release corrigeait aussi la reprise après crash en milieu de tour pour les sessions Remote (les sessions interrompues reprennent automatiquement au worker suivant), le sur-comptage de la télémétrie de limites de débit sous requêtes parallèles, et /context qui affichait 0 tokens pour tous les groupes d'outils sur Bedrock.

Sécurité, garde-fous cyber et system card

Les évaluations de pré-déploiement d'Anthropic concluent que Sonnet 5 est une amélioration globale par rapport à Sonnet 4.6. Les trois gains concrets : taux d'hallucination et de sycophantie plus bas, taux de comportement désaligné plus bas sur l'audit comportemental automatisé, et sécurité agentique renforcée, le modèle refusant mieux les requêtes malveillantes et résistant mieux aux tentatives de détournement par injection de prompt. La seule régression : sur le même audit, Sonnet 5 obtient un score un peu plus élevé qu'Opus 4.8 et Claude Mythos Preview sur le comportement désaligné. L'article de lancement et la system card énoncent tous deux ce compromis explicitement.

Sur le cyber, Sonnet 5 n'a jamais été entraîné délibérément sur la cybersécurité. Il peut effectuer certaines tâches cyber de routine et inoffensives, mais sur l'évaluation de développement d'exploit Firefox 147 développée en collaboration avec Mozilla, aucun des deux modèles Sonnet n'a pu développer un exploit fonctionnel (les deux à 0,0 %) ; Sonnet 5 a un taux de succès partiel légèrement supérieur à Sonnet 4.6, qu'Anthropic attribue à des améliorations d'intelligence générale plutôt qu'à un entraînement spécifique. Les deux modèles Sonnet ont des capacités cyber substantiellement plus faibles qu'Opus 4.8 et Mythos 5. Comme Sonnet 5 est un peu plus fort que Sonnet 4.6 sur ces tâches, il est livré avec les garde-fous cyber activés par défaut, le même ensemble que pour Opus 4.7 et 4.8. Les garde-fous de Fable 5, qui bloquent un éventail plus large de tâches de cybersécurité, sont plus stricts.

La system card Sonnet 5 complète est publiée avec l'article de lancement et rapporte un ensemble plus large d'évaluations en détail. Le Cyber Verification Program est disponible sur la plateforme Claude native, la plateforme Claude sur AWS, et Claude dans Microsoft Foundry, et arrive bientôt sur Claude dans Google Vertex.

Pourquoi c'est important pour les développeurs TypeScript et web

L'audience Claude Code est celle qui reçoit l'effet immédiat. Toute nouvelle session Claude Code en v2.1.197+ tourne sur Sonnet 5 par défaut, avec une fenêtre de contexte d'1M tokens qui couvre un monorepo entier de taille moyenne pour une édition agentique, et un coût par token qui en pratique est inchangé par rapport à Sonnet 4.6 (le tarif de lancement absorbe l'inflation de 1,0 à 1,35x du tokenizer). Le point coût-performance des nouveaux contrôles de niveau d'effort permet à un développeur de choisir un modèle coût-efficace pour les refactors de routine et un modèle plus capable pour les tâches de long horizon, dans la même session, sans quitter Claude Code. Le correctif de confiance MCP de la v2.1.196 ferme un risque discret de chaîne d'approvisionnement pour les équipes qui font tourner Claude Code sur des dépôts avec un .claude/settings.json commité, et la 2.1.197 livre un modèle qui, sur les propres chiffres d'Anthropic, est le premier de la lignée Sonnet à pouvoir remplacer Opus 4.8 sur le travail agentique que l'audience Claude Code fait tous les jours.

Questions fréquentes

Fastify v5.9.0 ajoute `request.mediaType` et `onMaxParamLength`, durcit la confiance dans les en-têtes `forwarded`, découpe les grandes réponses HTTP/2 et migre les tests de types vers TSTyche

Fastify v5.9.0, publié le 2026-06-28 (github.com/fastify/fastify), est la première version mineure de la ligne v5 en 2026 et un cycle substantiel de 65 PR. Les fonctionnalités principales sont `request.mediaType` (un accesseur typé pour le type de média négocié, [#6653](https://github.com/fastify/fastify/pull/6653) par climba03003), l'option de route `onMaxParamLength` ([#6716](https://github.com/fastify/fastify/pull/6716) par climba03003), et un correctif de sécurité qui ne fait plus confiance à `X-Forwarded-Host` et `X-Forwarded-Proto` quand le socket entrant est absent ([#6684](https://github.com/fastify/fastify/pull/6684) par mcollina). Le cycle livre un correctif de découpage en morceaux du buffer HTTP/2 pour les grandes réponses ([#6746](https://github.com/fastify/fastify/pull/6746) par mcollina), trois gains de performance liés au schéma (parsing différé du ContentType dans `getSchemaSerializer` #6692, mise en cache des objets `ContentType` analysés dans `ContentTypeParser` #6694, garde `typeof` avant `toString.call` dans `send` / `onSendEnd` #6693 par aquie00t), Node.js 26 ajouté à la matrice de tests ([#6728](https://github.com/fastify/fastify/pull/6728) par Fdawgs) et Node.js 20 retiré de la matrice yarn CI ([#6662](https://github.com/fastify/fastify/pull/6662) par Tony133), la migration de la suite de tests de types d'assertions `expect-type` artisanales vers [TSTyche](https://github.com/mrazauskas/tstyche) ([#6532](https://github.com/fastify/fastify/pull/6532) par mrazauskas, avec les suites #6726 et #6727), et un bump de fastify-plugin v6.0.0 purement TypeScript. Autres correctifs notables : déduplication de `res.end` du trailer (#6676), garde de complétion dupliquée du trailer (#6714), `error.code` sur les erreurs de routage (#6678), `hasRequestDecorator` / `hasReplyDecorator` détectant les propriétés natives assignées par constructeur (#6753), `getValidationFunction()` autorisé à retourner `undefined` (#6665), et un nettoyage du `_meta` du socket qui ferme une fuite keep-alive (#6799).

Articles connexes

Plus de couverture avec des sujets et tags en commun.

ai29 juin 2026

Cline 4.0.1 annule la migration SDK après les régressions de 4.0.0 ; 4.0.2 ramène le code SDK avec des correctifs pour l'effort de raisonnement et ClinePass

Cline a publié v4.0.1 le 28 juin 2026 et v4.0.2 le 29 juin 2026 (github.com/cline/cline), un cycle de récupération en deux étapes pour la migration SDK de v4.0.0 livrée le 26 juin. v4.0.1 livre l'extension VS Code 3.89.x d'avant le SDK sous un numéro de version 4.0.1, construite à partir d'une branche dédiée `legacy-extension` via un nouveau workflow `ext-vscode-publish-legacy.yml`, pour résoudre les régressions signalées dans 4.0.0 (aperçus de diff cassés dans l'éditeur, erreurs run_commands pendant les éditions de fichiers, flux d'édition de fichiers cassé avec GLM 5.2 et MiniMax M3 via Ollama). v4.0.2 restaure le chemin de code basé sur le SDK par-dessus la même branche legacy, en ajoutant le support de l'effort de raisonnement (incluant `xhigh`) pour les modèles thinking de DeepSeek (#11938), une couche de contrôle d'effort de raisonnement centralisée pour ClinePass (#11954), des identifiants Z.ai canoniques (#11951), un correctif de remplacement des variables d'environnement dans la webview (#11955), un polissage des métadonnées ClinePass et Z.ai (#11958), et un correctif de paramètre par défaut pour focus chain (#11960). La CLI v3.0.32 sort le même jour avec les améliorations de compaction de contexte du SDK v0.0.54 et le polissage de l'onboarding ClinePass. La séquence montre un projet qui récupère une migration majeure en 72 heures en faisant avancer la branche legacy plutôt qu'en annulant le travail SDK.

ai27 juin 2026

Cline 4.0 migre l'extension VS Code sur le SDK Cline partagé et ajoute ClinePass, un marketplace Customize, des Plugins et les prompts en file d'attente

Cline a publié v4.0.0 le 26 juin 2026 (github.com/cline/cline), une version majeure qui migre l'extension VS Code depuis son implémentation de tâches autonome historique vers le SDK Cline partagé, le même moteur TypeScript qui fait tourner la CLI Cline, Kanban et le plugin JetBrains. La version ajoute ClinePass (onboarding intégré, sélection de fournisseur, prise en charge d'abonnement et gestion des droits), un marketplace Customize pour les Skills, les serveurs MCP et les nouveaux Cline Plugins, les prompts en file d'attente, l'édition et la régénération, une refonte de la configuration des fournisseurs et des modèles autour de providers.json et d'un catalogue de modèles partagé (Fireworks GLM 5.2, Kimi K2.6 Fast, Kimi K2.7 Code, Qwen 3.7 Plus, MiniMax M3, SAP AI Core, LiteLLM, Codex OAuth), la désactivation par défaut de l'auto-approbation des commandes, et un workflow de build et de packaging de l'extension déplacé vers Bun. Les sous-agents sont temporairement désactivés dans l'extension pendant la stabilisation de l'expérience basée sur le SDK.

ai27 juin 2026

OpenAI Codex 0.142 ajoute des budgets de tokens par exécution, la délégation multi-agents, la recherche web indexée et un catalogue de plugins réorganisé

La ligne Codex 0.142 d'OpenAI est sortie entre le 22 et le 26 juin 2026 (rust-v0.142.0 à rust-v0.142.3 sur github.com/openai/codex). Le cycle transforme l'agent en un outil qu'une équipe peut gouverner : des budgets de tokens configurables qui suivent la consommation entre les threads et interrompent les tours quand le budget est épuisé, une délégation multi-agents configurable en désactivé, requête-explicite-uniquement ou proactif, un mode de recherche web indexée qui autorise la recherche en direct tout en restreignant l'accès direct aux pages aux URL approuvées par le serveur, des outils MCP qui utilisent la recherche d'outils par défaut, une vue /plugins réorganisée en sections OpenAI Curated, Workspace et Shared with me, la prise en charge du proxy système (PAC, WPAD, bypass) sous Windows et macOS pour l'authentification, et une longue liste de correctifs de fiabilité et de sécurité pour les exécuteurs distants. Elle s'appuie directement sur le relay Noise chiffré et la couche PathUri multi-OS de la version 0.141 du 18 juin.

Commentaires

Connexion Connectez-vous pour participer à la conversation.

Pas encore de commentaires. Soyez le premier à partager vos pensées.