Deux modèles de code open-weights ont atterri la même semaine. Moonshot AI a livré Kimi K2.7-Code sur Hugging Face comme build agentique dédié au code de la base Kimi K2.6, et Xiaomi a livré MiMo Code comme drop open-weights distinct. Pour les développeurs TypeScript et JavaScript qui auto-hébergent leurs outils de dev, cela élargit le menu pratique de modèles qui peuvent se brancher derrière Continue, Aider, OpenCode, ou tout autre outil avec backend de modèle local.
Kimi K2.7-Code
Kimi K2.7-Code est un modèle Mixture-of-Experts à 1T de paramètres avec 32B activés par token, 61 couches (une dense), un état caché d'attention de 7168 dim, un état caché MoE de 2048 dim par expert, 64 têtes d'attention, 384 experts avec 8 sélectionnés par token, et un expert partagé. Le vocabulaire est de 160K et la longueur de contexte est 256K. L'attention est Multi-head Latent Attention (MLA), l'activation est SwiGLU, et le modèle est livré avec un encodeur vision MoonViT à 400M de paramètres, bien que la variante code soit text-only à l'inférence.
La métrique en avant de Moonshot est une baisse d'environ 30% de l'usage de thinking tokens par rapport à K2.6 sur les mêmes tâches de code long terme, associée à une meilleure complétion end-to-end sur le travail de génie logiciel multi-étapes. Les 256K de contexte sont l'histoire pratique pour les tâches qui couvrent une grande codebase TypeScript : le modèle peut tenir une part significative d'un vrai dépôt plus l'issue, le plan de test, et la conversation préalable.
L'architecture implique quelques choses pour l'auto-hébergement. À 1T de paramètres, K2.7-Code n'est pas un modèle single-GPU. Le multi-GPU est le plancher, et un partenaire d'inférence hébergé est l'histoire production réaliste. Le scaffolding agentique (usage d'outils, planification, recovery d'erreur) est le goulot d'étranglement, pas les poids eux-mêmes. Attendez-vous à ce que l'écart entre le modèle brut et un agent de classe Claude Fable 5 soit beaucoup plus faible sur les benchmarks de code bruts que sur les évaluations agentiques long terme.
Xiaomi MiMo Code
MiMo Code de Xiaomi est le deuxième drop open-weights de la semaine, et le plus accessible des deux sur du hardware grand public. Xiaomi n'a pas encore publié de model card avec le même niveau de détail architectural que Moonshot ; le matériel public positionne MiMo Code comme un drop dédié au code, avec poids ouverts et le même cadrage général de workload agentique.
La pertinence est à la fois symbolique et pratique. Deux modèles de code open-weights en une seule semaine, provenant de deux vendors chinois distincts, est un signal fort que la frontière open-weights n'est plus une histoire à un seul vendor. Pour les outils de dev auto-hébergés, le menu est désormais assez large pour comparer des architectures, pas seulement des comptages de paramètres.
Ce que cela signifie pour les outils de dev auto-hébergés
La question pratique pour une équipe TypeScript qui fait tourner un agent de code local est de savoir si l'alternative open-weights est suffisante pour votre charge. La réponse dépend de ce que l'agent doit faire.
Pour la complétion de code, les éditions single-file et les refactors bien cadrés, l'écosystème open-weights a des options viables depuis plus d'un an. Pour les tâches agentiques qui demandent du raisonnement multi-fichiers, de la rétention long-contexte, et un usage d'outils fiable sur de nombreux tours, l'écart avec la frontière closed-weight (Claude Fable 5, classe GPT, classe Gemini) reste réel, mais il est plus étroit qu'il y a six mois. L'ascension de Claude Code en 2026 et le classement des outils de dev de mars 2026 ont été écrits quand le menu open-weights tenait sur une ligne. Après cette semaine, c'est au moins une courte liste, et les vendors closed-weight devront continuer à livrer des sauts de capacité pour rester en tête.
Côté outillage : Continue, Aider, OpenCode et Cline avec backend local peuvent tous charger un checkpoint Hugging Face dès aujourd'hui. Kimi K2.7-Code à 1T paramètres demande du multi-GPU ; MiMo Code est le candidat pour l'inférence sur laptop. Les chiffres d'architecture suggèrent que K2.7-Code a la marge pour du travail sérieux, mais le test pratique est de savoir si votre scaffold agentique peut en tirer parti. La même évaluation s'appliquera au moteur TS service-powered de WebStorm 2026.1 et à tout autre éditeur qui expose un picker de modèle local.



