Deux modèles de code open-source en une semaine : Kimi K2.7-Code et Xiaomi MiMo Code

Deux modèles de code open-weights ont atterri la même semaine. Moonshot AI a livré Kimi K2.7-Code sur Hugging Face comme build agentique dédié au code de la base Kimi K2.6, et Xiaomi a livré MiMo Code comme drop open-weights distinct. Pour les développeurs TypeScript et JavaScript qui auto-hébergent leurs outils de dev, cela élargit le menu pratique de modèles qui peuvent se brancher derrière Continue, Aider, OpenCode, ou tout autre outil avec backend de modèle local.

Kimi K2.7-Code

Kimi K2.7-Code est un modèle Mixture-of-Experts à 1T de paramètres avec 32B activés par token, 61 couches (une dense), un état caché d'attention de 7168 dim, un état caché MoE de 2048 dim par expert, 64 têtes d'attention, 384 experts avec 8 sélectionnés par token, et un expert partagé. Le vocabulaire est de 160K et la longueur de contexte est 256K. L'attention est Multi-head Latent Attention (MLA), l'activation est SwiGLU, et le modèle est livré avec un encodeur vision MoonViT à 400M de paramètres, bien que la variante code soit text-only à l'inférence.

La métrique en avant de Moonshot est une baisse d'environ 30% de l'usage de thinking tokens par rapport à K2.6 sur les mêmes tâches de code long terme, associée à une meilleure complétion end-to-end sur le travail de génie logiciel multi-étapes. Les 256K de contexte sont l'histoire pratique pour les tâches qui couvrent une grande codebase TypeScript : le modèle peut tenir une part significative d'un vrai dépôt plus l'issue, le plan de test, et la conversation préalable.

L'architecture implique quelques choses pour l'auto-hébergement. À 1T de paramètres, K2.7-Code n'est pas un modèle single-GPU. Le multi-GPU est le plancher, et un partenaire d'inférence hébergé est l'histoire production réaliste. Le scaffolding agentique (usage d'outils, planification, recovery d'erreur) est le goulot d'étranglement, pas les poids eux-mêmes. Attendez-vous à ce que l'écart entre le modèle brut et un agent de classe Claude Fable 5 soit beaucoup plus faible sur les benchmarks de code bruts que sur les évaluations agentiques long terme.

Xiaomi MiMo Code

MiMo Code de Xiaomi est le deuxième drop open-weights de la semaine, et le plus accessible des deux sur du hardware grand public. Xiaomi n'a pas encore publié de model card avec le même niveau de détail architectural que Moonshot ; le matériel public positionne MiMo Code comme un drop dédié au code, avec poids ouverts et le même cadrage général de workload agentique.

La pertinence est à la fois symbolique et pratique. Deux modèles de code open-weights en une seule semaine, provenant de deux vendors chinois distincts, est un signal fort que la frontière open-weights n'est plus une histoire à un seul vendor. Pour les outils de dev auto-hébergés, le menu est désormais assez large pour comparer des architectures, pas seulement des comptages de paramètres.

Ce que cela signifie pour les outils de dev auto-hébergés

La question pratique pour une équipe TypeScript qui fait tourner un agent de code local est de savoir si l'alternative open-weights est suffisante pour votre charge. La réponse dépend de ce que l'agent doit faire.

Pour la complétion de code, les éditions single-file et les refactors bien cadrés, l'écosystème open-weights a des options viables depuis plus d'un an. Pour les tâches agentiques qui demandent du raisonnement multi-fichiers, de la rétention long-contexte, et un usage d'outils fiable sur de nombreux tours, l'écart avec la frontière closed-weight (Claude Fable 5, classe GPT, classe Gemini) reste réel, mais il est plus étroit qu'il y a six mois. L'ascension de Claude Code en 2026 et le classement des outils de dev de mars 2026 ont été écrits quand le menu open-weights tenait sur une ligne. Après cette semaine, c'est au moins une courte liste, et les vendors closed-weight devront continuer à livrer des sauts de capacité pour rester en tête.

Côté outillage : Continue, Aider, OpenCode et Cline avec backend local peuvent tous charger un checkpoint Hugging Face dès aujourd'hui. Kimi K2.7-Code à 1T paramètres demande du multi-GPU ; MiMo Code est le candidat pour l'inférence sur laptop. Les chiffres d'architecture suggèrent que K2.7-Code a la marge pour du travail sérieux, mais le test pratique est de savoir si votre scaffold agentique peut en tirer parti. La même évaluation s'appliquera au moteur TS service-powered de WebStorm 2026.1 et à tout autre éditeur qui expose un picker de modèle local.

Questions fréquentes

Sakana Fugu Emballe un Orchestrateur Multi-Agents Derrière une API Unique, Revendique la Parité Avec Fable et Mythos

Sakana AI a lancé Fugu le 22 juin 2026, un système d'orchestration multi-agents livré sous la forme d'une seule API compatible OpenAI. Deux modèles, Fugu et Fugu Ultra, coordonnent un pool de LLMs closed-source grâce à un orchestration apprise issue de deux articles ICLR 2026 (TRINITY et Conductor). Fugu Ultra affiche des scores de benchmark compétitifs avec Fable 5 et Mythos Preview d'Anthropic, mais le lancement suscite des critiques vives sur la transparence des coûts, les dépendances closed-source et la méthodologie des benchmarks.

ai17 juin 2026

L'Open Knowledge Format de Google Cloud est un standard, pas un produit : plongée dans OKF v0.1

Le 12 juin 2026, Google Cloud a publié l'Open Knowledge Format (OKF), une spécification ouverte qui formalise le pattern LLM-wiki en format portable et interopérable : un répertoire de fichiers markdown avec frontmatter YAML, un seul champ obligatoire (type), cinq recommandés, et zéro outillage requis. Le tweet de Google Cloud Tech du 16 juin a généré 117 000 vues en 24 heures et a fait de la spec l'annonce de format de connaissance la plus discutée de l'année. Cette longue lecture parcourt la spec v0.1 section par section, les choix de design qui la rendent délibérément minimale, ce que Google livre avec (un agent d'enrichissement pour BigQuery, un visualiseur HTML statique, trois bundles d'exemple, et une intégration native au Knowledge Catalog BigQuery), et la question ouverte que tout constructeur d'agents IA et toute équipe plateforme de données devraient suivre sur les six prochains mois.

ai16 juin 2026

SpaceX rachète Cursor pour 60 milliards de dollars : plongée dans le plus gros deal IA de l'année pour le code

Le 16 juin 2026, quatre séances après l'IPO record de SpaceX à 85,7 milliards de dollars qui a fait d'Elon Musk le premier trillionnaire de la planète, l'entreprise a confirmé le rachat d'Anysphere, la maison-mère de l'éditeur de code IA Cursor, dans une transaction 100% en actions valorisée à 60 milliards. Le prix représente environ 16x la valorisation privée de Cursor fin 2025, le double de la levée qu'elle était sur le point de boucler, et la transaction boucle un montage inhabituel d'avril où SpaceX avait le droit d'acheter Cursor pour 60 Md$ ou de payer 10 Md$ pour le partenariat à la place. Cette longue lecture décortique la mécanique du deal, l'histoire de l'IPO comme monnaie d'acquisition, le pari technologique sur Composer + Colossus, le lien avec l'effondrement de xAI, et les questions que tout développeur utilisant Cursor, Claude Code, Copilot ou n'importe quel autre outil de code IA devrait se poser cette semaine.