Deux modèles de code open-source en une semaine : Kimi K2.7-Code et Xiaomi MiMo Code

Deux modèles de code open-source en une semaine : Kimi K2.7-Code et Xiaomi MiMo Code

lschvn

Deux modèles de code open-weights ont atterri la même semaine. Moonshot AI a livré Kimi K2.7-Code sur Hugging Face comme build agentique dédié au code de la base Kimi K2.6, et Xiaomi a livré MiMo Code comme drop open-weights distinct. Pour les développeurs TypeScript et JavaScript qui auto-hébergent leurs outils de dev, cela élargit le menu pratique de modèles qui peuvent se brancher derrière Continue, Aider, OpenCode, ou tout autre outil avec backend de modèle local.

Kimi K2.7-Code

Kimi K2.7-Code est un modèle Mixture-of-Experts à 1T de paramètres avec 32B activés par token, 61 couches (une dense), un état caché d'attention de 7168 dim, un état caché MoE de 2048 dim par expert, 64 têtes d'attention, 384 experts avec 8 sélectionnés par token, et un expert partagé. Le vocabulaire est de 160K et la longueur de contexte est 256K. L'attention est Multi-head Latent Attention (MLA), l'activation est SwiGLU, et le modèle est livré avec un encodeur vision MoonViT à 400M de paramètres, bien que la variante code soit text-only à l'inférence.

La métrique en avant de Moonshot est une baisse d'environ 30% de l'usage de thinking tokens par rapport à K2.6 sur les mêmes tâches de code long terme, associée à une meilleure complétion end-to-end sur le travail de génie logiciel multi-étapes. Les 256K de contexte sont l'histoire pratique pour les tâches qui couvrent une grande codebase TypeScript : le modèle peut tenir une part significative d'un vrai dépôt plus l'issue, le plan de test, et la conversation préalable.

L'architecture implique quelques choses pour l'auto-hébergement. À 1T de paramètres, K2.7-Code n'est pas un modèle single-GPU. Le multi-GPU est le plancher, et un partenaire d'inférence hébergé est l'histoire production réaliste. Le scaffolding agentique (usage d'outils, planification, recovery d'erreur) est le goulot d'étranglement, pas les poids eux-mêmes. Attendez-vous à ce que l'écart entre le modèle brut et un agent de classe Claude Fable 5 soit beaucoup plus faible sur les benchmarks de code bruts que sur les évaluations agentiques long terme.

Xiaomi MiMo Code

MiMo Code de Xiaomi est le deuxième drop open-weights de la semaine, et le plus accessible des deux sur du hardware grand public. Xiaomi n'a pas encore publié de model card avec le même niveau de détail architectural que Moonshot ; le matériel public positionne MiMo Code comme un drop dédié au code, avec poids ouverts et le même cadrage général de workload agentique.

La pertinence est à la fois symbolique et pratique. Deux modèles de code open-weights en une seule semaine, provenant de deux vendors chinois distincts, est un signal fort que la frontière open-weights n'est plus une histoire à un seul vendor. Pour les outils de dev auto-hébergés, le menu est désormais assez large pour comparer des architectures, pas seulement des comptages de paramètres.

Ce que cela signifie pour les outils de dev auto-hébergés

La question pratique pour une équipe TypeScript qui fait tourner un agent de code local est de savoir si l'alternative open-weights est suffisante pour votre charge. La réponse dépend de ce que l'agent doit faire.

Pour la complétion de code, les éditions single-file et les refactors bien cadrés, l'écosystème open-weights a des options viables depuis plus d'un an. Pour les tâches agentiques qui demandent du raisonnement multi-fichiers, de la rétention long-contexte, et un usage d'outils fiable sur de nombreux tours, l'écart avec la frontière closed-weight (Claude Fable 5, classe GPT, classe Gemini) reste réel, mais il est plus étroit qu'il y a six mois. L'ascension de Claude Code en 2026 et le classement des outils de dev de mars 2026 ont été écrits quand le menu open-weights tenait sur une ligne. Après cette semaine, c'est au moins une courte liste, et les vendors closed-weight devront continuer à livrer des sauts de capacité pour rester en tête.

Côté outillage : Continue, Aider, OpenCode et Cline avec backend local peuvent tous charger un checkpoint Hugging Face dès aujourd'hui. Kimi K2.7-Code à 1T paramètres demande du multi-GPU ; MiMo Code est le candidat pour l'inférence sur laptop. Les chiffres d'architecture suggèrent que K2.7-Code a la marge pour du travail sérieux, mais le test pratique est de savoir si votre scaffold agentique peut en tirer parti. La même évaluation s'appliquera au moteur TS service-powered de WebStorm 2026.1 et à tout autre éditeur qui expose un picker de modèle local.

Questions fréquentes

Articles connexes

Plus de couverture avec des sujets et tags en commun.

SpaceX rachète Cursor pour 60 milliards de dollars : plongée dans le plus gros deal IA de l'année pour le code
ai

SpaceX rachète Cursor pour 60 milliards de dollars : plongée dans le plus gros deal IA de l'année pour le code

Le 16 juin 2026, quatre séances après l'IPO record de SpaceX à 85,7 milliards de dollars qui a fait d'Elon Musk le premier trillionnaire de la planète, l'entreprise a confirmé le rachat d'Anysphere, la maison-mère de l'éditeur de code IA Cursor, dans une transaction 100% en actions valorisée à 60 milliards. Le prix représente environ 16x la valorisation privée de Cursor fin 2025, le double de la levée qu'elle était sur le point de boucler, et la transaction boucle un montage inhabituel d'avril où SpaceX avait le droit d'acheter Cursor pour 60 Md$ ou de payer 10 Md$ pour le partenariat à la place. Cette longue lecture décortique la mécanique du deal, l'histoire de l'IPO comme monnaie d'acquisition, le pari technologique sur Composer + Colossus, le lien avec l'effondrement de xAI, et les questions que tout développeur utilisant Cursor, Claude Code, Copilot ou n'importe quel autre outil de code IA devrait se poser cette semaine.
Staan, la première API de recherche européenne, passe en libre-service : plongée en profondeur
ai

Staan, la première API de recherche européenne, passe en libre-service : plongée en profondeur

Le 15 juin 2026, à VivaTech, l'API de recherche Staan est passée en libre-service pour tout développeur. C'est la surface publique d'European Search Perspective, la coentreprise 50/50 entre Qwant et Ecosia qui exploite l'index de recherche européen, et le lancement s'inscrit dans le vide laissé par la retraite de l'API Bing Search de Microsoft en août 2025 et par l'accès programmatique restreint de Google. Ce long format détaille le pipeline, les trois niveaux de produit, la tarification, le récit de souveraineté et ses limites, le « mécanisme de backup américain » et ce que cela signifie pour les agents IA et les outils de développement qui dépendent d'un index web frais.
Mistral "Le Chaton Fat" sature la timeline en 24 heures : reportage
ai

Mistral "Le Chaton Fat" sature la timeline en 24 heures : reportage

Dans la nuit du 14 au 15 juin 2026, une fausse page produit Mistral a fuité sur X. Au matin, le modèle avait acquis 30 à 100 000 milliards de paramètres, une suspension de l'UE, un score FrontierMath 4 « well beyond 100 », une auto-amélioration récursive, et un communiqué d'embauche d'Andrej Karpathy. Rien de tout cela n'était réel. Tout cela a tourné. Voici la chronologie, les community notes, et ce que ça dit de la manière dont l'écosystème IA absorbe un lancement.

Commentaires

Connexion Connectez-vous pour participer à la conversation.

Pas encore de commentaires. Soyez le premier à partager vos pensées.