L'après-midi du 15 juin 2026, sur le stand OVHcloud du deuxième jour de VivaTech, Qwant a ouvert en libre-service l'accès à Staan, l'API de recherche qu'elle faisait tourner discrètement pour elle-même et un petit ensemble de clients entreprise depuis un an. Le post d'annonce sur X se lit, en français d'abord et en anglais en dessous, avec le type d'escalade prudente que ce coin de la stack d'infrastructure IA attendait. Le post a rassemblé 60 400 vues, 454 likes, 82 reposts et 321 signets en 24 heures, un signal inhabituellement fort pour une annonce d'outillage développeur venant d'un moteur de recherche grand public que la plupart des lecteurs anglophones avaient, jusqu'ici, largement ignoré.
@Qwant_FR - 15:14 · 15 juin 2026
🇪🇺 Staan, la première API de recherche européenne est désormais disponible en libre-service 🇪🇺
Staan est l'API de recherche 100% européenne co-construite avec @ecosia à travers la joint-venture européenne European Search Perspective. Staan connecte les applications d'IA au web en les alimentant avec des millions de documents et de contenus web dans un cadre juridique respectueux des données et des utilisateurs.
À partir d'aujourd'hui, Staan permet à n'importe quel développeur d'obtenir sa clé API et de commencer à alimenter ses assistants, copilotes et agents IA en quelques minutes.
Pendant que les solutions américaines restreignent leurs API de recherche et leurs modèles de LLM, une seconde voie européenne et souveraine s'organise. ✊
Switch to Europe. Now.
La phrase intéressante est celle sur laquelle le marketing a passé les dernières semaines à adoucir le ton. « Pendant que les solutions américaines restreignent leurs API de recherche et leurs modèles de LLM » est la description d'un basculement de marché, pas un slogan, et elle fait un vrai travail d'explication de pourquoi ce lancement arrive comme il arrive. La retraite américaine de l'accès programmatique au web n'est pas une hypothèse, et ce n'est pas un récit Twitter. C'est le résultat de deux décisions business délibérées en 2025 qui, à elles deux, ont supprimé les deux plus grandes sources de résultats de recherche sur lesquelles les applications d'IA s'étaient discrètement construites.
Ce que c'est réellement, et ce que ce n'est pas
La correction de cadrage mérite d'être faite d'emblée, parce que la plupart des couvertures anglophones décriront Staan comme un lancement de moteur de recherche européen, ce qu'il n'est pas. Staan est une API de recherche web en temps réel, dans la même catégorie produit que Tavily, Exa, Brave Search, SerpApi et la couche de recherche à l'intérieur de Microsoft Azure AI Foundry. Elle n'a pas de front-end grand public. Elle ne concurrence pas Google pour les utilisateurs finaux. Elle ne concurrence pas, au sens direct, Qwant le moteur grand public non plus, parce que Qwant est l'un de ses clients, pas son adversaire. Ce que Staan concurrence, c'est la couche dans la stack IA qui connecte un modèle de langage au web vivant, la partie qui détermine si une citation dans une réponse de chatbot pointe vers une source réelle et fraîche ou vers une URL hallucinée qui n'existe pas.
Cette couche compte plus en 2026 qu'en 2024, et la raison a très peu à voir avec Staan lui-même. La couche compte parce que l'offre d'API de recherche que les applications d'IA peuvent appeler, en arrière-plan et à l'échelle, s'est contractée. Microsoft a retiré l'API Bing Search en août 2025, huit ans après le lancement initial de l'API Bing Search, et a redirigé les développeurs vers un produit différent, Grounding with Bing Search, qui est livré comme partie d'Azure AI Foundry plutôt que comme endpoint HTTP autonome. Google n'a jamais vendu d'API de recherche web autonome comparable à l'échelle, et l'accès programmatique limité qu'il propose est contraint par les quotas, le statut de partenaire et la surface produit propre de Google. La troisième source américaine majeure, l'index open-web utilisé par les outils académiques et hobbyistes, a été poussé dans des termes toujours plus étroits par la ligne de procès New York Times v. OpenAI, le règlement UMG v. Anthropic, et un flux constant d'actions d'application côté éditeurs qui ont rendu la réponse la plus sûre à « ne scrape pas sauf si tu as un accord ». Le résultat est un vide exactement à la couche dont les applications d'IA ont besoin pour fonctionner, et le vide s'élargit depuis un an.
L'annonce Qwant arrive dans ce vide avec un timing qu'il est difficile de qualifier d'accidentel, et avec un positionnement inhabituellement direct. Staan n'est pas le premier moteur de recherche européen ; Qwant, Ecosia, Mojeek et une poignée d'acteurs plus petits sont sur ce créneau depuis des années. C'est la première fois qu'une entreprise non américaine expose un index de recherche web de production au marché global des développeurs IA aux niveaux de prix et à l'enveloppe de latence que ce marché a appris à attendre. La liste des clients payants que Qwant a nommés jusqu'ici, CamoCopy, OVHcloud, Infomaniak, xPrivo, Pappers et les deux moteurs grand public fondateurs, est courte mais pas sans relief. OVHcloud et Infomaniak en particulier sont les deux plus grands fournisseurs européens de cloud et d'hébergement qui ne sont ni AWS, ni Azure, ni Google Cloud, ce qui est le bon set de clients pour un produit dont le pitch principal est « nous ne sommes pas eux ».
Le pipeline, dans l'ordre où une requête le voit
La manière la plus utile de comprendre Staan est de parcourir le chemin qu'une seule requête prend, parce que l'ordre est le produit. Une API de recherche pour applications d'IA n'est pas le même produit qu'une API de recherche pour utilisateurs humains, et les différences se voient au milieu du pipeline, pas aux extrémités.
La première étape est le pipeline de recherche lui-même. Une requête arrive sur HTTPS, touche un load balancer, et est routée vers un cluster de recherche qui exécute une stack que la FAQ décrit, dans un euphémisme utile, comme « un pipeline de recherche ». Le moteur sous-jacent n'est pas public, mais le comportement l'est : une requête retourne une liste de jusqu'à dix résultats, chacun avec un titre, une URL, un extrait et quelques champs de métadonnées. Le nombre de résultats est fixé à dix par appel, avec une limite supérieure sur la roadmap. L'entreprise n'expose pas actuellement de curseur paginé, ce qui signifie qu'un workflow qui veut plus de dix documents doit émettre plusieurs appels parallèles, pas plusieurs appels séquentiels, et c'est une vraie contrainte pour tout agent qui veut résumer les cinquante premiers résultats d'une requête.
La deuxième étape est celle qui justifie la différence de prix entre les deux niveaux inférieurs. Web Search retourne les résultats de recherche bruts et s'arrête là. Web Search for AI prend ces mêmes résultats, va chercher le contenu réel de chaque page, en extrait des passages ciblés, et reranke les passages par pertinence vis-à-vis de la requête d'origine. Le défaut est de trois extraits supplémentaires par résultat, configurable de un à dix, et le reranker est la partie qui transforme une liste de dix URLs en une liste de dix passages qu'un LLM peut réellement utiliser. Le pipeline est décrit dans la FAQ comme un fetch, puis une extraction, puis un reranking, ce qui est la même forme que ce que Tavily et Exa utilisent en interne, et la description correspond à ce qu'on attend d'un produit de recherche IA de l'ère 2025.
La troisième étape est le niveau AI Answer, qui est un produit entièrement différent. Au lieu de retourner une liste de résultats et de laisser l'appelant les passer à n'importe quel LLM qu'il utilise déjà, AI Answer prend la même requête, exécute le pipeline de recherche, fait le fetch, l'extraction et le reranking, puis appelle un modèle de langage pour produire une réponse unique avec des citations inline. Le modèle de langage est Mistral Small, hébergé sur la même infrastructure OVHcloud, et les citations sont des objets JSON que l'appelant peut afficher, auditer ou retirer avant de montrer la réponse à un utilisateur final. Le tout est un seul appel HTTP, et la réponse revient en markdown ou en texte brut, avec des requêtes connexes optionnelles et un contexte conversationnel optionnel pour les tours de suivi. Le choix de Mistral Small est un petit point de donnée réel dans le récit de souveraineté européen : ce même Mistral, dans une autre semaine, était au centre d'un faux lancement qui a trompé la timeline pendant 24 heures, et le fait que Staan s'appuie discrètement sur le vrai Mistral Small pour la génération de réponses en production est le genre de détail qui fait du pitch « stack européenne » autre chose que du marketing.
Le budget de latence est la partie la plus facile à vérifier. La page marketing dit P95 inférieur à 800 ms pour le niveau Web Search, et la FAQ confirme un objectif plutôt qu'un SLA contractuel. Pour le niveau AI Answer, la latence est dominée par l'appel à Mistral Small, et l'entreprise n'a pas publié de P95. À titre de comparaison, le P95 publié de Brave Search est autour de 1,2 seconde pour le niveau IA, et celui de Tavily est entre 1,5 et 3 secondes selon l'opération, donc Staan est dans la bonne fourchette pour le niveau le moins cher et non mesuré pour le plus cher. Le chiffre de 800 ms, s'il tient sous benchmark indépendant, est le nombre le plus important de la page, parce qu'il place Staan dans le budget des expériences de chat synchrones sans avoir besoin d'une réponse streamée pour paraître réactif.
La matrice produit, en un tableau
| Niveau | Ce que vous obtenez | Prix | Idéal pour |
|---|---|---|---|
| Web Search | 10 résultats web bruts par appel, JSON | 1 € pour 1 000 requêtes (1 000 premières / mois gratuites) | Lookup par mot-clé simple, RAG simple |
| Web Search for AI | 10 résultats + 3 extraits supplémentaires par défaut (configurable 1 à 10), avec reranking, JSON | 2 € pour 1 000 requêtes (1 000 premières / mois gratuites) | Assistants IA, pipelines RAG, outils d'agent |
| AI Answer | Un appel en entrée, une réponse citée en sortie, markdown ou texte brut, requêtes connexes et contexte conversationnel optionnels | Sur mesure (contacter les ventes) | Surfaces de chat en production, workflows régulés |
Deux détails que la page marketing enterre méritent d'être remontés. Premièrement, le whitelist et blacklist de domaines sont supportés sur les niveaux Web Search et Web Search for AI, mais la console actuelle ne permet de restreindre qu'à un seul domaine, le whitelist multi-domaine étant prévu pour Q3 2026. Deuxièmement, le paiement par carte bancaire n'est pas encore sur la console en libre-service, ce qui signifie que le label « libre-service » est qualifié : les développeurs peuvent s'inscrire, obtenir une clé API et commencer à appeler l'API, mais la couche facturation semble toujours passer par une conversation commerciale. L'entreprise a signalé les deux comme items de roadmap, et la FAQ les décrit comme tels.
Le troisième détail, celui qui va revenir dans chaque revue d'approvisionnement entreprise, c'est l'absence de SLA publié, l'absence de qualification SecNumCloud, et l'absence de roadmap publique de certification. Staan est hébergé sur OVHcloud, ce qui est en soi une réponse pour les acheteurs du secteur public européen et des industries régulées qui font la différence entre « hébergé en Europe » et « qualifié pour les charges de travail du secteur public européen ». La qualification est un problème séparé, et la FAQ est candide sur le fait que Staan n'est pas SecNumCloud-qualifié à ce stade.
Le « backup américain », et ce qu'il fait au récit de souveraineté
La partie la plus intéressante de l'histoire Staan, et celle sur laquelle le marketing a travaillé le plus dur pour adoucir le ton, c'est le « mécanisme de backup américain » que la FAQ divulgue de sa propre initiative. Le texte exact de la FAQ est :
C'est un mécanisme de backup américain qui intervient pour compléter certains résultats uniquement quand c'est nécessaire. Cette couverture évolue empirement, en ligne avec la croissance de notre propre index. Les requêtes transmises au fallback n'y sont pas conservées. Aucune donnée n'est stockée aux États-Unis ou réutilisée par le fallback. Le fallback peut être entièrement désactivé sur demande, avec la compréhension que la qualité de certains résultats peut s'en trouver diminuée.
C'est, pour le dire clairement, l'aveu que l'index n'est pas encore à parité avec les acteurs américains, et une description candide du workaround. Le fallback est un index américain, le partenaire n'est pas nommé, et l'entreprise est ouverte sur le fait que les données quittent l'Europe pour ces requêtes, même si elles ne sont pas stockées de l'autre côté. La position est défendable : aucune entreprise avec un index de deux ans n'est à parité avec Google sur la couverture de longue traîne, et le pire résultat d'un lancement en libre-service est la réponse « j'ai posé une question de niche et je n'ai rien eu ». La position est aussi, dans le cadrage de souveraineté sur lequel le post d'annonce s'appuie, une réserve significative. Une API « souveraine » qui, sur les requêtes de longue traîne, retombe sur un moteur américain, est souveraine la plupart du temps et ne l'est pas sur les requêtes où l'index n'a pas encore comblé son retard. Les acheteurs dont le modèle de menace est la pleine résidence des données désactiveront le fallback et accepteront le trou de couverture. Les acheteurs dont le modèle de menace est « je veux une option européenne pour la plupart des choses, et je suis d'accord pour que les US complètent le reste » le laisseront activé.
La divulgation candide est, à sa manière, un signe du sérieux de l'entreprise. Tavily, Exa et Brave Search décrivent tous leur couverture en termes confiants sans nommer les sources amont sur lesquelles ils tombent en repli quand leur propre index est maigre. Staan nomme le fallback comme fallback, documente les propriétés de confidentialité du fallback, et offre de le désactiver sur demande. C'est une posture sur laquelle les équipes d'approvisionnement entreprise peuvent construire, et c'est aussi une posture que les concurrents devront égaler ou expliquer pourquoi ils ne l'ont pas fait.
La retraite américaine, en deux décisions précises
Le post d'annonce Qwant cadre le lancement comme une réponse aux « solutions américaines restreignant leurs API de recherche et leurs modèles de LLM ». Le cadrage est correct, et les deux décisions précises sur lesquelles il pointe méritent toutes deux une description détaillée, parce que le vide qu'elles ont ouvert est exactement le vide que Staan est construit pour combler.
La première est la retraite par Microsoft en août 2025 de l'API Bing Search, l'endpoint autonome de longue date que les développeurs IA appelaient depuis 2017. La dépréciation a été annoncée en mai 2025 et finalisée en août, et le chemin de migration que Microsoft a indiqué est Grounding with Bing Search, une fonctionnalité d'Azure AI Foundry qui bundle la couche de recherche avec le reste de la stack Azure IA, y compris la sécurité de contenu, le cache de prompts et l'identité spécifique Azure. L'effet, en pratique, c'est que la manière la moins chère d'obtenir un signal web frais dans un workflow IA personnalisé, qui était un appel HTTP à 7 $ pour 1 000 requêtes, est désormais un service bundlé à 30 à 50 $ pour 1 000 requêtes qui exige aussi un compte Azure. Pour les développeurs IA qui n'étaient pas déjà sur Azure, la migration a eu un vrai coût. Pour les développeurs IA qui étaient sur Azure, la nouvelle offre était un vrai produit, mais ce n'était plus une API de recherche drop-in. Microsoft n'a rien cassé, mais il a relevé le plancher de ce que ça coûte d'appeler Bing depuis une surface IA, et le timing s'est trouvé coïncider avec le moment où les surfaces IA recevaient le plus d'usage.
La deuxième est la contraction continue de l'accès programmatique au web de Google. Google n'a jamais vendu d'API de recherche web autonome à l'échelle à laquelle Bing l'a fait, et l'accès qu'il a proposé, via la Custom Search JSON API, le Programmable Search Engine, et une poignée de deals partenaires, a été contraint par les quotas, le statut de partenaire, et la préférence de Google pour garder la couche de recherche près de ses propres surfaces produit. En 2025, la contrainte s'est resserrée encore quand Google a redirigé l'accès partenaire vers la surface de l'API Gemini, où le grounding est bundlé avec le reste de l'offre Gemini. L'effet a été le même que celui de Microsoft, mais plus petit en termes absolus, et la comparaison pertinente est qu'un workflow IA grounded sur Google exige maintenant à la fois une relation Gemini et un deal partenaire, ce qui est une barre plus haute que la Custom Search API qu'un hobbyiste pouvait appeler depuis un laptop.
Le vide que ces deux décisions ont ouvert est celui que Staan, et Tavily, et Exa, et Brave Search, et une poignée d'acteurs plus petits, sont tous en train de chercher à combler. Staan est le seul du groupe dont le pitch est « nous ne sommes pas américains, et notre index n'est pas un wrapper autour d'un index américain ». Le pitch est largement correct, avec la réserve ci-dessus. Le timing coïncide aussi, pas par hasard, avec la contraction plus large de l'infrastructure IA hébergée aux US qui s'est jouée sur les trois dernières semaines, depuis l'ordre d'export control du 12 juin sur Fable 5 qui a suspendu le modèle commercial le plus puissant d'Anthropic pour la quasi-totalité des utilisateurs non américains, jusqu'à la mécanique juridique plus profonde de pourquoi l'ordre ciblait une classe de personnes plutôt qu'une classe de capacités. Staan n'est pas une réponse à Fable, mais les deux histoires atterrissent la même semaine parce qu'elles partagent la même pression sous-jacente : l'offre d'infrastructure IA hébergée aux US sur laquelle les builders non américains peuvent compter se contracte, et les alternatives valent soudain leur coût d'intégration. L'index qui alimente Staan est le même index qui alimente Qwant, Ecosia et Lilo, et la gouvernance d'EUSP est 50/50 Qwant et Ecosia avec le siège opérationnel à Paris. Le pipeline est hébergé sur OVHcloud, le service Answer tourne sur Mistral Small, le SDK est en TypeScript, et la donnée est en France.
La comparaison qui compte, en un paragraphe
Sur la recherche web brute, les trois acteurs américains crédibles sont Tavily (recherche plus extraction, orienté RAG, environ 1 $ pour 1 000 crédits basiques, plus pour les options avancées), Exa (recherche neurale et par embeddings, environ 5 $ pour 1 000 résultats neuraux), et Brave Search (index web de qualité Google, 3 $ pour 1 000 appels, 5 $ pour le niveau IA). Les deux services américains crédibles de scraping et de rendu sont SerpApi (scraping de SERP Google, environ 50 $ pour 1 000 sur le plan standard) et Linkup (même catégorie que Tavily, équipe plus européenne et mix de fonctionnalités légèrement différent). Staan est moins cher sur la recherche brute (1 € vs 1 $ à 5 $ pour 1 000), le seul du groupe à proposer la résidence européenne des données par défaut, et le seul dont l'index est détenu et exploité indépendamment par une entreprise non américaine. C'est aussi le seul de ce groupe dont l'index a une empreinte de consommation publiquement vérifiable : c'est l'index derrière les moteurs grand public Qwant, Ecosia et Lilo, qui gèrent ensemble une part significative des requêtes de recherche grand public européennes, de l'ordre d'un faible pourcentage à un chiffre des requêtes européennes selon certaines estimations sectorielles. Les compromis sont la couverture linguistique plus restreinte (FR, EN, DE, pas de plan publié pour les autres), l'absence de SLA au lancement, le gap de paiement par carte bancaire sur la console en libre-service, et le fallback américain sur les requêtes de longue traîne que l'index n'a pas encore couvertes.
L'angle TypeScript, pour les lecteurs arrivés depuis un onglet Claude Code
Pour une équipe TypeScript ou JavaScript qui câble un assistant IA ou une boucle d'agent à un signal web frais, le chemin pratique vers Staan est court. Le service Answer a un SDK first-party sur github.com/Qwant/answer-node, la surface couvre les réponses streamées et non streamées, le format de réponse est JSON, et la licence est permissive. Les niveaux Web Search et Web Search for AI sont des endpoints HTTP uniques qui retournent du JSON, et le même appel fetch qu'une équipe utiliserait pour parler à Tavily ou Brave Search fonctionne contre Staan sans traitement spécial. Le gap de la carte bancaire signifie que les premiers 1 à 2 € d'usage doivent être coordonnés avec une conversation commerciale, ce qui est une friction réelle pour un side project solo mais pas pour une équipe qui fait déjà un onboarding fournisseur. La question pratique la plus grosse est de savoir si l'index est assez bon pour le workflow que l'équipe a en tête, et la bonne manière d'y répondre est de lancer un benchmark sur le cas d'usage réel, pas de lire la page marketing.
La deuxième question pratique est de savoir s'il faut désactiver le fallback américain, et la bonne réponse dépend de ce que fait l'équipe. Pour un pipeline RAG interne sur du contenu web public, le fallback peut rester activé, et la posture de confidentialité est celle que la FAQ décrit. Pour un pipeline qui est sous un accord formel de traitement de données avec un client entreprise européen, le fallback doit être désactivé, le trou de couverture doit être mesuré, et l'équipe doit prévoir soit de vivre avec, soit de le combler avec une seconde source. Pour un pipeline qui est livré à un acheteur du secteur public dans un pays avec des exigences de résidence, le fallback n'est pas une option, et la conversation d'approvisionnement doit se faire directement avec EUSP, pas avec la console en libre-service.
Ce qu'il faut surveiller
Pour les deux prochaines semaines, les signaux qui comptent sont : est-ce que l'équipe EUSP publie une page de statut API publique et la première vague de benchmarks indépendants ; est-ce qu'un outil de codage IA non européen (un concurrent de Claude Code, un rival de Cursor, un fork de Continue) livre Staan comme backend ; est-ce que Qwant publie un flux de paiement par carte en libre-service et un SDK public pour le niveau Web Search ; est-ce que Mistral publie une mise à jour de Mistral Small qui a un impact de latence mesurable sur le service Answer ; est-ce que le gap « pas de SLA, pas de SecNumCloud » est comblé ou explicitement repoussé à une roadmap future ; est-ce qu'un concurrent américain publie un niveau « résidence européenne des données » comparable en réponse ; et est-ce que le fallback américain reçoit un nom, une page de statut publique propre, ou un plan de retrait à mesure que l'index EUSP grandit. Les 72 premières heures diront si le lancement est un vrai produit ou un événement marketing. Les 30 premiers jours diront si l'index est assez bon pour garder les early adopters qui l'essaient.
Pour une équipe TypeScript ou JavaScript qui route déjà une surface IA vers Tavily, Exa, Brave, ou un vide en forme de Bing, le mouvement pratique est de passer un après-midi à swapper Staan sur un workflow secondaire, mesurer la qualité des réponses sur les requêtes qui comptent, et décider si les 1 à 2 € pour 1 000 appels valent la résidence européenne des données et le flux de paiement par carte manquant. Pour une équipe qui ne route encore vers aucune API de recherche, le mouvement est de commencer par Web Search au niveau à 1 €, lancer quelques centaines de requêtes réelles, et passer à Web Search for AI ou AI Answer seulement une fois que la couverture de base est assez bonne pour justifier le prix.
L'histoire n'est pas terminée. La question intéressante n'est pas de savoir si une entreprise européenne peut construire une API de recherche ; les équipes Qwant et Ecosia font ça depuis des années. La question intéressante est de savoir si une entreprise européenne peut construire une API de recherche qu'un agent IA, tournant sur un modèle de langage hébergé aux US, adoptera par défaut. La réponse, dans les 24 premières heures du libre-service, ressemble plus à « oui, pour les requêtes qui comptent » qu'à « non, mais c'est un bel effort ». C'est une réponse différente de celle qui aurait été vraie en 2024, et c'est une réponse différente de ce que la retraite américaine des API suggérerait si la retraite avait été la seule histoire.



