Construire ou acheter, preuves à l’appui
Un copilote de démonstration est un projet de week-end. Un agent de production — qui agit sur votre API pour des utilisateurs finaux authentifiés, dans leur langue, sans fuite de données entre tenants — n’en est pas un. Voici le calcul, avec des sources nommées.
Ce que le niveau production inclut vraiment
L’écart entre la démo du week-end et quelque chose que vous pouvez mettre devant des clients, c’est exactement la partie qui n’apparaît jamais dans la démo :
- Authentification de l’utilisateur finalL’agent doit agir au nom de l’utilisateur connecté : vérification des jetons, scopes, confirmation renforcée. Les équipes rapportent que l’OAuth prend plus de temps que la logique des outils.
- Isolation des tenantsChaque requête, cache, log et métrique cloisonné par client — et démontrable, parce que les revues de sécurité de vos acheteurs poseront la question.
- Sûreté des actionsLes actions d’écriture et destructrices exigent des portes de confirmation appliquées côté serveur. Un agent qui supprime sans demander génère les tickets qu’il devait éviter.
- Multilingue, RTL comprisVos utilisateurs finaux ne lisent pas tous l’anglais. Prompts, interface et états d’erreur dans chaque langue de votre marché, avec des mises en page droite-à-gauche qui se reflètent vraiment.
- Évaluations et régressionsLes changements de modèle et de prompt exigent un harnais d’évaluation, sinon chaque mise à niveau est un pari pris en production.
- Correctifs de sécurité et entretienProtocoles de streaming, révisions de la spécification MCP, alertes de dépendances : la maintenance commence le jour où la démo se termine.
Les données d’échec publiées
- 95%
- des pilotes d’IA générative en entreprise n’atteignent pas la production.MIT NANDA, Aug 2025
- 17% → 42%
- d’abandon des initiatives IA, d’une année sur l’autre.S&P Global, 2025
- 40%
- des projets d’IA agentique annulés d’ici 2027, selon les prévisions.Gartner, Jun 2025
- 57%
- des acheteurs attendent un ROI de l’IA sous trois mois.G2, 2025
Le consensus du secteur situe le seuil de construction vers ~1M conversations par an — en dessous, acheter est le choix défendable. La plupart des équipes produit en sont très loin.
Le calcul de l’interne
Une construction interne commence par un ingénieur IA ($200K/an chargé, si vous arrivez à le recruter) plus les mois avant qu’une version sûre pour les clients soit livrée. Syncanix commence à $199/mo, tourne la même semaine, et chaque quota est publié.
Trois façons de facturer la même conversation
La forme du modèle tarifaire compte plus que le prix catalogue : le même utilisateur final, le même mois, trois factures très différentes.
| Modèle | Comment il facture | Le mois d’un utilisateur intensif | Prévisibilité de la facture |
|---|---|---|---|
| À la résolution | Chaque conversation résolue par l’IA est facturée — Intercom affiche Fin à 0,99 $ la résolution. | 12 conversations résolues facturent 12 fois — 11,88 $ pour ce seul utilisateur au tarif affiché. | Évolue avec le volume de conversations ; les tempêtes de relances et les boucles de clarification se retrouvent sur la facture. |
| À la conversation (contrats sur mesure) | Contrats enterprise à la conversation — Decagon ne publie pas ses tarifs. | Dépend du contrat ; les conditions de volume se négocient affaire par affaire. | Prévisible seulement après négociation ; pas de libre-service. |
| MAEU (Syncanix) | Un utilisateur final actif mensuel compte une fois, quel que soit son nombre de conversations. Paliers dès 199 $/mois avec quotas publiés de messages et d’actions. | 12 conversations d’un même utilisateur restent un seul MAEU. Les plafonds sont publiés ; le dépassement passe par des crédits prépayés, jamais une facture surprise. | Calculable sur un coin de table : utilisateurs × palier, avec plafonds visibles. |
Prix catalogue publiés mi-2026 ; l’arithmétique est illustrative. Les taux de résolution et la profondeur des conversations varient selon le produit — on compare ici des mécaniques tarifaires, pas des résultats.