Bauen oder kaufen — mit Belegen
Ein Demo-Copilot ist ein Wochenendprojekt. Ein produktionsreifer Agent — der für authentifizierte Endnutzer auf Ihre API wirkt, in deren Sprache, ohne Datenlecks zwischen Tenants — ist keins. Hier ist die Rechnung, mit benannten Quellen.
Was Produktionsreife wirklich umfasst
Die Lücke zwischen der Wochenend-Demo und etwas, das Sie vor Kunden stellen können, ist genau der Teil, der in der Demo nie auftaucht:
- Endnutzer-AuthentifizierungDer Agent muss als der angemeldete Nutzer handeln — Token-Prüfung, Scopes, Step-up-Bestätigung. Teams berichten, dass das OAuth länger dauert als die Tool-Logik.
- Tenant-IsolationJede Abfrage, jeder Cache, jedes Log und jede Metrik pro Kunde abgegrenzt — und nachweisbar, denn die Sicherheitsprüfungen Ihrer Käufer fragen danach.
- AktionssicherheitSchreibende und destruktive Aktionen brauchen serverseitig erzwungene Bestätigungen. Ein Agent, der ohne Rückfrage löscht, erzeugt die Tickets, die er verhindern sollte.
- Mehrsprachig, inklusive RTLIhre Endnutzer lesen nicht alle Englisch. Prompts, Oberfläche und Fehlerzustände in jeder Marktsprache, mit Rechts-nach-links-Layouts, die wirklich spiegeln.
- Evals und RegressionenModell- und Prompt-Änderungen brauchen ein Evaluierungs-Harness — sonst ist jedes Upgrade eine Wette in der Produktion.
- Sicherheits-Patches und PflegeStreaming-Protokolle, MCP-Spezifikationsrevisionen, Abhängigkeits-Advisories — die Wartung beginnt an dem Tag, an dem die Demo endet.
Die veröffentlichten Fehlschlagdaten
- 95%
- der GenAI-Piloten in Unternehmen erreichen nie die Produktion.MIT NANDA, Aug 2025
- 17% → 42%
- Abbruchquote von KI-Initiativen, im Jahresvergleich.S&P Global, 2025
- 40%
- der agentischen KI-Projekte werden laut Prognose bis 2027 eingestellt.Gartner, Jun 2025
- 57%
- der Käufer erwarten KI-ROI innerhalb von drei Monaten.G2, 2025
Der Branchenkonsens legt die Selbstbau-Schwelle bei etwa ~1M Unterhaltungen pro Jahr an — darunter ist Kaufen die vertretbare Entscheidung. Die meisten Produktteams liegen weit darunter.
Die Eigenbau-Rechnung
Ein interner Aufbau beginnt mit einem KI-Engineer ($200K/Jahr Vollkosten, falls Sie einen einstellen können) plus den Monaten, bis etwas Kundensicheres ausgeliefert ist. Syncanix beginnt bei $199/mo, läuft in derselben Woche, und jedes Kontingent ist veröffentlicht.
Drei Arten, dieselbe Unterhaltung zu berechnen
Die Form des Preismodells zählt mehr als der Listenpreis: derselbe Endnutzer, derselbe Monat, drei sehr unterschiedliche Rechnungen.
| Modell | So wird abgerechnet | Der Monat eines Vielnutzers | Planbarkeit der Rechnung |
|---|---|---|---|
| Pro Lösung | Jede KI-gelöste Unterhaltung wird berechnet — Intercom listet Fin mit 0,99 $ pro Lösung. | 12 gelöste Unterhaltungen werden 12-mal berechnet — 11,88 $ für diesen einen Nutzer zum Listenpreis. | Skaliert mit dem Gesprächsvolumen; Retry-Stürme und Rückfrageschleifen landen auf der Rechnung. |
| Pro Unterhaltung (Individualverträge) | Enterprise-Verträge pro Unterhaltung — Decagon veröffentlicht keine Preise. | Hängt vom Vertrag ab; Volumenkonditionen werden pro Abschluss verhandelt. | Planbar erst nach einer Verhandlung; kein Self-Service. |
| MAEU (Syncanix) | Ein monatlich aktiver Endnutzer zählt einmal — egal, wie viele Unterhaltungen er führt. Tarife ab 199 $/Mon. mit veröffentlichten Nachrichten- und Aktionskontingenten. | 12 Unterhaltungen eines Nutzers bleiben ein MAEU. Limits sind veröffentlicht; Mehrverbrauch läuft über Prepaid-Guthaben, nie über eine Überraschungsrechnung. | Auf dem Bierdeckel berechenbar — Nutzer × Tarif, mit sichtbaren Limits. |
Veröffentlichte Listenpreise, Stand Mitte 2026; die Arithmetik ist illustrativ. Lösungsquoten und Gesprächstiefe variieren je Produkt — verglichen werden Preismechaniken, nicht Ergebnisse.