zum Hauptinhalt springen

Bauen oder kaufen — mit Belegen

Ein Demo-Copilot ist ein Wochenendprojekt. Ein produktionsreifer Agent — der für authentifizierte Endnutzer auf Ihre API wirkt, in deren Sprache, ohne Datenlecks zwischen Tenants — ist keins. Hier ist die Rechnung, mit benannten Quellen.

Was Produktionsreife wirklich umfasst

Die Lücke zwischen der Wochenend-Demo und etwas, das Sie vor Kunden stellen können, ist genau der Teil, der in der Demo nie auftaucht:

  • Endnutzer-AuthentifizierungDer Agent muss als der angemeldete Nutzer handeln — Token-Prüfung, Scopes, Step-up-Bestätigung. Teams berichten, dass das OAuth länger dauert als die Tool-Logik.
  • Tenant-IsolationJede Abfrage, jeder Cache, jedes Log und jede Metrik pro Kunde abgegrenzt — und nachweisbar, denn die Sicherheitsprüfungen Ihrer Käufer fragen danach.
  • AktionssicherheitSchreibende und destruktive Aktionen brauchen serverseitig erzwungene Bestätigungen. Ein Agent, der ohne Rückfrage löscht, erzeugt die Tickets, die er verhindern sollte.
  • Mehrsprachig, inklusive RTLIhre Endnutzer lesen nicht alle Englisch. Prompts, Oberfläche und Fehlerzustände in jeder Marktsprache, mit Rechts-nach-links-Layouts, die wirklich spiegeln.
  • Evals und RegressionenModell- und Prompt-Änderungen brauchen ein Evaluierungs-Harness — sonst ist jedes Upgrade eine Wette in der Produktion.
  • Sicherheits-Patches und PflegeStreaming-Protokolle, MCP-Spezifikationsrevisionen, Abhängigkeits-Advisories — die Wartung beginnt an dem Tag, an dem die Demo endet.

Die veröffentlichten Fehlschlagdaten

95%
der GenAI-Piloten in Unternehmen erreichen nie die Produktion.MIT NANDA, Aug 2025
17% → 42%
Abbruchquote von KI-Initiativen, im Jahresvergleich.S&P Global, 2025
40%
der agentischen KI-Projekte werden laut Prognose bis 2027 eingestellt.Gartner, Jun 2025
57%
der Käufer erwarten KI-ROI innerhalb von drei Monaten.G2, 2025

Der Branchenkonsens legt die Selbstbau-Schwelle bei etwa ~1M Unterhaltungen pro Jahr an — darunter ist Kaufen die vertretbare Entscheidung. Die meisten Produktteams liegen weit darunter.

Die Eigenbau-Rechnung

Ein interner Aufbau beginnt mit einem KI-Engineer ($200K/Jahr Vollkosten, falls Sie einen einstellen können) plus den Monaten, bis etwas Kundensicheres ausgeliefert ist. Syncanix beginnt bei $199/mo, läuft in derselben Woche, und jedes Kontingent ist veröffentlicht.

Drei Arten, dieselbe Unterhaltung zu berechnen

Die Form des Preismodells zählt mehr als der Listenpreis: derselbe Endnutzer, derselbe Monat, drei sehr unterschiedliche Rechnungen.

Vergleich der Preismodelle pro Lösung, pro Unterhaltung und pro MAEU.
ModellSo wird abgerechnetDer Monat eines VielnutzersPlanbarkeit der Rechnung
Pro LösungJede KI-gelöste Unterhaltung wird berechnet — Intercom listet Fin mit 0,99 $ pro Lösung.12 gelöste Unterhaltungen werden 12-mal berechnet — 11,88 $ für diesen einen Nutzer zum Listenpreis.Skaliert mit dem Gesprächsvolumen; Retry-Stürme und Rückfrageschleifen landen auf der Rechnung.
Pro Unterhaltung (Individualverträge)Enterprise-Verträge pro Unterhaltung — Decagon veröffentlicht keine Preise.Hängt vom Vertrag ab; Volumenkonditionen werden pro Abschluss verhandelt.Planbar erst nach einer Verhandlung; kein Self-Service.
MAEU (Syncanix)Ein monatlich aktiver Endnutzer zählt einmal — egal, wie viele Unterhaltungen er führt. Tarife ab 199 $/Mon. mit veröffentlichten Nachrichten- und Aktionskontingenten.12 Unterhaltungen eines Nutzers bleiben ein MAEU. Limits sind veröffentlicht; Mehrverbrauch läuft über Prepaid-Guthaben, nie über eine Überraschungsrechnung.Auf dem Bierdeckel berechenbar — Nutzer × Tarif, mit sichtbaren Limits.

Veröffentlichte Listenpreise, Stand Mitte 2026; die Arithmetik ist illustrativ. Lösungsquoten und Gesprächstiefe variieren je Produkt — verglichen werden Preismechaniken, nicht Ergebnisse.

zurück zu den Preisenkostenlos starten