Wenn Interessenten nach einem KI-Telefonagenten fragen, lautet die häufigste erste Frage: 'Was kostet das?' Die ehrliche Antwort: zwischen 30 € und 5.000 € pro Monat – und beide Zahlen können richtig sein. Dieser Guide schlüsselt alle Kostenkomponenten auf, erklärt die Preislogik der wichtigsten Plattformen und gibt konkrete Empfehlungen für typische KMU-Szenarien.
Die 4 Kostenkomponenten eines KI-Telefonagenten
Der Gesamtpreis setzt sich aus vier Blöcken zusammen, die oft vermischt werden:
- **Plattform-Lizenz:** Die monatliche Grundgebühr für die KI-Telefon-Infrastruktur (Retell AI, VAPI, Bland AI, ElevenLabs Conversational AI etc.)
- **Nutzungsgebühren:** Kosten pro Minute Gespräch oder pro Anruf – der größte variable Kostentreiber
- **Setup & Konfiguration:** Einmalige Kosten für die Einrichtung, Prompt-Engineering, Branchen-Trainings, Integration in Ihre Systeme
- **Laufende Optimierung:** Optionale monatliche Kosten für Anpassungen, Qualitätsmonitoring und Updates
Plattform-Vergleich: Retell AI vs. VAPI vs. Bland AI
| Kriterium | Retell AI | VAPI | Bland AI |
|---|---|---|---|
| Grundgebühr | 0 $/Monat | 0 $/Monat | 0 $/Monat |
| Preis/Minute | 0,07–0,15 $ | 0,05–0,12 $ | 0,09 $/Min (flat) |
| Stimmenqualität | Sehr gut (ElevenLabs) | Gut (mehrere Optionen) | Gut (eigene Stimmen) |
| Latenz | 600–900 ms | 500–800 ms | 400–700 ms |
| Deutsch | ✓ (sehr gut) | ✓ (gut) | ✓ (gut) |
| DSGVO/EU | US-Server, Addendum möglich | US-Server | US-Server |
| Beste für | Hohe Qualität, KMU | Entwickler, flexible API | Einfache Anwendungen |
Konkrete Preisbeispiele für typische KMU-Szenarien
Szenario 1: Handwerksbetrieb mit 80 Anrufen/Monat
- Ø Gesprächsdauer: 3 Minuten
- Gesamt: 240 Minuten/Monat
- Retell AI Nutzungskosten: 240 × 0,10 $ = 24 $/Monat ≈ 22 €
- Telefonummer (z.B. Twilio): 5 €/Monat
- **Gesamtkosten laufend: ~27 €/Monat + einmalig 499–999 € Setup**
Szenario 2: Arztpraxis mit 400 Anrufen/Monat
- Ø Gesprächsdauer: 2,5 Minuten
- Gesamt: 1.000 Minuten/Monat
- Retell AI Nutzungskosten: 1.000 × 0,10 $ = 100 $/Monat ≈ 92 €
- Zusatz: SMS-Terminbestätigung, EHR-Integration, Datenschutz-Addendum
- **Gesamtkosten laufend: ~180–250 €/Monat + einmalig 1.500–2.500 € Setup**
Szenario 3: Call-Center-Ersatz für E-Commerce (2.000 Anrufe/Monat)
- Ø Gesprächsdauer: 4 Minuten
- Gesamt: 8.000 Minuten/Monat
- Nutzungskosten: 8.000 × 0,10 $ = 800 $/Monat ≈ 740 €
- Plus: Shopify-Integration, CRM-Anbindung, Multi-Agenten-Setup
- **Gesamtkosten laufend: ~1.200–1.800 €/Monat + einmalig 3.000–6.000 € Setup**
Was steckt im Setup-Preis?
Viele Anbieter locken mit niedrigen Monatsbeiträgen und hohen Setup-Kosten. Was ist gerechtfertigt, was übertrieben?
- **Prompt-Engineering (200–800 €):** Der Agent muss lernen, wie Ihr Betrieb kommuniziert, welche Fragen er bekommt, wie er antwortet. Dieses Wissen muss sorgfältig in Prompts übersetzt werden.
- **Telefonummer-Integration (50–200 €):** Ihre bestehende Nummer umleiten oder eine neue einrichten – technische Arbeit, aber überschaubar.
- **Systemintegration (500–3.000 €):** CRM, Kalender, Branchensoftware anbinden – das ist der größte Setup-Kostentreiber und der größte Wertbringer.
- **Stimmen-Training (100–500 €):** Eigene Stimme klonen oder Standardstimmen anpassen – optional, aber professionell.
- **Testphase & Optimierung (300–1.000 €):** 2–4 Wochen echte Anrufe mit Qualitätsmonitoring und Nachbesserung.
Versteckte Kosten – die niemand nennt
Diese Kostenpositionen tauchen in keinem Anbieter-Pricing auf, entstehen aber in der Praxis:
- **Qualitätsmonitoring:** Jemand muss regelmäßig Gespräche abhören und den Agenten verbessern. 2–4 Stunden/Monat, Wert: 200–400 €.
- **Fehlerbehandlung:** Wenn der Agent eine Anfrage falsch bearbeitet, muss ein Mensch eingreifen. Plan: ~5% der Anrufe brauchen Nachbearbeitung.
- **Prompt-Updates:** Wenn sich Ihre Preise, Leistungen oder Prozesse ändern, muss der Agent aktualisiert werden.
- **Datenschutz-Compliance:** DSGVO-Dokumentation, Datenschutzhinweis am Gesprächsbeginn, Aufbewahrungsfristen für Transkripte – alles muss rechtlich sauber sein.
Vergleich KI-Telefonagent vs. menschliche Rezeptionistin
| Kriterium | KI-Telefonagent | Teilzeit-Rezeptionistin (20h/Wo) |
|---|---|---|
| Monatliche Kosten | 50–500 € | 2.400–3.200 € (inkl. Sozialabgaben) |
| Verfügbarkeit | 24/7, 365 Tage | Mo–Fr, 9–17 Uhr |
| Antwortzeit | Sofort (0 Sekunden Wartezeit) | Variable Wartezeiten |
| Krankheitsausfälle | Keine | Durchschnitt 15 Tage/Jahr |
| Komplexe Fragen | Begrenzt – Übergabe nötig | Voll geeignet |
| Einarbeitung | 2–4 Wochen Setup | 4–8 Wochen Einarbeitung |
| Skalierbarkeit | Unbegrenzt (Kosten skalieren linear) | Neue Stelle nötig |
Für wen lohnt sich welches Modell?
- **Unter 50 Anrufe/Monat:** KI-Einstiegspaket (ab 299 €/Monat komplett) lohnt sich bereits gegenüber menschlicher Kraft.
- **50–200 Anrufe/Monat:** Hybrid-Modell optimal: KI für 80% der Routineanrufe, Mensch für 20% komplexe Fälle.
- **Über 200 Anrufe/Monat:** KI-First mit strukturiertem Human-Handoff. ROI innerhalb von 3 Monaten realistisch.
- **Hochsensible Branchen (Arzt, Anwalt, Therapie):** DSGVO-konforme Lösungen mit On-Premise-Option oder Private-Cloud, Mehrkosten ca. +30%.
Unser Fazit: Was Sie wirklich bezahlen sollten
Ein ehrliches All-in-Paket für einen mittelgroßen KMU-Betrieb liegt bei 300–600 €/Monat laufend plus 1.000–2.500 € einmaligem Setup. Wer deutlich unter oder über diesen Werten liegt, sollte genau prüfen, was im Paket enthalten ist – und was nicht.
