AI Industry2026-06-06
TechCrunch AI
Branche kämpft mit den explodierenden Token-Kosten der KI
Die KI-Branche erlebt ein schmerzhaftes, aber notwendiges Erwachen. Nach Jahren einer „Schnell voran und Dinge kaputt machen“-Mentalität bemühen sich Unternehmen nun, die außer Kontrolle geratenen Kosten zu bewältigen, die mit großen Sprachmodellen verbunden sind. Der Übeltäter? Token-Rechnungen, die weit über die ursprünglichen Prognosen hinaus eskalieren und einen grundlegenden Strategiewechsel von reiner Innovation hin zu Kostenkontrolle und Nachhaltigkeit erzwingen.
Jede Interaktion mit einem großen Sprachmodell verbraucht Token – die grundlegenden Texteinheiten, die das Modell verarbeitet. Während eine einzelne Abfrage nur Bruchteile eines Cents kosten mag, summieren sich diese Kosten im großen Maßstab schnell. Unternehmen, die beliebte KI-Funktionen eingeführt haben, stehen nun vor monatlichen Rechnungen in Millionenhöhe, die die Gewinnmargen schmälern und in einigen Fällen ganze Produktlinien unrentabel machen. Das Problem wird dadurch verschärft, dass Nutzer oft lange, mehrteilige Gespräche führen, die jeweils Tausende von Token verbrauchen.
Die Reaktion der Branche ist vielschichtig. Erstens gibt es einen Run auf die Optimierung von Modellen für mehr Effizienz. Techniken wie Quantisierung, Pruning und Destillation werden eingesetzt, um die Rechenkosten pro Token zu senken, ohne allzu große Einbußen bei der Qualität hinzunehmen. Zweitens führen Unternehmen strengere Schutzmaßnahmen und Nutzungsrichtlinien ein. Dazu gehören die Begrenzung der Antwortlänge, die Deckelung der Anzahl kostenloser Abfragen und der Einsatz günstigerer, kleinerer Modelle für einfachere Aufgaben.
Drittens gibt es ein wachsendes Interesse an alternativen Architekturen, wie z. B. Mixture-of-Experts-Modellen (MoE), die für jede Abfrage nur eine Teilmenge der Parameter aktivieren und so die Kosten drastisch senken. Der Wandel von einer „Schnell-voran“- zu einer „Intelligent-voran“-Mentalität verändert die KI-Landschaft. Die Gewinner in der nächsten Phase der KI werden nicht unbedingt diejenigen mit den leistungsstärksten Modellen sein, sondern diejenigen, die nützliche KI-Erlebnisse zu Kosten liefern können, die einen nachhaltigen, langfristigen Geschäftsbetrieb ermöglichen. Die Ära der kostenlosen, unbegrenzten KI geht zu Ende und wird durch einen pragmatischeren, kostenbewussteren Ansatz ersetzt.