Zum Inhalt springen

Header

Zur Übersicht von Play SRF Audio-Übersicht

Das Ende des Hypes? KI frisst immer mehr vom Firmenbudget

Der Einsatz von Künstlicher Intelligenz wird für Firmen immer teurer. Wieso das so ist und was dagegen unternommen wird.

Im April ging ein Ruck durch die Tech-Branche als Uber verkündete, sein gesamtes KI-Jahresbudget in weniger als vier Monaten aufgebraucht zu haben. Nun hat die Firma ihre Bestenliste der Mitarbeitenden mit der meisten KI-Nutzung durch eine KI-Obergrenze ersetzt.

Der Fall illustriert einen breiteren Stimmungsumschwung:

Immer besser, immer teurer, immer öfter genutzt

Hintergrund sind steigende Kosten für die KI-Nutzung. Alle paar Wochen erscheinen neuere, stärkere Modelle, die auch teurer sind. Claude Opus 4.8 zum Beispiel kostete fast 1.7-mal mehr als sein Vorgänger. Gleichzeitig werden die Modelle, da sie immer besser werden, für immer mehr und immer komplexere Aufgaben eingesetzt.

Herrscht bald «Kostenwahrheit»?

Box aufklappen Box zuklappen

KI-Firmen wie OpenAI (ChatGPT), Anthropic (Claude) und Microsoft (Copilot) machen mit dem Verkauf von KI noch kein Geld: Sie stecken ein Vielfaches der Einnahmen in die Weiterentwicklung der Modelle.

Das kann nicht ewig so weitergehen. Irgendwann müssen die Unternehmen ihre Kosten decken, indem sie ihre Dienste zum «wahren» Preis anbieten. Noch sind sie davon jedoch weit entfernt.

Ganz zu schweigen von den Kosten, die nicht für die Unternehmen selbst, sondern für die breitere Gesellschaft anfallen – zum Beispiel in Form von Umweltschäden.

Auch aus diesem Grund sind KI-Anbieter weniger bereit, «Flatrate»-Abos anzubieten, und verrechnen Kosten häufiger pro effektiver Nutzung. OpenAI zum Beispiel sagte, unlimitierte Abos ergäben heute schlicht keinen Sinn mehr.

«Tokenmaxxing» war gestern

Uber ist nicht die einzige Firma, die wegen steigender KI-Preise gerade ein böses Erwachen erlebt: Eine Analyse von Wired und AlphaStreet zeigt, dass dreimal so viele Firmen «AI Token» in ihren Quartalsberichten erwähnen wie noch vor einem Jahr.

Herrschte gerade noch Euphorie um das sogenannte «Tokenmaxxing», bei dem die Angestellten angehalten wurden, möglichst viel KI zu verwenden, rückt nun plötzlich die Kostenkontrolle in den Fokus. Der CEO von OpenAI, Sam Altman, sagte Anfang Juni, er sei überrascht, wie schnell die Stimmung umgeschlagen habe.

Neuer Fokus: «Tokenomics»

Das Abschaffen von Leaderboards und das Einführen von Nutzungslimiten für die Mitarbeitenden war erst der Anfang: Unter dem Namen «Tokenomics» entstehen derzeit Methoden, um KI-Kosten zu erfassen und zu reduzieren.

Tokens: Wie wird KI-Nutzung verrechnet?

Box aufklappen Box zuklappen

Künstliche Intelligenz bricht jede Anfrage in mehrere «Token» herunter.

Dabei entspricht ein Wort einem bis zwei Token. So besteht die Frage «Was ist die Hauptstadt der Schweiz?» zum Beispiel aus neun Token, da «Hauptstadt» und «Schweiz» aus zwei Token bestehen und auch das Fragezeichen ein Token verbraucht – zumindest bei GPT-4, denn jedes Modell macht eine andere Aufteilung.

Variable Preise und Arbeitsweisen

Jedes Token, das eingegeben wird, hat einen bestimmten Preis – bei GPT-4o waren es im Mai 2.50 US Dollar pro Million «Input»-Token. Und auch jedes Token, das als Antwort zurückkommt, hat seinen Preis. Dieser ist deutlich höher, da aufwändiger: bei GPT-4o zum Beispiel 10 USD pro Million «Output»-Token.

Durch diese Preisberechnung ist es schwierig, die Kosten einer Anfrage im Voraus zu berechnen: Erst einmal muss man wissen, in wie viele Tokens jedes Modell jeden Satz aufteilt. Und dann müsste man vorhersehen können, wie lang die Antwort ist, die man zurückbekommt.

Abgesehen davon kann eine Antwort immer auch falsch oder nicht zufriedenstellend sein – und man muss noch einmal fragen.

Kaum absehbare Zusatzkosten

Bei Agenten, die nicht nur antworten, sondern Aufgaben erledigen, kommen weitere Unsicherheiten hinzu – manchmal greifen sie zum Beispiel auf Tools und APIs zu, die etwas kosten.

Und schliesslich kostet der Einsatz von KI auch Ressourcen: Strom, Daten und Rechenpower.

Eine Strategie ist das «Routing», bei dem für jede Aufgabe das günstigste Modell gewählt wird, das die Aufgabe zufriedenstellend erledigen kann. Denn nutzt man immer das neueste und stärkste Modell, ist es, als würde man einen Professor nach Schreibfehlern suchen lassen: unnötig teuer. Auch kleinere Modelle und Open-Source-Lösungen dürften häufiger zum Zug kommen.

Eine weitere Strategie sind kürzere Anfragen: Wie viel Information muss die KI wirklich haben, um eine Aufgabe zu lösen? Müssen immer mehrere Seiten Kontext und Anweisungen mitgeschickt werden? Kann man das bisherige Gespräch auch in zusammengefasster Form mitliefern?

Sinken die Kosten bald wieder?

Box aufklappen Box zuklappen

Tiefere Preise

Der «Token Spending Index» von Silicon Data zeigt bereits fallende Preise seit einem Höchstpunkt im Mai, und auch Seeking Alpha sieht nach der Verdoppelung seit letztem Dezember eine Entspannung.

Gründe dafür könnte die gesunkene Nachfrage von Techgiganten sein, die ihre KI-Nutzung wegen der hohen Kosten reduzieren, die Konkurrenz von günstigen Modellen wie jenen von DeepSeek and Xiaomi und der Wettbewerb unter den grossen Modellen, gerade im Vorfeld der IPOs von OpenAI und Anthropic.

Ausserdem sollen noch dieses Jahr effizientere KI-Modelle erscheinen dank besseren GPUs, die derzeit installiert werden.

Höhere Kosten

Allerdings bedeuten tiefere Preise pro Token nicht automatisch tiefere KI-Ausgaben: Wenn etwas günstiger wird, wird es mehr genutzt. Und je besser die Modelle werden, desto mehr und desto komplexere (und teurere) Aufgaben können sie erledigen.

Analysten von Bain and Co. stellen diesen Effekt bereits fest: Im Verlauf des letzten Jahres hätten sich die Token-Preise zwar halbiert, die Anzahl genutzter Tokens habe sich aber mehr als vervierfacht.

Zu den technischeren Ansätzen gehören «Batching», bei dem mehrere Anfragen zusammen geschickt werden, «Caching», bei dem ähnliche Abfragen günstiger beantwortet werden, und «Off-Peak Pricing», bei dem weniger dringende Anfragen erst gesendet werden, wenn sonst wenige Anfragen anfallen.

Ausblick unklar

Und nicht zuletzt wird es Zeit, die strategische Kosten-Nutzen-Analyse anzugehen – auch wenn die Kosten volatil und der Nutzen schwer zu messen ist.

Eine Umfrage von McKinsey zeigt: 94 Prozent der Unternehmen haben bisher keinen signifikanten Nutzen realisieren können. Unternehmensleitungen müssen sich nun fragen: Wie viel bringt der KI-Einsatz wirklich? Und an welcher Stelle macht er Sinn?

Wo steht die Schweiz? Drei Fragen an KI-Berater Marc Peter

Box aufklappen Box zuklappen
Lächelnder Mann in einem Anzug vor hellem Hintergrund.
Legende: zVg

Marc Peter ist Professor für Digital Business an der HES-SO Fachhochschule Westschweiz und bei Rochester-Bern Executive Programs. Daneben ist er als KI-Berater im engen Austausch mit Schweizer Firmen.

SRF: Erleben auch Schweizer Firmen gerade einen KI-Kostenschock?

Marc Peter: Weil es heute noch ein Ausprobieren ist, fallen diese Kosten noch nicht so hoch aus. Die Mehrheit der Firmen nutzt KI, um einzelne Büroaufgaben und Prozesse zu optimieren.

Werden KI-Kosten trotzdem auch bei hiesigen Firmen zum Thema?

Die Kostenthematik wird jetzt besprochen, es werden aber noch wenige Massnahmen umgesetzt, um die Kosten zu reduzieren.

Was sollten Schweizer Firmen tun, um sich auf steigende KI-Kosten vorzubereiten?

Die Fragen sollten eigentlich nicht bei den Kosten beginnen. Firmen sollten zuerst starten mit der Strategie: Wofür und wo nutzen wir KI. Dann die Frage der Infrastruktur: Wo hosten wir es. Und dann kommt die finanzielle Frage.

Radio SRF 1, Rendez-vous, 3.7.2026, 12:30 Uhr

Meistgelesene Artikel