KI-Kosten: Der billige Zugang wird zur teuren Gewohnheit

Rohtext Redaktion

· 20. Juni 2026 · 6 Min. Lesezeit

KI-Kosten: Der billige Zugang wird zur teuren Gewohnheit

← Alle Beiträge

Die erste Phase der Unternehmens-KI war großzügig. Werkzeuge wurden freigeschaltet, Teams sollten ausprobieren, Führungskräfte wollten Tempo sehen. Wer bremste, wirkte schnell wie jemand, der den Anschluss verpasst. Nun folgt die weniger laute, aber wichtigere Phase: Zugriff wird begrenzt, Modelle werden abgestuft, Lizenzen gestrichen, Budgets nachgezogen.

Amazon, Walmart, Cisco, Uber und Meta gehören zu den Unternehmen, die inzwischen Obergrenzen einführen, verschwenderische Nutzung eindämmen oder Mitarbeiter auf günstigere Modelle lenken. Das ist keine Abkehr von KI. Es ist eine Korrektur der Annahme, dass sich der breite Einsatz schon irgendwie rechnen werde, wenn nur genug Menschen die Werkzeuge nutzen.

Der entscheidende Punkt ist nicht, dass KI teuer ist. Teure IT ist für Großunternehmen nichts Neues. Der Punkt ist, dass KI-Kosten anders laufen als klassische Softwarekosten. Sie steigen mit jeder Anfrage, jeder Codeanalyse, jedem Agentenlauf, jedem internen Experiment. Was früher eine Lizenzfrage war, wird zur Verbrauchsfrage. Und Verbrauch ist in großen Organisationen schwerer zu kontrollieren als ein Vertrag.

Die neue Kostenstelle spricht in Tokens

Großunternehmen geben im Schnitt rund 11,6 Millionen Euro pro Jahr für KI-Modelle aus. Im Jahr 2024 waren es noch etwa 4,5 Millionen Euro. Der Sprung zeigt, wie schnell aus Pilotprojekten operative Infrastruktur geworden ist. Gleichzeitig verschiebt sich die Abrechnung. Anbieter wie Anthropic und OpenAI haben Dienste stärker von Pauschalen in Richtung tokenbasierter Modelle bewegt. Abgerechnet wird dann nicht mehr nur der Zugang, sondern die verarbeitete Datenmenge.

Das klingt zunächst fair: Wer mehr nutzt, zahlt mehr. In der Praxis ist es komplizierter. Viele Beschäftigte sehen nicht, was eine Anfrage intern kostet. Ein langer Prompt, ein großes Kontextfenster, ein mehrfach wiederholter Agentenlauf: Für den Nutzer wirkt das wie normale Arbeit. Für das Budget ist es Rechenzeit, Speicher, Modellzugriff und Infrastruktur.

Die Kosten pro Million Tokens sind seit Ende 2022 zwar um 98 Prozent gesunken, von 20 Dollar auf rund 0,40 Dollar. Normalerweise wäre das ein starkes Argument für Entspannung. Doch die Nutzung hat sich verändert. Neue agentische Systeme verbrauchen im Schnitt 18,6-mal mehr Tokens als ihre Vorgänger. Sie planen, prüfen, rufen Werkzeuge auf, schreiben Zwischenschritte, korrigieren sich selbst. Der einzelne Token wird billiger, aber der Prozess frisst mehr davon.

Damit entsteht ein Muster, das Cloud-Abteilungen seit Jahren kennen: Effizienzgewinne auf Einheitsebene werden vom Wachstum der Nutzung aufgezehrt. Nur passiert es bei KI schneller, weil die Werkzeuge direkt an Wissensarbeit, Softwareentwicklung, Support, Analyse und interne Prozesse angeschlossen werden.

Der Fall Uber ist ein Warnsignal

Uber hatte sein gesamtes KI-Budget für 2026 bereits im April aufgebraucht. Das ist kein kleines Controlling-Problem, sondern ein Hinweis auf fehlende Steuerbarkeit. Wenn ein Jahresbudget nach wenigen Monaten verbraucht ist, stimmt nicht nur die Prognose nicht. Dann fehlt oft auch die operative Bremse zwischen Nutzung und Rechnung.

Ein besonders grobes Beispiel zeigt, wie weit das gehen kann: Ein nicht näher bezeichnetes Unternehmen gab laut Axios 500 Millionen US-Dollar in einem einzigen Monat aus, weil Mitarbeiter unbegrenzten Zugang zu Anthropics Claude ohne Nutzungsobergrenzen hatten. Der Fall ist extrem. Aber gerade deshalb ist er aufschlussreich. KI-Zugriff ohne Grenzen ist in großen Organisationen keine Freiheit, sondern ein offener Kostenkanal.

Microsofts Entscheidung, bis Ende Juni Claude-Code-Lizenzen für tausende Ingenieure zu kündigen und stattdessen auf das hauseigene GitHub Copilot zu setzen, passt in dasselbe Bild. Es geht nicht nur um Modellqualität. Es geht um Beschaffung, Kontrolle, Bündelung, Vertragsmacht und interne Standardisierung. Wer eigene Werkzeuge im Konzern hat, kann Kosten anders verlagern und Nutzung enger führen.

Die Effizienzrechnung bleibt dünn

Die Gegenrechnung ist bisher weniger überzeugend, als viele Präsentationen vermuten ließen. Laut einer Bain-&-Company-Studie aus dem Jahr 2026 erzielten fast 40 Prozent der Unternehmen, die Kosteneinsparungen durch KI-Projekte gemessen haben, weniger als 10 Prozent Einsparungen. Angepeilt hatten sie 11 bis 20 Prozent. Das heißt nicht, dass KI keinen Nutzen bringt. Es heißt aber, dass der Nutzen seltener sauber, schnell und direkt auf der Kostenseite ankommt.

Viele Projekte verbessern Geschwindigkeit, Komfort oder Qualität einzelner Arbeitsschritte. Das ist real, aber betriebswirtschaftlich schwerer zu fassen als eingesparte Stellen, kürzere Entwicklungszyklen oder gesunkene Supportkosten. Wenn gleichzeitig Modellkosten, Infrastruktur, Schulung, Governance und Sicherheitsprüfungen steigen, wird aus der einfachen Effizienzerzählung eine anspruchsvolle Kostenrechnung.

Besonders heikel ist der Effekt auf Margen. 84 Prozent der Unternehmen verzeichnen einen Rückgang ihrer Bruttomargen um mehr als sechs Prozent allein durch Ausgaben für KI-Infrastruktur. Diese Zahl erklärt, warum Finanzabteilungen nun genauer hinsehen. KI ist nicht mehr nur ein Budgetposten für Experimente. Sie greift in die Ergebnisrechnung ein.

Wer gewinnt, wenn Nutzung begrenzt wird

Die Gewinner dieser Phase sind nicht zwingend die Anbieter mit den größten Modellen. Besser stehen jene da, die Unternehmen helfen, Verbrauch zu messen, Aufgaben auf passende Modellklassen zu verteilen und unnötige Anfragen zu vermeiden. KI-FinOps wird dadurch weniger ein Beratungsbegriff als eine operative Disziplin: Welche Teams dürfen welche Modelle nutzen? Wann reicht ein kleineres Modell? Welche Prompts erzeugen unnötig lange Ausgaben? Welche Agenten laufen zu oft im Kreis?

Auch kleinere, spezialisierte Modelle werden attraktiver. Nicht jede Aufgabe braucht ein großes Sprachmodell mit maximalem Kontextfenster. Klassifikation, Zusammenfassung, interne Suche, Formularverarbeitung oder einfache Codehilfen lassen sich oft günstiger abbilden. Unternehmen mit sauberer Datenarchitektur und geübter Cloud-Kostenkontrolle haben hier Vorteile. Sie müssen nicht erst lernen, dass Nutzung ohne Messung keine Strategie ist.

Verlierer sind Organisationen, die KI wie eine pauschale Bürosoftware behandeln. Noch stärker trifft es Anbieter, deren Geschäftsmodell darauf beruht, dass Kunden möglichst viel auf die teuersten Modelle schieben. Solange Budgets großzügig waren, fiel das weniger auf. Sobald Einkauf und Finanzabteilung eingreifen, wird Modellwahl zur Kostenentscheidung.

Der Kater ist kein Ende, sondern ein Filter

Es wäre zu einfach, aus den Kürzungen eine allgemeine KI-Ernüchterung abzuleiten. Viele Unternehmen erhöhen ihre KI-Budgets weiter, obwohl die erwarteten Einsparungen nicht überall eingetreten sind. Der Glaube an langfristigen Nutzen ist also nicht verschwunden. Er wird nur teurer geprüft.

Die eigentliche Veränderung liegt in der Machtverteilung innerhalb der Unternehmen. In der ersten Phase dominierten Produktteams, Entwickler, Strategen und Vorstände, die Nutzung ausweiten wollten. Jetzt kommen Controlling, Einkauf, Sicherheitsabteilungen und Infrastrukturteams stärker ins Spiel. Sie fragen nicht, ob ein Modell beeindruckt. Sie fragen, was ein Workflow pro Monat kostet, wer ihn verantwortet und ob ein günstigerer Weg reicht.

Damit wird KI normaler. Nicht kleiner, nicht harmloser, aber weniger entrückt. Sie rutscht aus der Sonderzone des Experiments in die Logik betrieblicher Infrastruktur. Dort gelten unangenehme Regeln: messen, begrenzen, priorisieren, abschalten.

Der Satz, man habe ein Monster geschaffen, ist als Bild verständlich. Präziser wäre: Unternehmen haben einen Verbrauchsmechanismus in ihre Arbeitsabläufe eingebaut, bevor sie seine Zähler richtig lesen konnten. Jetzt lernen sie, dass der Zugang zu KI nicht das Problem löst. Er erzeugt erst die nächste Frage: Welche Nutzung ist den Preis wert?

📂

Kategorie

Künstliche Intelligenz, große Sprachmodelle, Bildgeneratoren und was sie wirklich können – und was nicht.

Über den Autor

Jens Könnig

Jens analysiert seit Jahren digitale Märkte, Preisbewegungen und Plattform-Strategien. Als Betreiber mehrerer datengetriebener Systeme wertet er täglich große Mengen an Produkt- und Trenddaten aus. Sein Fokus liegt auf Einordnung statt Hype: Was bedeutet eine Entwicklung wirklich für Nutzer, Preise und Märkte?

Alle Artikel von Jens Könnig →