Startseite / KI
KI

Chinas KI-Preiskrieg macht Modell-APIs zur Ware

Chinas KI-Preiskrieg macht Modell-APIs zur Ware
← Alle Beiträge

Der auffälligste Teil an Chinas jüngster KI-Preissenkungsrunde ist nicht die einzelne Zahl. 99 Prozent weniger klingt extrem, aber solche Rabatte sagen allein wenig aus. Interessanter ist, dass gleich mehrere große Anbieter fast gleichzeitig in dieselbe Richtung gehen: ByteDance, Tencent, MiniMax, Alibaba und Xiaomi haben ihre Tokenpreise um 50 bis 99 Prozent gesenkt. DeepSeek reduzierte im selben Umfeld die Preise für sein V4-Pro-Modell dauerhaft um 75 Prozent. Baidu machte Ernie Speed und Ernie Lite für Geschäftsanwender kostenlos.

Das ist kein normaler Rabattzyklus. Es ist ein Hinweis darauf, dass sich der Markt für Modellzugang verändert. Nicht jedes Modell ist gleich, nicht jede API hat dieselbe Qualität, nicht jede Latenz ist akzeptabel. Aber der Abstand zwischen vielen Angeboten wird offenbar klein genug, dass Preis nun als Waffe taugt. Wer ein Modell nicht mehr klar über bessere Fähigkeiten verkaufen kann, verkauft es über geringere Kosten, bessere Einbindung oder schlicht über Reichweite.

Wenn Tokenpreise fallen, fällt auch die Aura

KI-Modelle wurden in den vergangenen Jahren gern wie proprietäre Hochtechnologie behandelt: teuer im Training, knapp in der Nutzung, schwer zu replizieren, strategisch aufgeladen. Diese Sicht war nicht völlig falsch. Große Modelle brauchen Kapital, Rechenzentren, Datenpipelines, Teams und Betriebserfahrung. Doch der API-Markt folgt einer anderen Logik als die Forschungsbühne. Dort zählt nicht, wer in einer Demo besser wirkt, sondern was ein Unternehmen pro Anfrage zahlt, wie stabil die Schnittstelle läuft und ob sich das System in bestehende Produkte einbauen lässt.

Genau hier wird der chinesische Preiskampf relevant. Xiaomi reduzierte die Preise für sein MiMo-V2.5-Modell im Mai 2026 um bis zu 99 Prozent. Tencent senkte auf seiner TokenHub-Plattform die Preise für bestimmte bestehende Modelle, darunter Hy-MT2-Pro, um fast 70 Prozent. Alibaba bot im Rahmen des 618-Midyear-Sales-Events 50 Prozent Rabatt auf Qwen3.7-Max. ByteDance brachte Seedance 2.0 Mini, ein Video-Generierungsmodell, für 23 Yuan pro eine Million Tokens auf den Markt, etwa 3,40 US-Dollar, und damit zum halben Standardpreis.

Solche Schritte setzen ein Signal an Entwickler und Unternehmenskunden: Wartet nicht auf perfekte Modelle, baut mit den billigen. Für viele Anwendungen reicht ein gutes, schnelles und günstiges Modell aus. Kundendienst, interne Suche, einfache Agenten, Textklassifikation, Übersetzung, Assistenzfunktionen in Apps — in diesen Fällen entscheidet selten ein einzelner Benchmark. Entscheidend ist, ob die Rechnung bei hoher Nutzung aufgeht.

Der Wettbewerb wandert weg vom Modell

Die naheliegende Deutung lautet: Chinesische KI-Anbieter kämpfen aggressiv um Marktanteile. Das stimmt, bleibt aber zu grob. Der tiefere Punkt ist, dass der reine Modellzugang an Differenzierung verliert. Wenn mehrere Anbieter brauchbare Modelle liefern, wird die API zur Ware. Dann verschiebt sich der Wettbewerb zu den Schichten darüber und darunter.

Darunter liegt die Kostenstruktur: eigene Rechenkapazitäten, effizientere Inferenz, optimierte Modellarchitektur, Auslastung der Infrastruktur, Energiepreise, Hardwarezugang. Darüber liegen Distribution, Entwicklerwerkzeuge, Cloud-Verträge, Unternehmensintegration, App-Ökosysteme und bestehende Kundenbeziehungen. Wer dort stark ist, kann niedrigere Tokenpreise eher verkraften, weil der Modellzugang nicht das einzige Produkt bleibt.

Das erklärt, warum große Plattformunternehmen in einem Preiskampf anders stehen als kleinere Labs. ByteDance kann KI in bestehende Produkte und Werbeökosysteme ziehen. Alibaba hat Cloud-Kunden und Handelsinfrastruktur. Tencent hat Unternehmensdienste, Plattformzugänge und Entwicklerkanäle. Xiaomi kann KI als Teil eines Geräte- und Serviceumfelds behandeln. Für diese Akteure ist der Tokenpreis nicht nur Umsatzquelle, sondern auch Lockmittel. Für ein kleines Modell-Lab ohne vergleichbare Distribution ist derselbe Preisverfall deutlich gefährlicher.

Billige Inferenz macht mehr Anwendungen möglich

Der Preisverfall hat eine operative Seite, die in der Debatte oft unterschätzt wird. Viele KI-Anwendungen scheitern nicht an der grundsätzlichen Machbarkeit, sondern an den Stückkosten. Ein Prototyp mit wenigen Nutzern kann beeindruckend wirken. Bei Millionen Anfragen pro Tag wird er teuer. Wenn Inferenzkosten deutlich fallen, werden Anwendungen wirtschaftlich, die zuvor zu knapp kalkuliert waren.

Das betrifft vor allem Produkte mit hoher Wiederholungsfrequenz: automatisierte Moderation, Analyse großer Dokumentenmengen, personalisierte Lernsysteme, Video- und Bildfunktionen, interne Assistenten für Unternehmen. Nicht alle davon werden gut sein. Nicht alle brauchen ein großes Modell. Aber die Hürde sinkt. KI-Funktionen können in Software verschwinden, ohne dass jede einzelne Nutzung als Premiumereignis bepreist werden muss.

Für Entwickler ist das kurzfristig angenehm. Niedrigere API-Kosten verbessern Margen oder erlauben niedrigere Endpreise. Für Unternehmenskunden sinkt das Risiko, eine KI-Funktion erst einmal breiter zu testen. Für die Modellanbieter ist es unangenehmer. Sie müssen mehr Nutzung erzeugen, um denselben Umsatz zu erreichen, und gleichzeitig die Betriebskosten unter Kontrolle halten. Das ist ein klassischer Volumenmarkt: gut für Kunden, hart für Anbieter ohne Kostenvorteil.

Die Verlierer sind nicht nur kleine Labs

Der offensichtliche Verlierer sind kleinere chinesische KI-Unternehmen, die weder tiefe Kassen noch eigene Plattformen haben. Ein Markt, in dem Rabatte von 50, 70 oder 99 Prozent gesetzt werden, sortiert schnell. Wer Wachstum über teure Inferenz einkauft und keine zusätzliche Ertragsschicht besitzt, gerät unter Druck. Konsolidierung wäre keine Überraschung.

Doch der Druck endet nicht an Chinas Grenze. Westliche Anbieter wie OpenAI oder Anthropic werden nicht automatisch von chinesischen Preisen verdrängt. Ihre stärksten Märkte, Compliance-Anforderungen, Integrationen und Markenpositionen unterscheiden sich. Trotzdem verändert ein glaubwürdiger Niedrigpreisanker die Verhandlung. Unternehmenskunden fragen irgendwann, warum eine bestimmte Klasse von Aufgaben bei einem Anbieter ein Vielfaches kostet, wenn andere Modelle ausreichend gut arbeiten.

Das bedeutet nicht, dass Premium-Modelle verschwinden. Es bedeutet, dass der Markt stärker segmentiert. Für schwierige Aufgaben, hohe Zuverlässigkeit, komplexe Agentensysteme oder regulierte Umgebungen bleiben teurere Angebote plausibel. Für Standardaufgaben dagegen wird der Preisvergleich brutaler. Genau dort entsteht die Ware: nicht bei der besten Modellversion, sondern bei der Masse alltäglicher Anfragen.

KI wird nicht kostenlos, nur anders bezahlt

Die kostenlose Bereitstellung einzelner Modelle, wie bei Baidus Ernie Speed und Ernie Lite für Geschäftsanwender, klingt nach Entwertung. Tatsächlich ist sie eher eine Verschiebung der Bezahlung. Kosten verschwinden nicht. Rechenzentren, Chips, Strom, Personal und Wartung bleiben real. Wenn der API-Zugang billiger oder kostenlos wird, muss der Ertrag an anderer Stelle entstehen: Cloud-Nutzung, Unternehmensverträge, Werbung, Datenflüsse, Gerätebindung, Produktivitätspakete oder Marktanteile.

Das ist der Kern dieser Preissenkungen. Sie zeigen weniger eine neue Großthese über künstliche Intelligenz als eine nüchterne Marktphase: Modell-APIs rutschen in Richtung Infrastruktur. Infrastruktur kann profitabel sein, aber selten dauerhaft über Aura. Sie wird gemessen, verglichen, gedrückt und in Beschaffungstabellen eingetragen.

Für die großen chinesischen Anbieter kann das ein kalkulierter Angriff sein. Sie senken die Zugangskosten, erhöhen die Nutzung, binden Entwickler und zwingen schwächere Rivalen in die Defensive. Für den globalen Markt ist es ein Warnhinweis: Der Wert wandert weg vom bloßen Modellbetrieb. Wer nur Tokens verkauft, bekommt es mit sinkenden Margen zu tun. Wer Kontrolle über Distribution, Anwendungen und Kundenbeziehungen hat, kann denselben Preisverfall als Hebel nutzen.

Der Preiskampf macht KI nicht trivial. Aber er macht einen Teil des Geschäfts gewöhnlicher. Und genau das ist für viele Anbieter die unangenehmste Nachricht.

J

Über den Autor

Jens Könnig

Jens analysiert seit Jahren digitale Märkte, Preisbewegungen und Plattform-Strategien. Als Betreiber mehrerer datengetriebener Systeme wertet er täglich große Mengen an Produkt- und Trenddaten aus. Sein Fokus liegt auf Einordnung statt Hype: Was bedeutet eine Entwicklung wirklich für Nutzer, Preise und Märkte?

Alle Artikel von Jens Könnig →