OpenAI hat gemeinsam mit Broadcom seinen ersten eigenen KI-Beschleuniger vorgestellt. Der Chip trägt den Namen „Jalapeño“ und wurde speziell für große Sprachmodelle entwickelt. Während sich viele Diskussionen in der KI-Branche auf neue Modelle konzentrieren, könnte diese Ankündigung langfristig deutlich wichtiger sein als die Veröffentlichung eines einzelnen GPT-Nachfolgers.
Der neue Prozessor wurde nicht für das Training von KI-Systemen entwickelt, sondern für die sogenannte Inferenz. Genau dort entstehen die Kosten, wenn Nutzer eine Anfrage an ChatGPT senden, ein KI-Agent Aufgaben ausführt oder Unternehmen die OpenAI-API nutzen. Jeder erzeugte Token kostet Rechenleistung, Strom und Infrastrukturkapazität.
OpenAI greift Nvidia indirekt an
Bis heute basiert ein großer Teil der KI-Infrastruktur auf Hardware von Nvidia. Die GPUs des Unternehmens gelten als Standard für Training und Betrieb moderner KI-Systeme. Mit Jalapeño beginnt OpenAI nun damit, einen Teil dieser Abhängigkeit zu reduzieren.
Der Chip wurde laut OpenAI von Grund auf für aktuelle und zukünftige LLMs entwickelt. Statt einer universellen Architektur setzt das Design auf die Anforderungen moderner Sprachmodelle. Dazu gehören Speicherzugriffe, Netzwerkkommunikation, Token-Generierung und die Verarbeitung großer Kontextfenster.
OpenAI spricht von einer Architektur, die deutlich näher an der theoretisch möglichen Maximalleistung arbeiten soll als aktuelle Systeme. Ziel ist es, den Energieverbrauch pro Anfrage zu senken und gleichzeitig die verfügbare Rechenleistung besser auszunutzen.
Neun Monate vom Entwurf bis zur Fertigung
Besonders bemerkenswert ist die Geschwindigkeit der Entwicklung. OpenAI und Broadcom geben an, den Weg vom ersten Design bis zum Tape-Out in nur neun Monaten geschafft zu haben. Für einen modernen Hochleistungs-ASIC wäre das außergewöhnlich schnell.
Nach Angaben der Unternehmen kamen dabei auch OpenAI-Modelle zum Einsatz. Die eigene KI half bei Optimierungsprozessen und technischen Entwicklungsaufgaben. Damit entsteht ein Kreislauf, bei dem KI-Systeme die Hardware beschleunigen, auf der zukünftige KI-Systeme laufen werden.
Ob diese Entwicklungszeit tatsächlich einen Branchenrekord darstellt, wird sich zeigen. Die Größenordnung verdeutlicht jedoch, wie stark KI inzwischen auch klassische Hardwareentwicklung beeinflusst.
Warum Inferenz inzwischen wichtiger wird als Training
Die öffentliche Aufmerksamkeit konzentriert sich häufig auf das Training neuer Modelle. Wirtschaftlich wird jedoch die Inferenz immer bedeutender. Millionen Nutzer erzeugen täglich Milliarden von Anfragen. Jede kleine Effizienzsteigerung wirkt sich unmittelbar auf die Kostenstruktur aus.
Ein Sprachmodell, das zehn Prozent günstiger betrieben werden kann, spart bei globalem Einsatz enorme Summen. Werden die Einsparungen größer, entstehen Spielräume für leistungsfähigere Modelle, längere Kontexte und niedrigere API-Preise.
Genau an diesem Punkt setzt Jalapeño an. OpenAI versucht nicht nur bessere Modelle zu entwickeln, sondern die gesamte Infrastruktur hinter diesen Modellen zu optimieren.
Gigawatt-Rechenzentren als nächster Schritt
Eine der interessantesten Aussagen der Ankündigung betrifft den geplanten Einsatz im großen Maßstab. OpenAI spricht von einer mehrjährigen Plattformstrategie und Rechenzentren im Gigawatt-Bereich.
Diese Größenordnung liegt auf dem Niveau großer Kraftwerkskapazitäten. Der Bedarf zeigt, welche Infrastruktur künftig erforderlich sein wird, wenn KI-Assistenten, Agentensysteme und autonome Software weltweit im Alltag genutzt werden.
Gemeinsam mit Broadcom und dem Systempartner Celestica plant OpenAI eine mehrjährige Chip-Roadmap. Jalapeño soll dabei nur die erste Generation darstellen.
OpenAI wird zum Infrastrukturunternehmen
Die eigentliche Bedeutung der Ankündigung liegt möglicherweise nicht im Chip selbst. Sie zeigt, wie sich OpenAI strategisch verändert.
Das Unternehmen entwickelt längst nicht mehr nur Sprachmodelle. Inzwischen kontrolliert OpenAI zunehmend den gesamten Technologie-Stack:
- KI-Modelle
- Agentensysteme
- Produkte wie ChatGPT und Codex
- Eigene Rechenzentrumsprojekte
- Eigene Hardware
- Eigene Infrastrukturplattformen
Dieser Ansatz erinnert an die Entwicklung großer Technologiekonzerne wie Google, die früh erkannten, dass langfristige Wettbewerbsvorteile nicht allein durch Software entstehen, sondern durch die Kontrolle der gesamten Infrastruktur.
Warum Jalapeño wichtiger sein könnte als das nächste GPT-Modell
Neue KI-Modelle erzeugen Schlagzeilen. Die wirtschaftliche Zukunft der Branche entscheidet sich jedoch zunehmend bei den Kosten pro Anfrage. Wer Intelligenz günstiger bereitstellen kann, gewinnt mehr Nutzer, kann leistungsfähigere Systeme betreiben und schneller skalieren.
Sollten sich die angekündigten Effizienzgewinne bestätigen, könnte Jalapeño deshalb deutlich mehr Einfluss auf die Zukunft von ChatGPT haben als die Veröffentlichung eines einzelnen neuen Modells.
Die KI-Branche bewegt sich damit in eine neue Phase. Der Wettbewerb findet nicht mehr nur bei den Modellen statt, sondern tief in der Infrastruktur. Genau dort hat OpenAI nun begonnen, eigene Akzente zu setzen.
📂
Kategorie
KI
Künstliche Intelligenz, große Sprachmodelle, Bildgeneratoren und was sie wirklich können – und was nicht.