Meta bindet DDR4 per CXL in DDR5-Server ein

Rohtext Redaktion

· 04. Juli 2026 · 5 Min. Lesezeit

Meta bindet DDR4 per CXL in DDR5-Server ein

← Alle Beiträge

Meta adressiert einen Teil seines Speicherproblems nicht mit mehr DDR5, sondern mit alter Hardware. Das Unternehmen hat einen eigenen CXL-2.0-ASIC namens Vistara entwickelt, um DDR4-Module in Servern zu nutzen, die eigentlich auf DDR5 ausgelegt sind. Vorgestellt wurde die Architektur auf dem International Symposium on Computer Architecture 2026.

Der technische Punkt ist einfach, aber operativ relevant: Meta behandelt DDR4 nicht als gleichwertigen Ersatz für DDR5. Der langsamere Speicher wird als zusätzlicher Pool angebunden. Daten, die häufig gebraucht werden, bleiben im schnellen DDR5. Weniger häufig genutzte Daten landen im DDR4-Bereich. Damit steigt die Speicherkapazität pro Server, ohne dass Meta die gesamte Plattform auf neue DRAM-Module stützen muss.

Der Engpass liegt nicht nur bei Rechenleistung

KI-Inferenz wird oft über GPUs, Beschleuniger und Stromversorgung diskutiert. In großen Produktionsumgebungen ist Arbeitsspeicher aber ebenfalls ein harter Kosten- und Kapazitätsfaktor. Wenn Modelle, Caches, Batch-Verarbeitung und verteilte Jobs mehr Speicher benötigen, reicht zusätzliche Rechenleistung allein nicht aus. Server können nicht mehr sinnvoll ausgelastet werden, obwohl ihre Prozessoren noch arbeiten könnten, weil der verfügbare Speicher die Auslastung begrenzt.

Metas MemServer-Speicherpfad

Die Grafik zeigt, wie schneller DDR5-Speicher direkt am Server bleibt und DDR4 über Vistara als separater CXL-Speicherpool angebunden wird.

Metas MemServer-Konfiguration kombiniert nach den veröffentlichten Angaben eine AMD-Epyc-Turin-CPU mit 768 GB DDR5-6400 und 256 GB DDR4-2400. Zusammen ergibt das rund ein Terabyte Arbeitsspeicher pro Server. Der DDR4-Anteil wird über Vistara angebunden. Der Chip spricht auf der Host-Seite CXL 2.0 beziehungsweise CXL 1.1 über eine PCIe-Gen5-x16-Schnittstelle und bindet auf der anderen Seite die älteren DDR4-Module ein.

Das ist kein normaler Adapter im Verbrauchermarkt-Sinn. Die Lösung setzt voraus, dass Betriebssystem, Speicherverwaltung und Workload-Platzierung mit zwei unterschiedlich schnellen Speicherklassen umgehen. Genau darin liegt der Nutzen für einen Betreiber wie Meta: Die Plattform kann mehr Speicher adressieren, muss aber nicht so tun, als hätten alle Speicherbereiche dieselben Eigenschaften.

DDR4 wird zum kalten Speicherpool

Meta beschreibt den DDR4-Bereich als eigenständigen, CPU-losen NUMA-Knoten. Für die Software sieht der zusätzliche Speicher also nicht wie lokal angebundener Standard-RAM aus, sondern wie ein separater Speicherbereich mit anderen Zugriffsparametern. Die Speicherverwaltung kann dadurch entscheiden, welche Daten im schnellen DDR5 bleiben und welche in den langsameren DDR4-Pool verschoben werden.

Diese Trennung ist wichtig. DDR4-2400 ist deutlich langsamer als DDR5-6400. Würde ein Server wahllos auf beide Speicherklassen zugreifen, entstünden schwer planbare Latenzen. Metas Ansatz ist daher kein Versuch, alten Speicher als neuen Speicher zu verkaufen. Er ist eine Form von Speicher-Tiering. Heiße Daten bleiben nah am Prozessor. Kalte Daten werden ausgelagert, ohne auf Storage zurückzufallen.

Für KI-Inferenz kann das ausreichen, wenn ein Teil der Daten zwar im Arbeitsspeicher verfügbar sein muss, aber nicht permanent mit maximaler Bandbreite gebraucht wird. Genau dort können in großen Rechenzentren die praktischen Vorteile entstehen: weniger Fragmentierung, weniger Neustarts, bessere Packung von Jobs auf vorhandene Maschinen.

Die Einsparung entsteht im Betrieb

Meta gibt an, dass die Architektur die Zahl benötigter AI-Inferenzserver um bis zu 25 Prozent reduziert habe. Außerdem soll der Overhead durch Job-Neustarts und Fragmentierung um 33 Prozent gesunken sein. Diese Werte sind keine allgemeinen Marktkennzahlen, sondern Metas Angaben für die eigene Umgebung. Sie zeigen aber, wo der wirtschaftliche Hebel liegt.

Wenn ein Betreiber mehr nutzbaren Speicher pro Server bekommt, verändert sich die Auslastungsrechnung. Jobs müssen seltener verschoben oder neu gestartet werden, weil ein Speicherlimit erreicht wurde. Bestehende Maschinen können dichter belegt werden. Beschaffung, Rack-Fläche, Stromversorgung, Kühlung und Wartung werden dadurch nicht automatisch einfacher, aber der Druck auf neue Serverkapazität sinkt.

Für Meta kommt ein zweiter Effekt hinzu: DDR4-Module aus stillgelegten oder ersetzten Servern müssen nicht zwangsläufig sofort ausgemustert und entsorgt werden. Sie erhalten eine zweite Einsatzphase in einer Plattform, die ansonsten DDR5 voraussetzt. Das kann Elektroschrott reduzieren und den Hardwarezyklus strecken. Entscheidend ist dabei nicht der ökologische Effekt allein, sondern die Kombination aus Materialnutzung und Kapazitätsgewinn.

Warum Meta einen eigenen ASIC baut

Dass Meta dafür einen Custom-Chip entwickelt, ist aus Sicht eines Hyperscalers plausibel. Standardkomponenten müssen viele Einsatzfälle abdecken. Meta optimiert dagegen für eine eng definierte Umgebung: eigene Serverdesigns, eigene Workloads, eigene Flottensteuerung, eigene Anforderungen an Verfügbarkeit und Kosten. Ein ASIC lohnt sich nur, wenn die Stückzahlen und die betriebliche Kontrolle groß genug sind.

Die Lösung ist laut den vorliegenden Angaben bereits in großem Umfang im Produktionseinsatz. Damit verschiebt sich die Bewertung. Vistara ist nicht nur ein Laboraufbau, sondern Teil einer realen Flotte. Für kleinere Betreiber wäre ein solcher Weg kaum nachzubauen. Sie müssten entweder auf kommerzielle CXL-Produkte warten oder mit Standardservern arbeiten, bei denen solche Speicherpfade nicht vorgesehen sind.

Es gibt kommerzielle CXL-Produkte, die ebenfalls Speichererweiterung und die Wiederverwendung älterer Module adressieren. Marvell etwa bietet mit Structera entsprechende Bausteine an. Auch Microsoft arbeitet an CXL-Ansätzen zur Speichererweiterung. Metas Entscheidung für einen eigenen ASIC zeigt dennoch, dass Hyperscaler dort eigene Hardware entwickeln, wo Standardlösungen die Kosten- oder Betriebsziele nicht genau genug treffen.

CXL wird hier zur Betriebswerkzeugkette

Compute Express Link wird in diesem Fall nicht als abstrakte Servertechnik interessant, sondern als Werkzeug zur Entkopplung von Prozessor und Speicher. Der Host muss nicht jeden Speicherbaustein direkt über klassische Speicherkanäle anbinden. Stattdessen kann zusätzlicher Speicher über PCIe und CXL in die Plattform integriert werden. Das eröffnet neue Bauformen: Speicherpools, abgestufte Speicherklassen und längere Nutzung vorhandener DIMMs.

Für Endverbraucher-PCs ist das derzeit nicht der relevante Pfad. CXL ist auf Serverplattformen ausgelegt, und die nötige Unterstützung in Desktop-CPUs und Mainboards fehlt. Der Nutzen entsteht vor allem dort, wo Speicherverwaltung, Hardwaredesign und Workloads gemeinsam kontrolliert werden. Genau das ist bei Meta der Fall.

Die praktische Lehre aus Vistara ist deshalb begrenzt, aber klar. Große Betreiber warten nicht nur auf die nächste DRAM-Generation. Sie bauen Zwischenebenen ein, wenn Lieferketten, Kosten und Workloads das verlangen. DDR4 wird dadurch nicht wieder zum Standardspeicher neuer Server. Es wird zu einer kontrollierten Reserve in einer Architektur, die den Unterschied zwischen schnellem und langsamem Speicher bewusst nutzt.

Für den Markt ist das weniger eine allgemeine Blaupause als ein Hinweis auf die Richtung. Speicher wird in KI-Rechenzentren stärker nach Temperatur, Zugriffsmuster und Kosten organisiert. Wer die gesamte Plattform kontrolliert, kann alte Komponenten länger verwenden und neue Server dichter auslasten. Wer nur Standardhardware einkauft, bleibt stärker an die normalen Produktzyklen der Server- und Speicheranbieter gebunden.

📂

Kategorie

Tech

Hardware, Betriebssysteme, Entwicklertools und Technologie-Trends jenseits des Hype-Zyklus.

Über den Autor

Jens Könnig

Jens analysiert seit Jahren digitale Märkte, Preisbewegungen und Plattform-Strategien. Als Betreiber mehrerer datengetriebener Systeme wertet er täglich große Mengen an Produkt- und Trenddaten aus. Sein Fokus liegt auf Einordnung statt Hype: Was bedeutet eine Entwicklung wirklich für Nutzer, Preise und Märkte?

Alle Artikel von Jens Könnig →