Nvidia BlueField-3: DPU mit ARM-Kernen und 400-Gbit/s-NIC entlastet die CPU

0
215

Bereits letzten Oktober auf einer Roadmap in Aussicht gestellt, hat Nvidia heute zur GTC die Data Processing Unit (DPU) BlueField-3 vorgestellt. Die DPU soll die CPU entlasten und besteht aus einer Netzwerkkarte mit ARM-Prozessor und kümmert sich um kritische Aufgaben in den Bereichen Netzwerk, Speicherverwaltung und Sicherheit.

BlueField ist eine durch die Übernahme von Mellanox hinzugewonnen Technologie, die in der bisherigen Generation bereits als Mellanox BlueField-2 bekannt war und jetzt unter dem Namen des Dachkonzerns Nvidia angeboten wird. Die neue BlueField-3 soll in einem Datacenter noch mehr Rechenlast von den CPUs nehmen, indem jetzt auf eine CPU mit 16 ARM Cortex-A78-Kernen gesetzt wird, die bei entsprechend beschleunigten Anwendungen die Rechenleistung von 300 klassischen CPU-Kernen liefern soll.

Das entspricht einer Steigerung um den Faktor zehn im Vergleich zu BlueField-2, mit dem Nvidia 30 klassische CPU-Cores ablösen will. Bei der Rechenleistung für beschleunigte Kryptographie nennt Nvidia eine Steigerung um den Faktor vier. Die ARM-Kerne sind erneut vollständig programmierbar, außerdem sind mehrere VLIW-Engines für die Entlastung der CPU zuständig. Im Bereich Sicherheit sind das etwa Root of Trust, die Verschlüsselung, das Key-Management und eine Regular-Expression-Engine. Für das beschleunigte Networking werden RDMA/RoCE, GPU Direct und SDN/NFV auf der DPU abgewickelt und für beschleunigten Storage stehen unter anderem Technologien wie NVMe-oF (over Fabrics), Elastic Block Storage (etwa bei Amazon) und Kompression zur Auswahl.

Mit DDR5 und PCIe 5.0 erst 2022 als Sample

BlueField-3 bietet aber nicht nur eine höhere Rechenleistung, sondern integriert erstmals den ConnectX-7-Netzwerkadapter für 400 Gbit/s und DDR5 mit zugehörigem Speicherinterface. Das Interface für die Integration in das Datacenter nutzt bereits PCIe 5.0, was auch erklärt, warum BlueField-3 erst im ersten Quartal 2022 als Sample verfügbar sein soll. Für den regulären Marktstart gibt es noch keinen Termin.

Aufbau von BlueField-3 (Bild: Nvidia)

Nvidia entwickelt Cybersecurity-Plattform

Eine Abwärtskompatibilität zu BlueField-2 soll dafür sorgen, dass bereits aufgesetzte Systeme mit geringem Aufwand zu BlueField-3 migriert werden können. Die gesamte Verwaltung findet über Nvidia DOCA statt, das für „Data Center Infrastructure-on-a-Chip Architecture“ steht. Über das DOCA SDK für BlueField-DPUs können Entwickler Anwendungen für die verschiedenen Aufgabengebiete einer DPU entwickeln. Auf BlueField-3 läuft zudem erstmals Morpheus, eine von Nvidia entwickelte, KI-gestützte Cybersecurity-Plattform, die Sicherheitsbedrohungen in Echtzeit erkennen und abwehren soll. Im Bereich Software gibt es Unterstützung unter anderem von VMware, Red Hat, Canonical und Check Point Software Technologies. Server-Anbieter wie Dell, Inspur, Lenovo und Supermicro wollen BlueField-DPUs für ihre Systeme anbieten.

BlueField für den DGX SuperPod

Im Hier und Jetzt wird aber erst einmal BlueField-2 von Nvidia ausgerollt. Nvidia selbst setzt mit Ankündigung zur GTC erstmals beim DGX SuperPod auf BlueField, um die zwei AMD Epyc 7742 alias Rome in den DGX A100 zu entlasten. Der DGX A100 SuperPod besteht aus 140 DGX A100 und somit 1.120 A100-GPUs. 170 InfiniBand-Switches von Mellanox mit jeweils 200 Gbit/s Bandbreite sorgen für die Vernetzung untereinander, im gesamten Netzwerk-Fabric sollen 280 Tbit/s an Bandbreite zur Verfügung stehen, das über 15 km Lichtwellenleiter realisiert wird. Der Netzwerkspeicher des DGX A100 SuperPod beläuft sich auf 4 PB Flash-Speicher. Für den DGX A100 SuperPod gibt Nvidia einen Spitzenleistung von 700 PetaFLOPS für KI-Berechnungen an.

BlueField kommt in den DGX SuperPod (Bild: Nvidia)

BlueField-4 im Jahr 2024

Heute hat Nvidia BlueField-3 vorgestellt, aber der Termin für den Nachfolger ist auch schon offiziell: Schon im Jahr 2024 soll BlueField-4 auf Basis von 64 Milliarden Transistoren eine Anbindung von bis zu 800 Gbit/s und 1.000 TOPS möglich machen.

Nvidia BlueField Roadmap (Bild: Nvidia)

ComputerBase hat Informationen zu diesem Artikel von Nvidia unter NDA erhalten. Die einzige Vorgabe war der frühest mögliche Veröffentlichungszeitpunkt.