NVIDIA GTC 2026: Jensen Huangs Billionen-Wette auf die KI-Infrastruktur
Vera Rubin, Groq-Übernahme, autonomes Fahren: Die wichtigsten Ankündigungen der GTC 2026 und was sie für Deutschland bedeuten.
Jensen Huang hat auf der GTC 2026 in San Jose sieben neue Chips gleichzeitig vorgestellt und eine Billion Dollar an Bestellungen in Aussicht gestellt. Was wie eine Produktpräsentation aussah, war in Wirklichkeit eine Machtdemonstration: NVIDIA baut nicht mehr nur Chips. NVIDIA baut die gesamte Infrastruktur der KI-Ära.
Vera Rubin: Die nächste Generation KI-Hardware
Das Herzstück der Keynote war die Vera Rubin Plattform. Sieben neue Chips, alle bereits in Serienproduktion. Die Zahlen im Überblick:
- Rubin GPU: Gefertigt in TSMCs 3-Nanometer-Prozess, mit 288 GB HBM4-Speicher und rund 22 TB/s Bandbreite pro GPU. Die Inferenzleistung liegt bei 50 PFLOPS im NVFP4-Format.
- Vera CPU: NVIDIAs erster vollständig eigener Arm-Prozessor, entwickelt ausschließlich für KI-Rechenzentren. Damit macht sich NVIDIA unabhängig von AMD und Intel.
- NVL72 Racks: Modelle lassen sich mit einem Viertel der GPUs trainieren, die bei der Vorgängergeneration Blackwell nötig waren. Der Inferenz-Durchsatz pro Watt ist zehnmal höher, die Kosten pro Token ein Zehntel.
Die ersten Vera Rubin Systeme werden in der zweiten Jahreshälfte 2026 ausgeliefert. Consumer-Varianten folgen 2027.
Zur Einordnung: Ein einzelner Vera Rubin NVL72-Rack bietet mehr KI-Rechenleistung als die zehn schnellsten Supercomputer Deutschlands zusammen. Und NVIDIA erwartet, dass davon Tausende gebaut werden.
Groq-Übernahme: 20 Milliarden für einen Konkurrenten
Die vielleicht strategisch wichtigste Ankündigung: NVIDIA hat die Groq-Übernahme für 20 Milliarden Dollar abgeschlossen und stellt auf der GTC den Groq 3 LPU vor. LPU steht für Language Processing Unit, eine komplett andere Chip-Architektur, die speziell für Inferenz optimiert ist.
Das Groq 3 LPX Rack fasst 256 LPUs und soll neben den Vera Rubin GPU-Racks stehen. Der Clou: Die Kombination aus GPU und LPU liefert 35-mal mehr Tokens pro Watt als GPUs allein.
Strategisch ist das ein klassischer NVIDIA-Move. Groq war der einzige Chip-Hersteller, der bei der Inferenz-Geschwindigkeit ernsthaft konkurrieren konnte. Statt den Wettbewerb auszuhalten, hat NVIDIA ihn einfach gekauft. Für Kunden ist das kurzfristig gut, weil sie beide Technologien aus einer Hand bekommen. Langfristig schrumpft die Auswahl an unabhängigen Chip-Anbietern weiter.
Autonomes Fahren: Der ChatGPT-Moment ist da
"The ChatGPT moment of self-driving cars has arrived", sagte Jensen Huang auf der Bühne. Und untermauerte das mit konkreten Partnerschaften:
- Uber baut ein Robotaxi-Netzwerk auf NVIDIA DRIVE Hyperion. Geplant: 28 Märkte bis 2028, Start in Los Angeles und San Francisco ab der ersten Jahreshälfte 2027.
- BYD, Hyundai, Nissan und Geely setzen auf DRIVE Hyperion für Level-4-Fahrzeuge, also vollautonomes Fahren ohne menschlichen Eingriff.
- Bolt, Grab, Lyft und TIER IV skalieren ihre Robotaxi-Entwicklung ebenfalls auf der Plattform.
Jedes Robotaxi soll mit NVIDIAs Alpamayo-Modellen und dem Halos-Betriebssystem laufen, einer einheitlichen Sicherheitsarchitektur für Level-4-Autonomie.
Deutschland hat seit 2022 ein Gesetz zum autonomen Fahren auf Level 4. Aber ob die Infrastruktur und Genehmigungsprozesse tatsächlich bereit sind, wenn BYD und Uber ab 2027 ihre Flotten starten wollen, steht auf einem anderen Blatt. Bislang gibt es in Deutschland keine einzige reguläre Robotaxi-Strecke im öffentlichen Verkehr.
NemoClaw, DLSS 5 und der Rest
Jensen Huang widmete einen großen Teil der Keynote dem Thema KI-Agenten. Im Mittelpunkt: NemoClaw, eine Enterprise-Plattform für das Open-Source-Framework OpenClaw. Huangs Einschätzung: "OpenClaw ist definitiv das nächste ChatGPT."
NemoClaw bringt Enterprise-Sicherheit und Datenschutz für autonome KI-Agenten. Dazu gehören die neuen Nemotron-Modelle (4B und 120B Parameter) für lokale Inferenz, also ohne Cloud-Anbindung. Für europäische Unternehmen mit strengen Datenschutzanforderungen ist das besonders relevant. Die Plattform befindet sich allerdings noch im Alpha-Stadium.
Abseits davon: DLSS 5 nutzt generative KI für fotorealistisches Gaming. Und CUDA feiert seinen 20. Geburtstag, der Software-Burggraben, der NVIDIAs Dominanz überhaupt erst möglich gemacht hat.
Fazit: Die Billionen-Dollar-Frage
Jensen Huang erwartet Bestellungen im Wert von einer Billion Dollar für Blackwell und Vera Rubin bis 2027. Das ist eine gewaltige Zahl. Und sie wirft die zentrale Frage auf: Baut die Welt gerade zu viel KI-Infrastruktur oder zu wenig?
Für Europa und Deutschland ist die Lage klar. Egal wie die Antwort ausfällt: Die Abhängigkeit von NVIDIA für KI-Compute ist nahezu total. Kein europäischer Chip-Hersteller kann bei KI-Hardware mithalten. Wer in Europa KI betreiben will, braucht NVIDIA. Das ist keine Kritik an NVIDIA, sondern eine Feststellung über den Zustand der europäischen Tech-Industrie.