18

News des 18. März 2025

Auf seiner Hausmesse GTC 2025 (GTC-Keynote auf YouTube) hat nVidia einen größeren Einblick zu seinen künftigen HPC/AI-Produkten gegeben – inklusive auch einer ersten Vorstellung von "Rubin" sowie einer ersten Erwähnung der NextGen-Architektur "Feynman". Der überraschende Punkt hierbei ist, dass die von nVidia angekündigte 1-Jahres-Kadenz bei neuem HPC/AI-Produkten nicht (entgegen vorheriger Annahmen) über neue Architekturen im Jahres-Rythmus gelöst wird, sondern über Refresh-Lösungen im Wechsel mit neuen Architekturen. Neue Architekture kommen somit auch im HPC/AI-Bereich bei nVidia "nur" aller zwei Jahre – augenscheinlich ein Zugeständnis an den hohen Entwicklungsaufwand dieser inzwischen sehr komplexen Produkte mit (kumuliert) vielen hunderten Milliarden an Transistoren. Rubin steht somit für eine Auslieferung im zweiten Halbjahr 2026 an, Feynman für eine Auslieferung im zweiten Halbjahr 2028 – dazwischen liegt immer ein Refresh der jeweiligen Vorgänger-Generation.

In beiden Fällen ergibt sich damit auch die Chance, dass nVidia unter gleichem Namen eventuell noch Consumer/Gaming-Lösungen auflegt. Jene dürften dann aber natürlich nur denselben Codenamen führen, technologisch jedoch komplett anders ausfallen. Wie weit anders, läßt sich inzwischen nur noch grob schätzen, denn nVidia gab zu "Rubin" kaum etwas genaues zum Aufbau von Chip & Architektur bekannt. Selbiges hatte sich bereits zu HPC/AI-Blackwell angedeutet, wo nVidia auch nur gewisse Rahmendaten zum "GB100" Chip von sich gab, bislang aber nie etwas genaueres zu den verbauten Hardware-Einheiten. Inzwischen reichen augenscheinlich die Nennungen reiner FP4- und FP8-Werte aus, belastbare Angaben zu Chip & Architektur sind out. Auch mit konkreten Produktnamen zu "Rubin" hielt sich nVidia zurück, wobei dies vielleicht eher verständlich ist angesichts des angesetzten Auslieferungstermins. Zu erwähnen noch, dass nVidia ab "Rubin" die nummerische Bemessungsgrundlage bei den DataCenter-Produkten ändert: Ein "GB200-NVL72" enthält 72 Chip-Packages mit also 144 Chips, bei "Vera Rubin NVL144" werden dann jedoch die Chips selber gezählt – bleibt also die Chip-Anzahl zwischen beiden HPC/AI-Architekturen in diesem Beispiel gleich.

Blackwell Rubin Feynman
Grafikchip GB100 (vermtl. 2x GB102), 2x ~800mm², 2x 104 Mrd. Transistoren, TSMC N4P wiederum DualChip-Konstrukt, 3.3fache FP4-Power gegenüber "Blackwell Ultra" ?
GPU-Produkte B100, B200, GB200 (Dual-GPU + "Grace"-CPU) ? ?
GPU-Refresh B300 & GB300 ("Blackwell Ultra") mit mehr HBM und +50% FP4-Leistung "Rubin Ultra": verdoppelte GPU ?
CPU "Grace": 144 ARM Neoverse-Kerne "Vera": 88 ARM Custom-Kerne (+SMT) "Vera"
Datacenter-Produkte GB200-NVL72 & GB300-NVL72 Vera Rubin NVL144 & Rubin Ultra NVL576 ?
Namensgebung Mathematiker David Blackwell Astronomin Vera Rubin Physiker Richard Feynman
Vorstellung GTC 2024 GTC 2025 ?
Auslieferung ab Q4/2024 angekündigt für H2/2026 angekündigt für H2/2028

Daneben hat nVidia auf der GTC 2025 auch seine Profi-Beschleuniger der "Blackwell"-Generation unter dem Verkaufsnamen "RTX Pro" vorgestellt, wobei der Unterschied zu den Ada-Lovelace-basierten Profi-Beschleunigern allein im Kürzel "Pro" liegt. Die nachfolgende Nummer gibt hingegen nur die Stellung im Portfolio an und wird von beiden Grafikkarten-Serien verwendet (RTX 6000 vs RTX Pro 6000). Beachtbar an diesen wirklich nur im Profi-Bereich eingesetzten Lösungen sind drei Dinge: Erstens setzt nVidia bei der Spitzen-Lösung "RTX Pro 6000" auf einen GB202-Chip nahe des Vollausbaus mit gleich 188 freigeschalteten Shader-Clustern (gegenüber nur 170 bei der GeForce RTX 5090). Zugunsten einer hypothetischen "GeForce RTX 5090 Ti" muß dies natürlich nichts sagen, diese Option hat nVidia auch ohne diese Profi-Grafikkarten jederzeit. Zweitens setzt nVidia bei einigen dieser neuen Profi-Karten gleich 24-GBit-Speicherchips von GDDR7 ein, erreicht damit bis zu 96 GByte Speicherausbau bei der RTX Pro 6000 (die 24-GBit-Speicherchips werden aber auch bei kleineren Profi-Lösungen verwendet). Konkret kommen hier 32 Stück an 24-Gbit-Speicherchips am 512-Bit-Interface des GB202-Chips zum Einsatz, realisiert natürlich im Clamshell-Verfahren (zwei Speicherchips pro 32-Bit-Teilinterface).

Ob nVidia damit dem Consumer-Markt diese 24-Gbit-Speicherchips entzieht, ist nicht gänzlich sicher, da für diese Profi-Karten GDDR7-Speicherchips mit EEC verwendet werden. Allerdings werden Speicherchips für kleine und mittelgroße Mengen gern gleich mit EEC hergestellt und bei der Verwendung in Consumer-Produkten nur deaktiviert – anstatt zwei extra Produktserien (mit entsprechend kleinerer Menge) auflegen zu müssen. Aller Wahrscheinlichkeit nach ist es am Ende also doch dieselbe Fertigung an 24-GBit-Speicherchips – welche nVidia derzeit exklusiv nur für seine Profi-Karten sowie im Consumer-Bereich allein die GeForce RTX 5090 Laptop verwendet. Denkbar natürlich, dass die Fertigung dieser speziellen GDDR7-Chips derzeit noch nicht so hochvolumig ist, dass man jene auch für (millionenfach benötigte) Consumer-Produkte ansetzen könnte. Und drittens bedeutet die Vorstellung dieser neuen Profi-Beschleuniger natürlich auch neuen Lieferdruck auf nVidia bei den Grafikchips GB203 & GB202. Gerade angesichts der aktuellen AI-Welle sind in einige Kreisen Grafikkarten mit richtig viel Speicher hochbegehrt – und nVidia dürfte sicherlich auch lieber diese Profi-Produkte als denn "profane" Consumer-Beschleuniger verkaufen.

Sowohl der 3DC Performance-Index als auch der Stromverbrauchs-Überblick-Artikel wurden nunmehr aktualisiert mit den Werten der neuen Grafikkarten des Jahres 2025. Im Fall des Performance-Index war dem ein wichtiges Update für die "älteren" Karten vom Anfang März vorangegangen, welches die korrekte Festsetzung der neuen Performance-Werte erst möglich machte. Hieraus ergibt sich auch der Unterschied zwischen den vorläufigen Index-Werten der GeForce RTX 50 Serie (beispielsweise die GeForce RTX 5090 auf vorläufig 885%, nunmehr 920%): Da die RTX40-Serie mit diesem Update (etwas) hochgestuft wurde, änderte sich die Vergleichsgröße für die RTX50-Serie – und auch jene musste zu deren Index-Festsetzung somit hochgestuft werden. Anzumerken daneben, dass der Stromverbrauchs-Artikel seit einiger Zeit nun auch extra Angaben zur Spanne der einzelnen Stromverbrauchs-Meßwerte enthält. Dies weist u.a. darauf hin, dass die aktuellen AMD-Karten zumeist in der Nähe ihres Durchschnittswerts verbrauchen, bei den aktuellen nVidia-Karten hingegen die einzelnen Verbrauchswerte auch deutlich darunter sowie darüber liegen können.

FHD-Index 4K-Index Stromverbr. Release
Arc B570 1250% ~189% 140W 16. Januar 2025
GeForce RTX 5090 4360% 920% 509W 30. Januar 2025
GeForce RTX 5080 3420% 610% 311W 30. Januar 2025
GeForce RTX 5070 Ti 3060% 520% 287W 20. Februar 2025
GeForce RTX 5070 2560% 408% 230W 5. März 2025
Radeon RX 9070 XT 3020% 500% 302W 6. März 2025
Radeon RX 9070 2710% 440% 220W 6. März 2025

Die PC Games Hardware berichtet die Systemanforderungen der Demo zu "Half-Life 2 RTX", welche nVidia zusammen mit Valve erstellt hat – und wohl daher keinerlei AMD-Grafikkarten nennt. Ob jene unter diesem sicherlich direkt auf nVidia-Hardware optimierten RayTracing-Remaster von "Half-Life 2" überhaupt sinnvoll eingesetzt werden können, bleibt offen, zumindest die Radeon RX 9000 Serie sollte da eigentlich eine Chance haben. Allerdings könnte es auch am Fallstrick des Upscaler-Supports scheitern, denn alle angesetzten Hardware-Anforderungen ergehen unter der Nutzung von DLSS. Wenn also Valve hier keinen FSR-Support einbaut, könnte es schnell Essig mit AMD-Grafikkarten werden, unabhängig von deren Leistungsklasse. Davon abgesehen ist die Anforderung einer GeForce RTX 4070 für FullHD "High" sowie einer GeForce RTX 5080 für 4K "Ultra" auf 144 fps nicht von schlechten Eltern, wenn man einrechnet, dass dies alles mit DLSS-Einsatz gemeint ist – auf einem 20 Jahre alten Spiel.

offizielle PC-Systemanforderungen für "Half-Life 2 RTX Demo"
Minimum Empfehlung "Ultra"
gedacht für 1080p "Low" + DLSS @ 30 fps 1080p "High" + DLSS @ 60 fps 4K "Ultra" + DLSS @ 144 fps
System Windows 10/11 64-Bit, 50 GB freier Festplatten-Platz, SSD durchgehend empfohlen
CPU Core i7-8600 oder Ryzen 5 3600 Core i7-10700 oder Ryzen 5 5600 Core i7-12700K oder Ryzen 7 7700X
Speicher 16 GB RAM 16 GB RAM 16 GB RAM
Grafik GeForce RTX 3060 Ti GeForce RTX 4070 GeForce RTX 5080