23

News des 22./23. Februar 2025

Die "ROP-Affäre" der GeForce RTX 50 Serie weitet sich nunmehr aus: Zum einen berichtet Twitterer Tomasz Gawronski über einen ersten Fall bei einer GeForce RTX 5070 Ti, was nVidia in seinem Statement bereits erwähnt hatte, aber bislang in freier Wildbahn noch nicht zu sehen war. Inwiefern die für die Launch-Reviews benutzten Karten betroffen waren, läßt sich nicht abschließend sagen, da nicht jeder Hardwaretester einen GPU-Z-Screenshot anfügt. Bei TechPowerUp waren zumindest alle getesteten GeForce RTX 5070 Ti Modelle von diesem Problem nicht betroffen. Die ComputerBase hatte ihre eigene GeForce RTX 5070 Ti schon entsprechend nachgeprüft (ebenfalls fehlerfrei), die anderen Hardwaretester dürfen sich hierzu gern auch noch erklären. Und zum anderen ist auf Reddit nun auch noch eine GeForce RTX 5080 mit fehlerhafter ROP-Anzahl aufgetaucht.

reguläre ROPs falsche ROP-Anzahl Differenz
GeForce RTX 5090 (D) 176 168 –8 ROPs (–4,5%)
GeForce RTX 5080 112 104 –8 ROPs (–7,1%)
GeForce RTX 5070 Ti 96 88 –8 ROPs (–8,3%)

Jene Karte hatte nVidia noch überhaupt nicht erwähnt, aufgrund der Gleichheit des Fehlers (es fehlen überall exakt 8 ROPs) erstaunt dies allerdings auch nicht besonders. Möglicherweise traf dieses Problem auch auf GeForce RTX 5070, 5060 Ti und 5060 zu und wurde dort sogar zuerst entdeckt, da bei den kleineren Modellen jeweils 8 fehlende ROPs die Performance um so stärker reduzieren werden. Schließlich soll es zu diesen kleineren Modellen ein Fertigungsproblem gegeben haben, was zu geringer Leistung führt und diese kleineren Karten um einen Monat zurückgeworfen hat – jene Aussage passt sehr wohl zu dieser ROP-Problematik (was natürlich nicht zwingend bedeutet, das dies wirklich diesen Grund hat). Während nVidia somit bei den Modellen GeForce RTX 5070 und kleiner von Anfang an fehlerfreie Hardware ausliefern will, müssen die derzeit im Umlauf befindlichen Exemplare von GeForce RTX 5070 Ti, 5080 5090D & 5090 mittels GPU-Z identifiziert und nachfolgend in RMA gegeben werden.

Erstaunlich ist dabei der teilweise hohe Performance-Impact dieser 8 fehlenden ROPs, was gerade bei einer GeForce RTX 5090 nur –4,5% weniger als der Default-Zustand sind. TechPowerUp hatten hierzu allerdings schon ein TimeSpy-Extreme-Ergebnis von immerhin –11% weniger bei einer GeForce RTX 5090 ausgemessen, bei der ComputerBase sind es nunmehr auch –11% unter dem regulären TimeSpy mit der GeForce RTX 5070 Ti. Die reale Spiele-Performance ist weit weniger stark betroffen (gemäß TechPowerUp sind es eher denn –2%, gemäß nVidia –4%), aber dennoch dürfen eigentlich auch Einzelwerte nicht so stark reagieren. Es besteht hiermit die theoretische Möglichkeit, dass sogar etwas mehr betroffen ist als nur 8 ROPs. Alternativ wäre es natürlich auch denkbar, dass die Grafikchip-interne Lastverteilung nicht mit der halbierten Anzahl an ROPs pro Raster-Engine (regulär sind es bei nVidia 16 ROPs pro Raster-Engine) umgehen kann und daher die betroffene Raster-Engine die ganze Grafik-Pipeline schlicht ungebührlich blockiert.

Zu den (vielfältigen) Problemen des Blackwell-Launches gesellt sich nun auch noch eine abrauchende "Asus GeForce RTX 5090 Astral", so beschrieben und bebildert bei Reddit. Grundlage hierfür waren allerdings nicht Stecker/Kabel-Probleme, sondern durchgebrannte Teile der Stromwandlung auf der Grafikkarte selber. Logischerweise ist dies erst einmal nur ein Einzelfall, bleibt aber dennoch zu beobachten. Nebenbei ist Gamers Nexus dabei, diese abgerauchte Grafikkarte zu erwerben, um nachfolgend deren Fehlerursache genauer eruieren zu können. Bedenklich ist dennoch, dass sich derart viele Fehler in kurzer Zeit und angesichts der geringen ausgelieferten Menge an RTX50-Grafikkarten ergeben. Die Fehlerquote ist beim Blackwell-Launch einfach zu hoch, vollkommen untypisch für nVidia und sehr wohl auch (frühere) fehlgeschlagene Launches anderer Grafikchip-Entwickler überbietend.

VideoCardz bringen Angaben zu Transistoren-Anzahl und Chipfläche von AMDs Navi 48, der Chip-Grundlage von Radeon RX 9070 & 9070 XT. Dabei stammt die Transistoren-Anzahl aus AMDs offiziellen Angaben, die Chipfläche hingegen aus einem fernöstlichen Forum – was wie üblich mit Vorsicht bzw. etwas Spielraum zu genießen ist. Beide Angaben sind zudem recht erstaunlich: Mit den (offiziell) 53,9 Mrd. Transistoren ist der Navi-48-Chip nahezu so groß wie bisher Navi 31 (58 Mrd.) und liegt auch über dem GB203-Chip der GeForce RTX 5080 (45,6 Mrd.). Da AMD wie bekannt mit dem Navi-48-Chip aber eher die Hardware der Radeon RX 7800 XT repliziert (Navi 32, 28,1 Mrd.), bedeutet dies, dass bei RDNA4 sehr viele Transistoren rein zugunsten der Architektur hinzugekommen sein müssen. Allerdings will AMD dafür dennoch keine größere Chipfläche belegen, Navi 48 soll grob 350mm² groß sein – faktisch auf dem Niveau des Navi-32-Chips (348mm²).

Fertigung Generation Transist. Chipfläche Tr.-Dichte Grafikkarten
AMD Navi 48 4nm TSMC RDNA4 53,9 Mrd. ~350mm² ~154 MTr/mm² Radeon RX 9070 & 9070 XT
nVidia GB202 4nm TSMC Blackwell 92,2 Mrd. 750mm² 123 MTr/mm² GeForce RTX 5090D & 5090
nVidia GB203 4nm TSMC Blackwell 45,6 Mrd. 378mm² 121 MTr/mm² GeForce RTX 5070 Ti & 5080
nVidia GB205 4nm TSMC Blackwell 31,1 Mrd. 263mm² 118 MTr/mm² GeForce RTX 5070
AMD Navi 31 5/6nm TSMC RDNA3 58 Mrd. 522mm² 111 MTr/mm² Radeon RX 7900 GRE, XT & XTX
AMD Navi 32 5/6nm TSMC RDNA3 28,1 Mrd. 348mm² 81 MTr/mm² Radeon RX 7700 XT & 7800 XT
AMD Navi 33 6nm TSMC RDNA3 13,3 Mrd. 204mm² 65 MTr/mm² Radeon RX 7600 & 7600 XT
nVidia AD102 5nm TSMC Ada Lovelace 76,3 Mrd. 609mm² 125 MTr/mm² GeForce RTX 4090D & 4090
nVidia AD103 5nm TSMC Ada Lovelace 45,9 Mrd. 379mm² 121 MTr/mm² GeForce RTX 4070 Ti Super, 4080 & 4080 Super
nVidia AD104 5nm TSMC Ada Lovelace 35,8 Mrd. 295mm² 121 MTr/mm² GeForce RTX 4070, 4070 Super & 4070 Ti
nVidia AD106 5nm TSMC Ada Lovelace 22,9 Mrd. 188mm² 122 MTr/mm² GeForce RTX 4060 Ti
nVidia AD107 5nm TSMC Ada Lovelace 18,9 Mrd. 159mm² 119 MTr/mm² GeForce RTX 4060

Einen gewissen Vorteil hat RDNA4 aber dann natürlich durch den Punkt, dass bei Navi 31/32 die MCDs getrennte Chips sind und nur aus der 6nm-Fertigung kommen. Nunmehr wieder im monolithischen Verfahren und gleich unter 4nm hergestellt, kann sich da durchaus eine klar bessere Transistoren-Packdichte speziell beim MCD-Inhalt ergeben, sprich Speicherinterface und Infinity Cache (wobei beide nicht gerade für gute Skalierungen mit neueren Fertigungsverfahren bekannt sind). Aber dies erklärt nicht die ansonsten ungewöhnlich hohe Steigerung der Packdichte von Navi 31 zu Navi 48 (111 MTr/mm² zu ~154 MTr/mm²), gerade da es bei nVidias neuester Chip-Generation (auf gleicher Fertigung) keineswegs eine solche Entwicklung gegeben hat. AMD muß hier einen durchaus abweichenden Design-Ansatz gewählt haben, alternativ könnte natürlich auch die Chipflächen-Angabe zu Navi 48 ungenau sein bzw. der finale Chip doch etwas größer als gedacht herauskommen. Selbst auf angenommen 390mm² wäre schließlich die Packdichte von Navi 48 mit dann ~138mm² MTr/mm² immer noch den anderen aktuellen Grafikchips überlegen.