5

News des 5. August 2022

Laut WCCF-Tech-Mitarbeiter Hassan Mujtaba @ Twitter haben die Grafikkarten-Hersteller nunmnehr ihre Arbeit an den NextGen-Grafikkarten begonnen. Dies gilt derzeit erst einmal nur für nVidia – und damit augenscheinlich nur für die GeForce RTX 4090, denn GeForce RTX 4080 & 4070 starten wohl nicht vor Jahresanfang 2023. Sprich, erst zum jetzigen Zeitpunkt haben die Grafikkarten-Hersteller von nVidia Testsamples des AD102-Chips in der konkreten Hardware-Konfiguration der GeForce RTX 4090 (128 SM @ 384 Bit) bekommen, kann deren eigentliche Arbeit der bei der Erstellung entsprechender Grafikkarten beginnen. Jene sind damit bei gutem Verlauf in 2-3 Monaten spruchreif – was mit etwas Glück für den angepeilten Launch der GeForce RTX 4090 in diesem Oktober reichen mag. Aber selbiger muß schließlich auch nicht zwingend bereits mit den Hersteller-Designs begangen werden, dafür reicht üblicherweise nVidias eigene "Founders Edition".

Good News! AIBs have started prep work on Next-Gen GPUs.
Quelle:  Hassan Mujtaba @ Twitter am 5. August 2022
 
Do you mean AIC of NV or AIB of AMD?
Quelle:  Greymon55 @ Twitter am 5. August 2022
 
NV for now
Quelle:  Hassan Mujtaba @ Twitter am 5. August 2022

Laut Twitterer Kopite7kimi könnte die größte Ada-Grafikkarte "AD102-450" – welche derzeit allgemein als "Ada Titan" bezeichnet wird – durchaus doch mit dem Vollausbau des AD102-Grafikchips antreten. Dies wären dann 144 anstatt der bisher gemeldeten 142 Shader-Cluster. Dies macht aus Performance-Sicht natürlich keinen wirklichen Unterschied mehr, streichelt eher nur die Seele derjenigen, welche unbedingt Grafikchips im Vollausbau wünschen. Aus Sicht der Fertigungsausbeute kann nVidia sich dies sicherlich leisten, denn "Ada Titan" wird nun kaum ein Millionenseller und die Rolle der Salvage-Lösung übernimmt bereits die GeForce RTX 4090. Daneben deutet sich an, dass die TSMC-Fertigung in dieser Frage besser ist als die vorherige Samsung-Fertigung, wo nVidia doch auffallend oft mit Salvage-Lösungen operierte.

1. The TITAN have a chance to use a full-fat chip. I will update that when I confirm it.
2. A full-fat AD103 will have 64M L2, and AD104 will have 48M. Only RTX 4090 should have a L2 cut. (99%??)

Quelle:  Kopite7kimi @ Twitter am 5. August 2022

Daneben sagt der Twitterer noch aus, dass die kleineren Ada-Grafikkarten üblicherweise nicht beim Level2-Cache beschnitten sind, dies im groben nur bei der GeForce RTX 4090 (72 MB Level2-Cache anstatt der 96 MB physikalisch vorhandenen) zutrifft. Bei kleineren Ada-Grafikkarten wären somit L2-Beschneidungen nur noch denkbar, wenn auch das Speicherinterface gekürzt wird, da beides technisch zusammenhängt. Dies macht insgesamt gesehen auch Sinn, denn die Mengen an Level2-Cache sind bei nVidia nicht übermäßig groß (AD104: 48 MB, AD103: 64 MB, AD102: 96 MB), womit Abspeckungen an dieser Stelle dann arg auf die Performance gehen könnten. Nur der AD102-Chip hat einen Level2-Cache halbwegs auf der Größenordnung von AMDs "Infinity Cache", womit die Abspeckung der GeForce RTX 4090 von 96 auf 72 MB Level2-Cache wohl nicht so tragisch ausfällt. Salvage-Gründe dürften hier kaum eine Rolle spielen (Cache wird üblicherweise redundant ausgelegt), da geht es eher um die Vergrößerung des Performance-Abstands der später erscheinenden "Ada Titan".

Laut Twitterer AGF (welcher unter früheren Accounts gezeigt hat, über Insider-Wissen zu verfügen) kann ein solch voll ausgefahrener AD102-Chip bei sogar unterhalb 600 Watt Stromverbrauch die Marke von 24'000 GPU-Punkten im TimeSpy Extreme durchbrechen. Dies sieht zuerst nach einem übermäßigen Leistungsplus gegenüber der regulären GeForce RTX 4090 aus, die dabei erzielten 5000 Mehrpunkte ergeben relativ allerdings auch "nur" +26%. Dies kann man mit einem AD102-Vollausbau und entsprechenden Taktraten wie Stromverbrauch durchaus erreichen, gerade wenn auch noch der Level2-Cache zur weiteren Beschneidung der GeForce RTX 4090 benutzt wird. Offenbar legt nVidia innerhalb der Ada-Lovelace-Generation Wert darauf, dass sich das Spitzenprodukt dann auch wirklich absetzen kann, auch gegenüber der "regulären" GeForce RTX 4090.

One hint: full AD102 at less than 600W >24k TSE
Quelle:  AGF @ Twitter am 5. August 2022

Hardware TS Extreme Quelle
AD102, 144 SM @ 384 Bit AD102-???, <600W >24'000 AGF, 5. Aug.
AD102, 128 SM @ 384 Bit (OC) AD102-300, 21 Gbps GDDR6X, AIB OC variant ≥20'000 Kopite7kimi, 19. Jul.
AD102, 128 SM @ 384 Bit AD102-300, 2.52 GHz, 21 Gbps GDDR6X, 450W TBP >19'000 Kopite7kimi, 18. Jul.
AD103, 80 SM @ 256 Bit AD103-300, 21 Gbps GDDR6X, 420W TBP >15'000 Kopite7kimi, 29. Jul.
AD103, 76 SM @ 256 Bit AD103-300, 21 Gbps GDDR6X, ~420W TBP ~15'000 Kopite7kimi, 5. Aug.
AD104, 60 SM @ 192 Bit AD104-???, 21 Gbps GDDR6X, 300W TBP >11'000 Kopite7kimi, 4. Aug
RTX 3090 Founders Edition 10'213 PC-Welt
AD104, 56 SM @ 160 Bit AD104-275, 18 Gbps GDDR6, 300W TBP ~10'000 Kopite7kimi, 29. Jul.
RTX 3080 Founders Edition 9092 PC-Welt
RTX 3070 Founders Edition 6796 PC-Welt
Anmerkung: alle Angaben zu noch nicht vorgestellter Hardware basieren auf Gerüchten & Annahmen

Daneben agitiert AGF zugunsten einer anderen Herangehensweise an die kolportierten Stromverbrauchswerte der RTX40-Grafikkarten: Laut dem Twitterer würden dabei oftmals Zahlen zu maximalen Boardbelastungen verbreitet und gelesen, welche allerdings nicht dem realen Stromverbrauch sowie auch nicht nVidias letztlicher TDP-Festsetzung entsprechen würden. Allerdings scheint sich diese Rede primär auf die oberhalb 600 Watt genannten Werte zu beziehen – welche sicherlich zu hinterfragen sind, teilweise auch schon hinterfragt wurden. Denn die konkret zu GeForce RTX 4070, 4080 & 4090 seitens 'AGF' genannten Schätzwerte (!) sind zwar niedriger (250W, 360W, 420W) als die von 'Kopite7kimi' genannten Werte (300W, 420W, 450W) – aber eben auch nicht wesentlich niedriger, sondern oftmals nur mit maßvoller Differenz. Logischerweise würde man AGFs Werte vorziehen, darf Kopite7kimi in diesem Fall gern einmal Unrecht haben.

Sad to read the current state of leaks on Nvidia Lovelace. Everything is about power levels and stupid numbers based on silicon qualification TGP, not real products. Now, even mid range SKUs caught this power virus, spreading over the net like COVID-19, without any sanity check
Quelle:  AGF @ Twitter am 2. August 2022
 
Many points in the voltage/power curve are currently tested. The following SKUs seem possible:
4070 at 250W
4080 at 360W
4090 at 420W
It doesn't mean that it will be the final line up but they exist.

Quelle:  AGF @ Twitter am 5. August 2022
 
It was never targeted as high as people believe in the first place... I keep repeating that max board TGP never ever becomes a final product power. Hopper was leaked with 1000W TGP but is finally sold at 700W SMX5 and 350W in PCIe. People never learn
Quelle:  AGF @ Twitter am 6. August 2022

Laut dem chinesischen ITHome kommt RayTracing bei Innosilicon erst mit der nachfolgenden "Fengshua 3" Generation – deren Entwicklung allerdings wohl schon weitgehend abgeschlossen sein soll. Dies ordnet die kürzlich vorgestellte "Fengshua 2" Generation indirekt als "Zwischen-Generation" ein, womöglich auch um die neue 5nm-Fertigung auszutesten. Nicht erwähnt, aber wohl augenscheinlich ist, dass "Fengshua 3" dann technologisch auf der PowerVR C-Series basieren wird – denn Innosilicon entwickelt keine Grafikchip-Architekturen, sondern nur fertige Grafikchips auf Basis dieser lizensierten Technologie-Vorlage. Dabei versprach der Innosilicon-Präsident "hohe Rechenleistungen für Privatanwender" für "Fengshua 3" – sprich, hiermit werden wohl wieder echte Grafikkarten angepeilt. Irgendwelche Zeitpläne gab es leider nicht, aber da Innosilicon seine Werke vergleichsweise zeitig vorstellt (noch vor dem Start der Fertigung), braucht man diese 3. Innosilicon-Generation sicherlich nicht vor dem Jahr 2023 erwarten.