7

News des 7. Februar 2022

Twitterer HXL verweist auf ein Gerücht aus dem Chiphell-Forum, wonach nVidias GH100-Chip immerhin satte 140 Milliarden Transistoren tragen soll. Dies ist satt mehr als beim vorherigen HPC-Chip "GA100", welcher immerhin auch schon 54 Mrd. Transistoren schwer ist. Die große Frage hieran ist natürlich, ob sich diese Angabe auf ein einzelnes Die bezieht – oder einen MCM-Verbund aus zwei GH100-Dies: Bei 70 Mrd. Transistoren pro Die wäre der Sprung vom GA100-Chip aus ziemlich klein, bei 140 Mrd. pro Die hingegen grenzwertig hoch. Eventuell kommt man mit einer Betrachtung der verbrauchten Transistoren pro Shader-Cluster der Sache näher: Auf 70 Mrd. Transistoren pro Die wären dies +15% gegenüber dem GA100-Chip – auf 140 Mrd. hingegen gleich das 2,3fache. Letzteres erscheint dann eher unwahrscheinlich, denn so viel mehr an Technik kann man kaum in den GH100-Chip hineinbringen. Denkbar ist derzeit natürlich noch alles (inkl. eventuell falscher Angaben) – dieser Fall braucht schlicht solidere Daten & Hinweise.

GH100
140 billion+ Transistors ?

Quelle:  HXL @ Twitter am 5. Februar 2022

Generation Fertigung Chip-Daten Packdichte SM/CU Tr. pro SM/CU
nVidia GP100 Pascal 16nm TSMC 15,3 Mrd. Tr. auf 610mm² 25,1 Mio. Tr./mm² 60 SM 255 Mio Tr./SM
nVidia GV100 Volta 12nm TSMC 21,1 Mrd. Tr. auf 815mm² 25,9 Mio. Tr./mm² 84 SM 251 Mio Tr./SM
AMD Vega 20 Vega 7nm TSMC 13,2 Mrd. Tr. auf 331mm² 39,9 Mio. Tr./mm² 64 CU 206 Mio Tr./CU
nVidia GA100 Ampere 7nm TSMC 54 Mrd. Tr. auf 826mm² 65,4 Mio. Tr./mm² 128 SM 422 Mio Tr./SM
AMD Arcturus CDNA1 7nm TSMC 25,6 Mrd. Tr. auf 750mm² 34,1 Mio. Tr./mm² 128 CU 200 Mio Tr./CU
AMD Aldebaran CDNA2 6nm TSMC 2x 29,1 Mrd. Tr. auf 2x 717mm² 40,6 Mio. Tr./mm² 2x 128 CU 227 Mio Tr./CU
nVidia GH100 Hopper 5nm TSMC ~140 Mrd. Tr. (unklar, ob pro Die) auf 900-1000mm² (pro Die) pro Die 144 SM 486 oder 972 Mio Tr./SM

Twitterer Underfox hat ein Intel-Patent erspäht, welches sich um Grafik-Rendering auf multiplen Grafik-Dies dreht – sprich einen Multichip-Ansatz für Intel-Grafik. Wirklich überraschend kommt dies nun nicht, denn im HPC-Bereich arbeiten Intel kommenden Compute-Beschleuniger bereits jetzt mit mehreren (vielen) Dies, zudem geht Intel zukünftig auch im Prozessoren-Bereich in diese Richtung (Prozessoren-Generation "Meteor Lake" mit drei Dies). Aber natürlich stellt die Aufteilung von Grafik-Berechnungen auf mehrere Einzelchips immer noch eine ganz andere Schwierigkeit dar, als dies für HPC-Zwecke zu tun oder aber eine Aufgaben-gebundene Chip-Aufteilung (CPU, GPU, I/O)) zu erzeugen. Interessanterweise dürfte spätestens der Multichip-Ansatz dann auch für einen Intel-Angriff auf die absolute Leistungsspitze gut sein: Denn sobald man MultiChip einmal am Laufen hat, kann die Skalierung nach oben hin nur noch von Stromverbrauchs-Erwägungen gebremst werden.

Laut Heise hat die Rechenkraft des Ethereum-Netzwerks kürzlich die Petahash-Grenze überschritten, womit selbiges sich seit Jahresanfang 2021 mehr als verdreifacht hat. Im genauen lag der Zugewinn vom 1. Januar 2021 auf 1. Januar 2022 bei 673 Terahashes, eine Steigerung auf das 3,16fache. Interessant ist hierbei der von Heise aufgeworfene direkte Bezug zur bekannten Mining-Leistung der aktuellen Ampere/RDNA2-Grafikkarten: Jene liegen bei 30-70 MHash/s, je nach Modell und außerhalb der GeForce RTX 3090. Bei den LHR-Karten von nVidia sollte man natürlich besser gleich mit 75% Mining-Leistung kalkulieren, denn im professionellen Maßstab wird nVidias Mininglimiter sicherlich ausgehebelt. Je nachdem wo der Durchschnitts-Wert liegt, könnten der 2021er Zuwachs an Ethereum-Rechenleistung auf 12-17 Millionen Grafikkarten hinauslaufen.

Bezogen rein auf Desktop-Grafikkarten wäre dies nahezu ein Drittel von einer (derzeitigen) Jahreslieferung. Da anfänglich aber auch Gaming-Notebooks für Mining-Zwecke abgezweigt wurden, wird es wohl nicht ganz so viel sein: Im groben Maßstab ging somit eine Quartalslieferung Desktop-Grafikkarten an die Cryptominer, nur die anderen drei Quartalslieferungen gingen an Gamer. Das ganze gibt ein schönes Beispiel dafür ab, dass selbst ein nur mittelgroßer Mehrbedarf (+30% sind letztlich nicht sooo viel) einen Markt radikal durcheinander bringen kann, sofern die Möglichkeit zur (gleichartigen) Produktionsmengen-Ausweitung fehlt. Andererseits erscheint das Problem letztlich doch lösbar, denn +30% Angebotsausweitung (vielleicht weniger, wenn Cryptomining zurückgeht) sind mittel- und langfristig zu erbringen, zumindest wenn man genügend Grafikchips hierfür herstellen kann. Nur kurzfristig ist einer solch erheblichen Bedarfsausweitung unmöglich adäquat zu begegnen.

Desktop dGPU Mobile dGPU gesamt dGPU
Q1/2021 11,8 Mio. Stück ~10,5 Mio. Stück ~22,3 Mio. Stück
Q2/2021 11,47 Mio. Stück ~11,1 Mio. Stück ~22,5 Mio. Stück
Q3/2021 12,72 Mio. Stück ~11,6 Mio. Stück ~24,3 Mio. Stück
Q4/2021 geschätzt 13-14 Mio. Stück geschätzt 12 Mio. Stück geschätzt 25-26 Mio. Stück
2021 geschätzt 49-50 Mio. Stück geschätzt 45 Mio. Stück geschätzt 94-95 Mio. Stück
basierend auf Angaben von Jon Peddie Research samt eigenen Hochrechnungen