26

TSMCs 3nm-Fertigung wird (erneut) keine Performance-Verdopplung ermöglichen

Der Planet 3DNow! und AnandTech berichten zu den technischen Spezifikationen von TSMCs 3nm-Fertigung, welche der derzeit weltweit führende Halbleiter-Fertiger immerhin schon im zweiten Halbjahr 2022 in die Massenfertigung überführen will. Jene soll gegenüber der standardmäßigen 5nm-Fertigung eine Flächenreduktion um -42%, eine Taktraten-Verbesserung um +10-15% sowie eine Stromverbrauchsersparnis von -25-30% bringen (bei Taktrate/Stromverbrauch gilt immer entweder/oder, nicht jedoch gleichzeitig in dieser Höhe). TSMC wird in der Presse dafür ziemlich gelobt, obwohl eigentlich beim Vergleich der Daten zur 5nm-Fertigung auffallen müsste, dass die 3nm-Fertigung einen nochmals kleineren Sprung daherbringt. Wie schon oftmals an dieser Stelle derart genannt, hat TSMC zugunsten der eigenen Roadmap-Durchführung die technischen Fortschritte der jeweiligen NextGen-Fertigungsstufen reduziert – von 3nm zu 5nm ist es eher denn ein "Dreiviertel-Nodesprung" als denn ein üblicher "Fullnode-Sprung".

Massenfertigung Vergleich Flächenbedarf Taktrate Stromverbr.
TSMC N7 laufend N7 vs. N10 > -37% ? < -40%
TSMC N7P laufend N7P vs. N7 ±0 +7% -10%
TSMC N7+ laufend N7+ vs. N7 -17% +10% -15%
TSMC N6 laufend N6 vs. N7 -18% ±0 ±0
TSMC N5 Q2/2020 N5 vs. N7 -45% +15% -30%
TSMC N5P 2021 N5P vs. N5 ±0 +5% -10%
TSMC N4 2021 N4 vs. N5 ? ? ?
TSMC N3 H2/2022 N3 vs. N5 -42% +10-15% -25-30%

Besonders deutlich ist dies anhand der Stromverbrauchs-Reduktion abzulesen, welche mit minus 25-30% nicht in der Lage sein wird, einen Chip mit doppelter Transistorenmenge im selben Stromverbrauchs-Budget zu halten. Dafür wäre nominell eine Stromverbrauchs-Reduktion von -50% vonnöten, wovon der von TSMC angegebene Wert überaus klar abweicht. Ganz grob hochgerechnet reicht TSMCs 3nm-Fertigung somit aus, um Chips mit ca. 50-60% mehr Transistoren im selben Stromverbrauchs-Budget zu halten – nicht wenig und sicherlich in der Praxis auch einen ordentlichen Performancegewinn ergebend, aber eben auch schon rein nominell weit von einem Fullnode-Sprung entfernt, was üblicherweise eine Verdopplung bedeutet. In der Praxis können dann weitere Seiteneffekte auch noch zu einer Reduzierung dieses nominellen Performance-Ziels führen, hervorgerufen beispielsweise über Chipteile, die sich schlecht verkleinern lassen oder/und egal der Fertigung immer gleich viel Energie ziehen (Interfaces beispielsweise).

Bei der derzeit anstehenden 5nm-Fertigung ist dies im übrigen nicht viel anders: Auch dort reicht die Stromverbrauchs-Reduktion von -30% gegenüber dem standardmäßigen 7nm-Verfahren nicht für eine Transistoren-Verdopplung im selben Stromverbrauchs-Budget aus, vielmehr sind mit TSMCs "N5" eher nur +60% Mehrperformance zu erzielen. Die Alternativen von größeren Chips oder aber (noch) mehr Strom verbrauchenden Chips sind bei einigen Sonderprojekten im HPC-Bereich gangbar, aber eben nicht bei Produkten für den Massenmarkt, wie Grafikchips für Gaming-Grafikkarten. Zudem leistet sich nVidia mit der Ampere-Generation augenscheinlich schon einen gewissen Ausbruch aus den bisherigen Gepflogenheiten, üblicherweise nicht mehr als 250 Watt TDP anzustreben und beim Realverbrauch unterhalb 300 Watt herauszukommen. Gerade aber weil die Ampere-Generation nunmehr wohl die 300-Watt-Grenze reißt, sind noch höhere Wattagen für zukünftige Grafikkarten um so unwahrscheinlicher – weil dann nur 20% mehr Stromverbrauch schnell zur 400-Watt-Grenze führen, dies irgendwann nicht mehr vermittelbar und (in großen Stückzahlen) verkaufbar ist.

Für PC-Prozessoren sind diese Aussichten nicht wirklich von großem Belang, da es kaum erwartbar ist, dass AMD seine bisherige Kern-Offensive zukünftig im gleichen Tempo fortsetzt. Hiergegen spricht dann auch das Problem der Software-Landschaft, welche erst einmal das gute Ausnutzen von Achtkerner und mehr lernen muß – womit es keinen Sinn macht, jetzt alsbald 16-Kerner als neues Normalmaß für PC-Prozessoren zu positionieren. Im HEDT- und Server-Bereich wird AMD natürlich durchaus limitiert, wenn ein neuer Fertigungsnode keine (nominelle) Verdopplung der Kern-Anzahl ermöglicht. Eventuell wird es hierbei zukünftig kleinere Sprünge geben (keine Verdopplung, sondern nur +50% mehr Kerne) – eventuell kann man auch mit den Taktraten tricksen, so dass die Verdopplung (auf niedrigerem Takt) dennoch geliefert werden kann. Für AMD dürfte im Segment der HEDT- und Server-Prozessoren derzeit aber sowieso nicht unbedingt noch (viel) mehr Performance auf der Agenda stehen, da dies derzeit überhaupt nicht das Problem von AMD speziell im Server-Segment darstellt.

Für Grafikkarten bedeutet dies hingegen, dass man von den kommenden 5nm- und 3nm-Generationen maximal jeweils +60% Mehrperformance erwarten kann – mit vermutlich eher einer etwas geringeren Mehrperformance, sofern die Seiteneffekte stark ziehen, jedoch kaum einer höheren Performance-Zielsetzung. Dies wäre aus heutiger Sicht nicht einmal schlecht, schließlich hat nVidias Turing-Generation gerade einmal eine Mehrperformance von ca. 35% mitgebracht. Aber im generellen Maßstab ist dies natürlich arg wenig, gerade wenn wie gesagt ein Nodesprung vorliegt. Zudem wollen auch diese (maximal) +60% erst einmal erreicht sein, dafür muß dann auch wirklich alles optimal funktionieren und dürfen vor allem die Fertigungskosten nicht all zu stark anziehen. Jene könnten sich genauso noch zum bremsenden Element entwickeln, bei stark anziehenden Halbleiterkosten könnten die Chipentwickler schließlich geneigt sein, die technologischen Möglichkeiten zugunsten der Kostenlage nicht ganz auszunutzen – und somit die Mehrperformance der jeweiligen Generation nochmals limitieren. In jedem Fall liegen nunmehr seitens Chipfertiger TSMC klare Maßgaben vor, dass die früher (grob) erreichten Performance-Verdopplungen pro Grafikchip-Generation heuer allein vom technischen Standpunkt her nicht mehr anzunehmen sind.

Bei Samsung sieht dies dann etwas anders aus: Dort fehlt die 5nm-Fertigung als Nodesprung, vielmehr stellen die Fertigungsschritte "5LPE" und "4LPE" nur (weitere) Verbesserungen der 7nm-Fertigung dar. Den eigentlichen Nodesprung bei Samsung bringt dann die 3nm-Fertigung "3GAA" daher, sehr deutlich beim um -50% reduzierten Stromverbrauch zu sehen. Damit hält Samsung weiterhin die Fahne von vollwertigen Fullnode-Sprüngen hoch – benötigt dafür aber auch mehr Zeit, was ergo zu einem technologisch ziemlich gleichen Ergebnis wie bei TSMC führen dürfte. Ob Samsung allerdings so schnell im Wettstreit der Auftragsfertiger bedeutende Kontingente an technologisch führender Hardware an Land ziehen kann, bleibt abzuwarten: nVidias Gaming-Ampere ist dafür sicherlich ein Anfang, dieser Auftrag (für Samsungs 8LPP-Fertigung) wurde seitens nVidia allerdings vermutlich eher aus Kostenerwägungen heraus erteilt, und nicht wegen einer besseren Fertigungstechnologie bei Samsung.

Massenfertigung Vergleich Flächenbedarf Taktrate Stromverbr.
Samsung 8LPP laufend 8LPP vs. 10LPE ≤ -10% ±0 ≤ -10%
Samsung 7LPP laufend 7LPP vs. 10LPE -40% +20% -50%
Samsung 6LPP laufend 6LPP vs. 7LPP -9% ±0 ?
Samsung 5LPE H1/2020 5LPE vs. 7LPP < -20% +10% -20%
Samsung 4LPE 2021 4LPE vs. 7LPP ? ? ?
Samsung 3GAA 2022 3GAA vs. 7LPP -40% +35% -50%

Generell wäre zudem zu den angegebenen Terminlagen zu erwähnen, dass die Überführung in die Massenfertigung laut des Chipfertigers mitnichten bedeutet, dass dann sofort PC-Prozessoren und PC-Grafikchips aus der jeweiligen NextGen-Fertigung purzeln. Zuerst sind einmal die Smartphone-SoCs dran, was dann oftmals aber auch erst ein halbes Jahr nach Start der Massenfertigung zu real kaufbaren Produkten führt. Und ausgehend davon kann man grob ein Jahr ansetzen, ehe damit große und stromfressende PC-Chips gefertigt werden. TSMCs 5nm-Fertigung ist also ein Thema für die PC-Chips zum Jahreswechsel 2021/22, für die 3nm-Fertigung von TSMC und Samsung kann man aus PC-Sicht grob den Jahresanfang 2024 anpeilen. Die Chipentwickler auf dem PC müssen sich aber natürlich nicht an diese frühestmöglichen Termine halten, sondern könnten ihre konkreten Produkte auch erst später ansetzen – teils aus Kosten- und Ausbeute-Gründen, teils weil die eigenen Entwicklungstermine es gar nicht früher vorsehen.