13

Hardware- und Nachrichten-Links des 12./13. September 2020

Eine letzte Bestätigung für die Existenz eines Tiger-Lake-Achtkerners hat Intel mittels eines eigenerstellten Artikels auf Medium geliefert: Danach wird bei den Details zum Cache-System der Tiger Lake zugrundeliegenden "Willow Cove" CPU-Kerne explizit ein Achtkern-Die erwähnt – und gleichfalls ausgeführt, dass es zu diesem später genauere Informationen geben wird. Mittels jenes Achtkern-Dies will Intel gemäß der Gerüchteküche dann Tiger Lake-H aus der Taufe heben, sprich Mobile-Prozessoren bis zu einer TDP von 45 Watt erstellen. Dies dürfte auf Basis des bisher zu Tiger Lake gezeigten recht problemlos und vermutlich ohne größere Rückschritte bei den Taktraten machbar sein. Leider wird dies erst nächstes Jahr passieren, womit entsprechende Notebooks kaum vor Frühling bis Jahresmitte 2021 zu erwarten sind. Dann erst kann Tiger Lake gegenüber AMD so richtig in den Ring steigen – denn die derzeit vorliegenen Vierkerner von Tiger Lake sind nun einmal Technik-bedingt nicht für alle Performance-Klassen geeignet.

The Willow Cove core increases the mid-level cache to 1.25MB — up from 512KB. We also added a 3MB non-inclusive last-level-cache (LLC) per core slice. A single core workload has access to 12MB of LLC in the 4-core die or up to 24MB in the 8-core die configuration (more detail on 8-core products at a later date).
Quelle:  Intels Boyd Phelps auf Medium am 3. September 2020

Jenes Achtkern-Die von Tiger Lake dürfte dann sicherlich auch die Scharte der aktuellen Tiger-Lake-Prozessoren auswetzen, wo es nur ein PCI Express 4.0 Interface mit x4 Lanes zur gleichzeitigen Anbindung von NVMe-SSD und extra Grafikkarte gibt. Gleichzeitig wird jenes Achtkern-Die von Tiger Lake die höchst interessante Frage aufwerfen, wieso man bei gutem Funktionieren eigentlich noch "Rocket Lake" als Extra-Architektur für den Desktop-Einsatz benötigt. Schließlich stellt Rocket Lake nichts anderes als Tiger Lake auf 14nm dar – potentiell sogar mit etwas zurückhängender, zwischen Ice Lake und Tiger Lake liegender Architektur. Mehr CPU-Kerne bringt Rocket Lake ebenfalls nicht (ebenfalls maximal 8) – und wenn Tiger Lake im Power-Limit von 45 Watt auf gute, konkurrenzfähige Taktraten kommt, sollte Tiger Lake eigentlich auch Desktop-fähig sein, dort hat man schließlich viel höhere Power-Limits zur Verfügung. In jedem Fall dürfte es einen interessanten Zweikampf ergeben, wenn man Tiger Lake-H und Rocket Lake auf dasselbe Power-Limit bringt und gegeneinander antreten läßt.

Bei der PC Games Hardware spricht man über die finalen Daten zur GeForce RTX 3070, welche wie bekannt am 15. Oktober antritt. Dabei wird auch ein Blockschaltbild zum zugrundliegenden GA104-Chip aufgeboten, welches letzte Fragen zu dessen Hardware-Kapazitäten klärt. So tritt der GA104-Chip von GeForce RTX 3060 Ti & 3070 nunmehr doch mit 6 Raster-Engines an. Diesen Punkt hatte nVidia bei der offiziellen Ampere-Vorstellung offengelassen und oftmals wurden hierzu dann nur 4 Raster-Engines angenommen – was gut zu den maximal 48 Shader-Clustern des GA104-Chips passt. Allerdings trifft nun doch die alte Ampere-Vorhersage von Twitterer "Kopite7kimi" vollumfänglich zu, welcher bereits im Mai 2019 eben 6 GPC beim GA104-Chip notiert hatte. Im übrigen lag in der Detaillierheit dieser seinerzeitigen Daten ein Hauptgrund für deren Glaubwürdigkeit: Fakes kümmern sich in aller Regel nicht um solcherart kleinere Details, sondern suchen eher die plakative Zahl. In der Summe hat "Kopite7kimi" bisher drei von fünf realisierten Ampere-Chips vollkommen korrekt vorhergesagt – womit man annehmen darf, dass auch die Hardware-Daten zu den zwei übrigen Chips (GA106 & GA107) korrekt sind.

Für den GA104-Chip selber haben jene 6 anstatt 4 Raster-Engines dabei zwei Bedeutungen: Erstens einmal steigt damit die Anzahl der Raster Operation Units (ROPs) von 64 auf 96. Jene sind in der Ampere-Generation nicht mehr separat ausgeführt, sondern Teil des GPCs (Graphics Processing Clusters, Obereinheit einer Raster-Engine), korrelieren somit mit der Anzahl der GPCs bzw. Raster-Engines. Unter dem GA102-Chip enthält jeder GPC seine 16 ROP-Einheiten, somit maximal 112 ROPs beim GA102-Chip. Beim GA104-Chip ergibt dieser Aufbau dann immerhin noch 96 ROPs – und damit deutlich mehr als bei bisherigen nVidia-Grafikchips mit 256bittigem Speicherinterface (üblicherweise 64). Damit nähert sich der GA104-Chip dem GA102-Chip in diesen zwei Punkten – Raster-Engines & ROPs – doch ziemlich stark an, trotz einer erheblichen Differenz bei der Anzahl der maximalen Shader-Cluster (48 vs. 84). Hier dürfte auch der Grund dafür liegen, wieso nVidias eigene Ampere-Benchmarks nur eine Performance-Differenz von +35% zwischen GeForce RTX 3070 & 3080 ausgewiesen haben: Bei den Shader-Clustern liegen beide Grafikkarten zwar +48% auseinander, bei der Anzahl der Raster-Engines und ROPs herrscht allerdings sogar ein Gleichstand.

RTX3070 GA104 RTX3080 RTX3090 GA102
Raster-Engines (GPC) 6 6 6 7 7
Shader-Cluster (SM) 46 48 68 82 84
ROPs 96 96 96 112 112
Level2-Cache 4 MB 4 MB 5 MB 6 MB 6 MB
Speicherinterface 256 Bit GDDR6 256 Bit GDDR6 320 Bit GDDR6X 384 Bit GDDR6X 384 Bit GDDR6X