15

Hardware- und Nachrichten-Links des 14./15. Juni 2018

Als Zugabe zu den kürzlichen Turing-Details gibt es noch eine weitere Aussage aus berufenem Munde in unserem Forum – diesesmal zur Turing-Performance. Wie üblich gibt sich Igor Wallossek von Toms's Hardware hierzu reichlich nebulös – und sagt einfach nur aus, das es nicht die oftmals genannten +40% Mehrperformance zwischen Turing und Pascal geben soll. Dies läßt sich logischerweise in zwei Richtungen hin auslegen: Entweder ist damit eine Mehrperformance von bis zu +30% gemeint – was jetzt nicht gerade wahrscheinlich ist, dies wäre doch eher unterdurchschnittlich für eine neue Grafikkarten-Generation, welche auf neuen Grafikchips basiert. Oder aber es meint, das die Mehrperformance von Turing die 40-Prozent-Markt überschreitet – was sicherlich die wahrscheinlichere Auflösung darstellt, auch wenn normalerweise die Möglichkeiten der oftmals zu Turing genannten 12nm-Fertigung eigentlich bei 40% Mehrperformance enden, wollte nVidia nicht bedeutsame Architektur-Verbesserungen oder/und viel größere Chipflächen bringen.

40% sind es nicht
Quelle:  Igor Wallossek von Toms's Hardware @ 3DCenter-Forum am 13. Juni 2018

Die Performance ist eine Raub- und keine Hauskatze. Ich hätte etwas weniger erwartet.
Quelle:  Igor Wallossek von Toms's Hardware @ 3DCenter-Forum #1 & #2 am 13. Juni 2018

Darauf, das es eher die höhere als die niedrigere Auflösung ist, deutet auch eine frühere Aussage hin, wonach man von Turing eher einen beachtlichen Sprung als denn einen typischen Refresh-Sprung erwarten kann. Insofern kann man es fast als gegeben ansehen, das Igor Wallossek hiermit einen Performancesprung durch Turing oberhalb von +40% meint. Sicher ist dies nicht, denn wie gesagt sind alle diese Forenpostings in mehrere Richtungen hin auslegbar – und laut Igors eigener Aussage liegen wir bei der bisherigen Auslegung seiner Ausssagen (angeblich) auch schon maßgeblich falsch. Dies ist halt das Risiko bei der Auslegung von solcherart Informationen, welche üblicherweise wenig präzise daherkommen und vielleicht auch nur im Zusammenhang mit Fakten verstehbar sind, welche derzeit noch nicht öffentlich eingesehen werden können. Aber aus genau diesem Grund sind die entsprechenden Newspostings auch sehr deutlich mit "Gerüchteküche" gekennzeichnet und legen wir auch Wert darauf, die jeweilige Quelle möglichst originalgetreu wiederzugeben – worauf sich jeder seine eigene Meinung bilden kann.

In ihrer Berichterstattung zu den Turing-Details bringen WCCF Tech im übrigen noch einen wichtigen Punkt zur Sprache: nVidias Turing-Generation dürfte sicherlich den ersten Hardware-Support für RayTracing im Bereich der Gaming-Chips mit sich bringen. Dafür gibt es derzeit zwar noch keine zugrundeliegenden Gerüchte – aber das ganze ist eine ziemlich offensichtliche Entwicklung, welche in unserem Forum schon des längerem diskutiert wird. Augenscheinlich ist auch die Chipfläche, welche nVidia für ein paar Tensor-Cores (oder ähnliches) opfern muß, verhältnismäßig klein – und da nVidia bei der RayTracing-Präsentation ziemlich weit vorn mit dabei war, erscheint die ehe frühe als späte Umsetzung in Hardware nur folgerichtig. Dabei muß sich nVidia auch nicht in Richtung einer ernsthaften RayTracing-Performance verausgaben, dies kann gern das Thema nachfolgender Grafikchip-Generationen sein – erst einmal etwas zu haben, womit man feine Demos auflegen und technologische Überlegenheit demonstrieren kann, reicht für die Turing-Generation wohl vollkommen aus. Der reale RayTracing-Support in PC-Spielen dürfte schließlich nur langsam loslegen und anfänglich RayTracing generell nur für Spezialeffekte nutzen, ergo ist da keine ganz besonders schnelle RayTracing-Hardware (auf entsprechend großer Chipfläche) notwendig.

Die PC Games Hardware haben sich mit dem Prozessoren-Die von "Cannon Lake" beschäftigt. Der erste 10nm-Prozessor von Intel kommt nur als kleines 2C+GT2-Die daher, sprich zwei CPU-Kerne samt GT2-Grafiklösung für Einsteigerbedürfnisse. Die geschätzte Chipfläche liegt dabei mit ~71mm² nur maßvoll niedriger als beim 2C+GT2-Die von Skylake-U (aus der 14nm-Fertigung) mit 102mm². Aber natürlich gilt hierbei einzurechnen, das je kleinere Prozessoren man benutzt, um so geringer die Fortschritte bei der Flächenreduktion wirken – was damit zusammenhängt, das typischerweise schlecht skalierbare Chipteile (Speicherinterface & PCI-Express-Interface) bei kleineren Prozessoren relativ gesehen größer ausfallen und damit die insgesamte Skalierung um so schlechter werden lassen. Hinzu kommt noch, das Cannon Lake natürlich auch Architektur-Verbesserungen mit sich bringen könnte und in jedem Fall eine dickere Grafiklösung mit sich bringt – GT2 bedeutet bei Skylake bis Coffee Lake "nur" 24 CUs, bei Cannon Lake dann allerdings gleich 40 CUs. Da gerade bei den kleineren Intel-Prozessoren die integrierte Grafiklösung inzwischen die Hälfte (oder mehr) der Chipfläche belegt, dürfte diese größere Grafiklösung bei Cannon Lake doch einiges ausmachen.

Vor allem aber gilt einzurechnen, das Intel bei seiner eigenen Fertigungstechnologie-Entwicklung weniger denn auf Flächenvorteile schaut als andere Halbleiterfertiger. Intel verschiebt die Gewichtung bei seiner Fertigungstechnologie-Entwicklung eher in Richtung von Taktrate und Stromverbrauch – letzteres ergibt gerade im Mobile-Bereich alle beide wichtigen Möglichkeiten: Entweder kann man sehr ernergieeffiziente Prozessoren herausbringen, oder aber mit höherem Takt auf gleicher Leistungsaufnahme wie in der vorherigen Generation eine starke Mehrperformance bieten. Die letzten paar mm² an Chipfläche muß Intel dabei nicht herausholen, dafür sind die derzeit bei Intel üblichen Chipflächen (Vierkerner bei 122mm², Sechskerner bei ~150mm²) bereits ausreichend klein bzw. wirtschaftlich. Unter der 10nm-Fertigung bekommt Intel das 10-Kern-Die von Skylake-X/SP (322mm²) vermutlich bereits auf knapp 200mm² gedrückt – womit unter 10nm sogar der Weg zu Zehnkern-Prozessoren im normalen Consumer-Segment offenstehen würde. Ob Intel so schnell so weit geht, bleibt ungewiß, vermutlich dürfte man mittels der nachfolgenden Ice-Lake-Generation (in der 10nm-Fertigung) erst einmal Achtkerner als "normales" Produkt einführen – nicht also wie bei Coffee Lake nur nachgereicht und zum (vermutlich) höheren Preispunkt.