3

Wofür hat AMD den Tonga-Chip aufgelegt?

Eine der großen Überraschungen zum Launch des Tonga-Grafikchips in Form der Radeon R9 285 ist die Größe dieses neuen Grafikchips: Eine Chipfläche von 359mm² mit 5,0 Milliarden Transistoren – und damit genauso groß wie der vorhergehende Tahiti-Chip mit einer Chipgröße von 365mm² und jedoch nur 4,3 Milliarden Transistoren. Dabei war man sich vor dem Launch ziemlich sicher darüber, daß der Tonga-Chip den Tahiti-Chip primär zugunsten einer höheren Wirtschaftlichkeit ablösen sollte – sprich mit weniger Transistoren und vor allem einer kleineren Chipfläche. Teilweise ging man sogar davon aus, daß der Tonga-Chip sogar den Pitcairn-Chip der Radeon R9 270 Serie ablösen soll, welcher mit 212mm² Chipfläche und 2,8 Milliarden Transistoren deutlich kleiner ist. Eine gute Vorabschätzung für den Tonga-Chip lautete daher auf eine Chipfläche von 280mm² und ca. 3,5 Milliarden Transistoren, erreicht primär über den Wegfall der Einheiten für den professionellen Einsatz sowie der Verkleinerung des Speicherinterfaces.

Daß der Tonga-Chip nunmehr (nahezu) genauso groß wie der Tahiti-Chip geworden ist und sogar 16% mehr Transistoren besitzt, wirft daher einige Fragen ob der Zielsetzung von AMD mit dem Tonga-Chip auf. Diese Fragen sind derzeit schwierig zu beantworten, da der Vollausbau des Tonga-Chips nicht sicher bekannt ist. Bekannt sind allein die Hardware-Daten der Radeon R9 285 mit 28 Shader-Clustern an einem 256 Bit DDR Speicherinterface samt der seitens AMD gegenüber dem Tech Report gegebenen Information, das es noch vier weitere, bislang deaktivierte Shader-Cluster gibt. Aber auch mit 32 Shader-Clustern an einem 256 Bit DDR Speicherinterface kommt man letztlich nicht dazu, einen Grafikchip mit gleich 5,0 Milliarden Transistoren erklären zu können – und vor allem nicht erklären zu können, wo der Sinn darin liegt, den Tahiti-Chip mit einer nahezu gleichen Hardware zur gleichen Chipgröße abzulösen. Folgende Optionen bieten sich zur Auflösung dieser Frage derzeit an:

1.
Der Tonga-Chip verfügt in der Tat nur über die genannten 32 Shader-Cluster an einem 256 Bit DDR Speicherinterface, möglicherweise auch an einem 384 Bit DDR Speicherinterface, dies bleibt sich letztlich gleich. Die höhere Transistorenanzahl ging letztlich für die verdoppelten Raster-Engines, andere kleine Verbesserungen und eventuelle Produktions-Tweaks drauf. Das Ziel bestand hierbei nur in einer Performance-mäßigen Ablösung des Tahiti-Chips zu einer besseren Wirtschaftlichkeit. Jene bessere Wirtschaftlichkeit wird trotz der nahezu gleichen Chipfläche über andere Punkte erzielt, welche außerhalb dessen liegen, was die Presse gewöhnlich erfährt – möglicherweise eine höhere Produktionsausbeute, möglicherweise ein etwas kostengünstigerer Fertigungsprozeß, wohl auch einfachere Grafikboards (zumindest bei einem 256 Bit DDR Speicherinterface). Besonders wahrscheinlich oder gar sexy ist diese Erklärung nicht, aber sie ist nicht unmöglich, denn insbeondere der Punkt der wirklichen Fertigungskosten ist von außen her nicht einsehbar.

2.
Der Tonga-Chip verfügt nur über die genannten 32 Shader-Cluster an einem 256 oder auch 384 Bit DDR Speicherinterface. Die höhere Transistoren-Anzahl geht allerdings für bislang nicht bekannte Funktionen drauf, welche AMD derzeit auch noch nicht aktiviert hat (wäre es anders, würde man es bei der Performance merken bzw. würde AMD dementsprechend darauf herumreiten). Dies können eher banale Dinge wie größere Caches sein oder auch neue Hardware-Features, beispielsweise für DirectX 12. Entscheidender Punkt in diesem Gedankenmodell wäre, daß AMD jene Feature jetzt innerhalb der Radeon R200 Serie bewußt nicht aktiviert, weil jene erst mit der Radeon R300 Serie herausgebracht werden sollen. Damit würde sich rechtfertigen lassen, wieso AMD einen nahezu gleich großen Chip auflegt – weil jener in Zukunft einmal deutlich mehr Performance oder/und Features zeigen wird.

3.
AMDs Bestätigung der vier zusätzlichen Shader-Cluster ist letztlich keine Angabe darüber, wieviele Shader-Cluster der Tonga-Chip insgesamt hat – es wurde allein die Frage bejaht, ob da noch vier mehr Shader-Cluster existieren. Dies läßt die Möglichkeit offen, daß der Tonga-Chip sogar über noch mehr Shader-Cluster als "nur" 32 verfügt. Denkbar wäre ein System, wo der Tonga-Chip ganze 40 Shader-Cluster an einem 256 Bit DDR Speicherinterface trägt, dies wäre durchaus in die genannten 5,0 Milliarden Transistoren samt der Chipfläche von 359mm² hineinpackbar, sofern man auf die für den professionellen Einsatz benötigten Transistoren verzichtet. Letztere braucht man bei Tonga nicht wirklich, diese Aufgabe kann vom größten Chip des Portfolios übernommen werden – derzeit Hawaii und später Fiji. Die Zielsetzung von AMD in dieser Variante wäre, nicht nur Tahiti, sondern später auch Hawaii mit dem Tonga-Chip abzulösen – und gegenüber letzterem hätte Tonga dann die kleinere Chipfläche und damit die bessere Wirtschaftlichkeit.

4.
Der Tonga-Chip wird vielleicht nicht mehr von TSMC, sondern schon von GlobalFoundries gefertigt. Hiermit würde sich die höhere Transistoren-Packdichte gut erklären lassen, da GlobalFoundries diesbezüglich seine Vorteile gegenüber TSMC haben soll. Zudem müsste Tonga in diesem Fall keine weiteren versteckten Vorteile bieten, allein die sichere Erfüllung des Waferabkommens mit GlobalFoundries (welches bei Nichteinhaltung sehr empfindliche Strafzahlungen vorsieht) reicht aus, um die Auflage des Tonga-Chips zu begründen. Trotzdem könnte der Tonga-Chip in dieser Variante noch irgendwelche bislang nicht erkannten Neuerungen tragen, die höhere Transistorenanzahl sollte dies zumindest möglich machen. Diese Variante würde natürlich umgehend in sich zusammenfallen, wenn eine sichere Bestätigung kommt, das Tonga weiterhin von TSMC gefertigt wird.

Welche dieser Auflösungen zutrifft, wird sich mit der Zeit hoffentlich zeigen, eventuell bringt die Diskussion zu dieser Meldung auch noch weitere Gedankenansätze hierzu hervor. Aus der Sicht von Hardware-Enthusiasten wäre es natürlich schön, wenn der Tonga-Chip letztlich noch diverse Überraschungen bereithält und sich somit dessen Sinn (gegenüber dem Tahiti-Chip) wirklich erklären läßt. Bislang darf man es als wirkliches Rätsel betrachten, wieso AMD einen 365mm² großen Chip (Thaiti) des nominell gleichen Fertigungsverfahrens mittels eines 359mm² großen Chips (Tonga) ablöst, welcher weder mehr Performance noch andere wirklich ziehende Fortschritte mit sich bringt.

Änderung vom 3. September 2014: Variante 4 hinzugefügt.

Nachtrag vom 7. September 2014

Noch nachzutragen zum Tonga-Chip ist noch eine Bestätigung, daß der Chip laut AMD definitiv in "28nm HP bei TSMC" gefertigt wird. Die Idee No.4 unserer Fragerunde, wofür AMD den Tonga-Chip aufgelegt hat, erledigt sich somit umgehend. Im übrigen muß sich diese Angabe von "28nm HP" nicht wirklich mit der früheren Meldung von zwei AMD HighEnd-Chips in "28nm HPM" beißen. Die Fertigungsverfahren-Bezeichnungen sind leider nicht so exakt abgegrenzt bzw. werden von verschiedenen Chipentwicklern auch unterschiedlich angewandt: Beispielsweise bezeichnet Microsoft den bei TSMC gefertigten Xbox-One-SoC auch als "28nm HPM" im Sinne einer Abkürzung von "28nm HP-HKMG", während bei Chipentwickler AMD derselbe Chip als "28nm HP" bezeichnet wird. Die wahrscheinlichste Auflösung ist schlicht, daß hier nirgends wirklich "28nm High Performance Mobile (HPM)" gemeint ist, sondern überall das standardmäßige "28nm High Performance" (28nm HP). 28nm HPM wird wohl wirklich nur für Mobile-Chips mit deutlich geringerem Energiehunger eingesetzt, was schlecht auf Grafikchips und Konsolen-SoCs übertragbar ist.