Die EETimes [1] erwähnen in ihrer Berichterstattung zur ISSCC interessante Details zu AMDs kommender letzter APU auf Basis der Bulldozer-Architektur, "Carrizo [2]". Jene wurde bisher [3] als nur geringfügig abweichend gegenüber der aktuellen AMD-APU "Kaveri [4]" begriffen, da es weiterhin vier CPU-Rechenkerne samt 512 Shader-Einheiten bei der integrierten Grafik geben soll. Einzig allein der Sprung von der Steamroller- zur Excavator-Ausbaustufe der Bulldozer-Architektur erschien bislang als der interessante Punkt zu Carrizo – neben wilden Spekulationen über Speicherinterfaces für GDDR5, eDRAM oder HBM [5] vielleicht.
Solcherart Spekulationen darf man nun jedoch angesichts der Größenangaben zu Carrizo neu aufleben lassen: Während Kaveri in der 28nm-Bulk-Fertigung von GlobalFoundries 2,41 Milliarden Transistoren auf 245mm² Chipfläche packt, sollen es bei Carrizo in der anscheinend identischen Fertigung nun gleich mehr als 3,1 Milliarden Transistoren sein – aber auf wiederum nur 245mm² Chipfläche. AMD würde hierbei also nicht nur die Packdichte deutlich steigern (eine Disziplin, in welcher AMD über seine Grafikchips viel Erfahrung hat), sondern eben auch für faktisch den gleichen Inhalt gute 700 Millionen mehr Transistoren aufbieten – sehr ungewöhnlich, wenn da nicht weitere Funktionen versteckt wären.
Llano | Trinity | Richland | Kaveri | Carrizo | |
---|---|---|---|---|---|
Fertigung | 32nm SOI GlobalFoundries | 32nm SOI GlobalFoundries | 32nm SOI GlobalFoundries | 28nm Bulk GlobalFoundries | 28nm Bulk GlobalFoundries |
Die-Daten | 1,45 Mrd. Transistoren auf 228mm² Chipfläche | 1,3 Mrd. Transistoren auf 246mm² Chipfläche | 2,41 Mrd. Transistoren auf 245mm² Chipfläche | >3,1 Mrd. Transistoren auf 245mm² Chipfläche | |
CPU-Unterbau | 4 Husky-Rechenkerne der K10.5-Architektur | 4 Piledriver-Rechenkerne der Bulldozer-Architektur | 4 Steamroller-Rechenkerne der Bulldozer-Architektur | 4 Excavator-Rechenkerne der Bulldozer-Architektur | |
CPU-Takt | maximal 3.0 GHz | maximal 4.2 GHz (unter TurboCore) | maximal 4.4 GHz (unter TurboCore) | maximal 3.7 GHz (unter TurboCore) | unbekannt |
Grafikeinheit | 400 VLIW5 Shader-Einheiten (20 TMUs, 8 ROPs) mit maximal 600 MHz Takt | 384 VLIW4 Shader-Einheiten (24 TMUs, 8 ROPs) mit maximal 800 MHz TurboCore-Takt | 384 VLIW4 Shader-Einheiten (24 TMUs, 8 ROPs) mit maximal 844 MHz TurboCore-Takt | 512 (1D) Shader-Einheiten (32 TMUs, 8 ROPs) mit maximal 720 MHz TurboCore-Takt | 512 (1D) Shader-Einheiten (32 TMUs, 8 ROPs) mit unbekanntem Takt |
Speicherinterface | 128 Bit DDR3, maximal DDR3/1866 | 128 Bit DDR3, maximal DDR3/1866 | 128 Bit DDR3, maximal DDR3/2133 | 128 Bit DDR3, maximal DDR3/2133 | 128 Bit DDR3, maximal DDR3/2133, extra DDR4-Interface (anfänglich deaktiviert) |
Featureset | SSE4a, DirectX 11.0 | SSE4a, AVX 1.1, FMA3/4, DirectX 11.0 | SSE4a, AVX 1.1, FMA3/4, GCN 1.1, DirectX 11.2b, HSA, Mantle, TrueAudio | SSE4a, AVX2, FMA3/4, GCN 1.2/2.0, DirectX 11.2b (DirectX 12?), Full HSA, Mantle, TrueAudio | |
Sockel | FM1 | FM2 | FM2 | FM2+ | FM2+ |
Launch | 14. Juni 2011 [6] | Mobile: 15. Mai 2012 [7] Desktop: 2. Oktober 2012 [8] |
Mobile: 12. März 2013 [9] Desktop: 5. Juni 2013 [10] |
Desktop: 14. Januar 2014 [11] Mobile: 4. Juni 2014 [12] |
geplant März 2015 (Carrizo-L für Einsteiger-Notebooks angeblich bereits im Dezember [13]) |
Als erstes würde einem da das (zusätzliche) DDR4-Speicherinterface einfallen, welches zuletzt schon [14] als faktisch bestätigt galt. Jenes soll zwar anfänglich nicht zum Einsatz kommen, kann aber in der Zukunft jederzeit aktiviert werden, womit AMD zeitnah auf die Preislage bei DDR4-Speicher reagieren kann – sobald es sich lohnt, wird es dann wohl auch DDR4-Ausführungen von Carrizo geben. Gerade da AMDs Zukunftspläne nach Bulldozer noch etwas vage sind, kann es passieren, daß Carrizo nicht all zu schnell abgelöst wird und daher länger durchhalten muß als die bislang jährlich neu aufgelegten AMD-APUs. In diesem Fall wäre DDR4-Speicher schnell verpflichtet – denn sobald Intel auf DDR4-Speicher umschwenkt, wird der Endkundenmarkt schnell DDR4-Speicher als "Grundvoraussetzung" ansehen.
Eine komplette Erklärung für 700 Millionen mehr Transistoren kann das DDR4-Speicherinterface aber nicht ergeben, jenes muß viel kleiner als diese Größenordnung sein. Was AMD also mit ein paar hundert Millionen "zusätzlicher" Transistoren bei Carrizo anfängt, bleibt dann tatsächlich dem Feld der Spekulationen überlassen: Denkbar wären zum einen Massetransistoren (zur besseren Taktbarkeit des Designs) oder aber eine technologische Aufrüstung der integrierten Grafiklösung – auch AMDs Tonga-Grafikchip [15] hat schließlich schon ebenfalls ca. 700 Millionen Transistoren, die bislang nicht erklärbar sind. Möglicherweise steckt hinter beiden Fällen eine gemeinsame Erklärung – aber auch alle anderen Theorien sind derzeit noch denkbar. Die 3,1 Milliarden Transistoren von Carrizo sind in jedem Fall eine heftige Größe für eine APU – zum Vergleich, Intels Haswell-Chips [16] sind selbst in der größten Vierkern-Anordnung mit GT3-Grafiklösung nur ungefähr 2 Milliarden Transistoren schwer.
Nachtrag vom 19. November 2014
Zur Frage, woher die 700 Millionen zusätzlichen Transistoren [17] der Carrizo-APU herkommen, gibt es auch eine ganz einfache Erklärung: Angeblich soll bei Carrizo die Southbridge (mit den Controller-Chips für SATA, USB, Sound, Netzwerk, etc.) bereits integriert sein. Jene dürfte zwar kaum alle 700 Millionen zusätzlichen Transistoren belegen, aber in der Summe von DDR4-Speicherinterface, Southbridge, volles HSA-Feature für die integrierte Grafik, eventuell mehr Cache und Massetransistoren könnte dies vielleicht hinkommen (und trotzdem besteht natürlich die Chance, daß da noch mehr vorhanden ist). Mit der integrierten Southbridge würden entsprechende Mainboards nochmals viel einfacher ausfallen können – allerdings verwundert dann ein wenig die Weiterverwendung des Sockels FM2+, denn egal des Sockels würde eine APU mit integrierter Southbridge sowieso immer vollkommen eigene Mainboards benötigen. Für den Desktop-Bereich macht die höhere Integration wohl am Ende nicht viel aus (sondern beschränkt eher die Wahlmöglichkeiten), im Mobile-Bereich könnte AMD an dieser Stelle viel Komplexität und damit Kosten einsparen, was die Notebook-Hersteller überaus gern sehen – und AMD in Zukunft vielleicht häufiger einmal verbauen als derzeit.
Verweise:
[1] http://www.eetimes.com/document.asp?doc_id=1324643&page_number=2
[2] http://www.3dcenter.org/news/amd-carrizo
[3] http://www.3dcenter.org/news/amd-carrizo-kommt-ohne-grosse-hardware-veraenderungen-gegenueber-kaveri
[4] http://www.3dcenter.org/news/amd-kaveri
[5] http://www.3dcenter.org/news/ein-moeglicher-grafikspeicher-der-zukunft-high-bandwith-memory-hbm
[6] http://www.3dcenter.org/artikel/launch-analyse-amd-llano
[7] http://www.3dcenter.org/artikel/launch-analyse-amd-trinity-mobile
[8] http://www.3dcenter.org/artikel/launch-analyse-amd-trinity-desktop
[9] http://www.3dcenter.org/news/amd-stellt-richland-als-reines-taktraten-upgrade-von-trinity-vor
[10] http://www.3dcenter.org/artikel/launch-analyse-amd-richland
[11] http://www.3dcenter.org/artikel/launch-analyse-amd-kaveri
[12] http://www.3dcenter.org/artikel/launch-analyse-amd-kaveri-mobile
[13] http://www.3dcenter.org/news/hardware-und-nachrichten-links-des-8-oktober-2014
[14] http://www.3dcenter.org/news/hardware-und-nachrichten-links-des-78-august-2014
[15] http://www.3dcenter.org/news/wofuer-hat-amd-den-tonga-chip-aufgelegt
[16] http://www.3dcenter.org/news/aktualisiert-chipflaechen-der-haswell-prozessoren-dies-bekannt
[17] http://www.3dcenter.org/news/amds-carrizo-apu-kommt-mit-ueber-3-milliarden-transistoren