23

Erste Details zu AMDs Bobcat-Nachfolger "Kabini"

Der Planet 3DNow! bringt zwei interessante Details zum im ersten Halbjahr 2013 zu erwartenden Bobcat-Nachfolger "Kabini" mit Jaguar-Rechenkernen: Diese werden zum einen bereits Intels CPU-Befehlssatzerweiterung AVX unterstützen, zum anderen scheint der bisher pro Rechenkern 512 kByte große Level2-Cache bei Kabini einem gemeinsamen Level2-Cache in der Größe von (insgesamt) 2 MB zu weichen. Andere Änderungen der Jaguar-Rechenkerne sind noch nicht bekannt, jene wird AMD aber wohl demnächst auf der HotChips-Konferenz im August ausbreiten. Bekannt sind zu Kaveri noch die Eckpunkte, das AMD von zwei (Bobcat) auf vier (Kabini) Rechenkerne hochgehen wird, zudem wird die integrierte Kabini-Grafik erstmals in diesem Bereich auf AMDs aktueller GCN-Architektur basieren. Desweiteren sind schon die groben von AMD geplanten Kabini-Ausführungen und deren TDPs aus einem früheren Beta-Treiber zu entnehmen:

AMD9833.1 = "KB 2C 12W (9833)"
AMD9834.1 = "KB 2C 5W (9834)"
AMD9831.1 = "KB 4C 17W (9831)"
AMD9832.1 = "KB 4C 17W (N-1) (9832)"
AMD9830.1 = "KB 4C 25W (9830)"

Gut zu erkennen ist, daß die Vierkern-Version von Kabini mit TDPs von 17W und 25W antreten wird, während die Zweikern-Version von Kabini TDPs von 5W und 12W aufweisen wird. So gesehen senkt AMD damit sogar die Verlustleistung gegenüber Bobcat, denn dieser bringt es mit zwei Rechenkernen auf TDPs von 9W und 18W. Grund für diese (relative) Absenkung der Verlustleistung bei wahrscheinlich weiter gesteigerter CPU-Power und einem sicherlich deutlich mächtigeren Grafik-Teil ist der Wechsel von TSMCs 40nm-Fertigung (Bobcat) auf TSMCs 28nm-Fertigung (Kabini) – was AMD reichlich Möglichkeiten gibt, zum einen mehr Transistoren auf der gleichen Chipfläche zu verbauen oder/und eben an Verlustleistung einzusparen.

Bobcat Kabini
Fertigung 40nm TSMC (Bulk) 28nm TSMC (Bulk)
Chipfläche ~77mm² ?
CPU-Teil 1-2 Rechenkerne, 512 kByte Level2-Cache pro Rechenkern, alle CPU-Befehlssatzerweiterungen bis SSE4A 2-4 Rechenkerne, anscheinend 2 MB Level2-Cache insgesamt, alle CPU-Befehlssatzerweiterungen bis AVX
GPU-Teil 80 VLIW5 Shader-Einheiten GCN-basierte Grafiklösung, spekuliert werden derzeit 128 bis 256 (1D) Shader-Einheiten
Speicherinterface SingleChannel DDR3, offiziell bis DDR3/1333 (viele kleinere Modelle nur bis DDR3/1066) ?
TDPs Zweikern-Versionen 5,9W, 9W & 18W 5W & 12W
TDPs Vierkern-Versionen - 17W & 25W
Topmodell E2-1800 mit 2 Rechenkernen, 1.7 GHz CPU-Takt und 523 MHz GPU-Takt (TC @ 680 MHz), max. DDR3/1333
(gesamte Modell-Liste)
?

Wie stark AMD den Grafik-Teil von Kabini gegenüber Bobcat aufbohren wird, ist derzeit der Gegenstand einiger Spekulationen – aufgrund des höheren TDP-Limits der Vierkern-Ausführungen sowie des Wechsels auf eine deutlich kleinere Fertigungsgröße dürfte auch hier einiges möglich sein. Gemäß des bisherigen GCN-Schemas à jeweils 64 Shader-Einheiten in einem Shader-Cluster sind 64, 128, 192 und 256 Shader-Einheiten bei Kabini denkbar – wobei je höher die Anzahl wird, um so näher würde Kabini natürlich in den Bereich der Trinity- und Kaveri-Prozessoren kommen, zum anderen lohnt sich dann ziemlich schnell auch eine gleichzeitige Aufbohrung des Speicherinterfaces.

Letzteres dürfte AMD allerdings aufgrund der weiterhin angepeilten kleinen Chipfläche (ein größeres Speicherinterface nimmt auf so einem kleinen Chip relativ gesehen viel zusätzliche Chipfläche ein) und des primären Einsatzgebietes im LowCost-Bereich zu vermeiden versuchen – was im Umkehrschluß bedeuten mag, daß AMD die Grafik-Einheit von Kabini wohl maximal so stark auslegen dürfte, daß jene gerade noch so an einem SingleChannel-Speicherinterface ihre Leistung entfalten kann. 128 (1D) Shader-Einheiten erscheinen somit als eine ziemlich logische Auflösung jener Frage – damit würde man trotzdem gegenüber den bisherigen 80 VLIW5 Shader-Einheiten von Bobcat enorm an theoretischer und sogar noch mehr bei der praktischen Rechenleistung hinzugewinnen. Zusammen mit den (bis zu) vier Rechenkernen scheint der Bobcat-Nachfolger nächstes Jahr ein erneut sehr interessantes Produkt zu werden, welches für viele Standard-Aufgaben eine zufriedenstellende Performance zur Verfügung stellen kann.