21

News des 21. Juli 2010

Gemäß SemiAccurate gibt es nun eine verläßliche Angabe über die Größe des GF104-Dies – diese liegt bei immerhin 367mm² und damit doch etwas über der Die-Größe des RV870/Cypress-Chips von 334mm². Für nVidia hat dies die Auswirkung, daß der GF104-Chip – bei angenommen gleicher Produktionsausbeute – dann doch nicht günstiger zu fertigen ist als ATIs RV870/Cypress-Chip, welcher zudem auch noch in höheren Preisbereichen und damit zu höheren Abgabepreisen verkauft wird. Die praktischen Auswirkungen für den Endkunden sind allerdings überschaubar: Der letztliche Straßenpreis ergibt sich weniger aus der konkreten Kostenlage, sondern eher aus der Überlegung, wieviel man für die Hardware angesichts ihrer Performance und Features verlangen kann. Selbst ein pro Forma geringerer Gewinn pro Chip kann letztlich wieder durch eine höhere verkaufte Stückzahl oder aber eine bessere Produktionsausbeute ausgeglichen werden – eine wirkliche Information darüber, ob nun ATI oder nVidia günstiger produzieren, ergibt sich aus diesem eher geringen Unterschied in der Die-Größe nicht.

Laut der türkischen Webseite Donanim Haber tritt im August eine GeForce GTS 450 auf Basis des GF106-Grafikchips mit einem 128 Bit DDR Speicherinterface und 1024 MB Grafikkartenspeicher an. Weitere Informationen zu der Karte gibt es derzeit noch nicht, so daß Spekulationen Tür und Tor geöffnet sind – aber ganz falsch kann Meldung kaum sein, denn genau zu diesen Daten wurde eine GF106-basierte GeForce GTS 450 schon einmal vor zwei Monaten gemeldet, wenngleich dort auch noch eine zweite GeForce GTS 450 mit einem gleich 192 Bit DDR breiten Speicherinterface genannt wurde. Ob nVidia das Spielchen mit den unterschiedlichen Speicherinterface bei gleichem Kartennamen bei der GeForce GTS 450 wiederholt, oder ob sich dies irgendwie anders auflösen läßt, bliebe abzuwarten – ohne genauere Hardware-Daten läßt sich derzeit sowie keine Einschätzung zum Leistungspotential bzw. zum Preisrahmen der GeForce GTS 450 treffen.

Seitens Fudzilla kommt erneut eine Aussage, AMDs Fusion-Prozessoren würden eine integrierte Mainstream-Grafiklösung auf RV830/Redwood-Niveau beinhalten. Dies wäre zwar überaus schön, weil ein heftiger Performancesprung für integrierte Grafiklösungen – aber es ist davor zu warnen, sich hiervon zu viel zu versprechen. Letztlich wurde bisher noch nahezu jede integrierte Grafiklösung als "großer Performancedurchbruch" angekündigt – um dieses Versprechen dann letztlich so gut wie nie einzuhalten. Zudem erscheint es uns als nahezu unmöglich, eine solch leistungsstarke Grafik in die Bobcat-Architektur einzubauen: Diese ist für Nettops und Netbooks gedacht und soll in Konkurrenz zu Intels Atom gehen – kürzlich sprach AMD sogar noch explizit von einer sehr kleinen Chipfläche bei Bobcat. Da dieser Prozessor weiterhin in 40nm hergestellt werden soll, sind die allein 166mm² Die-Fläche des RV830/Redwood-Chips unter 40nm wohl komplett budgetsprengend bei Bobcat.

Hinzu kommt der Punkt, daß ein RV830/Redwood-Grafikkern am Bobcat-Speicherinterface glatt verhungern würde – diesem steht nämlich nur ein 64 Bit DDR SingleChannel-Interface bis DDR3/1333 zur Verfügung, was eine Speicherbandbreite von 10,7 GB/sec erreicht. Dies sind gerade einmal LowCost-Gefilde (eine Radeon HD 5450 mit DDR2-Speicher hat 6,4 GB/sec), noch dazu wo sich Grafikchip und Prozessor diese Speicherbandbreite schließlich teilen müssen – und damit in jedem Fall deutlich zu wenig, um einen RV830/Redwood-Grafikkern sinnvoll mit Speicherbandbreite zu füttern. Deswegen halten wir den RV830/Redwood zumindest innerhalb der Bobcat-Architektur für nahezu ausgeschlossen, vermutlich wird es dort nur einen integrierten RV810/Cedar-Kern geben – auch dessen 63mm² Die-Fläche unter 40nm sind schon viel für die primäre Aufgabe der Bobcat-Architektur, einen möglichst kleinen und sparsamen Chip zu erzeugen.

Bobcat Llano Bulldozer
Ausrichtung Tablets, Netbooks, Nettops, Subnotebooks LowCost- und Mainstream-Markt Mobile/Desktop HighEnd-Markt Desktop
Namen Projekt: Fusion
Architektur: Bobcat
Prozessor: Ontario
Plattform: Brazos
Projekt: Fusion
Architektur: Llano
Prozessor: Llano
Plattformen: Sabine (Mobile) bzw. Lynx (Desktop)
Architektur: Bulldozer
Prozessor: Zambezi
Plattform: Scorpius
Technik abgespeckter Kern, ein bis zwei Rechenkernen, SingleChannel Speicherinterface, Speichersupport bis DDR3/1333, Kern ähnlich wie aktueller K10-Prozessor (größerer Level2-Cache, kein Level3-Cache), zwei bis vier Rechenkerne, DualChannel Speicherinterface, Speichersupport bis DDR3/1866 aufgebohrter Kern mit mehr Hardware-Einheiten, vier bis acht Rechenkerne, DualChannel Speicherinterface, Speichersupport bis DDR3/1866
Fertigung 40nm Bulk bei TSMC, Chipfläche angeblich nur halb so groß wie bisherige AMD-Chips 32nm SOI bei GlobalFoundries, angeblich rund eine Milliarde Transistoren 32nm SOI bei GlobalFoundries
Grafik integrierte DirectX11-Grafik, vermutlich ähnlich wie RV810/Cedar-Chip oder kleiner, vermutlich 40-80 Shader-Einheiten integrierte DirectX11-Grafik, vermutlich ähnlich wie RV830/Redwood-Chip oder kleiner, vermutlich 200-400 Shader-Einheiten -
Sockel FT1 (BGA) Mobile: FP1 (BGA) und FS1 (µPGA)
Desktop: FM1 (µPGA)
AM3r2 (µPGA)
TDPs 5W – 1 Kern
9W – 1/2 Kerne
18W – 1/2 Kerne
20W – 2 Kerne
Mobile:
20W/26W/30W – 2 Kerne
33W – 3 Kerne
30W/35W/45W – 4 Kerne
Desktop:
bis zu 75W: 2/3/4 Kerne
bis zu 100W: 3/4 Kerne
?
Chipsatz "Hudson D1" (SATA III) "Hudson D2" (SATA III, USB 3.0) 890FX/GX (SATA III)
Launch Q4/2010 Q1/2011 Q2/2011

Bei der Llano-Architektur erscheint dagegen die Integration eines RV830/Redwood-Grafikkerns prinzipiell machbar – dadurch, daß dieser gleich komplett in 32nm gefertigt wird, kann AMD die Die-Fläche dieses Grafikchips auch noch einmal herunterschrauben. Auch passen die 627 Millionen Transistoren von RV830/Redwood gerade so in das für Llano bekannte Transistorenbudget von gut einer Milliarde Transistoren: Der Prozessor selber wird wohl runde 400 Millionen Transistoren wiegen (der K10 ohne Level3-Cache hat 300M, mit Level3-Cache sind es 758M – Llano kommt zwar ohne Level-Cache, aber mit einem größeren Level2-Cache), so daß zusammen mit den 627M von RV830/Redwood knapp eine Milliarde Transistoren herauskommen. Zudem verfügt Llano gleich über ein 64 Bit DDR DualChannel-Interface bis DDR3/1866, die Speicherbandbreite liegt demzufolge bei 29,9 GB/sec – dies ist in etwa das Niveau einer Radeon HD 5570 mit DDR3-Speicher (28,8 GB/sec), wenngleich sich bei Llano natürlich auch wieder Prozessor und Grafikkern diese Speicherbandbreite teilen müssen.

Aufgrund der Knappheit der Kalkulation sowohl bei der Transistorenmenge als auch beim Speicherinterface würde es uns aber nicht überraschen, wenn Llano letztlich mit einer etwas kleineren Grafiklösung als dem vollen RV830/Redwood-Chip antritt. Selbst schon die Hälfte dessen (200 Shader-Einheiten) wären ein erheblicher Fortschritt gegenüber den besten bisherigen integrierten Grafikeinheiten, welche bei AMD derzeit nur mit 40 Shader-Einheiten (Radeon HD 4200 Serie) antreten. Auch marktstrategisch wäre eine zu groß ausfallende Grafikeinheit bei der Llano-Architektur nicht clever seitens AMD, denn man will dort sicherlich auch weiterhin gute Geschäfte mit extra Grafikchips wenigstens im Mainstream-Bereich machen – ein Prozessor, dessen Grafikeinheit gleich mal den Mainstream-Markt im Grafikkartenbereich kanabalisiert, ist da eher unwahrscheinlich.