5

News des 5. September 2024

Twitterer MEGAsizeGPU bestätigt, dass der kürzlich erwähnte BenchLife-Bericht zur Terminlage von GeForce RTX 5080 & 5090 nicht von einem Erscheinen im September spricht, sondern dass mit dieser Terminangabe die nVidia-interne Finalisierung des Designs gemeint sei. Die Fehlauslegung basiert wohl auf einem chinesischen Begriff, der innerhalb von Herstellerkreisen anders verwendet wird als eine automatische Übersetzungs-Funktion dies verarbeitet. Dies wurde unsererseits schon vermutet und vom Twitterer nunmehr klar bestätigt. Im September soll nVidia somit intern fertig sein, dann dürften die Grafikkarten-Hersteller gebrieft werden und benötigen ihrerseits üblicherweise zwei Monate, ehe selbige spruchreif sind. Stimmt die initiale Information, dann könnten GeForce RTX 5080 & 5090 somit durchaus schon im November antreten – oder auch später, wenn nVidia erst einmal genügend Lagerware verteilt haben will und vielleicht auch die oft in diesem Zusammenhang kolportierte CES als Vorstellungs-Termin mitnehmen wollte.

What Benchlife said is that 5080/D and 5090/D are scheduled to officially finalize the design in September, not officially launch in September.
Quelle:  MEGAsizeGPU @ X am 5. September 2024
 
Benchlife uses the word “开案” which is widely used in PC manufacture but could be misunderstood by a translator program.
Quelle:  MEGAsizeGPU @ X am 5. September 2024

Expreview vermelden hingegen für die CES 2025 die offizielle Vorstellung der GeForce RTX 5090D für den chinesischen Markt, welche nachfolgend allerdings erst Ende Januar 2025 verfügbar sein soll. Gleichzeitig soll die vorhergehende GeForce RTX 4090D ab Dezember den EOL-Status erreichen, sprich hier ist somit ein fliessender Übergang geplant. Mittels der D-Versionen hält nVidia (knapp) die US-Sanktionen gegenüber China ein, wobei dies bei der GeForce RTX 4090D einfach über die Abkappung von ca. 11% der Recheneinheiten geschieht. Es wird interessant werden, wie nVidia dies bei der GeForce RTX 5090D handelt, denn mehr KI-Leistung darf jene nicht erhalten – womit man jene entweder auf das Performance-Niveau der GeForce RTX 4090D herunterbrechen muß, oder aber diesesmal (mit längerer Vorbereitung) intelligentere Wege findet, die KI-Leistung herunterzusetzen, ohne deswegen die Gaming-Performance all zu stark zu reduzieren. Die Terminlage ist daneben recht interessant, denn das nVidia eine Karte rein für China auf einer Messe in den USA (CES Las Vegas) vorstellt, wäre einigermaßen ungewöhnlich. Sinn würde dies hingegen ergeben, wenn die GeForce RTX 5090D dort gemeinsam mit anderen RTX50-Lösungen vorgestellt werden würde.

VideoCardz haben in ihrer Berichterstattung zu diesen neuen nVidia-Grafikkarten auch eine Performance-Angabe zur GeForce RTX 5080 erwähnt: Danach soll diese Karte laut Leaker 'Kopite7kimi' (augenscheinlich nicht-öffentlich geäußert) ca. +10% Mehrperformance zur GeForce RTX 4090 mitbringen. Dies geschah allerdings ohne die Nennung weiterer Details, worauf sich diese Performance-Angabe bezieht. Sofern hier nicht etwas wie DLSS oder/und Frame Generation gemeint ist, wäre dies unter Raster- wie RayTracing-Rendering eine hohe Hausnummer, denn dafür müsste die GeForce RTX 5080 ca. +47% Mehrperformance unter Raster-Rendering sowie ca. +49% Mehrperformance unter RayTracing auf die GeForce RTX 4090 oben drauf legen (jeweils unter der 4K-Auflösung, gemäß des 3DC 4K Performance-Index bzw. der letzten RayTracing-Benchmarks unter 4K).

An important detail not mentioned earlier but confirmed to VideoCardz by Kopite7kimi is that the RTX 5080 is projected to show a 1.1x increase in performance over the RTX 4090. The leaker did not specify whether this improvement pertains to overall, raster, or ray tracing performance.
Quelle:  VideoCardz am 3. September 2024

Jene Performance-Vorgabe ist deswegen so bedeutsam, als dass selbige nahelegt, dass nVidia für die GeForce RTX 5080 nicht mehr mit dem GB203-Chip operiert. Denn vom vorhergehenden AD103-Chip ausgehend mit nur minimal mehr Shader-Clustern beim GB203-Chip (80 → 84) ist selbst unter Mithilfe einer großzügigeren TDP, von mehr Chiptakt und bedeutsamen IPC-Gewinnen kaum eine reale Mehrperformance von 47-49% zu erwarten. Dies wäre allein unter RayTracing denkbar, wenn nVidia dort mittels Gaming-Blackwell mehr explizite Hardware verbaut und somit die RayTracing-Mehrperformance von Blackwell bedeutsam höher ausfällt als die Raster-Mehrperformance. Dies muß als beachtbare Restchance verbleiben: Bezieht sich die genannte Mehrperformance der GeForce RTX 5080 rein auf RayTracing, geht es eventuell auch ohne bedeutsam mehr Shader-Cluster. Handelt es sich hingegen um den Zugewinn unter Raster oder eine Insgesamt-Performance, müsste die GeForce RTX 5080 nahezu zwingend auf einer stark abgespeckten Version des GB202-Chips basieren – genauso wie die GeForce RTX 5090 (nur letztere deutlich weniger abgespeckt).

Denn +47% Raster-Performance ist nahezu unmöglich ohne bedeutsam mehr Hardware-Einheiten erreichbar – und im unwahrscheinlichen gegenteiligen Fall hätte nVidia den GB202-Chip nicht von 144 auf 192 Shader-Cluster hochgezogen. Derzeit spricht allerdings nicht gerade viel dafür, dass nVidia bei Gaming-Blackwell eine bedeutsame Einheiten-normierte Performance-Steigerung erreicht haben könnte, womit der Weg zu bedeutsamer Mehrperformance immer auch mehr Recheneinheiten bedingt. Für die GeForce RTX 5090 ist dies einfach, da der GB202-Chip als einziger der Consumer-Chips der "Blackwell"-Generation über bedeutsam mehr Shader-Cluster verfügen wird (+33%). Wenn die kleineren Grafikkarten darunter hingegen eine bedeutsame Mehrperformance (auch unter Raster-Rendering) hinlegen wollen, hilft meistens nur der Sprung zum nächsthöheren Chip: GeForce RTX 5080 somit vom 2. auf den 1. Chip (AD103→GB202), GeForce RTX 5070 & 5070 Ti vom 3. auf den 2. Chip (AD104→GB203) und dies so weiter bis zum Portfolio-Ende. Derzeit ist dies natürlich nur eine (fehlbare) Portfolio-Projektion – und andererseits fast die einzige Möglichkeit für nVidia, eine bedeutsame Raster-Mehrperformance auf einer Hardware-Generation ohne wirklich bessere Chipfertigung aufzubieten

Chip Hardware Speicher TDP Release Status
Titan AI GB202 180-190 SM @ 512 Bit 32 GB GDDR7 ? unsicher, ob realisiert einzelnes Gerücht
GeForce RTX 5090 GB202 160-170 SM @ 448 Bit 28 GB GDDR7 450W November 2024 bis Januar 2025 mehrere aktuelle Gerüchte
GeForce RTX 5090D GB202 ? ? ? Ende Januar 2025 (rein China) kürzliches Gerücht
GeForce RTX 5080 GB202 100-120 SM @ 256-384 Bit 16-24 GB GDDR7 350W November 2024 bis Januar 2025 mehrere aktuelle Gerüchte
GeForce RTX 5070 Ti GB203 76-80 SM @ 256 Bit 16 GB GDDR7 ? vermutlich Q1/2025 reine Annahme
GeForce RTX 5070 GB203 56-60 SM @ 192/256 Bit 12/16 GB GDDR7 >220W vermutlich Q1/2025 einzelne Gerüchte
GeForce RTX 5060 Ti GB205 46-48 SM @ 192 Bit 12 GB GDDR7 ? vermutlich Q2/2025 reine Annahme
GeForce RTX 5060 GB206 34 SM @ 128 Bit 8/16 GB GDDR7 ? vermutlich Q2/2025 reine Annahme
GeForce RTX 5050 GB206/GB207 20-24 SM @ 128 Bit 8 GB GDDR6 ? vermutlich Q2/2025 reine Annahme
Hinweis: Angaben zu noch nicht offiziell vorgestellter Hardware basieren auf Gerüchten & Annahmen

Wie Heise und ComputerBase thematisieren, wird Intel wohl nahezu alle Tiles von "Arrow Lake" fremdfertigen lassen. Intel selbst übernimmt wohl nur das Base-Tile sowie das Packaging von Arrow Lake, alles andere kommt von TSMC – darunter auch die Compute-Tiles, welche Intel eigentlich selber unter 20A herstellen wollte. Intel verpackt dies als "Fortschritte bei der Halbleiterfertigung", in deren Zug man gleich zu 18A umschwenkt, mittels welchem Intel sich größere Aufträge für seine Foundry-Sparte erhofft. Damit wird allerdings auch erstmals eine vollständige Intel Prozessoren-Generation für alle Marktsegmente (Meteor Lake und Lunar Lake sind rein Mobile, und dort auch nicht vollständig) außer Haus gefertigt, was nicht nur sehr ungewöhnlich für Intel ist, sondern natürlich die eigene (großvolumige) Chipfertigung auch einiges an Auslastung kosten wird.

Letzteres ist sogar der gewichtigere Punkt, denn Intels Fertigungsanlagen fressen jedes Quartal große Summen an Betriebskosten, sind nur wirtschaftlich bei einer hohen Auslastung. Intel müsste eigentlich jetzt schon Anschlußverträge mit anderen Chipentwicklern haben – was sich jedoch durch die Konzentration auf 18A auf jeden Fall verschieben wird, denn selbiger Fertigungsnode ist derzeit noch in der Erprobung. Es ist ein klein wenig unklar, wie Intel dies geschäftlich rechtfertigen will, die eigenen (wie gesagt großvolumigen) Werke bewußt unterauszulasten, gerade wenn man selber neue Prozessoren-Serien mit Bedarf an großen Fertigungsvolumen herausbringt. Zumindest kurz- und mittelfristig dürfte es für Intel schwer werden, wieder in die schwarzen Zahlen zurückzukehren, denn faktisch bezahlt man seine eigenen neuen Prozessoren somit doppelt. Damit könnte sich auch der Druck auf Intel erhöhen, die eigenen Halbleiter-Werke doch noch abzustoßen – ein Weg, welche Intel ironischerweise durch die Ausgliederung in eine eigene Foundry-Firma bereits selbst vorbereitet hat.

Eine von Phoronix gezeigte AMD-Roadmap zur OpenSource-Firmware "openSIL" offeriert wahrscheinlich eine erste belastbare Terminangabe zu AMDs Zen 6. Danach soll die openSIL-Version für "Venice", der Zen6-Servervariante, grob im vierten Quartal 2026 spruchreif werden – was, wie AMD selber angibt, ein Quartal nach dem "Venice"-Release sein soll. Diese Regelung passt auch grob zu dem, was derzeit bei Zen 5 passiert: openSIL für "Turin" soll zum Jahreswechsel 2024/25 bereitstehen, während diese Zen5-Servervariante im Herbst 2024 ansteht. Letzteres ergibt dann sogar einen Fingerzeig auf mögliche Consumer-Prozessoren bei Zen 6: Wenn dessen Server-Varianten im 3. Quartal 2026 ansteht, könnte die Consumer-Varianten von Zen 6 somit bereits im 2. Quartal 2026 bereitstehen, ähnlich wie der relative Ablauf bei Zen 5 war. Dies ist natürlich nur eine Hochrechnung und selbst AMDs eigene Planung könnte sich noch ändern, nichtsdestrotrotz ergibt die erste grobe Angabe zur Terminplanung bei Zen 6.