4

Gerüchteküche: GeForce RTX 5080 soll 400W TDP und GeForce RTX 5090 gar 600W TDP erhalten

Leaker Kopite7kimi hat sich nach etwas Schaffenspause am Dienstag zu Wort gemeldet mit der Aussage, dass von den Blackwell-basierten GeForce-Grafikkarten ein höherer Stromverbrauch erwartet werden muß, speziell bei den größeren Modellen. Gemeint ist mit "Stromverbrauch" augenscheinlich nicht nur der reale Stromverbrauch, sondern in erster Linie die TDP bzw. das gesetzte Powerlimit (bei nVidia üblicherweise identisch). Zugleich geht es hierbei wahrscheinlich bzw. hoffentlich nicht um die maximal mögliche Strombelastung der entsprechenden Boards. Dies kann durchaus einen Unterschied ergeben, denn bei der GeForce RTX 40 Serie hatte nVidia die Platine zur Founders Edition der GeForce RTX 4090 auf eine maximale Strombelastung von 600 Watt hin konzipiert, die Karte ging dann allerdings trotzdem "nur" mit 450W TDP in den Handel. Eine solche Wendung ist letztlich nie auszuschließen und verbleibt somit auch bei dieser Gerüchte-Meldung als Restrisiko.

I know you someone got the details of GeForce of Blackwell recently.
Both of them all have some increase in power consumption, with higher SKUs increasing more.

Quelle:  Kopite7kimi @ X am 3. September 2024

Besonders spezifisch war dieser initiale Tweet allerdings sowieso nicht, erst mit den nachfolgenden Antworten auf die Fragen anderer Twitterer brachte 'Kopite7kimi' wirkliches Licht ins Dunkle: So sollen es mehr als 220W bei der GeForce RTX 5070 sein sowie wurden die TDP-Werte von 400W für die GeForce RTX 5080 sowie 600W für die GeForce RTX 5090 explizit bestätigt. Gegenüber den jeweiligen Vorgängern ist dies bedeutsam mehr: Von GeForce RTX 4080 zu 5080 wären dies +25% mehr TDP, von GeForce RTX 4090 zu 5090 hingegen sogar +33% mehr. Dabei ist jener Schritt bei der GeForce RTX 5090 am ehesten verständlich, denn allein der hierbei zugrundeliegende GB202-Chip wird im Blackwell-Chipportfolio bedeutsam mehr Ausführungseinheiten (und sogar ein größeres Speicherinterface) tragen. Sofern man dies auch ausfährt, geht es unter der für Consumer-Blackwell angesetzten N4P-Fertigung augenscheinlich nicht ohne klar höheren Stromverbrauch.

I say 550W for 5090.
Quelle:  RawMango @ X am 3. September 2024
 
more
Quelle:  Kopite7kimi @ X am 3. September 2024
 
is 5070 more than the rumored 220?
Quelle:  Varun @ X am 3. September 2024
 
more
Quelle:  Kopite7kimi @ X am 3. September 2024
 
So, 600w for 5090 and 400w for 5080 is right?
Quelle:  Raichu @ X am 3. September 2024
 
Yeah
Quelle:  Kopite7kimi @ X am 3. September 2024

Reserven bleiben dennoch vorhanden, dass FE-Design der GeForce RTX 5090 soll gemäß anderen Quellen gar für 660W TDP ausgelegt sein, was dann die Übertaktungsreserve ergibt. Insofern ist dies eine nachvollziehbare Entwicklung, denn immerhin war wie gesagt schon die Vorgänger-Lösung für diese Strombelastung ausgelegt. Interessant wird es darunter bei der GeForce RTX 5080, denn 400 Watt für den zweitbesten Grafikchip erscheinen als sehr hoch angesetzt. Immerhin steigert sich die Einheiten-Anzahl zwischen AD103 und GB203 nur um 4 mehr Shader-Cluster aka +5%, was keineswegs den Anlaß zu einer solch großen TDP-Steigerung geben sollte. Dies läßt den Verdacht offen, dass es auch bei der GeForce RTX 5080 zu einer bedeutsamen Steigerung der Einheiten-Anzahl kommt – und dies dann die TDP-Steigerung erklärt. Dafür müsste die GeForce RTX 5080 allerdings auf einem größeren Grafikchip als dem GB203 basieren, da selbiger keine weiteren Reserven für große Steigerungen der Einheiten-Anzahl aufweist.

Die hiermit naheliegende Auflösung besteht somit darin, dass eventuell auch die GeForce RTX 5080 auf dem GB202-Chip basiert, in diesem Fall einer großen Abspeckung mit wohl nur 100-120 Shader-Einheiten (von physikalisch 192 vorhandenen). Sicher ist dies derzeit natürlich überhaupt nicht, dies ist nur eine Möglichkeit. Klarer ist der Fall allerdings bei der GeForce RTX 5070: Wenn jene mehr als 220 Watt TDP aufweist, ist es eher unwahrscheinlich, dass diese Grafikkarte noch auf dem GB205-Chip basiert, welcher schon bei 48 Shader-Clustern an einem 192-Bit-Interface endet (reicht gerade so für die Hardware der GeForce RTX 4070 aus, jene hat 46 SM @ 192-bit). Eher wahrscheinlich ist an dieser Stelle, dass die GeForce RTX 5070 schon den größeren GB203-Chip benutzt, was erstens für einen beachtbaren Hardware-Sprung gegenüber der GeForce RTX 4070 sorgt und zweitens recht automatisch eine höhere TDP mit sich bringt.

initiales RTX40-Portfolio aktuelles RTX40-Portfolio angenommenes RTX50-Portfolio #1 angenommenes RTX50-Portfolio #2
Titan AI
GB202, 180-190 SM @ 512 Bit, 32 GB GDDR7
Titan AI
GB202, 180-190 SM @ 512 Bit, 32 GB GDDR7
GeForce RTX 4090
AD102, 128 SM @ 384 Bit, 24 GB GDDR6X
GeForce RTX 4090
AD102, 128 SM @ 384 Bit, 24 GB GDDR6X
GeForce RTX 5090
GB202, 160 SM @ 448 Bit, 28 GB GDDR7
GeForce RTX 5090
GB202, 160-170 SM @ 448 Bit, 28 GB GDDR7
GeForce RTX 4080
AD103, 76 SM @ 256 Bit, 16 GB GDDR6X
GeForce RTX 4080 Super
AD103, 80 SM @ 256 Bit, 16 GB GDDR6X
GeForce RTX 5080
GB203, 80 SM @ 256 Bit, 16 GB GDDR7
GeForce RTX 5080
GB202, 100-120 SM @ 256-384 Bit, 16-24 GB GDDR7
GeForce RTX 4070 Ti
AD104, 60 SM @ 192 Bit, 12 GB GDDR6X
GeForce RTX 4070 Ti Super
AD103, 66 SM @ 256 Bit, 16 GB GDDR6X
GeForce RTX 5070
GB203, 56-60 SM @ 192/256 Bit, 12/16 GB GDDR7
GeForce RTX 5070 Ti
GB203, 76-80 SM @ 256 Bit, 16 GB GDDR7
GeForce RTX 4070 Super
AD104, 56 SM @ 192 Bit, 12 GB GDDR6X
GeForce RTX 5070
GB203, 56-60 SM @ 192/256 Bit, 12/16 GB GDDR7
GeForce RTX 4070
AD104, 46 SM @ 192 Bit, 12 GB GDDR6X
GeForce RTX 4070
AD104, 46 SM @ 192 Bit, 12 GB GDDR6X
GeForce RTX 5060 Ti
GB205, 46-48 SM @ 192 Bit, 12 GB GDDR7
GeForce RTX 5060 Ti
GB205, 46-48 SM @ 192 Bit, 12 GB GDDR7
GeForce RTX 4060 Ti
AD106, 34 SM @ 128 Bit, 8/16 GB GDDR6
GeForce RTX 4060 Ti
AD106, 34 SM @ 128 Bit, 8/16 GB GDDR6
GeForce RTX 5060
GB206, 34 SM @ 128 Bit, 8/16 GB GDDR7
GeForce RTX 5060
GB206, 34 SM @ 128 Bit, 8/16 GB GDDR7
GeForce RTX 4060
AD107, 24 SM @ 128 Bit, 8 GB GDDR6
GeForce RTX 4060
AD107, 24 SM @ 128 Bit, 8 GB GDDR6
GeForce RTX 5050
GB207/GB206, 20-24 SM @ 128 Bit, 8 GB GDDR6
GeForce RTX 5050
GB207/GB206, 20-24 SM @ 128 Bit, 8 GB GDDR6
Hinweis: rein hypothetischer Aufbau des "Blackwell"-basierten Portfolios an Desktop-Grafikkarten

Damit läßt sich eine neue Portfolio-These (#2) zu Gaming-Blackwell aufstellen, welche diese höheren TDPs einrechnet und demzufolge die GeForce RTX 5080 dem GB202-Chip zuordnet. Da damit die frühere Position der GeForce RTX 5080 als Top-Modell basierend auf dem GB203-Chip verwaist wäre, könnte nVidia eine "GeForce RTX 5070 Ti" für diese Aufgabe aus der Taufe heben (eine andere Möglichkeit bestände darin, alle darunterstehenen Karten um eine Stufe aufzuwerten, danach fehlt am unteren Rand natürlich noch eine SKU). Die sich damit ergebene Portfolio-These #2 würde sicherlich kaum jemand ablehnen, immerhin steigt damit die Hardware-Ausstattung aller RTX50-Modelle gegenüber ihren RTX40-Namensvettern. Sofern damit nicht gerade wesentliche Preissteigerung einhergehen, wäre ein solches RTX50-Portfolio durchaus als fortschrittlich einzuordnen.

Die höheren TDPs würden sich in diesem Fall primär aus der stärkeren Hardware ergeben, was aufgrund des wie gesagt kleinen Fertigungsnode-Sprungs von 5nm auf N4P nicht besonders verwunderlich wäre. Aber auch der gegenteilige Fall wäre nicht wirklich schlecht: Steigt die TDP derart deutlich auch ohne eine bedeutsam größere Anzahl an Hardware-Einheiten, würde dies auf beachtbare IPC-Gewinne oder/und deutliche Taktraten-Steigerungen hindeuten. Dies ist nicht die wahrscheinlichste Auflösung (angesichts der bekannten Steigerung der Einheiten-Anzahl beim GB202-Chip), aber weiterhin im Rahmen des Möglichen. So oder so scheint nVidia eine Performance-Steigerung bei Gaming-Blackwell nicht Stromverbrauchs-neutral erreichen zu können, sondern muß hierfür mehr TDP ansetzen. Damit dürfte zumindest gesichert sein, dass sich nVidia nicht auf dem aktuellen Erfolg ausruht und keine laue nächste Grafikkarten-Generation auflegt.

Nachtrag vom 4. September 2024

BenchLife (maschinelle Übersetzung ins Deutsche) kommentieren die kürzlichen Informationen über die TDPs von GeForce RTX 5080 & 5090 bzw. fügen hierzu Informationen ihrer eigenen Quellen an, welche interessanterweise etwas abweichend ausfallen. So sollen die Kühler/Karten-Designs zugunsten von 400W TDP bei der GeForce RTX 5080 sowie 600W TDP bei der GeForce RTX 5090 gemäß BenchLife vielmehr alte Entwürfe darstellen, welche gar nicht mehr aktuell sind. Derzeit soll die TDP der GeForce RTX 5080 somit auf 350W (+9% zum Namensvorgänger) sowie diejenige der GeForce RTX 5090 auf 550W (+22%) liegen. Die Werte von 400/600W könnte allerdings tatsächlich noch auftauchen, dann allerdings als jeweiliges Maximum dieser Grafikkarten, sprich die per Overclocking erhöhbare TDP-Reserve. Dies klingt recht stimmig, weicht aber natürlich nicht unerheblich von den Infos seitens 'Kopite7kimi' ab – mal schauen, wer da Recht behält.

    GeForce RTX 5080 & 5090 Infos von Benchlife (eigene Übersetzung & Zusammenfassung)

  • wird voraussichtlich zur CES 2025 vorgestellt
  • die AIB-Partner haben bislang keine relevanten "Projekteröffnungsmaterialien" erhalten
  • trotzdem sind derzeit bereits Kühlerdesigns für 5 Modelle in Vorbereitung
  • 400W für die 5080 & 600W für die 5090 waren mal im Gespräch, inzwischen sollen es jedoch 350W & 550W sein
  • 400W & 600W könnten nach wie vor die maximale Kühlleistung des Kühlers bzw. der Platine sein (sind aber nicht die TDP)
  • nVidia dürfte im September den AIB-Partnern genauere Informationen zu den Karten geben

Sehr mißverständlich ist im übrigen der letzte Absatz beim BenchLife-Artikel, welcher von einem "offiziellen Start" der GeForce RTX 5080/5090 im September spricht – während im selben Artikel vorher klar eine Vorstellung zur CES 2025 notiert wurde. Vermutlich ist dies etwas anders gemeint oder aber klappt es auch nicht gut mit der maschinell unterstützten Übersetzung: Aller Wahrscheinlichkeit nach ist mit dem September-Termin die interne Vorstellung nVidias gegenüber den Grafikkarten-Herstellern gemeint, welche laut BenchLife derzeit zwar die Kühlerdesigns vorbereiten, aber noch keine konkreten Karteninformationen erhalten haben (was einen Release-Termin im September oder auch andersweitig zeitnah unmöglich macht). Trifft diese Auslegung zu, dann wäre unter Umständen ein Jahresendtermin für GeForce RTX 5080 & 5090 noch zu erreichen, ein Oktober-Termin hingegen vermutlich zu knapp. Die CES hingegen eignet sich möglicherweise gut als Vorstellungs-, aber weniger denn als Launch-Termin (dafür braucht man die Hardware-Redakteure vor dem Benchmark-Computer, nicht auf der Messe befindlich). Im gesamten sind die Terminpläne von nVidia noch eher diffus, aufgrund des reinen Tagesdatums sind jedoch zumindest für den frühen/mittleren Herbst kaum noch Chancen zu sehen.

Nachtrag vom 5. September 2024

Twitterer MEGAsizeGPU bestätigt, dass der kürzlich erwähnte BenchLife-Bericht zur Terminlage von GeForce RTX 5080 & 5090 nicht von einem Erscheinen im September spricht, sondern dass mit dieser Terminangabe die nVidia-interne Finalisierung des Designs gemeint sei. Die Fehlauslegung basiert wohl auf einem chinesischen Begriff, der innerhalb von Herstellerkreisen anders verwendet wird als eine automatische Übersetzungs-Funktion dies verarbeitet. Dies wurde unsererseits schon vermutet und vom Twitterer nunmehr klar bestätigt. Im September soll nVidia somit intern fertig sein, dann dürften die Grafikkarten-Hersteller gebrieft werden und benötigen ihrerseits üblicherweise zwei Monate, ehe selbige spruchreif sind. Stimmt die initiale Information, dann könnten GeForce RTX 5080 & 5090 somit durchaus schon im November antreten – oder auch später, wenn nVidia erst einmal genügend Lagerware verteilt haben will und vielleicht auch die oft in diesem Zusammenhang kolportierte CES als Vorstellungs-Termin mitnehmen wollte.

What Benchlife said is that 5080/D and 5090/D are scheduled to officially finalize the design in September, not officially launch in September.
Quelle:  MEGAsizeGPU @ X am 5. September 2024
 
Benchlife uses the word “开案” which is widely used in PC manufacture but could be misunderstood by a translator program.
Quelle:  MEGAsizeGPU @ X am 5. September 2024