Den årliga tillställningen GTC brukar vara en plattform där Nvidia bjuder på demonstrationer och nyheter kopplade till ett av deras främsta områden, nämligen artificiell intelligens (AI) och hårdvara för att driva detta. När Jensen Huang äntrar den digitala scenen står klart att årets upplaga inte är något undantag. Nvidia blidkar dock inte enbart professionella användare, utan toppar sändningen med nästa konsumentinriktade Geforce-serie.

I enlighet med tidigare uppgifter låter Nvidia stora delar av den två år gamla Geforce RTX 3000-serien leva vidare, medan RTX 4000 definierar ett nytt toppskikt med de två modellerna RTX 4090 och RTX 4080. Under skalet på den färska duon finns grafikarkitekturen "Ada Lovelace", som tillverkas på TSMC:s 4-nanometersteknik och sätter funktionerna under RTX-paraplyet i fokus.

Lovelace.jpg
geforce-rtx-4090-100vp-l@2x.jpg

Specifikationsfattigt avtäckande av värstingkort

Geforce RTX 4090 en värstingmodell med 24 GB GDDR6-minne och 76 miljarder transistorer, som översätts till hela 16 384 CUDA-kärnor med turbofrekvens om 2,52 GHz. Prestandamässigt jämför Nvidia tronföljaren mot den nuvarande toppgrafikkortet RTX 3090 Ti och menar att rastreringsprestandan är runt två gånger bättre hos RTX 4090. När ray tracing står på menyn kan prestandaklivet vridas upp till fyra gånger högre.

Specifikationer Geforce RTX 4090, RTX 4080 16 GB och RTX 4080 12 GB

RTX 4090

RTX 3090 Ti

RTX 4080 16 GB

RTX 4080 12 GB

RTX 3080 Ti

Teknik

4 nm TSMC

8 nm Samsung

4 nm TSMC

4 nm TSMC

8 nm Samsung

Krets

AD102?

GA102

AD103?

AD104?

GA102

Kretsyta

608 mm²

628 mm²

?

?

628 mm²

Transistorer

76 miljarder

28,3 miljarder

?

?

28,3 miljarder

Arkitektur

Ada Lovelace

Ampere

Ada Lovelace

Ada Lovelace

Ampere

CUDA-kärnor

16 384 st.

10 752 st.

9 728 st.

7 680 st.

10 240 st.

RT-kärnor

128 st.?

84 st.

76 st. ?

60 st. ?

80 st.

Tensor-kärnor

512 st.?

336 st.

304 st.?

240 st.?

320 st.

Texturenheter

512 st.?

336 st.

304 st.?

240 st.?

320 st.

Rasterenheter

?

112 st.

?

?

112 st.

Klockfrekvens

2 230 MHz

1 560 MHz

2 210 MHz

2 310 MHz

1 365 MHz

GPU Boost

2 520 MHz

1 860 MHz

2 510 MHz

2 610 MHz

1 665 MHz

Beräkningskraft

82 575 GFLOPS

39 997 GFLOPS

48 835 GFLOPS

40 090 GFLOPS

34 099 GFLOPS

Minnesmängd

24 GB GDDR6X

24 GB GDDR6X

16 GB GDDR6X

12 GB GDDR6X

12 GB GDDR6X

Minnesfrekvens

?

21 000 MHz

?

?

19 000 MHz

Minnesbuss

384-bit

384-bit

256-bit

192-bit

384-bit

Minnesbandbredd

?

1 008 GB/s

?

?

912 GB/s

PCI Express-anslutning

PCI Express 4.0 x16

PCI Express 4.0 x16

PCI Express 4.0 x16

PCI Express 4.0 x16

PCI Express 4.0 x16

Strömförsörjning

12VHPWR1×12-pin

12-pin

12VHPWR

12VHPWR

12-pin

SLI-anslutning

Nej

NVLink 3.0 x4

Nej

Nej

-

TBP

450 W

450 W

320 W

285 W

350 W

Lanseringspris

1 599 USD

1 999 USD

1 199 USD

899 USD

1 199 USD

På förhand har högt effektuttag ständigt varit på tapeten, men när den officiella debuten nu äger rum kan den oroade nu dra en lättnadens suck – 600 och 800 watt uteblir. Det är visserligen möjligt att överklocka Geforce RTX 4090 norr om 3 GHz och därmed ett kraftigt effekttutag, men i standardutförande handlar det om 450 watt enligt specifikation. Förutsatt att Nvidias påstående om prestandaökningarna stämmer, stämmer också att "Ada Lovelace" en energieffektiv historia – upp till dubbelt så energieffektiv.

Skärmbild (85).png
4090.jpg

Geforce RTX 4080 och Geforce RTX 4080 blir väsensskilt radarpar

Under ett ögonblick visar Nvidia också vad som väntar ett steg ned i det "Ada Lovelace"-signerade toppsegmentet, nämligen Geforce RTX 4080 med 12 alternativt 16 GB GDDR6X-minne. Grafikkorten jämförs mot RTX 3080 Ti och även här spikas ett prestandakliv på två till fyra gånger. Med en närmare titt på specifikationsbladet är det tydligt att denna jämförelse sannolikt endast gäller det mer välutrustade kortet.

4080.jpg

Nvidia gör nämligen sitt bästa för att göra det krångligt för kunder. Geforce RTX 4080-modellen med 16 GB grafikminne har nämligen 27 procent fler CUDA-kärnor – 9 728 ställt mot 12 GB-modellens 7 680 CUDA-kärnor. Turbofrekvensen är dock aningen högre för den senare, närmare bestämt 2,61 GHz istället för 2,51 GHz. Därmed är även effektbudget för modellerna olika: 320 respektive 285 watt. Kontakten som används är 12VHPWR, eller medföljande adapter.

Till synes oförändrade kylare och höga priser

Av presentationen att döma bryter Nvidia den två generationer gamla traditionen som är att byta kylarlösning för referensgrafikkorten. De Founder's Edition-varianter som visas i sändningen har snarlik utformning som "Ampere"-syskonen, men möjligtvis större fläktar och lite extra tjocklek. Framtiden får utvisa om de blir tillgängliga i Europa den här generationen. Tilläggas kan att Nvidia inte erbjuder Founder's Edition-variant av det enklare Geforce RTX 4080-utförandet.

Toppmodellen Geforce RTX 4090 blir först ut av de två grafikkorten och dagen att markera i almanackan är den 12 oktober. Riktpriset är 1 599 USD, men med rådande växlingskurs är det svenska priset som anges via Nvidias webbplats inte lika glädjande, med ett startpris om 21 590 kronor. RTX 4080-duon debuterar någon gång i november, med riktpris från 12 200 samt 16 199 kronor.

Skärmbild (86).png
Skärmbild (98).png

För den som brukar följa hårdvarulanseringar är det tydligt att Nvidia inte öppnar alla dammluckor när det gäller specifikationer. Fler detaljer om arkitekturen "Ada Lovelace" och specifikationerna för de avtäckta grafikkorten lär dyka upp i närtid, när tumultet kring GTC-presentationen lagt sig.

Smartare ray tracing och extra bildrutor nyckelord för "Ada Lovelace"

RTX är en stämpel som täcker in Nvidias funktioner för både maskininlärning och ray tracing. På ray tracing-sidan belyser företaget att RT-kärnorna får ny specifik hårdvara för att hantera och accelerera specifika funktioner. För att ytterligare snabba upp arbetsflödet bestyckar Nvidia SM-klustren hos "Ada Lovelace" med något de kallar för Shader-Execution Reordering (SER).

Skärmbild (12).png
Skärmbild (8).png
Skärmbild (104).png

Grafikkort arbetar typiskt med uppgifter som är lätta att parallellisera, men när ray tracing blandas in i leken försvinner detta. Ljusstrålarna studsar mot olika material och olika beräkningstid samt minnesåtkomst är givna delar av sådana laster. SER är enligt Nvidia att likställa med processorvärldens Out-of-order Execution. Grafikkortets olika ray tracing-operationer kan därmed sorteras på ett vis som bättre nyttjar hårdvaran, vilket påstås ge ett prestandalyft på två till tre gånger.

Vidare understryker Nvidia att även de maskininlärningsorienterade Tensor-kärnorna får ett lyft, men bolaget lägger främst fokus på DLSS 3. Akronymen står för Deep-Learning Super Sampling och har hittills använt maskininlärning för att i realtid skala upp lågupplösta bilder till en målupplösning. Med DLSS 3 får uppskalning stå åt sidan för att interpolera mellanliggande bilder för att nå en högre bildfrekvens, något som blir exklusivt tillgängligt med "Ada Lovelace"-familjens uppdaterade Tensor-kärnor.

Tekniken drar nytta av maskininlärning för att kunna förutspå hur de mellanliggande bilderna ska se ut, där information om hur och i vilken riktning pixlar flyttar sig från bild till bild. Nvidia beskriver det faktum att DLSS inte är del av det typiska renderingsflödet, eftersom vare sig grafikkort eller processor då blir en begränsande faktor. Bolaget ger smakprov på hur funktionen fungerar i Microsoft Flight Simulator 2020, där bildfrekvensen med ray tracing stiger från knappa 50 till över 100 FPS.