Nvidia avtäcker Geforce RTX 4000 och arkitekturen "Ada Lovelace"

Den årliga tillställningen GTC brukar vara en plattform där Nvidia bjuder på demonstrationer och nyheter kopplade till ett av deras främsta områden, nämligen artificiell intelligens (AI) och hårdvara för att driva detta. När Jensen Huang äntrar den digitala scenen står klart att årets upplaga inte är något undantag. Nvidia blidkar dock inte enbart professionella användare, utan toppar sändningen med nästa konsumentinriktade Geforce-serie.

I enlighet med tidigare uppgifter låter Nvidia stora delar av den två år gamla Geforce RTX 3000-serien leva vidare, medan RTX 4000 definierar ett nytt toppskikt med de två modellerna RTX 4090 och RTX 4080. Under skalet på den färska duon finns grafikarkitekturen "Ada Lovelace", som tillverkas på TSMC:s 4-nanometersteknik och sätter funktionerna under RTX-paraplyet i fokus.

Specifikationsfattigt avtäckande av värstingkort

Geforce RTX 4090 en värstingmodell med 24 GB GDDR6-minne och 76 miljarder transistorer, som översätts till hela 16 384 CUDA-kärnor med turbofrekvens om 2,52 GHz. Prestandamässigt jämför Nvidia tronföljaren mot den nuvarande toppgrafikkortet RTX 3090 Ti och menar att rastreringsprestandan är runt två gånger bättre hos RTX 4090. När ray tracing står på menyn kan prestandaklivet vridas upp till fyra gånger högre.

Specifikationer Geforce RTX 4090, RTX 4080 16 GB och RTX 4080 12 GB

	RTX 4090	RTX 3090 Ti	RTX 4080 16 GB	RTX 4080 12 GB	RTX 3080 Ti
Teknik	4 nm TSMC	8 nm Samsung	4 nm TSMC	4 nm TSMC	8 nm Samsung
Krets	AD102?	GA102	AD103?	AD104?	GA102
Kretsyta	608 mm²	628 mm²	?	?	628 mm²
Transistorer	76 miljarder	28,3 miljarder	?	?	28,3 miljarder
Arkitektur	Ada Lovelace	Ampere	Ada Lovelace	Ada Lovelace	Ampere
CUDA-kärnor	16 384 st.	10 752 st.	9 728 st.	7 680 st.	10 240 st.
RT-kärnor	128 st.?	84 st.	76 st. ?	60 st. ?	80 st.
Tensor-kärnor	512 st.?	336 st.	304 st.?	240 st.?	320 st.
Texturenheter	512 st.?	336 st.	304 st.?	240 st.?	320 st.
Rasterenheter	?	112 st.	?	?	112 st.
Klockfrekvens	2 230 MHz	1 560 MHz	2 210 MHz	2 310 MHz	1 365 MHz
GPU Boost	2 520 MHz	1 860 MHz	2 510 MHz	2 610 MHz	1 665 MHz
Beräkningskraft	82 575 GFLOPS	39 997 GFLOPS	48 835 GFLOPS	40 090 GFLOPS	34 099 GFLOPS
Minnesmängd	24 GB GDDR6X	24 GB GDDR6X	16 GB GDDR6X	12 GB GDDR6X	12 GB GDDR6X
Minnesfrekvens	?	21 000 MHz	?	?	19 000 MHz
Minnesbuss	384-bit	384-bit	256-bit	192-bit	384-bit
Minnesbandbredd	?	1 008 GB/s	?	?	912 GB/s
PCI Express-anslutning	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16
Strömförsörjning	12VHPWR1×12-pin	12-pin	12VHPWR	12VHPWR	12-pin
SLI-anslutning	Nej	NVLink 3.0 x4	Nej	Nej	-
TBP	450 W	450 W	320 W	285 W	350 W
Lanseringspris	1 599 USD	1 999 USD	1 199 USD	899 USD	1 199 USD

På förhand har högt effektuttag ständigt varit på tapeten, men när den officiella debuten nu äger rum kan den oroade nu dra en lättnadens suck – 600 och 800 watt uteblir. Det är visserligen möjligt att överklocka Geforce RTX 4090 norr om 3 GHz och därmed ett kraftigt effekttutag, men i standardutförande handlar det om 450 watt enligt specifikation. Förutsatt att Nvidias påstående om prestandaökningarna stämmer, stämmer också att "Ada Lovelace" en energieffektiv historia – upp till dubbelt så energieffektiv.

Geforce RTX 4080 och Geforce RTX 4080 blir väsensskilt radarpar

Under ett ögonblick visar Nvidia också vad som väntar ett steg ned i det "Ada Lovelace"-signerade toppsegmentet, nämligen Geforce RTX 4080 med 12 alternativt 16 GB GDDR6X-minne. Grafikkorten jämförs mot RTX 3080 Ti och även här spikas ett prestandakliv på två till fyra gånger. Med en närmare titt på specifikationsbladet är det tydligt att denna jämförelse sannolikt endast gäller det mer välutrustade kortet.

Nvidia gör nämligen sitt bästa för att göra det krångligt för kunder. Geforce RTX 4080-modellen med 16 GB grafikminne har nämligen 27 procent fler CUDA-kärnor – 9 728 ställt mot 12 GB-modellens 7 680 CUDA-kärnor. Turbofrekvensen är dock aningen högre för den senare, närmare bestämt 2,61 GHz istället för 2,51 GHz. Därmed är även effektbudget för modellerna olika: 320 respektive 285 watt. Kontakten som används är 12VHPWR, eller medföljande adapter.

Till synes oförändrade kylare och höga priser

Av presentationen att döma bryter Nvidia den två generationer gamla traditionen som är att byta kylarlösning för referensgrafikkorten. De Founder's Edition-varianter som visas i sändningen har snarlik utformning som "Ampere"-syskonen, men möjligtvis större fläktar och lite extra tjocklek. Framtiden får utvisa om de blir tillgängliga i Europa den här generationen. Tilläggas kan att Nvidia inte erbjuder Founder's Edition-variant av det enklare Geforce RTX 4080-utförandet.

Toppmodellen Geforce RTX 4090 blir först ut av de två grafikkorten och dagen att markera i almanackan är den 12 oktober. Riktpriset är 1 599 USD, men med rådande växlingskurs är det svenska priset som anges via Nvidias webbplats inte lika glädjande, med ett startpris om 21 590 kronor. RTX 4080-duon debuterar någon gång i november, med riktpris från 12 200 samt 16 199 kronor.

För den som brukar följa hårdvarulanseringar är det tydligt att Nvidia inte öppnar alla dammluckor när det gäller specifikationer. Fler detaljer om arkitekturen "Ada Lovelace" och specifikationerna för de avtäckta grafikkorten lär dyka upp i närtid, när tumultet kring GTC-presentationen lagt sig.

Smartare ray tracing och extra bildrutor nyckelord för "Ada Lovelace"

RTX är en stämpel som täcker in Nvidias funktioner för både maskininlärning och ray tracing. På ray tracing-sidan belyser företaget att RT-kärnorna får ny specifik hårdvara för att hantera och accelerera specifika funktioner. För att ytterligare snabba upp arbetsflödet bestyckar Nvidia SM-klustren hos "Ada Lovelace" med något de kallar för Shader-Execution Reordering (SER).

Grafikkort arbetar typiskt med uppgifter som är lätta att parallellisera, men när ray tracing blandas in i leken försvinner detta. Ljusstrålarna studsar mot olika material och olika beräkningstid samt minnesåtkomst är givna delar av sådana laster. SER är enligt Nvidia att likställa med processorvärldens Out-of-order Execution. Grafikkortets olika ray tracing-operationer kan därmed sorteras på ett vis som bättre nyttjar hårdvaran, vilket påstås ge ett prestandalyft på två till tre gånger.

Vidare understryker Nvidia att även de maskininlärningsorienterade Tensor-kärnorna får ett lyft, men bolaget lägger främst fokus på DLSS 3. Akronymen står för Deep-Learning Super Sampling och har hittills använt maskininlärning för att i realtid skala upp lågupplösta bilder till en målupplösning. Med DLSS 3 får uppskalning stå åt sidan för att interpolera mellanliggande bilder för att nå en högre bildfrekvens, något som blir exklusivt tillgängligt med "Ada Lovelace"-familjens uppdaterade Tensor-kärnor.

Tekniken drar nytta av maskininlärning för att kunna förutspå hur de mellanliggande bilderna ska se ut, där information om hur och i vilken riktning pixlar flyttar sig från bild till bild. Nvidia beskriver det faktum att DLSS inte är del av det typiska renderingsflödet, eftersom vare sig grafikkort eller processor då blir en begränsande faktor. Bolaget ger smakprov på hur funktionen fungerar i Microsoft Flight Simulator 2020, där bildfrekvensen med ray tracing stiger från knappa 50 till över 100 FPS.