Rykte anger specifikationer för Geforce RTX 3000 "Ampere"

Hade hoppats på att få se TDP.

Skrivet av medbor:

HD används väl främst av mobiler och strömsnåla kretsar trodde jag. Känns med rimligt att GPUer kör med HP och därmed en helt annan siffra

Det enda som spelar roll är densitetsökning hos de transistorer som används i respektive krets. Rimligt att anta att man använder samma typ i en GPU, vilken det är vet jag inte.

TSMC verkar alltid peka på runt en faktor 3 i densitetsökning från 16/12 nm till 7 nm. Det är ju två nodsteg, 10 nm ligger emellan så 3x är mindre än två hela noder som borde ge 4x. Enligt TSMC namngivning borde 7 nm vara 5x tätare, men i praktiken verkar det vara strax över 3x så beräkningen borde vara OK.

Huvudpoängen är ändå att en GPU på 7 nm med dubbelt så många transistorer som en på 16/12 nm kommer vara mindre!

Vem behöver Pornhub? Som andra påpekat känns ju 3080Ti-specsen snarare som specsen för Quadro-kort än konsumentvarianten, men man kan ju drömma :> Får hoppas att det blir ett rejält kliv upp i prestanda för RT, 2080 Ti kändes på tok för dyr för vad den levererade och prestandahoppet från 1080 Ti kändes inte riktigt värt det.

Med 3080 Ti finns det ¨åtminstone en stor potential att det kan bli en vettig prestandaökning, men räknar inte med att det blir billigt.

Skrivet av Yoshman:

Det enda som spelar roll är densitetsökning hos de transistorer som används i respektive krets. Rimligt att anta att man använder samma typ i en GPU, vilken det är vet jag inte.

TSMC verkar alltid peka på runt en faktor 3 i densitetsökning från 16/12 nm till 7 nm. Det är ju två nodsteg, 10 nm ligger emellan så 3x är mindre än två hela noder som borde ge 4x. Enligt TSMC namngivning borde 7 nm vara 5x tätare, men i praktiken verkar det vara strax över 3x så beräkningen borde vara OK.

Huvudpoängen är ändå att en GPU på 7 nm med dubbelt så många transistorer som en på 16/12 nm kommer vara mindre!

Jag hoppas du har rätt men för Vega arkitekturen ser det inte lika ljust ut och jag ser inte varför nvidia skulle lyckas så extremt mycket bättre

Vega64
4096
14nm
12,5B transistors
495mm2
25.25M tr/mm2

Radeon VII
3840
7nm
13.23B transistors (=105.84%)
331mm2
39.97M tr/mm2

14nm vs 7nm = 58% tätare

Skrivet av the squonk:

Därför Ti kommer senare, så man kan köpa båda

Det verkar faktiskt som att Nvidia har gått över till att släppa hela serien på samma gång.

Sedan får vi för övrigt se hur mycket dessa kommer kosta. 20-serien pushade 12nm-noden rejält med kretsar över 700mm².

Det ryktas att Big Navi hamnar på ca 500mm², och om @Yoshman är rätt på det så kanske Ampere blir lika stor. Blir intressant detta!

Klarar min Ryzen 1800 x cpu och mina DDR4 2666 minnen det starkaste kortet av kommande nvidia eller amd, eller svårt att veta nu ?

Skrivet av medbor:

Jag hoppas du har rätt men för Vega arkitekturen ser det inte lika ljust ut och jag ser inte varför nvidia skulle lyckas så extremt mycket bättre

Vega64
4096
14nm
12,5B transistors
495mm2
25.25M tr/mm2

Radeon VII
3840
7nm
13.23B transistors (=105.84%)
331mm2
39.97M tr/mm2

14nm vs 7nm = 58% tätare

Håller med om att man kanske inte skall hoppas för mycket på nVidias transistordensitet på 7nm.

Navi hade en transistordensitet på 41M tr/mm2, alltså nästan exakt som Vega 20, så ytterligare ungefär nio månader gjorde inte mycket. EUV kan definitivt hjälpa lite, men under 50M tr/mm2 verkar rimligare även i det fallet. Jag tror vi kan anta att nVidias GPUer har ungefär samma sammansättning av logik/SRAM/IO som AMDs.
Det bekräftas också av att TU100 har 18600Mtr/754mm2 = 24,7M tr/mm2
Ganska exakt detsamma som Vega 64.

Om vi räknar med att nVidia faktiskt kan klämma in 25% mer transistorer på sin version av processen, så ligger det här ryktet ändå precis vid reticle-gränsen eller över eftersom de har mer än dubblat de totala ALU-resurserna med RT och tensor cores.
.
..
...
Fan trot. Just innanför de teoretiska möjligheternas gränser men jag tänker inte tro på det här ryktet förrän vi ser fysisk verklighet. Och då har vi inte ens börjat diskutera power draw eller pris.

Skrivet av trickeh2k:

Vem behöver Pornhub? Som andra påpekat känns ju 3080Ti-specsen snarare som specsen för Quadro-kort än konsumentvarianten, men man kan ju drömma

Eller Titan RTX (Ampere)... Inte en chans att 3080Ti kommer använda en full GA100 så där torde ryktet vara felaktigt.

3060 med GA104 går rakt på Navi23. 40 SM/CU i båda.

3070 med ev (se nedan) nedskalad GA103 går rätt så rakt på Navi22. 56 SM vs 56-60 CU.

3080 med full GA103 (undra om det här är korrekt, var är GA102?) går nästan rakt på Navi21. 72 SM vs 80 CU.

Som sagt, var är GA102? Det avgör 3080Ti öde lite, är det en nedskalad GA100 eller en GA102. Vilken thriller.

Skrivet av medbor:

Jag hoppas du har rätt men för Vega arkitekturen ser det inte lika ljust ut och jag ser inte varför nvidia skulle lyckas så extremt mycket bättre

Vega64
4096
14nm
12,5B transistors
495mm2
25.25M tr/mm2

Radeon VII
3840
7nm
13.23B transistors (=105.84%)
331mm2
39.97M tr/mm2

14nm vs 7nm = 58% tätare

Fast säger inte det mer om att Vega VII inte på något sätt utnyttjar 7 nm full ut? 25 MTr/mm² pekar ju på att GPUer har, eller hade fram till 16 nm i alla fall, en densitet som är rätt nära HD-transistorer.

Visst kan det vara så att vi nu nått punkten där krympningar för med strömslukande kretsar knappt ser någon densitetsskalning alls. Det som ändå får mig att tro att det är möjligt att få långt bättre skalning är om man tittar på Intels CPU-kärnor (som definitivt kör HP-transistorer då de inte alls ligger i närheten av den maximala densiteten för vare sig 14 nm eller 10 nm).

Enligt ett uttalande från Keller består en Sunny Cove kärna av ~300 MTr medan en Skylake kärna består av ~217 MTr.

Enligt uppskattningar från kretsfoton tar 4 st Skylake kärnor ca 50 mm² på 14 nm medan 4 st Sunny Cove tar ca 31 mm² på 10 nm. Det är en densitetsökning på ~2,2 gånger.

Från samma artikeln bilden ovan var tagen fanns en annan bild där även Intels maximala densiteten är med

Räknar man ut faktiska densiteten på en Sunny Cove kärna så ligger den någonstans 40-45 MTr/mm².

Historiskt har GPUer haft betydligt högre transistordensitet än CPUer på motsvarande process, så om ingen fundamental har ändrats just till TSMC 7 nm tyder Vegas ~40 MTr/mm² på att man inte alls utnyttjar möjligheterna fullt ut.

Omvänt. Anta att Vega är representativt, i så fall är det i praktiken omöjligt att göra en Ampere krets som har mer än 50-60 % fler CUDA-kärnor jämfört med TU102. Det skulle i så fall betyda att en full GA100 maximalt kan få runt 112 SM -> 7168 CUDA-kärnor (och det är en "full" krets). Och tror vi ens att det är möjligt att göra 750-800 mm² kretsar på TSMC 7 nm redan nu? Om inte så är ju maximala antalet CUDA-kärnor ännu mindre.

Då allt detta är spekulationer är det sista absolut möjligt. Men hur förklarar man då Intels skalning från 14nm->10nm kontra TSMCs 16/12nm->7nm?

Intel når inte heller sin teoretiska ~2,7x skalning enligt beräkningarna ovan, men de är långt närmare jämfört med ~3,2x skalning TSMC får rent teoretiskt.

Är övertygad att Ampere kommer ha minst dubbla densiteten över Turing. Just då Intel fixat en sådan skalning på vad som garanterat är HP-transistorer samt att systemkretsarna redan visat att man kan komma hyggligt nära den teoretiska skalningen i praktiken. I alla fall Qualcomm använder delvis HP-transistorer i 7nm Snapdragon, det används åtminstone "prime-core" (edit: se nedan).

~500 mm² kretsar verkar i alla fall att kunna tillverkas. Är ARM64 servers på väg ut (monolitiska 64-80 kärnor kretsar) i den storleken som planeras lanseras sommar/hösten detta år.

Edit: hittade artikeln där jag läst om Snapdragon på TSMC 7 nm

"On their latest Snapdragon 855, Qualcomm took advantage of the new HP cells in order to better optimize for performance and power. Here, one of the big cores, called the prime core, were implemented using the high-performance cells while the other three big cores were implemented using the low-power cells."

Vad kan konstatera där är att HP vs HD ger inte jättestor skillnad i frekvens. Prime-core klockar ~15 % högre än de andra stora kärnorna som då ska använda HD (men självklart möjligt att man inte alls pushar prime-core till max, den klockar runt 2,85 GHz och enligt ARM ska CPU-designen fixa upp till ~3,3 GHz). Kan det vara så att GPUer till rätt stor del faktiskt använder HD-transistorer, de klockar ju faktiskt lägre än moderna systemkretsar för mobiler?

Senast redigerat 2020-05-01 11:33
Skrivet av Yoshman:

Fast säger inte det mer om att Vega VII inte på något sätt utnyttjar 7 nm full ut? 25 MTr/mm² pekar ju på att GPUer har, eller hade fram till 16 nm i alla fall, en densitet som är rätt nära HD-transistorer.

Visst kan det vara så att vi nu nått punkten där krympningar för med strömslukande kretsar knappt ser någon densitetsskalning alls. Det som ändå får mig att tro att det är möjligt att få långt bättre skalning är om man tittar på Intels CPU-kärnor (som definitivt kör HP-transistorer då de inte alls ligger i närheten av den maximala densiteten för vare sig 14 nm eller 10 nm).

Enligt ett uttalande från Keller består en Sunny Cove kärna av ~300 MTr medan en Skylake kärna består av ~217 MTr.

Enligt uppskattningar från kretsfoton tar 4 st Skylake kärnor ca 50 mm² på 14 nm medan 4 st Sunny Cove tar ca 31 mm² på 10 nm. Det är en densitetsökning på ~2,2 gånger.

Från samma artikeln bilden ovan var tagen fanns en annan bild där även Intels maximala densiteten är med
https://fuse.wikichip.org/wp-content/uploads/2019/06/tsmc-density-with-7nm.png
Räknar man ut faktiska densiteten på en Sunny Cove kärna så ligger den någonstans 40-45 MTr/mm².

Historiskt har GPUer haft betydligt högre transistordensitet än CPUer på motsvarande process, så om ingen fundamental har ändrats just till TSMC 7 nm tyder Vegas ~40 MTr/mm² på att man inte alls utnyttjar möjligheterna fullt ut.

Omvänt. Anta att Vega är representativt, i så fall är det i praktiken omöjligt att göra en Ampere krets som har mer än 50-60 % fler CUDA-kärnor jämfört med TU102. Det skulle i så fall betyda att en full GA100 maximalt kan få runt 112 SM -> 7168 CUDA-kärnor (och det är en "full" krets). Och tror vi ens att det är möjligt att göra 750-800 mm² kretsar på TSMC 7 nm redan nu? Om inte så är ju maximala antalet CUDA-kärnor ännu mindre.

Då allt detta är spekulationer är det sista absolut möjligt. Men hur förklarar man då Intels skalning från 14nm->10nm kontra TSMCs 16/12nm->7nm?

Intel når inte heller sin teoretiska ~2,7x skalning enligt beräkningarna ovan, men de är långt närmare jämfört med ~3,2x skalning TSMC får rent teoretiskt.

Är övertygad att Ampere kommer ha minst dubbla densiteten över Turing. Just då Intel fixat en sådan skalning på vad som garanterat är HP-transistorer samt att systemkretsarna redan visat att man kan komma hyggligt nära den teoretiska skalningen i praktiken. I alla fall Qualcomm använder delvis HP-transistorer i 7nm Snapdragon, det används åtminstone "prime-core" (edit: se nedan).

~500 mm² kretsar verkar i alla fall att kunna tillverkas. Är ARM64 servers på väg ut (monolitiska 64-80 kärnor kretsar) i den storleken som planeras lanseras sommar/hösten detta år.

Edit: hittade artikeln där jag läst om Snapdragon på TSMC 7 nm

"On their latest Snapdragon 855, Qualcomm took advantage of the new HP cells in order to better optimize for performance and power. Here, one of the big cores, called the prime core, were implemented using the high-performance cells while the other three big cores were implemented using the low-power cells."

Vad kan konstatera där är att HP vs HD ger inte jättestor skillnad i frekvens. Prime-core klockar ~15 % högre än de andra stora kärnorna som då ska använda HD (men självklart möjligt att man inte alls pushar prime-core till max, den klockar runt 2,85 GHz och enligt ARM ska CPU-designen fixa upp till ~3,3 GHz). Kan det vara så att GPUer till rätt stor del faktiskt använder HD-transistorer, de klockar ju faktiskt lägre än moderna systemkretsar för mobiler?

Varken radeon 7 eller navi hade så höga densiteter, båda ligger på ca 40M/mm2, antingen är AMD helt värdelösa eller så är något annat konstigt här...

5500XT får samma densitet också

Skrivet av medbor:

Varken radeon 7 eller navi hade så höga densiteter, båda ligger på ca 40M/mm2, antingen är AMD helt värdelösa eller så är något annat konstigt här...

5500XT får samma densitet också

Finns absolut en möjlighet att ~40 Mtr/mm² är vad man kan förvänta sig på TSMC 7 nm när det handlar om strömslukande kretsar.

En (av flera) saker som ställt till det för Intel på deras 10 nm är att man gick till kobolt i vissa lager (som jag förstår det, de som ska skyffla mycket ström). Det råder delade mening om det verkligen behövs vid den densitet Intels 10 nm / TSMC 7 nm håller, i alla fall hur värdefullt det är. Det som talar emot att just det skulle spela roll är att kobolt, vad jag kan förstå, inte påverkar storleken på transistorn (vare sig den är HP eller HD). Men skulle kunna vara så att man inte kan krympa p.g.a. att man då får för hög värmeutveckling i de ledningar som skyfflar ström (vid riktigt smala ledningar har kobolt lägre resistans jämfört med koppar, det är orsaken till att byta).

Om 40 Mtr/mm² är representativt lär de specifikationer vi sett för Ampere så här långt vara helt uppåt väggarna. Alt. så har Nvidia lyckats minska antalet transistorer per CUDA-kärna rätt ordentligt. DET vore en sensation, det brukar ju gå åt andra hållet!

Skrivet av Yoshman:

Finns absolut en möjlighet att ~40 Mtr/mm² är vad man kan förvänta sig på TSMC 7 nm när det handlar om strömslukande kretsar.

En (av flera) saker som ställt till det för Intel på deras 10 nm är att man gick till kobolt i vissa lager (som jag förstår det, de som ska skyffla mycket ström). Det råder delade mening om det verkligen behövs vid den densitet Intels 10 nm / TSMC 7 nm håller, i alla fall hur värdefullt det är. Det som talar emot att just det skulle spela roll är att kobolt, vad jag kan förstå, inte påverkar storleken på transistorn (vare sig den är HP eller HD). Men skulle kunna vara så att man inte kan krympa p.g.a. att man då får för hög värmeutveckling i de ledningar som skyfflar ström (vid riktigt smala ledningar har kobolt lägre resistans jämfört med koppar, det är orsaken till att byta).

Om 40 Mtr/mm² är representativt lär de specifikationer vi sett för Ampere så här långt vara helt uppåt väggarna. Alt. så har Nvidia lyckats minska antalet transistorer per CUDA-kärna rätt ordentligt. DET vore en sensation, det brukar ju gå åt andra hållet!

Tekniskt sett kan ju cuda kärnor och SM kluster ändras mellan generationer, tänker på dubblerad shader clock för många år sedan och andra saker. Men känns som att något är fel med AMDs densiteter. Kanske är därför de kan lova så mycket bättre prestanda per watt inför RDNA2?

Skrivet av medbor:

Tekniskt sett kan ju cuda kärnor och SM kluster ändras mellan generationer, tänker på dubblerad shader clock för många år sedan och andra saker. Men känns som att något är fel med AMDs densiteter. Kanske är därför de kan lova så mycket bättre prestanda per watt inför RDNA2?

Historiskt har AMD och Nvidias kretsar med likvärdig nod varit jämförbara sett till densitet. Blir intressant att se om det blir någon skillnad nu.

Lustigt hur vissa nyheter kan få forna nyheter att helt plötsigt gå från wow till lama.
Big Navi som jag längtat efter känns helt plötsligt som ett määäh.

Skrivet av Yoshman:

Finns absolut en möjlighet att ~40 Mtr/mm² är vad man kan förvänta sig på TSMC 7 nm när det handlar om strömslukande kretsar.

Navi 23 ska ju ryktesvis vara något mindre än Navi10 så en liten täthetsförbätting är nog att vänta men knappast en dubblering.

SNÄLLA GEFORCE... låt inte Priserna vara så skyhöga som RTX 2000 serien... är faktiskt sugen på att byta ut mitt GTX 1080 ti mot RTX 3080 ti, men inte för ett så högt pris som 15000kr...

Skrivet av Triton242:

Lustigt hur vissa nyheter kan få forna nyheter att helt plötsigt gå från wow till lama.
Big Navi som jag längtat efter känns helt plötsligt som ett määäh.

Det blir faktiskt rätt intressant. Jag är fortfarande väldigt nyfiken på Big Navi.

Ska göra en fullständigt ovetenskaplig och kanske meningslös räkneövning.

2080Ti är ca 40% snabbare än 5700XT.

3080Ti ryktas få 88% fler CUDA-kärnor än 2080Ti. Så om vi säger att prestandaindex för 2080Ti är 140 så hamnar 3080Ti på 263 (om klockfrekvenser och IPC är samma). Jag ignorerar här att läckan även har presumtiva frekvenser, de brukar i princip aldrig stämma inför släpp till skillnad från antal kärnor osv.

5700XT har 40 CU-enheter och ryktet om Big Navi är 80 CU-enheter, alltså en ökning på 100%. Det ger ett index på 100 för 5700XT och om IPC och klockfrekvenser är samma på den framtida RDNA2-kretsen så blir prestandaindex 200. AMD har lovat att resterna från GCN som finns kvar i RDNA är borta från RDNA2 och att det kommer bli en effektivare krets. Frågan är hur mycket? RDNA2 behöver ge ca 30% mer prestanda per klockcykel för att kunna konkurrera med det som ryktas bli Ampere. Kommer AMD lyckas med det? Återstår att se.

Allt detta är ju bara en rolig räkneövning för att spekulationer är kul. Jag har helt bortsett från eventuell bandbredd eller hur produkterna kommer klockas. Så inget kommer stämma i slutändan.

Skrivet av Yoshman:

Om 40 Mtr/mm² är representativt lär de specifikationer vi sett för Ampere så här långt vara helt uppåt väggarna. Alt. så har Nvidia lyckats minska antalet transistorer per CUDA-kärna rätt ordentligt. DET vore en sensation, det brukar ju gå åt andra hållet!

Vi får väl se om två veckor när Nvidia sannolikt presenterar Ampere för professionella marknaden om två veckor. Det fanns ett rykte tidigare om okända Nvidia-enheten som testats på Geekbench och sas ha 7552 kärnor. https://www.sweclockers.com/nyhet/29206-nvidia-grafikkort-med...

Det är väl antagligen för tidigt för MCM GPU?

Skrivet av Novdid:

AMD har lovat att resterna från GCN som finns kvar i RDNA är borta från RDNA2

Var kommer den informationen ifrån?

kan dags att få byta sitt 2080ti då..

@mackebacke: Om du spelar i 1440P eller 4K, överklockar processorn och får upp dina minnen i minst 3200MHz eller byter minnen så ska det fungera utmärkt.

Ska du spela i 1080p hade jag bytt processor när det är dags.

Mvh

Skrivet av ipac:

Var kommer den informationen ifrån?

Sweclockers: AMD Radeon RX 5000 är hybrid med inslag av GCN – "renodlad" RDNA först år 2020

Jaha, den historien.
Hade för mig att det hela debunkades, men kan minnas fel.

@ipac:

Jag har för mig att jag hört samma information från annat håll också. Vi får väl se helt enkelt.

Skrivet av Novdid:

Det blir faktiskt rätt intressant. Jag är fortfarande väldigt nyfiken på Big Navi.

Ska göra en fullständigt ovetenskaplig och kanske meningslös räkneövning.

2080Ti är ca 40% snabbare än 5700XT.

3080Ti ryktas få 88% fler CUDA-kärnor än 2080Ti. Så om vi säger att prestandaindex för 2080Ti är 140 så hamnar 3080Ti på 263 (om klockfrekvenser och IPC är samma). Jag ignorerar här att läckan även har presumtiva frekvenser, de brukar i princip aldrig stämma inför släpp till skillnad från antal kärnor osv.

5700XT har 40 CU-enheter och ryktet om Big Navi är 80 CU-enheter, alltså en ökning på 100%. Det ger ett index på 100 för 5700XT och om IPC och klockfrekvenser är samma på den framtida RDNA2-kretsen så blir prestandaindex 200. AMD har lovat att resterna från GCN som finns kvar i RDNA är borta från RDNA2 och att det kommer bli en effektivare krets. Frågan är hur mycket? RDNA2 behöver ge ca 30% mer prestanda per klockcykel för att kunna konkurrera med det som ryktas bli Ampere. Kommer AMD lyckas med det? Återstår att se.

Allt detta är ju bara en rolig räkneövning för att spekulationer är kul. Jag har helt bortsett från eventuell bandbredd eller hur produkterna kommer klockas. Så inget kommer stämma i slutändan.

Sett till klockfrekvens så lovar ju PS5 ganska mycket högre frekvenser för RDNA2, dessutom kan man nog räkna med att en konsolkrets knappast är maxad sett till klockfrekvens för att för få kretsar skulle kunna valideras vid tillverkningen då.

Min känsla är att det kommer bli förvånansvärt jämnt uppe i toppen i höst

De släpper säkert 3080Ti som det står här med ett hopp ner till 3080 som de senare kan fylla upp med Super serien. Men 3080Ti lär landa på 20K+

Det enligt mig mest intressanta är att man förhoppningsvis mycket bättre lyckats matcha RT/cuda ration. Dagens generation grafikkort från Nvidia har ju förhållandevis skrattretande RT-prestanda.

Får se om ryktet är sant

@Westelindh!: Bör inte dom som utvecklar programvara kunna matcha detta också? Är inte så insatt, men känns smidigare. Eller är ray tracing någon sorts plug in som utvecklarna inte har så mycket kontroll över?

Skrivet av ipac:

Navi 23 ska ju ryktesvis vara något mindre än Navi10 så en liten täthetsförbätting är nog att vänta men knappast en dubblering.

Ingen förväntar rimligen en fördubbling i densitet över Vega och Navi på 7nm. Däremot kan man förvänta sig mer än en fördubbling mellan TSMC 16/12 nm och 7 nm.

AMDs GPUer ligger idag på 40 MTr/mm², det medan TSMCs 7 nm ska vara kapabel till ~90 MTr/mm² om man kör med HD-transistorer och ~65 MTr/mm² om man kör med HP-transistorer.

Redan vid 50 MTr/mm² når man en fördubbling i densitet över vad man har på 16/12 nm. Kommer man nära 65 MTr/mm² blir ju ökningen i densitet en faktor 2,6.

Senast redigerat 2020-05-01 19:54

Lite skeptisk till specifikationerna för 3080ti. SKUs som heter 100 är den fulla kretsen och brukar användas för Tesla/ Titan / Quadro osv. Men vem vet, kanske är Big Navi bättre än väntat och behöver ett ordentligt svar från nVidia? Jag hoppas att vi får tillbaka den konkurrens som fanns förr i tiden mellan AMD och nVidia