Nvidia Turing med skräddarsydd 12-nanometersteknik

När Nvidia och AMD släppte nya grafikkort år 2016 var det ett länge efterlängtat generationsskifte. Under ganska exakt 4,5 år hade duon stått och stampat på TSMC:s 28-nanometersteknik, där avgörande parametrar som kretsstorlek och energieffektivitet blev allt svårare att tygla.

Anledningen till detta var att 20 nanometer från TSMC visserligen levererade rejält förbättrad transistortäthet, men tekniken led av hög strömförbrukning och visade sig inte vara lämpad för redan strömtörstiga doningar som grafikkretsar. Av denna anledning fick duon vänta två år på ännu mer avancerade tekniker.

IMG_8240.jpg

Med Geforce GTX 1080 och arkitekturen Pascal tog Nvidia steget till 16 nanometer från TSMC.

Det dröjde alltså till år 2016 innan de kunde lägga 28 nanometer bakom sig. Dock valde de att gå skilda vägar – AMD lade alla kort på Globalfoundries mer transistortäta 14-nanometersteknik, medan Nvidia troget stannade hos TSMC vars 16 nanometer var något mindre kompakt men klarade högre klockfrekvenser.

Globalfoundries upphör med utvecklingen av 7 nanometer

Traditionellt har AMD och Nvidia bytt till mer avancerade tekniker vartannat år. Nästa stora steg efter 16 och 14 nanometer är 7 nanometer hos TSMC, men det dröjer innan tekniken är redo för högpresterande kretsar. Globalfoundries har kastat in handduken och av allt att döma är Samsung inte intressant för varken AMD eller Nvidia, åtminstone i ett första skede.

IMG_8977.jpg

AMD tog en annan väg med arkitekturen Polaris och Radeon RX 480, vars grafikkrets tillverkas av Globalfoundries på 14 nanometer.

AMD har is i magen och väntar på 7 nanometer, där arkitekturen Vega blir först ut i slutet av året men endast som beräkningskort. Konsumenter får vänta till år 2019 då bolaget släpper arkitekturen Navi eller sjätte generationens Graphics Core Next (GCN). Nvidia tar istället ett mellansteg till 12 nanometer.

Nvidia Turing – 12 nanometer för Nvidia

Sedan introduktionen av 16 nanometer har TSMC finslipat tekniken och släppt flera iterationer, som alla har något högre prestandapotential (klockfrekvens) och energieffektivitet. När fjärde generationens 16 nanometer släpptes ansågs den vara så pass bra att den förtjänade ett nytt namn: 12 nanometer.

Nvidia går inte in på några närmare detaljer om tekniken som används för Turing, mer än att det är en skräddarsydd variant vid namn 12nm FFN (FinFET Nvidia). Att TSMC anpassat en tillverkningsteknik visar vilken stor och viktig kund det är för den taiwanesiska kontraktstillverkaren.

Även om Nvidia inte går in på djupet går det att anta flera saker om tekniken. Till skillnad från ordinarie 12 nanometer som främst är ämnad systemkretsar för mobila enheter är Nvidias dito sannolikt optimerad för högre klockfrekvenser, med högre strömläckage som följd.

Nvidia Tesla V100 – Volta med 21 miljarder transistorer på 12 nanometer

En annan sak som särskiljer arkitekturen Turing och även Volta är att kretsarna är fullständigt enorma, väl över vad som anses vara möjligt att tillverka. Normala fall går gränsen vid 600 mm2, efter det anses ofta kretsarna vara för svåra att tillverka och verktygen är normalt inte gjorda för större doningar.

Oavsett namngivning har TSMC:s specialanpassade 12 nanometer mer eller mindre samma transistortäthet som 16 nanometer och i jakten på mer avancerade kretsar med fler transistorer finns bara en väg att gå – bygg större. Det är därför troligt att TSMC anpassat sina verktyg för att överskrida teknikens reticle limit, alltså gränsen för hur stora kretsar som går att tillverka.

Grafikkort

GPU

Teknik

Transistorer

Storlek

Trans./mm2

RTX 2080 Ti

TU102

12nm

18 600 milj.

754 mm2

24,67 milj.

RTX 2080

TU104

12nm

13 600 milj.

545 mm2

24,95 milj.

RTX 2070

TU106

12nm

10 600 milj.

445 mm2

23,82 milj.

Titan V

GV100

12nm

21 000 milj.

815 mm2

25,77 milj.

Tesla P100

GP100

16nm

15 300 milj.

610 mm2

25,08 milj.

GTX 1080 Ti

GP102

16nm

12 000 milj.

471 mm2

25,48 milj.

GTX 1080

GP104

16nm

7 200 milj.

314 mm2

22,93 milj.

GTX 1060

GP106

16nm

4 400 milj.

200 mm2

22,00 milj.

GTX Titan X

GM200

28nm

8 000 milj.

601 mm2

13,31 milj.

GTX Titan

GK110

28nm

7 080 milj.

561 mm2

12,62 milj.

GTX 680

GK104

28nm

3 540 milj.

294 mm2

12,04 milj.

GTX 580

GF110

40nm

3 000 milj.

520 mm2

5,769 milj.

GTX 480

GF100

40nm

3 000 milj.

529 mm2

5,671 milj.

GTX 285

GT200b

55nm

1 400 milj.

470 mm2

2,979 milj.

GTX 280

GT200a

65nm

1 400 milj.

576 mm2

2,431 milj.

9800 GTX+

G92b

55nm

754 milj.

260 mm2

2,900 milj.

8800 GT

G92a

65nm

754 milj.

324 mm2

2,327 milj.

8800 Ultra

G80

90nm

681 milj.

484 mm2

1,407 milj.

RX Vega 64

Vega 10

14nm

12 500 milj.

486 mm2

25,72 milj.

RX 480/580

Polaris 10/20

14nm

5 700 milj.

232 mm2

24,57 milj.

R9 Fury X

Fiji

28nm

8 900 milj.

596 mm2

14,93 milj.

R9 290X

Hawaii

28nm

6 200 milj.

438 mm2

14,16 milj.

HD 7970

Tahiti

28nm

4 300 milj.

365 mm2

11,78 milj.

HD 6970

Cayman

40nm

2 640 milj.

389 mm2

6,787 milj.

HD 5870

Cypress

40nm

2 150 milj.

334 mm2

6,437 milj.

HD 4890

RV790

55nm

959 milj.

282 mm2

3,400 milj.

HD 4870

RV770

55nm

956 milj.

260 mm2

3,677 milj.

HD 3870

RV670

55nm

666 milj.

192 mm2

3,469 milj.

HD 2900 XT

R600

80nm

720 milj.

420 mm2

1,714 milj.

Toppkretsen i Turing-familjen är inte riktigt lika massiv som hyperexklusiva GV100, men likväl massiv. Kretsytan för TU102 är 754 mm2, alltså omkring 25 procent större än vad som under väldigt många år varit en gräns. Föregångaren GP102 är därmed en jämförelsevis nätt historia med sina 471 mm2.

Grafikkretsen GP104 är vid det här laget en riktig långkörare, som först använts för Geforce GTX 1080, GTX 1070 Ti och GTX 1070. Denna ersätts av TU104 som historiskt sett också får anses vara en gigant med sina 545 mm2, vilket gör den knappt 74 procent större än dess föregångare.

Slutligen har vi TU106 som släpps i oktober tillsammans med RTX 2070. Trots att det handlar om en krets för mellanklassen är den stor med sina 445 mm2 nästan lika stor som GP102. Jämfört med GP106 i mellanklassaren GTX 1060 som TU106 åtminstone enligt namnschemat ersätter är hela 123 procent större.

Stora och dyra eller ekonomiska grafikkretsar?

En gammal sanning är att större kretsar per automatik är dyrare att tillverkare än mindre på mer avancerade tillverkningstekniker. I takt med att teknikerna blivit svårare att utveckla och fysikens lagar allt mer säger stopp, stämmer inte detta längre. Medan stora delar av industrin flockades runt 40, 28 och 16/14 nanometer väljer många att vänta med övergången till 7 nanometer av just kostnadsskäl.

Skiftet till 7 nanometer trögt till följd av höga utvecklingskostnader

Hur Nvidias avtal ser ut med TSMC och vad de betalar per kiselplatta (eng. wafer) är det omöjligt att svara på. En kvalificerad gissning av undertecknad är att kostnaderna för enorma grafikkretsar på en mycket förfinad 16-nanometersteknik ligger under den hos 7 nanometer, där samma antal transistorer och komplexitet ska rymmas på en kretsyta som är mer än hälften så stor.

Medan beslutet sannolikt är ekonomiskt försvarbart går Nvidia miste om andra fördelar med 7 nanometer, som bättre energieffektivitet och möjligheten till högre klockfrekvenser. En annan aspekt som ofta glöms bort när det talas om nya tillverkningstekniker är tajmning. Time-to-market är också en högst trolig faktor som spelat in i valet av tillverkningsteknik för Turing.