Nvidia Pascal – först ut på 16 nanometer

När AMD tillkännagav Radeon HD 7970 i slutet av 2011 blev det startskottet för TSMC:s tillverkningsteknik 28 nanometer, som ersatte föregående 40 nanometer. Detta innebar en rejäl förbättring i energieffektivitet och dubblering i transistortäthet, två aspekter som sedan grafikprocessorns begynnelse drivit utvecklingen framåt.

Nästa naturliga steg skulle bli 20 nanometer, men tekniken gav inte samma fördelar som tidigare teknikskiften. Relativt hög strömförbrukning kombinerat med en dryg dubblering i transistortäthet gjorde att vissa mobilkretsar blev varma och led av så kallade "hotspots", varför både AMD och Nvidia ratade tekniken för sina stora och strömtörstiga kretsar.

Istället fick duon efter bästa förmåga utföra mirakel på 28 nanometer, där Nvidia kanske lyckades bäst med energieffektiva Maxwell. Så sent som förra året slog dock de båda i en vägg när de tvingades tillverka rekordstora kretsar på 600 mm2 med åtta miljarder – eller fler – transistorer, för att höja prestandan.

Nvidia Pascal – först ut på 16 nanometer

Över fyra år senare är väntan över och TSMC har något nytt att komma med. Den nya tekniken kallas 16 nanometer och kommer med "FinFET"-transistorer, som till skillnad från traditionella inte leder ström över en plan yta utan har en kiselfena där strömmen flödar. Detta ger bättre möjligheter att kontrollera flödet, vilket i sin tur innebär lägre strömläckage och förmågan att nå högre klockfrekvenser.

Samsung-14nm-FinFET.jpg

Tillverkningstekniken 16 nanometer från TSMC har använts av flertalet mobilkretsar, då under beteckningen 16 FinFET (16FF). Det här var kontraktstillverkarens första generation avsedd de aktörer som ville åt en tidig övergång. Med Pascal använder Nvidia den nya varianten 16 FinFET Plus (16FF+), som uppges erbjuda 15 procent högre prestanda (klockfrekvens) än 16FF.

Nämnvärt är också att antalet nanometer inte längre nödvändigtvis avslöjar hur transistortät en teknik är. TSMC:s 16 nanometer är i själva verket 20 nanometer med FinFET-transistorer, där den sista delen ger 40 procent högre prestanda alternativt 50 procent lägre strömförbrukning jämfört mot den teknik som av bolaget marknadsförs som 20 nanometer. Det här motiverar således namnbytet till en "mindre" geometri.

TSMC 16 nanometer mot Samsung 14 nanometer

Det som gör den här grafikgenerationen särskilt intressant är att Nvidia troget stannar hos TSMC som kund, medan ärkerivalen AMD valt en annan aktör för Polaris. Det handlar då om 14 nanometer från Samsung, som licenserat ut sin teknik till Globalfoundries. Tidiga rykten har även gjort gällande att Nvidia övervägde göra samma övergång.

Likt TSMC:s 16-nanometersteknik bygger Samsungs 14 nanometer vidare på 20 nanometer med FinFET-transistorer som den stora nyheten. I samtal med en högt uppsatt representant på Nvidia finns, utöver eventuella prisskillnader, två avgörande skillnader mellan teknikerna.

Enligt personen i fråga ska Samsung erbjuda något bättre transistortäthet jämfört mot TSMC, vilket borde göra tekniken perfekt för en grafikkrets då det möjliggör ett större antal beräkningsenheter. Den andra sidan av myntet är dock att TSMC sägs kunna erbjuda högre klockfrekvenser på 16 nanometer.

Med andra ord handlar det om ett väl avvägt beslut, där varken det ena eller andra är fel. Nvidia valde att gå på TSMC där de fick en något mindre transistorbudget i utbyte mot högre klockfrekvenser, någonting de således hoppas ska väga upp för den fördel AMD väntas få på 14 nanometer.

Grafikkort

GPU

Teknik

Transistorer

Storlek

Tesla P100

GP100

16nm

15 300 milj.

610 mm2

GTX 1080

GP104

16nm

7 200 milj.

314 mm2

GTX Titan X

GM200

28nm

8 000 milj.

601 mm2

GTX Titan

GK110

28nm

7 080 milj.

561 mm2

GTX 680

GK104

28nm

3 540 milj.

294 mm2

GTX 580

GF110

40nm

3 000 milj.

529 mm2

GTX 480

GF100

40nm

3 000 milj.

529 mm2

GTX 285

GT200b

55nm

1 400 milj.

470 mm2

GTX 280

GT200a

65nm

1 400 milj.

576 mm2

9800 GTX+

G92b

55nm

754 milj.

260 mm2

8800 GT

G92a

65nm

754 milj.

324 mm2

8800 Ultra

G80

90nm

681 milj.

484 mm2

R9 Fury X

Fiji

28nm

8 900 milj.

596 mm2

R9 290X

Hawaii

28nm

6 200 milj.

438 mm2

HD 7970

Tahiti

28nm

4 300 milj.

365 mm2

HD 6970

Cayman

40nm

2 640 milj.

389 mm2

HD 5870

Cypress

40nm

2 150 milj.

334 mm2

HD 4890

RV790

55nm

959 milj.

282 mm2

HD 4870

RV770

55nm

956 milj.

260 mm2

HD 3870

RV670

55nm

666 milj.

192 mm2

HD 2900 XT

R600

80nm

720 milj.

420 mm2

Tidigare under våren tillkännagav Nvidia grafikkretsen GP100 som gjorde entré med beräkningskortet Tesla GP100. Kretsen är ur alla avseenden ett monster med sina 610 mm2 och 15,3 miljarder transistorer, med råge det största antalet i någon krets som tillverkats hittills.

När och om GP100 gör entré för konsumenter är än så länge höljt i dunkel. Istället inleder Nvidia konsumentlanseringen med GP104, som är till hälften så stor och rentutav huserar färre transistorer än GM200 som används i Geforce GTX 980 Ti och det från idag forna flaggskeppet GTX Titan X. Här kommer den nya arkitekturen Pascal med högre klockfrekvenser in i bilden.

slides-4.jpg