Traditionen trogen håller Nvidia i sin årliga GPU Technology Conference och under en session intar alltid bolagets grundare och VD Jen-Hsun Huang scenen. Under fjolåret presterades arkitekturen Pascal med beräkningskortet Tesla P100 och för 2017 års upplaga är det dags för nästa steg – Volta.

Specifikationer: Nvidia Tesla V100

Tesla V100

Tesla P100

Tesla M40

Tesla K40

Teknik

12nm TSMC

16nm TSMC

28nm TSMC

28nm TSMC

Krets

GV100

GP100

GM200

GK110

Kretsyta

815 mm2

610 mm2

601 mm2

551 mm2

Transistorer

21,1 miljarder

15,3 miljarder

8 miljarder

7,1 miljarder

Arkitektur

Volta

Pascal

Maxwell

Kepler

SM-kluster

80 st.

56 st.

24 st.

15 st.

CUDA-kärnor

5 120 st.

3 584 st.

3 072 st.

2 880 st.

Texturenheter

320 st.

224 st.

192 st.

240 st.

Klockfrekvens

1 370 MHz

1 328 MHz

948 MHz

745 MHz

GPU Boost

1 455 MHz

1 480 MHz

1 114 MHz

875 MHz

Beräkningskraft (SP, FP32)

14 899 GFLOPS

10 608 GFLOPS

6 844 GFLOPS

5 040 GFLOPS

Beräkningskraft (DP, FP64)

7 450 GLOPS

5 304 GFLOPS

214 GFLOPS

1 680 GFLOPS

Minnesbuss

4 096-bit

4 096-bit

384-bit

384-bit

Minnestyp

HBM2

HBM2

GDDR5

GDDR5

Minnesmängd

16 GB

16 GB

Upp till 24 GB

Upp till 12 GB

Minnesfrekvens

~1 750 MHz

1 430 MHz

6 000 MHz

6 000 MHz

Minnesbandbredd

900 GB/s

732 GB/s

288 GB/s

288 GB/s

TDP

300 W

300 W

250 W

235 W

Det nya beräkningskortet heter Tesla V100 och debuterar arkitekturen Volta. Grafikkretsen GV100 bygger på TSMC:s 12-nanometersteknik, som baseras på fjolårets 16 nanometer men med optimeringar för energieffektivitet, prestanda och transistortäthet. Det här möjliggör för Nvidia att skapa den mest avancerade och största kretsen någonsin.

► Läs alla artiklar om #Nvidia Volta

Grafikkretsen huserar inget mindre än 21 miljarder transistorer, vilket kan jämföras med 15,3 miljarder transistorer för tidigare rekordhållare GP100. Detta med en kretsyta på massiva 815 mm2, avsevärt större än enstaka kretsar som historiskt mätt som mest närmare 700 mm2.

Antalet CUDA-kärnor för Tesla V100 är 5 120 stycken och beräkningskraften anges till 15 TFLOPS vid singelprecision (FP32) och 7,5 TFLOPS vid dubbelprecision (FP64). Vid sidan om detta hör en ny typ av Tensor-kärnor som kan utföra beräkningar särskilt ämnade maskininlärning och med dessa är den teoretiska beräkningskraften hela 120 TFLOPS.

Den massiva grafikkretsen omgärdas av fyra HBM2-kapslar på 4 GB vardera med en klockfrekvens på 875 MHz (1 750 MHz effektivt), vilket ger totalt 16 GB minne och en teoretiskt bandbredd om 900 GB/s. I anslutningsväg har Tesla V100 stöd för andra generationens NVLink med en bandbredd på 300 GB/s – nästan tio gånger högre än 32 GB/s för PCI Express 3.0 x16.

Leveranserna av Nvidia Tesla V100 inleds under årets tredje kvartal. När den nya grafikkretsen släpps för konsumenter framgår inte, men med Pascal i åtanke är det troligt att Nvidia skapar en mindre och mer energieffektiv krets vid namn GV102 utan beräkningsorienterade finesser.