Traditionen trogen håller Nvidia i sin årliga GPU Technology Conference och under en session intar alltid bolagets grundare och VD Jen-Hsun Huang scenen. Under fjolåret presterades arkitekturen Pascal med beräkningskortet Tesla P100 och för 2017 års upplaga är det dags för nästa steg – Volta.
Specifikationer: Nvidia Tesla V100
Tesla V100 | Tesla P100 | Tesla M40 | Tesla K40 | |
---|---|---|---|---|
Teknik | 12nm TSMC | 16nm TSMC | 28nm TSMC | 28nm TSMC |
Krets | GV100 | GP100 | GM200 | GK110 |
Kretsyta | 815 mm2 | 610 mm2 | 601 mm2 | 551 mm2 |
Transistorer | 21,1 miljarder | 15,3 miljarder | 8 miljarder | 7,1 miljarder |
Arkitektur | Volta | Pascal | Maxwell | Kepler |
SM-kluster | 80 st. | 56 st. | 24 st. | 15 st. |
CUDA-kärnor | 5 120 st. | 3 584 st. | 3 072 st. | 2 880 st. |
Texturenheter | 320 st. | 224 st. | 192 st. | 240 st. |
Klockfrekvens | 1 370 MHz | 1 328 MHz | 948 MHz | 745 MHz |
GPU Boost | 1 455 MHz | 1 480 MHz | 1 114 MHz | 875 MHz |
Beräkningskraft (SP, FP32) | 14 899 GFLOPS | 10 608 GFLOPS | 6 844 GFLOPS | 5 040 GFLOPS |
Beräkningskraft (DP, FP64) | 7 450 GLOPS | 5 304 GFLOPS | 214 GFLOPS | 1 680 GFLOPS |
Minnesbuss | 4 096-bit | 4 096-bit | 384-bit | 384-bit |
Minnestyp | HBM2 | HBM2 | GDDR5 | GDDR5 |
Minnesmängd | 16 GB | 16 GB | Upp till 24 GB | Upp till 12 GB |
Minnesfrekvens | ~1 750 MHz | 1 430 MHz | 6 000 MHz | 6 000 MHz |
Minnesbandbredd | 900 GB/s | 732 GB/s | 288 GB/s | 288 GB/s |
TDP | 300 W | 300 W | 250 W | 235 W |
Det nya beräkningskortet heter Tesla V100 och debuterar arkitekturen Volta. Grafikkretsen GV100 bygger på TSMC:s 12-nanometersteknik, som baseras på fjolårets 16 nanometer men med optimeringar för energieffektivitet, prestanda och transistortäthet. Det här möjliggör för Nvidia att skapa den mest avancerade och största kretsen någonsin.
► Läs alla artiklar om #Nvidia Volta
Grafikkretsen huserar inget mindre än 21 miljarder transistorer, vilket kan jämföras med 15,3 miljarder transistorer för tidigare rekordhållare GP100. Detta med en kretsyta på massiva 815 mm2, avsevärt större än enstaka kretsar som historiskt mätt som mest närmare 700 mm2.
Antalet CUDA-kärnor för Tesla V100 är 5 120 stycken och beräkningskraften anges till 15 TFLOPS vid singelprecision (FP32) och 7,5 TFLOPS vid dubbelprecision (FP64). Vid sidan om detta hör en ny typ av Tensor-kärnor som kan utföra beräkningar särskilt ämnade maskininlärning och med dessa är den teoretiska beräkningskraften hela 120 TFLOPS.
Den massiva grafikkretsen omgärdas av fyra HBM2-kapslar på 4 GB vardera med en klockfrekvens på 875 MHz (1 750 MHz effektivt), vilket ger totalt 16 GB minne och en teoretiskt bandbredd om 900 GB/s. I anslutningsväg har Tesla V100 stöd för andra generationens NVLink med en bandbredd på 300 GB/s – nästan tio gånger högre än 32 GB/s för PCI Express 3.0 x16.
Leveranserna av Nvidia Tesla V100 inleds under årets tredje kvartal. När den nya grafikkretsen släpps för konsumenter framgår inte, men med Pascal i åtanke är det troligt att Nvidia skapar en mindre och mer energieffektiv krets vid namn GV102 utan beräkningsorienterade finesser.