Nvidia GM200 – gräddan av Maxwell

När Nvidia under hösten lanserade Geforce GTX 980 och GTX 970 var det uppenbart att arkitekturen Maxwell hade mer att bjuda på. Med för klassen låg strömförbrukning och en kretsarea strax under 400 mm2 fanns gott om utrymme för kraftfullare doningar. Idag släpps gräddan av Maxwell – GM200.

NVC2142216_9.jpg

Grafikprocessorn GM200 är utan tvivel Nvidias mest avancerade någonsin och med hela åtta miljarder transistorer är det även en av de mer sofistikerade kretsarna i världen. Detta kan jämföras mot vad som redan var imponerande 7,1 miljarder för GK110 i föregående Geforce GTX Titan-modeller och GTX 780-serien.

Trots ett rekordhögt antal transistorer står Nvidia likt konkurrenten AMD kvar och stampar på TSMC:s 28-nanometersteknik. Detta gör att kretsarean kliver upp till 602 mm2, vilket gör att GM200 passerar 551 mm2 för GK110 och GT200 (576 mm2) som låg till grund för snart sju år gamla Geforce GTX 280 och GTX 260.

Att jämföra och sammanfatta GM200 mot GM204 i Geforce GTX 980 är enkelt. Det handlar om en grafikprocessor med 50 procent fler resurser och för Geforce GTX Titan X är det utan kompromisser som avstängda CUDA-kärnor eller obskyr segmentering av minneshanteringen.

TITAN_X_Block_Diagram_FINAL.png

Antalet CUDA-kärnor kliver upp till 3 072 stycken fördelade över 24 SMM-kluster. Dessa är i sin tur uppdelade i sex segment eller GPC-kluster, där fyra SMM delar resurser. Uppdelningen möjliggör mer finkornig clock-gating då varje del kan stängas av individuellt för att spara ström, men öppnar även upp för framtida segmentering där Nvidia kan tänkas släppa en avskalad variant till ett lägre pris.

TITAN_X_SM_Diagram_FINAL.png

Till varje SMM-kluster hör 8 texturenheter, vilket för fullskaliga GM200 i Geforce GTX Titan X innebär 192 stycken. För antalet rasterenheter gäller 16 stycken per GPC-kluster eller totalt 96 – ett rejält steg upp från 64 stycken i GTX 980 eller en dubblering mot antalet i GK110. Det här ska göra grafikprocessorn särskilt lämpad spelande i 4K-upplösning med höga inställningar.

Likt andra grafikprocessorer i Maxwell-familjen har även GM200 ett relativt stort L2-cacheminne. Medan GM204, GM206 och GM107 samtliga har 2 048 KB (2 MB) kliver GM200 upp till 3 072 KB (3 MB). Detta används för att färre förfrågningar ska behöva göras till grafikkortets videominne, vilket sänker strömförbrukningen och bidrar till ökad prestanda.

NVIDIA_EdDayMaxwellDay2_FINAL_PUBLISHED_PRO_Page_087.jpg
NVIDIA_EdDayMaxwellDay2_FINAL_PUBLISHED_PRO_Page_088.jpg
NVIDIA_EdDayMaxwellDay2_FINAL_PUBLISHED_PRO_Page_089.jpg
NVIDIA_EdDayMaxwellDay2_FINAL_PUBLISHED_PRO_Page_090.jpg

Till GM200 hör en 384-bitars minnesbuss för GDDR5-minne, i fallet GTX Titan X hela 12 GB i kapacitet. Klockfrekvensen ligger 7 012 MHz eller samma nivå som för GTX Titan Black och GTX 780 Ti, vilket resulterar i på pappret samma 336,6 GB/s i bandbredd. Arkitekturen Maxwell kommer dock med förbättrad minneskompression, som höjer den teoretiska bandbredden med upp till 33 procent.

En tydlig kompromiss som gjorts mot tidigare GTX Titan-modeller är att prestanda vid dubbelprecision begränsats med GTX Titan X. Vad orsaken till detta är framgår inte, sannolikt är dock att Nvidia hellre ser att utvecklare pyntar extra för att köpa ett grafikkort i påkostade Quadro-serien.