Kepler – En ny arkitektur
Tesla | Fermi | Kepler | |
---|---|---|---|
Modell | GT200 | GF110 | GK104 |
Transistorer | 1,4 mdr | 3,0 mdr | 3,54 mdr |
CUDA-kärnor | 240 st. | 512 st. | 1 536 st. |
Klockfrekvens | 648 MHz | 772 MHz | 1 006 MHz |
Shaderfrekvens | 1 476 MHz | 1 544 MHz | - |
GFLOPS | 1 063 | 1 581 | 3 090 |
Texturenheter | 80 | 64 | 128 |
Fillrate (texel) | 51,8 GT/s | 49,4 GT/s | 128,8 GT/s |
Minnesfrekvens | 2 484 MHz | 4 008 MHz | 6 008 MHz |
Bandbredd | 159 GB/s | 192,4 GB/s | 192,3 GB/s |
Skärmanslutningar | 2 st. | 2 st. | 4 st. |
TDP | 183 W | 244 W | 195 W |
Nvidia Kepler är en ny arkitektur och därmed inte fullt jämförbar med föregångarna. Denna gång nöjer sig Nvidia med att öka antalet transistorer med cirka 20 procent, men det betyder inte att förändringarna är små.
Precis som i Fermi är grunden i den nya arkitekturen Graphics Processing Clusters. Grafikprocessorn GK104 består av fyra beräkningskluster (GPC) med två streamprocessorer vardera, som i sin tur innehåller 192 CUDA-kärnor – totalt 1 536 beräkningsenheter eller tre gånger fler än i Fermi.
Varje GPC har dessutom dedikerade textur/rasterenheter samt minneskontroller med 128 KB L2-cache. Hela GK104 innehåller 512 KB L2-cache, 128 texturenheter samt stöder 6 GHz GDDR5-minne, det sistnämnda ett nytt rekord i grafikkortsvärlden.
Resultatet sägs vara en betydligt snabbare och effektivare grafikprocessor än föregångaren Fermi. Enligt Nvidia kan Kepler ge uppemot dubbelt så hög "prestanda per watt" och samtidigt prestera bättre än konkurrenterna, inklusive prestandakungen Radeon HD 7970.