Kepler – En ny arkitektur

kepler_0008_Layer 1.jpg

Tesla

Fermi

Kepler

Modell

GT200

GF110

GK104

Transistorer

1,4 mdr

3,0 mdr

3,54 mdr

CUDA-kärnor

240 st.

512 st.

1 536 st.

Klockfrekvens

648 MHz

772 MHz

1 006 MHz

Shaderfrekvens

1 476 MHz

1 544 MHz

-

GFLOPS

1 063

1 581

3 090

Texturenheter

80

64

128

Fillrate (texel)

51,8 GT/s

49,4 GT/s

128,8 GT/s

Minnesfrekvens

2 484 MHz

4 008 MHz

6 008 MHz

Bandbredd

159 GB/s

192,4 GB/s

192,3 GB/s

Skärmanslutningar

2 st.

2 st.

4 st.

TDP

183 W

244 W

195 W

Nvidia Kepler är en ny arkitektur och därmed inte fullt jämförbar med föregångarna. Denna gång nöjer sig Nvidia med att öka antalet transistorer med cirka 20 procent, men det betyder inte att förändringarna är små.

kepler_0007_Layer 2.jpg

Precis som i Fermi är grunden i den nya arkitekturen Graphics Processing Clusters. Grafikprocessorn GK104 består av fyra beräkningskluster (GPC) med två streamprocessorer vardera, som i sin tur innehåller 192 CUDA-kärnor – totalt 1 536 beräkningsenheter eller tre gånger fler än i Fermi.

Varje GPC har dessutom dedikerade textur/rasterenheter samt minneskontroller med 128 KB L2-cache. Hela GK104 innehåller 512 KB L2-cache, 128 texturenheter samt stöder 6 GHz GDDR5-minne, det sistnämnda ett nytt rekord i grafikkortsvärlden.

1.jpg
2.jpg

Resultatet sägs vara en betydligt snabbare och effektivare grafikprocessor än föregångaren Fermi. Enligt Nvidia kan Kepler ge uppemot dubbelt så hög "prestanda per watt" och samtidigt prestera bättre än konkurrenterna, inklusive prestandakungen Radeon HD 7970.