Fast säger inte det mer om att Vega VII inte på något sätt utnyttjar 7 nm full ut? 25 MTr/mm² pekar ju på att GPUer har, eller hade fram till 16 nm i alla fall, en densitet som är rätt nära HD-transistorer.
Visst kan det vara så att vi nu nått punkten där krympningar för med strömslukande kretsar knappt ser någon densitetsskalning alls. Det som ändå får mig att tro att det är möjligt att få långt bättre skalning är om man tittar på Intels CPU-kärnor (som definitivt kör HP-transistorer då de inte alls ligger i närheten av den maximala densiteten för vare sig 14 nm eller 10 nm).
Enligt ett uttalande från Keller består en Sunny Cove kärna av ~300 MTr medan en Skylake kärna består av ~217 MTr.
Enligt uppskattningar från kretsfoton tar 4 st Skylake kärnor ca 50 mm² på 14 nm medan 4 st Sunny Cove tar ca 31 mm² på 10 nm. Det är en densitetsökning på ~2,2 gånger.
Från samma artikeln bilden ovan var tagen fanns en annan bild där även Intels maximala densiteten är med
https://fuse.wikichip.org/wp-content/uploads/2019/06/tsmc-density-with-7nm.png
Räknar man ut faktiska densiteten på en Sunny Cove kärna så ligger den någonstans 40-45 MTr/mm².
Historiskt har GPUer haft betydligt högre transistordensitet än CPUer på motsvarande process, så om ingen fundamental har ändrats just till TSMC 7 nm tyder Vegas ~40 MTr/mm² på att man inte alls utnyttjar möjligheterna fullt ut.
Omvänt. Anta att Vega är representativt, i så fall är det i praktiken omöjligt att göra en Ampere krets som har mer än 50-60 % fler CUDA-kärnor jämfört med TU102. Det skulle i så fall betyda att en full GA100 maximalt kan få runt 112 SM -> 7168 CUDA-kärnor (och det är en "full" krets). Och tror vi ens att det är möjligt att göra 750-800 mm² kretsar på TSMC 7 nm redan nu? Om inte så är ju maximala antalet CUDA-kärnor ännu mindre.
Då allt detta är spekulationer är det sista absolut möjligt. Men hur förklarar man då Intels skalning från 14nm->10nm kontra TSMCs 16/12nm->7nm?
Intel når inte heller sin teoretiska ~2,7x skalning enligt beräkningarna ovan, men de är långt närmare jämfört med ~3,2x skalning TSMC får rent teoretiskt.
Är övertygad att Ampere kommer ha minst dubbla densiteten över Turing. Just då Intel fixat en sådan skalning på vad som garanterat är HP-transistorer samt att systemkretsarna redan visat att man kan komma hyggligt nära den teoretiska skalningen i praktiken. I alla fall Qualcomm använder delvis HP-transistorer i 7nm Snapdragon, det används åtminstone "prime-core" (edit: se nedan).
~500 mm² kretsar verkar i alla fall att kunna tillverkas. Är ARM64 servers på väg ut (monolitiska 64-80 kärnor kretsar) i den storleken som planeras lanseras sommar/hösten detta år.
Edit: hittade artikeln där jag läst om Snapdragon på TSMC 7 nm
"On their latest Snapdragon 855, Qualcomm took advantage of the new HP cells in order to better optimize for performance and power. Here, one of the big cores, called the prime core, were implemented using the high-performance cells while the other three big cores were implemented using the low-power cells."
Vad kan konstatera där är att HP vs HD ger inte jättestor skillnad i frekvens. Prime-core klockar ~15 % högre än de andra stora kärnorna som då ska använda HD (men självklart möjligt att man inte alls pushar prime-core till max, den klockar runt 2,85 GHz och enligt ARM ska CPU-designen fixa upp till ~3,3 GHz). Kan det vara så att GPUer till rätt stor del faktiskt använder HD-transistorer, de klockar ju faktiskt lägre än moderna systemkretsar för mobiler?