Enligt det sättet att resonera har "IPC" i GCN1.2 (Fury X) minskat med 33 % jämfört med GCN1.1 (390X)...
Rejält förenklat består en GPU av fem delar
shader-array
TMU (texturenheter)
ROP (raster & blending)
geometri/vertex-array
VRAM+cache
och en jämförelse av den första punkten (diskussionen var runt stream-processorer och CUDA-cores) genom att studera resultat som extremt mycket beror på balansen mellan alla dessa punkter (SweC prestandaindex) blir ju totalt nonsens.
Håller med om att det mest intressanta är hur de nya kretsarna kommer prestera i sin helhet, men den enda del det finns några rykten som har någon form av substans är första punkten. Min invändning här är att Maxwells shader-array är definitivt mer effektiv än Keplers, men det är inte nära några 25 %. Och ja, det kanske du anser är "detaljer" men en del av mitt arbete består i att göra extrema optimeringar och i dessa lägen ligger definitivt djävulen i detaljerna, så för mig är detta kanske långt mer självklart än för de flesta andra.
Många verkar helt missa hur extremt mycket Kepler och Maxwell skiljer sig åt i designen samt också hur mycket bättre balans Maxwell har av dessa enheter givet den riktning moderna spelmotorer tagit. Jämför vi 980 och 780Ti så har de väldigt snarlik kapacitet i shader-array, tittar man på AotS som är extremt shader-tungt så är fördelen där mindre för Maxwell än vad SweC prestandaindex skvallrar om.
En trend i nya spel är att man lägger på allt mer post-processing, många av dessa efter är ROP och bandbreddskrävande. ROP-kapaciteten i 980 är 175 % högre än 780Ti! Bandbredd kan vid första anblick tala för 980Ti, men mycket post-processing har hög datalokalitet vilket gynnar Maxwells större cache (både L1 och L2, en sak som nämns i whitepaper om Pascal är att L1 dubblas från Maxwell).
Textureffekter har däremot minskat i relevans då spel aldrig mindre använder olika former av "maps" (cube-maps, environment-maps etc), motsvarande görs idag med shaders och post-processing. 980 har faktiskt ca 40 % lägre kapacitet här än 780Ti. Maxwell är helt enkelt en långt bättre balanserad krets för moderna spel.
Det man kan notera när man jämför 390, 390X och Fury X är att balansen mellan delar blir allt sämre. 390 (och även 380) verkar vara de AMD kretsar som har bäst balans mellan de olika delarna. Från 390 och uppåt är ROP-kapacitet och geometri-kapacitet densamma, vilket syns i väldigt dålig effektivitet av all den extra shader-kapasitet som högre modeller lägger på.
Av de rykten som finns kring Polaris tycker jag att AMD fokuserat på helt rätt punkter, man pratar ju om rejält mycket bättre geomtrikapacitet t.ex. (något som t.ex. kommer säkerställa att Polaris hanterar Gameworks-effekter långt bättre). Så förväntar mig definitivt mer är 25 % högre prestanda med motsvarande antal stream-processorer som dagens kretsar då shared-array absolut inte är en flaskhalsarna i dagens GCN.
Därför jag inte riktigt reagerade på min missuppfattning om 2048 stream-cores, är övertygad att en GCN med 2048 cores där man biffade upp ROPs och geomtrikapacitet skulle vara snabbare i >90 % av fallen än dagens 390X (980 har 2048 "kärnor" med samma teoretiska kapacitet per "kärna" och MHz som GCN).
Det trevliga med att öka frekvensen är att allt utom VRAM-kapacitet skalar med frekvens (inklusive L1/L2, så även bandbredd skalar till viss del), så tror att en design där man kanske förenklar vissa delar för att möjliggöra högre frekvens inom en viss effektbudget är en bra idé. Dagens processer verkar väldigt effektiva upp till 1,5-2,0 GHz om man tittar på var ARM och Intel designer lägger sig när man uteslutande optimerar för perf/W, GPUerna borde därför kunna lyftas lite från dagens ~1,0 GHz nivå med positiv effekt (väldigt mycket spekulation från min sida dock).
Du menar att det varit signifikant värre än detta tidigare, notera 1,2 GHz resultaten med DX11?
http://www.hardocp.com/images/articles/14610034644x5teWArBn_4_1.png
http://www.hardocp.com/images/articles/14610034644x5teWArBn_4_4.png
Tittar jag på de artiklar som testade "Omega" samt nu "Crimson" drivarna så handlar det i genomsnitt om förbättringar på 1-2 %, vissa titlar får någon procent lägre prestanda medan vissa ser upp mot 5 % högre (t.ex. GTA med Crimson). Visst rent matematiskt är det väl en förbättring, men knappast något som gör en relevant skillnad. Huruvida grafikkortet är "fabriksöverklockat" eller inte har en större påverkan än detta.
De som har Maxwell gen 2 fick vid något läge en drivare som ökade prestanda i spel som använder MSAA med 10-30 % via MFAA förutsatt att man innan använde minst MSAA x4 (vilket SweClockers alltid använder i sitt prestandaindex för de titlar som stödjer MSAA).
Ändå verkar konsensus vara att Nvidias drivare inte ger någon boost med tiden... Och just detta fall ligger det något i detta, allt färre titlar stödjer MSAA då det fungerar dåligt med många tekniker som nya titlar använder.
Ja det har varit betydligt sämre tidigare, men de har som sagt inte nått Nvidias nivå.
Fanns en trådar om detta i samband med lanseringen av R9 390 och Fury, runt Juni i fjol, (beoynd3d kanske?).
Overheaden är ju inget som märks med kraftiga CPU:r, men de som har klenare har helt klart fått ett lyft.
Edit Några resultat från sommaren 2015.
http://forums.guru3d.com/showpost.php?p=5116933&postcount=934
Bör ha hänt en del även efter dess.
AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |