Radeon Vega – mindre är bättre

Till skillnad från vad många trodde får inte Renoir den senaste grafikarkitekturen Radeon DNA (RDNA), utan stannar kvar vid Vega som är vidareutvecklade Graphics Core Next (GCN) från år 2011. Det här var enligt AMD inget lätt beslut och valet av Vega var en nödvändighet, snarare än en önskan.

Arkitekturen Vega för Renoir

Som nämnt i tidigare avsnitt spikades designen för Renoir kort innan arkitekturen Zen såg dagens ljus på butikshyllor i början av 2017. Precis som att Zen 2 fanns tillgänglig redan då hade bolaget även RDNA till sitt förfogande, men i en variant som inte var optimerad för bärbara ändamål.

För en integrerad grafikdel vill AMD ha en design som drar omkring 10 watt och för Renoir fanns inte tid att ta fram en optimerad version av RDNA. Arkitekturen Vega fick leva vidare ännu en generation. Utifrån AMD:s uttalanden är ingen högoddsare att RDNA integreras i en framtida generation.

AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-7.jpg

Arkitektoniskt är Vega i stort densamma som tidigare, med vissa förbättringar och anpassningar för att passa i processorer med TDP på 15 watt. Jämfört med Raven Ridge och Picasso kan Renoir press ned grafikdelen i ännu lägre strömsparlägen, vilket kommer väl till pass exempelvis vid lättare laster som videotittande. Infinity Fabric är också optimerad att varje bit data ska kosta mindre sett till strömförbrukning.

En gnutta Radeon DNA

Den enskilt största uppdateringen arkitektoniskt är ingenting som syftar till att öka prestanda i exempelvis spel. Grafikdelen begåvas med kraftfullare acceleration för avkodning av videoinnehåll. Nyheten här är främst 31 procent högre prestanda, vilket kommer väl till pass för HDR-innehåll men även bättre energieffektivitet vid videotittande.

AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-9.jpg

Sett till anslutningar finns Displayport 1.4 med stöd för tekniken Display Stream Compression (DSC), vilket gör det möjligt att driva en extern 4K UHD-skärm i 144 Hz. En mer praktisk tillämpning för detta med en bärbar dator är att det möjliggör att driva flera samtida 4K-skärmar i 60 Hz.

Mindre är bättre

En överraskning är att grafikdelen vid första anblick är mindre potent än tidigare. Istället för upp till 11 beräkningsenheter med 64 streamprocessorer vardera stannar Renoir vid endast 8 stycken. Övergången till 7 nanometer innebär dock att grafikdelen kan nå ännu högre klockfrekvenser, med bättre prestanda som resultat.

Renoir

Picasso

Raven Ridge

Teknik

7 nanometer

12 nanometer

14 nanometer

Grafikarkitektur

Vega

Vega

Vega

Beräkningsenheter

8 st.
(-27,3%)

11 st.

11 st.

Streamprocessorer

512 st.
(-27,3%)

704 st.

704 st.

Turbofrekvens

1 750 MHz
(+25%)

1 400 MHz

1 300 MHz
(-7,1%)

Beräkningskraft

1 792 GFLOPS
(-9,1%)

1 971 GFLOPS

1 830 GFLOPS
(-7,2%)

Med Picasso toppade grafikdelen 1 400 MHz medan Renoir går upp till 1 750 MHz. Det är en ökning med 25 procent, vilket är långtifrån tillräckligt för att kompensera för bortfallet i antalet beräkningsenheter. Den maximala och på pappret teoretiska beräkningskraften (TFLOPS) går rentav ned med 10 procent.

Här är det värt att betona att det handlar om en mobil design, som sällan eller aldrig arbetar i toppfrekvenser konstant. Precis som processorkärnorna är det viktiga inte turbofrekvensen, utan vilken klockfrekvens som är hållbar över tid vid kontinuerlig belastning såsom spel.

AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-8.jpg

Enligt AMD presterar en (1) beräkningsenhet om 64 streamprocessorer upp till 59 procent bättre än i Picasso. Det är således en förbättring som till väldigt stor del kommer genom att grafikdelen i snitt håller högre klockfrekvenser. Det finns även andra förbättringar som ökar prestandan, som stöd för högre minnesfrekvenser.

Färre beräkningsenheter ger längre batteritid

I avsnittet om processordelen var ett av skälen till att krympa L3-cacheminnet att få ned läckströmmen vid låg eller ingen last. Samma argument använder AMD för att motivera färre beräkningsenheter för grafikdelen. Färre beräkningsenheter innebär färre transistorer som läcker när de inte används.

För att ändå syna AMD:s argumentation hade fler beräkningsenheter inte behövt betyda mycket lägre prestanda om de valt att implementera individuell power gating för varje enhet. För Renoir har dock AMD valt en enklare design, där hela grafikdelen antingen är på eller av. Enskilda enheter kan inte stängas av.

Givetvis är kostnaden också någonting AMD vägt in och som alltid försöker de hitta rätt balans mellan prestanda och kretsstorlek. Fler beräkningsenheter med något lägre snittfrekvens till samma effektförbrukning hade gett högre prestanda, men här gjordes bedömningen att den optimala siffran var åtta.