Den monolitiska erans slut

Med Zen 2 tar AMD ett radikalt steg i hur de tillverkar sina processorer. Från en monolitisk kärna med så mycket integration av funktioner som möjligt, till att istället tillverka funktioner på olika kretsar och sedan sätta dessa på ett substrat. Det innebär kostnadsmässiga fördelar, men prestandamässigt medför det svåra och inte alls självklara kompromisser.

I fallet Zen 2 och konsumentserien Ryzen 3000 tillverkas processorkärnorna – beräkningsenheterna – på TSMC:s senaste 7-nanometersteknik. Andra delar som minneskontrollern, PCI Express och andra I/O-anslutningar har flyttat ut till en separat krets, tillverkas på Globalfoundries 12-nanometersteknik som känns igen från Ryzen 2000-serien.

amd-2.jpg

Under värmespridaren på AMD Ryzen 3000-serien med en I/O-del tillverkad på 12 nanometer och en CCD-krets tillverkad på 7 nanometer.

AMD hymlar inte med att det är en kompromiss som bottnar i kostnadsskäl och att det här inte är en tillverkningsmetod de annars skulle valt. Att exempelvis flytta ut minneskontrollern ökar latenserna mellan primärminnet på moderkortet och processorkärnorna, vilket har potential att bli en prestandadödare. Att integrera minneskontrollern gjordes från första början just på grund av prestandan. Som nämnt är det dubblerade L3-cacheminnet ett sätt att motverka detta.

Sedan länge eller "sedan alltid" har tightare integration varit någonting både AMD och Intel eftersträvat, då detta lett till prestandamässiga fördelar och faktiskt även kostnadsmässiga. En av de största bedrifterna åstadkom AMD år 2003 när de lyckades med att integrera en minneskontroller, vilket gav märkbara fördelar för konsumenter men framförallt servrar.

År 2019 är läget annorlunda. Vi närmare oss gränsen för vad som är möjligt med krympningar och nya tillverkningstekniker. Det här är en domedagsprofetia som ekat inom industrin i flera år, men som Intels tidigare teknikchef Mark Bohr sade i en intervju för några år sedan; "vi börjar få slut på atomer".

Resultatet har blivit att priset för nya tillverkningstekniker skjutit i höjd och att vi stöter på nya utmaningar. Skenande strömläckage gör att det inte är säkert att en ny nod ger högre prestanda och lägre strömförbrukning. Samtidigt är vissa delar svårare att skala ned än andra, däribland I/O-funktioner som AMD valt att behålla på en äldre teknik. Andra delar missgynnas rentav och kan få oacceptabelt låg hållbarhet över tid.

AMD hade kunnat välja att göra en monolitisk kärna även med Zen 2 med alla fördelar det ger. Problemet är att I/O-funktioner är sådana som är svåra att krympa och att dessa således hade tagit upp en allt större plats på kretsen i relation till processorkärnorna. Detta med en modern tillverkningsteknik som är dyrare per kvadratmillimeter jämfört mot tidigare.

Samtidigt är I/O-funktioner sådant som generellt inte tjänar på nya tekniker, i alla fall om de inte kan krympas och ge kostnadsmässiga fördelar. Transistorerna som hanterar SATA, PCI Express, USB och dylikt ska inte köras snabbare, då detta bryter dessa standarder och endast skapar problem. Som exemplar är det därför Intel kunde "porta" styrkretsen B360 från 14 nanometer till 22 nanometer (och kalla den B365) utan några som helst konsekvenser för slutkund.

Sett till processorkärnorna ser det annorlunda ut. Här vill ett företag som AMD eller Intel kunna integrera så mycket nya funktioner som möjligt, utöka tidigare kapaciteter, få ned spänningen och skruva upp klockfrekvenserna så långt det går. I ett nytt läge där nya tekniker inte längre självklart är billigare är det således här, med beräkningsenheterna, som det är acceptabelt att det kostar extra.

Intel-Lakefield-8.jpg

AMD är inte heller ensamma om detta. Intel är på väg att gå samma väg och är snart rentutav förbi med konceptet "Foveros", som förutom att tillverka kretsar på olika tekniker även staplar dessa ovanpå varandra. En sak är garanterad och det är att både AMD och Intel kommer lägga betydande resurser på detta och att den monolitiska eran är på väg att nå vägs ände.

Nytt substrat – ny designmetodologi på en gammal sockel

Det här radikalt annorlunda sättet att designa processorer ställde AMD inför många kringliggande utmaningar. Det behövdes ett nytt substrat av hög kvalitet för att få de olika kretsarna att "tala med varandra" med så liten prestandaförlust som möjligt. Samtidigt ville bolaget inte introducera en ny plattform, utan stanna kvar vid sockel AM4.

Tom_Ley-Next_Horizon_Gaming-Physical_Design_06092019-2.jpg

Säga vad man vill om sockel AM4, den introducerades år 2016 för arkitekturen Excavator – fjärde och sista generationens Bulldozer. Antalet kontaktstift (eng. pins) togs fram utifrån kraven dessa processorer ställde och vad som var planerat med arkitekturen Zen (1) och Ryzen 1000-serien.

På sidan "Vägen till Zen 2" skriver vi om hur det var allt annat än självklart att Zen 2 någonsin skulle nå konsumenter. Det var således inte alls självklart att Zen 2 skulle användas för sockel AM4. AMD går så långt som att det inte ens fanns på kartan när specifikationerna för sockeln spikades.

Tom_Ley-Next_Horizon_Gaming-Physical_Design_06092019-4.jpg
Tom_Ley-Next_Horizon_Gaming-Physical_Design_06092019-5.jpg
Tom_Ley-Next_Horizon_Gaming-Physical_Design_06092019-6.jpg
Tom_Ley-Next_Horizon_Gaming-Physical_Design_06092019-7.jpg
Tom_Ley-Next_Horizon_Gaming-Physical_Design_06092019-8.jpg
Tom_Ley-Next_Horizon_Gaming-Physical_Design_06092019-9.jpg

Sett till själva substratet blir spelreglerna helt annorlunda mot en monolitisk krets. De flesta funktionerna flyttar fysiskt till helt andra delar än tidigare tänkt, men saker som strömförsörjning och anslutningar måste på grund av sockeln använda exakt samma kontaktstift som tidigare generationer.

Tom_Ley-Next_Horizon_Gaming-Physical_Design_06092019-10.jpg

Samtidigt introducera Ryzen 3000-serien PCI Express 4.0. Förutom att dubblera bandbredden ställer denna högre krav på signalintegritet och ledningsbanorna ställt mot PCI Express 3.0. Just PCI Express 4.0 ska ha ställt till det flera gånger på vägen, då dessa ledningsbanor är extra känsliga mot störningar som härrör från andra kringliggande ledningsbanor från andra funktioner i de olika kretsarna.

Tom_Ley-Next_Horizon_Gaming-Physical_Design_06092019-11.jpg
Tom_Ley-Next_Horizon_Gaming-Physical_Design_06092019-12.jpg

Lösningen blev ett nytt substrat med hela 12 lager – upp från tidigare 8 lager – och ett mödosamt pussel som enligt AMD krävde många omgångar av "trial and error". Att faktiskt sammansätta en färdig processor med kretsar och substrat blev också en utmaning som de fick lära sig bemästra.