Arkitekturen Zen

Förutom en självklar aspekt som högre prestanda hade Zen ett liknande designmål som Intel, som sedan arkitekturen Haswell arbetat envetet med att skapa en kärna som kan skala från fläktlösa enheter hela vägen upp till kraftfulla, energislukande servrar. Borta är strategin Big Core (Bulldozer, Piledriver, Steamroller, Excavator) och Small Core (Bobcat, Jaguar) med två arkitekturer för olika ändamål.

AMD Ryzen Tech Day - Architecture Keynote-5.jpg

Då Zen inte är en vidareutveckling utan en helt ny skapelse skiljer den markant mot Bulldozer och dess vidareutvecklingar. Utöver ovanstående förändringar lyfter AMD fram fem finesser, som ska vara avgörande för arkitekturens framgång. Dessa samlas under paraplynamnet AMD Sense MI Technologies.

AMD Ryzen 7 Tech Day - Jim Anderson-20.jpg

Pure Power är en teknik som har sina rötter i AMD:s grafikarkitekturer. Tekniken mäter av saker som temperatur, hastighet (klockfrekvens) och spänning i realtid, och optimerar ständigt dessa relativt varandra för att få ned strömförbrukningen utan att tumma på prestandan. Enligt AMD har tekniken en exakthet på enstaka millivolt och milliwatt.

AMD Ryzen Tech Day - Architecture Keynote-20.jpg
AMD Ryzen Tech Day - Architecture Keynote-21.jpg
AMD Ryzen Tech Day - Architecture Keynote-23.jpg
AMD Ryzen Tech Day - Architecture Keynote-15.jpg
AMD Ryzen Tech Day - Architecture Keynote-16.jpg
AMD Ryzen Tech Day - Architecture Keynote-17.jpg
AMD Ryzen Tech Day - Architecture Keynote-18.jpg
AMD Ryzen Tech Day - Architecture Keynote-19.jpg

I själva kretsen sitter 48 sensorer som mäter av effektåtgången och 20 sensorer för att mäta temperatur. Förutsatt att processorn inte drar för mycket eller enstaka komponenter blir för varma vid belastning är det möjligt att höja klockfrekvensen, och på så vis få ut högre prestanda.

AMD Ryzen Tech Day - Architecture Keynote-22.jpg

Vid tillverkning av kretsar uppstår alltid variationer, där vissa transistorer klarar av högre klockfrekvenser till lägre spänning än andra. Detta utnyttjar AMD genom att sätta spänning individuellt per kärna, där "snabbare" kärnor körs i lägre spänning än "långsammare". På så sätt frigörs extra termiskt utrymme och strömbudget för att kunna leverera så hög prestanda som möjligt över samtliga kärnor samtidigt.

AMD Ryzen Tech Day - Architecture Keynote-24.jpg

Direkt relaterat till Pure Power är Precision Boost, som är en mycket finkornig teknik för att justera klockfrekvenser dynamiskt. Tidigare processorer från både AMD och Intel har haft sina respektive turbofunktioner som justerar klockfrekvenser i steg om 100 MHz, utefter parametrar som strömförbrukning och temperatur.

Traditionellt har operativsystemet skött växlingen av klockfrekvenser via något som kallas Performance State (P-State), där mjukvaran skickar en förfrågan om högre prestanda till processorn. Det här är en tidsödande process som enligt AMD tar mellan 50–300 millisekunder (0,05–0,3 sekunder).

Med Precision Boost tar processorn kontroll över när klockfrekvenserna ändras, vilket påminner om Speed Shift som Intel introducerade med arkitekturen Skylake. Enligt AMD sjunker tiden till 1 millisekund (0,001 sekund) när handskakningen mellan processor och operativsystem upphör.

Nämnvärt är att denna mer avancerade turbofunktion inte är ständigt aktiverad, då vissa strömsparfunktioner fortfarande styrs av operativsystemet. Det här ska dock vara en parentes i praktiken, då Precision Boost kickar in från det att processorn går upp från ett viloläge till dess basfrekvens.

AMD Ryzen 7 Press Deck-10.jpg

Teknik tre kallas Extended Frequency Range (XFR), som också är kopplad till Pure Power. Medan Precision Boost kan ses som "garanterade" turbolägen berättar AMD att XFR är en bonus som låses upp med hjälp av bättre kylning och lägre temperaturer, någonting som sänker strömläckaget i kislet.

Det handlar dock inte om automatisk och gränslös överklockning som det tidigare talats om. Tekniken är i praktiken en förlängning av Precision Boost och gör det möjligt att gå över det maximala turboläget, som endast kan uppnås med en eller två kärnor. Det betyder att XFR endast fungerar under samma förutsättningar.

Tekniken går i steg om 25 MHz över maximal Precision Boost, men inte högre än 100 MHz. Detta gäller endast Ryzen 7 1800X och 7 1700X som således kan arbeta i upp till 4,1 respektive 3,9 GHz. För 7 1700 ligger XFR på 50 MHz, vilket innebär att taket är 3,75 GHz.

Under AMD:s lanseringsevenemang som hölls bakom lyckta dörrar medgavs att XFR inte har mycket extra att erbjuda i dagsläget. Bolaget påpekade att detta är generation ett och att XFR kommer utvecklas tillsammans med framtida iterationer av Zen, för att kunna erbjuda ännu högre klockfrekvenser och fungera mer frekvent.

AMD Ryzen Tech Day - Architecture Keynote-7.jpg

Neural Net Prediction är enligt AMD ett "artificiellt nätverk i varje Zen-processor som bygger modell av beslut baserat på mjukvaruexekvering". Exakt vad detta innebär fungerar framgår inte, men konceptet går i alla fall ut på att förutspå nästa instruktion baserat på tidigare kod som körts.

AMD Zen December 2016 Update_Final For Distribution-page-019.jpg

Den femte finessen kallas Smart Prefetch, som ligger i processorns Back End och sparar data i cacheminnet som tros återanvändas. Likt Neural Net Prediction ska även denna ha algoritmer för att "lära sig" mönster och därmed även vilken data som är relevant att spara till senare.

Fyrkärniga kluster och Infinity Fabric

För att på ett relativt enkelt sätt kunna använda arkitekturen Zen och implementera den i nya typer av produkter är den uppbyggd i kluster, som kallas CPU Complex (CCX). Varje CCX består av fyra kärnor som kommunicerar med varandra genom ett gemensamt L3-cacheminne.

AMD Ryzen Tech Day - Architecture Keynote-11.jpg
AMD Ryzen Tech Day - Architecture Keynote-14.jpg
AMD Ryzen Tech Day - Architecture Keynote-8.jpg
AMD Ryzen Tech Day - Architecture Keynote-9.jpg
AMD Ryzen Tech Day - Architecture Keynote-10.jpg

Cacheminnet på L3-nivå ligger på totalt 8 MB och är uppdelat i fyra bitar om 2 MB vardera, vilka individuellt kan stängas av för att spara ström. För att det inte ska vara en flaskhals arbetar L3-cacheminnet i samma klockfrekvens som den kärna som är högst klockad i ett CCX-kluster för tillfället.

Ett CCX är således ett byggblock, som används för att skapa processorer. De två konkreta exempel som finns idag är Ryzen med upp till 8 kärnor samt processorfamiljen Naples för servrar, som ska gå hela vägen upp till 32 kärnor och således bygger på åtta CCX-kluster.

AMD Ryzen Tech Day - Mark Papermaster-8.jpg
AMD Ryzen Tech Day - Mark Papermaster-9.jpg
AMD Ryzen Tech Day - Mark Papermaster-10.jpg
AMD Ryzen Tech Day - Mark Papermaster-11.jpg
AMD Ryzen Tech Day - Mark Papermaster-12.jpg
AMD Ryzen Tech Day - Mark Papermaster-13.jpg
AMD Ryzen Tech Day - Mark Papermaster-14.jpg
AMD Ryzen Tech Day - Mark Papermaster-16.jpg

För att förenkla processen att skapa skräddarsydda kretsar, oavsett om det gäller Ryzen, kommande APU:er i A-serien med integrerade grafikdelar, servrar eller en ny generation systemkretsar för spelkonsoler, har AMD tagit fram någonting de kallar för Infinity Fabric.

AMD går inte in på tekniska detalj om det gränssnittet, men gör gällande att det ska kunna användas för att koppla samma praktiskt taget all IP – från CPU till GPU och allehanda former av hårdvaruacceleration. Det är också Infinity Fabric som varje CCX kommunicerar genom och enligt AMD med nära perfekt skalning.