::: AMD Zen Samlingstråd :::
Låt oss länka och diskutera Zen här
Bulldozer gjorde mig djupt besviken. Man photoshoppade vitala läckor som kunde avslöja prestandafaktorer tidigt, och John Fruehe på AMD ljög om Bulldozers prestanda.
Nu ser vi äntligen många konkreta faktorer till att Zen kommer bli en stark mikroarkitektur. För att skissa upp Zen så tog AMD tillbaka Jim Keller som ursprungligen var med och konstruerade första Athlon K7 och K8 ihop med andra veteraner från DEC (Digital Equipment Corporation). AMD har numera en ny CEO som gör uttalanden om att den har 40% högre IPC än Excavator som i sin tur är en förbättrad version av Bulldozer. Lisa Su, AMD's CEO har också gjort uttalanden efteråt som säger att man till och med nått över 40% IPC mot Excavator:
AMD Preisdent & CEO Lisa Su – Q4 2015 AMD Earnings Call Transcript:
Our Zen-based CPU development is on track to achieve greater than 40% IPC uplift from our previous generation and we’re on schedule to sample later this year.
Vi kan alltså räkna med att enkeltrådig prestanda (prestanda per kärna/tråd dvs) äntligen kommer att vara i nivå/snabbare med/mot Intel's senaste motsvarigheter.
Man ser också att AMD genom etableringen av Zen, kommer fortsätta att öka IPC betydligt mer aggressivt än tidigare i form av 'Zen+'-kärnor, vilket är mycket positivt för hela CPU-industrin.
Vi ser nu också SMT (flertrådsteknologi) i Zen, och det är omöjligt att säga hur väl denna implementation fungerar. Intel har förbättrat sin SMT (Hyperthreading) med åren, medans det blir debuten för SMT i AMD's processorer (sanning med modifikation då Bulldozer faktiskt betraktas på alla sätt och vis som en SMT-arkitektur men marknadsförs annorlunda). SMT va redan på tapeten hos DEC i Alpha EV8 prototyper, och det är också därifrån AMD har/haft en del av sina ingenjörer, och inte minst Jim Keller. Jag har stora förväntningar på dess parallellism och hur den kommer att skala.
Ett helt nytt inklusivt cachesystem och en micro-op buffert för att göra färre missar i dess branch prediction är numera en del av designen vilket är en av dom stora anledningarna till att IPC stiger avsevärt. 512Kb L2 cache per core är också något att höja ögonbrynen lite över.
För att ta fördelarna med Zen's cachearkitektur:
L1i dubbelt så stor som Skylake
L1d är 8-way, dvs samma som Haswell/Skylake
L1d är fördubblad från BD i både storlek och associativitet
L1i är fördubblad i associativitet från BD
L2 cachen har dubbelt så hög associativitet än Skylake och är dubbelt så stor
Instruktionscachen är inte längre delad mellan två kärnor
Varje "Zen block" ska ha en 8MB L3 cache, vilket betyder att en nativ 8 kärnig Zen-processor kommer ha 16MB L3 cache.
Det är också nu en dedikerad 4-way decoder per kärna med rejält uppiffad FPU och 4 ALU's/2 AGU's. Det betyder 50% mer resurser för heltalsoperationer jämfört med Excavator och beroende på hur man ska tolka dess nya förhållande med dess flyttalsenheter så rör det sig om dubbla resurser. Åtminstone om man ser till att man nu har 4 pipelines 2st FADD och 2st FMUL och mycket lägre latens på flyttalsoperationer. Detta var en av dom större bristerna i tidigare Bulldozer. Med andra ord är man tillbaka i ett 1:1 förhållande på integer/float. Man är helt klart tillbaka på detta område, då flyttalsoperationer har vart en av AMD's starkare sidor tidigare.
Zen ska komma i en stor variation av typer beroende utav plattform. Den 8 kärniga versionen är nativ och består utav två CCX block. En CCX (CPU complex) är benämningen utav 4 kärnor och 8MB L3 cache. Den 8 kärniga versionen kommer alltså med 16MB L3 cache totalt.
Ovan har vi en tidig die-shot utav en 8 kärnig Zen CPU bestående utav två CCX block med 16MB L3 cache totalt. Nedan är en senare:
AMD AM4 Plattformen ser följande ut:
DDR4
PCI-express v.3
USB 3.1 Gen2 10Gbps
NVME
SATA Express
[ AMD 7800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Win10 PRO x64 ][ LG 34GN850 ]