Vi får se om Jim Keller lever upp till sitt rykte, Ska ha varit CPU-kretsen som kommer i Metor Lake han primärt jobbade med under sin tid på Intel.
Intressant att AMD insåg hur framtidens processorer ska tillverkas långt före stora Intel.
Separera IO-kretsen från CPU-kretsen är exakt vad Intel gjorde i Arrandale (mobile Westmere) och var inte Clarksfield motsvarande för desktop?
Alla är rätt på det klara med för- och nackdelarna med en sådan design. Det man insåg 2009 var att då övervägde nackdelarna, men underlaget för sådana beslut är inte statiska och kan därför ändras med tiden!
Det är fortfarande så att monolitiska designer presterar bättre och har högre prestanda/W, allt annat lika. De två saker som primärt ändrats de senaste 10-15 åren är
allt fler saker ser minskad vinst av mindre noder, I/O är en sådan sak som skalar väldigt illa numera
specifikt för x86 är det allt svårare att bredda beräkningsenheterna, vad man då primärt bör spendera transistorer kommer då upp på agendan igen. Det AMD (och även IBM som haft liknande lösningar med POWER) visat är att man till stor del kan väga upp de prestandamässiga nackdelarna med chiplets genom att spendera massor med transistorer på CPU-cache
Den senare punkten lär vara det som på sikt kan komma knäcka x86_64. Att spendera massor med transistorer på cache är väl bra, om det inte finns bättre saker att lägga transistorer på.
Både Arm och än mer Apple har visat att med en "modern" instruktionsuppsättning är det möjligt att fortsätta bygga snabbare beräkningsenheter. Apples Firestorm är väsentligt mycket bredare än något Intel/AMD har, det på ett sätt som fungerar i praktiken vilket visar sig att Firestorm utför ungefär lika mycket vid 3,2 GHz som Zen3/Cypress Cove gör vid 5 GHz. Prestanda/W är heltalsfaktorer bättre hos Apples design p.g.a. att man inte måste pressa frekvenserna...
Det ess Intel kan tänkas ha relaterat till chiplets är deras EMIB-teknik. Intel lär också få skruva upp budgeten de spendera på cache, precis som AMD. Då Intel också har EMIB borde deras "klister" vara lite av ett superlim som rent praktiskt kan visa sig i en klisterövning som resulterar i något som prestandamässigt är lite närmare en monolitisk krets.
Även här borde Intel/AMD ha lite uppförsbacke mot primärt Arm. Intel kan inte nå speciellt mycket lägre än ~30 kärnor per monolitisk krets, gränsen är 28 för 14 nm och den verkar bara öka till någonstans mellan 30-40 kärnor per krets på 10 nm. AMD har paket med 64 kärnor, men dessa består ju av totalt sett >1000 mm2 kisel över 9 kretsar.
Samtidigt finns idag Arm kretsar som tillverkas på TSMC 7 nm där kretsytan ligger på 500-600 mm2 och där man klämt in upp till 80 kärnor på en monolitisk krets, det med CPU-kärnor som har likvärdig prestanda/cykel som Intel/AMD. Så länge det är praktiskt möjligt att göra monolitiska kretsar är det bättre sett till prestanda och energieffektivitet (det är en huvudanledning varför AMD fortfarande kör monolitiska kretsar för bärbara).
Är inte Apples M1 staplad?
Angående staplade cpuer. IBM för 10+ år sedan, skulle dessutom ha vattenkanaler mellan varje lager för kylning.
https://arstechnica.com/gadgets/2008/06/ibm-demonstrates-wate...
M1 är en MCM, men den är väl inte staplad? D.v.s. RAM och SoC finns i samma "paket", de är dock separata kretsar.
Menar man inte att kretsarna verkligen är staplade på höjden med "staplade kretsar", d.v.s. det är en speciell form av MCM (Multi-Chip Module) där saker ligger på höjden i stället för (bara) på bredden.
Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer