Intel "Alder Lake" på 10 nanometer tar mobildesign till stationärt format

Permalänk
Melding Plague

Intel "Alder Lake" på 10 nanometer tar mobildesign till stationärt format

Något överraskande tar Intel designfilosofin big.LITTLE från de mobila ARM-processorerna till stationära processorer med Alder Lake.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Det kan bli bra. Men jag tror att om ARM skall slå på stationära så måste X86-emulering vara på plats. Progrmbiblioteket är för stort för att bara slopa. Om det är lättare att programmera på ARM, arkitekturen har högre IPC osv så är det ju vettigt att all "ny" utveckling såsmåningom går över till ARM, men ska man få med användarna på tåget så måste parallellt stöd för X86 alltid finnas där.

Visa signatur

ozzed.net Min egenkomponerade 8-bit musik. Gillar du musiken från gamla klassiska NES eller Gameboy och liknande är det värt ett besök. :) Jag finns också på Spotify, Bandcamp, Jamendo, Youtube, och du kan även följa mig på Twitter och Facebook.
Vet du att du har fel? Signalera detta tydligt med Argumentationsfel och gärna Whataboutism.

Permalänk
Medlem

@Ozzed: Det är endast bit.LITTLE-konceptet som ursprunglingen kommer från ARM-världen, det finns inget som tyder på att Alder Lake kommer vara baserad på ARM utan det lär vara X86 som gäller fortfarande.

Permalänk
Medlem
Citat:

Anledningen till detta sägs vara att Intel hoppar över 10 nanometer för stationära processorer och går direkt till 7 nanometer med Rocket Lake.

Det står 14nm i tabellen?

Permalänk
Medlem
Skrivet av perost:

@Ozzed: Det är endast bit.LITTLE-konceptet som ursprunglingen kommer från ARM-världen, det finns inget som tyder på att Alder Lake kommer vara baserad på ARM utan det lär vara X86 som gäller fortfarande.

Dock står det ju att de kan tänkas sikta på Windows 10X, och det kan väl bara köras på ARM?

Visa signatur

ozzed.net Min egenkomponerade 8-bit musik. Gillar du musiken från gamla klassiska NES eller Gameboy och liknande är det värt ett besök. :) Jag finns också på Spotify, Bandcamp, Jamendo, Youtube, och du kan även följa mig på Twitter och Facebook.
Vet du att du har fel? Signalera detta tydligt med Argumentationsfel och gärna Whataboutism.

Permalänk
Medlem
Skrivet av Ozzed:

Dock står det ju att de kan tänkas sikta på Windows 10X, och det kan väl bara köras på ARM?

Nej, Windows 10X är en nedstrippad version av Windows gjord för enheter med dubbla skärmar som t.ex. Surface Neo (som använder Intel Lakefield-processorer).

Permalänk
Datavetare

Misstänker precis som herr Eklöv att Alder Lake mer är en testplattform för tekniken. Att kombinera få "stora" kärnor med många små har poänger även för desktop, men det är i enheter som är kraftigt TDP-begränsade där de klart största fördelarna finns.

Väldigt mycket i UI är helt sekventiellt, d.v.s. det har noll skalning förbi en enda kärna. Samtidigt är lägsta möjliga latens av största vikt för UI, så man vill köra den logiken med snabbast möjliga enkeltrådprestanda.

Kikar man på utvecklingen hos ARM och specifikt Qualcomms systemkretsar baserade på Cortex A76 och senare ser hur detta kan nyttjas. En filosofiändring tog plats just med A76, man gick från att enbart prioritera lågt pris och perf/W till att designa långt mer komplexa kretsar (men de består fortfarande av väsentligt färre transistorer än motsvarande x86) som presterar i nivå med (och sedan Cortex A77 bättre än) Skylake/Zen2 per cykel.

Problemet med en sådan design är att det drar mer ström i absoluta tal, det är inte på något sätt rimligt att ha fyra-åtta sådana kärnor körandes i maximal frekvens inuti en telefon. I moderna high-end Snapdragon har man en Cortex A76/77 kärna som är optimerad för maximal frekvens. Det är kärnan som OS:et kommer lägga UI-jobben på. Sedan har man typiskt 1-3 A76/77 som är lägre klockade, mer optimerade för maximal perf/W och sedan finns fyra "små" kärnor som med fördel tar hand om alla bakgrundsjobb som musik, notifieringar etc. Detta ger både optimal responstid i UI samtidigt som bakgrundsjobb tar minimalt med ström (== minimalt med värmeutveckling).

Problemet med en strikt symmetrisk design när TDP är en väsentligt flaskhals syns bl.a. i AnandTechs test av Intels nya NUC Frost Canyon som har 6C/12T. Kör man Cinebench är Frost Canyon klart snabbare än föregångaren Bean Canyon med sina 4C/8T, men kikar man i stället på uppgifter som är mer typiska på bärbara och NUCs så är Bean Canyon väldigt ofta snabbare! Här blir det en nackdel att 6C/12T leder till att frekvensen, och därmed enkeltrådprestanda, straffas under last jämfört med 4C/8T.

Edit: Fördelen med en strikt symmetrisk design är enklare OS-design. För att riktigt utnyttja en asymmetrisk design optimalt bör applikationerna explicit ge information till OS:et om vilken typ av last en viss tråd är avsedd för. Det går att automatiskt klassificera OS-trådar, Linux gör redan det, men även om det är träffsäkert kan det aldrig blir 100%-igt.

Att köra samma lösning som Qualcomm nu har för Snapdragon är helt rätt för bärbara. Man "reserverar" utrymme för en eller max två kärnor att köra på hög frekvens oavsett last på andra kärnor. För de laster som skalar väl med kärnor har det alltid varit så att många enklare kärnor ger bättre perf/W jämfört med färre snabbare kärnor, så man låter då sådan laster primärt köra på "little" kärnorna.

Möjligen kan det finnas vinster även när TDP är på desktopnivå, men de är inte fullt lika uppenbara som för enheter med kraftigt begränsad kylning och/eller som går på batteri.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Avstängd

Är detta en papperslansering?

Visa signatur

There is more stupidity than hydrogen in the universe, and it has a longer shelf life. /Frank Zappa

Permalänk
Medlem
Skrivet av Måttband:

Är detta en papperslansering?

Nej, det är ett rykte. En papperslansering är när en produkt lanseras utan att finnas tillgänglig att köpa, i det här fallet vet ingen när eller ens om Intel kommer lansera processorer baserade på Alder Lake.

Permalänk
Medlem
Skrivet av Yoshman:

Misstänker precis som herr Eklöv att Alder Lake mer är en testplattform för tekniken. Att kombinera få "stora" kärnor med många små har poänger även för desktop, men det är i enheter som är kraftigt TDP-begränsade där de klart största fördelarna finns.

Väldigt mycket i UI är helt sekventiellt, d.v.s. det har noll skalning förbi en enda kärna. Samtidigt är lägsta möjliga latens av största vikt för UI, så man vill köra den logiken med snabbast möjliga enkeltrådprestanda.

Kikar man på utvecklingen hos ARM och specifikt Qualcomms systemkretsar baserade på Cortex A76 och senare ser hur detta kan nyttjas. En filosofiändring tog plats just med A76, man gick från att enbart prioritera lågt pris och perf/W till att designa långt mer komplexa kretsar (men de består fortfarande av väsentligt färre transistorer än motsvarande x86) som presterar i nivå med (och sedan Cortex A77 bättre än) Skylake/Zen2 per cykel.

Problemet med en sådan design är att det drar mer ström i absoluta tal, det är inte på något sätt rimligt att ha fyra-åtta sådana kärnor körandes i maximal frekvens inuti en telefon. I moderna high-end Snapdragon har man en Cortex A76/77 kärna som är optimerad för maximal frekvens. Det är kärnan som OS:et kommer lägga UI-jobben på. Sedan har man typiskt 1-3 A76/77 som är lägre klockade, mer optimerade för maximal perf/W och sedan finns fyra "små" kärnor som med fördel tar hand om alla bakgrundsjobb som musik, notifieringar etc. Detta ger både optimal responstid i UI samtidigt som bakgrundsjobb tar minimalt med ström (== minimalt med värmeutveckling).

Problemet med en strikt symmetrisk design när TDP är en väsentligt flaskhals syns bl.a. i AnandTechs test av Intels nya NUC Frost Canyon som har 6C/12T. Kör man Cinebench är Frost Canyon klart snabbare än föregångaren Bean Canyon med sina 4C/8T, men kikar man i stället på uppgifter som är mer typiska på bärbara och NUCs så är Bean Canyon väldigt ofta snabbare! Här blir det en nackdel att 6C/12T leder till att frekvensen, och därmed enkeltrådprestanda, straffas under last jämfört med 4C/8T.

Edit: Fördelen med en strikt symmetrisk design är enklare OS-design. För att riktigt utnyttja en asymmetrisk design optimalt bör applikationerna explicit ge information till OS:et om vilken typ av last en viss tråd är avsedd för. Det går att automatiskt klassificera OS-trådar, Linux gör redan det, men även om det är träffsäkert kan det aldrig blir 100%-igt.

Att köra samma lösning som Qualcomm nu har för Snapdragon är helt rätt för bärbara. Man "reserverar" utrymme för en eller max två kärnor att köra på hög frekvens oavsett last på andra kärnor. För de laster som skalar väl med kärnor har det alltid varit så att många enklare kärnor ger bättre perf/W jämfört med färre snabbare kärnor, så man låter då sådan laster primärt köra på "little" kärnorna.

Möjligen kan det finnas vinster även när TDP är på desktopnivå, men de är inte fullt lika uppenbara som för enheter med kraftigt begränsad kylning och/eller som går på batteri.

Är förmodligen för Intel vill fortsätta använda samma kisel för bärbart och stationärt, i en bärbar med 45W TDP så finns det anledningar att ha BIG.Little och när de små kärnorna ändå finns med på kislet så kan de lika gärna vara aktiverade på S-CPU:erna också.
Ungefär grafikdelen som inte är så flitigt använt på t.ex. gaming-datorer men man får med det på köpet för att Intel inte vill ha olika konstruktioner.

Visa signatur

kill -s SIGCHLD `pidof Kenny`
bash: Oh my god, they killed Kenny
init: You Bastards

Permalänk
Medlem

Låter som att det kan bli lite rörigt för hebbe och lelle att välja processor om det ska marknadsföras som 16 kärnor men vara 8.8 egentligen. Kul dock, alltid roligt med förändringar om de tar med sig något bra.

Visa signatur

Bara fanboys kallar folk för fanboy!

Permalänk
Medlem

@Yoshman: Mycket intressant inlägg.

Vad skulle fördelen vara (i en desktop miljö) att t.ex ha 1 liten kärna och en stor istället för 1 stor kärna med SMT/HT? Jag kan naturligtvis se fördelar i form av realtidsoperationer osv, men som jag förstått det är dessa inte så vanliga, och sällan så kritiska på en desktop, att de skulle behöva en separat kärna.
Skulle det leda till en meningsfull frekvensökning för de stora kärnorna om man hade 2-4 stora kärnor premierade på processorn för kylning och sedan 8-12 småkärnor?

Vad skulle du säga blir den stora effekten för oss desktop konsumenter som gillar spel, film, några medel-tunga beräkningar, om man skulle gå över till en stor/liten modell med x86?

Permalänk
Skrivet av Yoshman:

Misstänker precis som herr Eklöv att Alder Lake mer är en testplattform för tekniken. Att kombinera få "stora" kärnor med många små har poänger även för desktop, men det är i enheter som är kraftigt TDP-begränsade där de klart största fördelarna finns.

Väldigt mycket i UI är helt sekventiellt, d.v.s. det har noll skalning förbi en enda kärna. Samtidigt är lägsta möjliga latens av största vikt för UI, så man vill köra den logiken med snabbast möjliga enkeltrådprestanda.

Kikar man på utvecklingen hos ARM och specifikt Qualcomms systemkretsar baserade på Cortex A76 och senare ser hur detta kan nyttjas. En filosofiändring tog plats just med A76, man gick från att enbart prioritera lågt pris och perf/W till att designa långt mer komplexa kretsar (men de består fortfarande av väsentligt färre transistorer än motsvarande x86) som presterar i nivå med (och sedan Cortex A77 bättre än) Skylake/Zen2 per cykel.

Problemet med en sådan design är att det drar mer ström i absoluta tal, det är inte på något sätt rimligt att ha fyra-åtta sådana kärnor körandes i maximal frekvens inuti en telefon. I moderna high-end Snapdragon har man en Cortex A76/77 kärna som är optimerad för maximal frekvens. Det är kärnan som OS:et kommer lägga UI-jobben på. Sedan har man typiskt 1-3 A76/77 som är lägre klockade, mer optimerade för maximal perf/W och sedan finns fyra "små" kärnor som med fördel tar hand om alla bakgrundsjobb som musik, notifieringar etc. Detta ger både optimal responstid i UI samtidigt som bakgrundsjobb tar minimalt med ström (== minimalt med värmeutveckling).

Problemet med en strikt symmetrisk design när TDP är en väsentligt flaskhals syns bl.a. i AnandTechs test av Intels nya NUC Frost Canyon som har 6C/12T. Kör man Cinebench är Frost Canyon klart snabbare än föregångaren Bean Canyon med sina 4C/8T, men kikar man i stället på uppgifter som är mer typiska på bärbara och NUCs så är Bean Canyon väldigt ofta snabbare! Här blir det en nackdel att 6C/12T leder till att frekvensen, och därmed enkeltrådprestanda, straffas under last jämfört med 4C/8T.

Edit: Fördelen med en strikt symmetrisk design är enklare OS-design. För att riktigt utnyttja en asymmetrisk design optimalt bör applikationerna explicit ge information till OS:et om vilken typ av last en viss tråd är avsedd för. Det går att automatiskt klassificera OS-trådar, Linux gör redan det, men även om det är träffsäkert kan det aldrig blir 100%-igt.

Att köra samma lösning som Qualcomm nu har för Snapdragon är helt rätt för bärbara. Man "reserverar" utrymme för en eller max två kärnor att köra på hög frekvens oavsett last på andra kärnor. För de laster som skalar väl med kärnor har det alltid varit så att många enklare kärnor ger bättre perf/W jämfört med färre snabbare kärnor, så man låter då sådan laster primärt köra på "little" kärnorna.

Möjligen kan det finnas vinster även när TDP är på desktopnivå, men de är inte fullt lika uppenbara som för enheter med kraftigt begränsad kylning och/eller som går på batteri.

Något som kan vara en faktor är hur koncentrerad värmen blir på mindre chipp. Kylförmågan får mindre betydelse ju mindre chippen blir då det blir allt svårare att ens föra över värmen från processorn till kylaren. Nånstans når man i ett tak där IHSen blir en begränsning för TDP och då börjar prestanda/W bli mer intressant. Vi ser redan rätt höga temperaturer på Zen2 processorerna (trotts kapabel kylning och lödd IHS) som ändå är relativt energieffektiva.

Intels 7nm lär vara ännu mindre och kanske har storleken lett till problem som tvingar Intel till mer kreativa lösningar.

Permalänk
Medlem
Skrivet av Masyve:

Låter som att det kan bli lite rörigt för hebbe och lelle att välja processor om det ska marknadsföras som 16 kärnor men vara 8.8 egentligen. Kul dock, alltid roligt med förändringar om de tar med sig något bra.

4.8Ghz 8/16B 1.8Ghz 8/8L

Och kanske med olika storlek på cache, etc. Är de klistrade med olika nodstorlek också måntro?

Skitbra för laptop. Värdelöst till stationär.

Visa signatur

Hur många datorer är för många?

Permalänk

Kommer ni ihåg Lakefield? Föreställ er en sådan som 8+8 så kanske vi kommer nära Alder Lake.

Permalänk
Datavetare
Skrivet av Fey:

@Yoshman: Mycket intressant inlägg.

Vad skulle fördelen vara (i en desktop miljö) att t.ex ha 1 liten kärna och en stor istället för 1 stor kärna med SMT/HT? Jag kan naturligtvis se fördelar i form av realtidsoperationer osv, men som jag förstått det är dessa inte så vanliga, och sällan så kritiska på en desktop, att de skulle behöva en separat kärna.
Skulle det leda till en meningsfull frekvensökning för de stora kärnorna om man hade 2-4 stora kärnor premierade på processorn för kylning och sedan 8-12 småkärnor?

Vad skulle du säga blir den stora effekten för oss desktop konsumenter som gillar spel, film, några medel-tunga beräkningar, om man skulle gå över till en stor/liten modell med x86?

Som jag skrev ovan, ser inte riktigt lika stora vinster för desktop som för bärbara. Men det hänger lite på exakt hur snabb Atom kommer vara när detta är aktuellt.

Jobbar inte själv med Intels plattform "SnowRidge", så har inte förstahandsinformation. De Atom kärnor, namn Tremont, som sitter där är väsentligt mycket snabbare än tidigare Atom. IPC ligger på Ivy Bridge/Haswell-nivå, men maximal frekvens är <= 2,5 GHz.

24 Tremont kärnor drar vid 2,2 GHz ~35 W. Det är väsentligt mycket högre perf/W än motsvarande aggregerad prestanda med Xeon.

Om det nu kommer en desktop-variant så är vinsten att man får ut högre total kapacitet givet en viss effektbudget. Då Tremont-kärnorna (eller de som kommer finnas på 7 nm) är optimerade att vara små, billigare och energieffektiva men inte klocka superhögt är de olämpliga för latenskänsliga uppgifter. Men tänk ett spel, du kan då ha <= 8 stora kärnor som kan nå högre i frekvens än om det var 12-16 stora kärnor samtidig som de små kärnorna är mer än nog för att hantera bakgrundsuppgifter som nätverk, I/O etc. Med dagens spelmotorer lär det knappast bli någon större vinst, möjligen lite bättre lägsta FPS, men om säg ett decennium från nu kanske det har någon relevans (det är utveckling, den är bara *mycket* långsammare än de flesta hoppas/tror).

Skrivet av Fönstrputtsaren:

Något som kan vara en faktor är hur koncentrerad värmen blir på mindre chipp. Kylförmågan får mindre betydelse ju mindre chippen blir då det blir allt svårare att ens föra över värmen från processorn till kylaren. Nånstans når man i ett tak där IHSen blir en begränsning för TDP och då börjar prestanda/W bli mer intressant. Vi ser redan rätt höga temperaturer på Zen2 processorerna (trotts kapabel kylning och lödd IHS) som ändå är relativt energieffektiva.

Intels 7nm lär vara ännu mindre och kanske har storleken lett till problem som tvingar Intel till mer kreativa lösningar.

Helt sant, värmeöverföringen vid en fast temperaturdifferens mellan det som kyls (kretsen) och kylmedium (luften/vattnet mot kylflänsen) är linjärt beroende av arean. All för många stora, högt klockade kärnor kommer slå i taket för hur mycket som faktiskt kan kylas bort.

Atom har högre perf/W jämfört med big-core x86, men dess lägre IPC och lägre frekvens gör dessa kärnor olämpliga för interaktiva laster. Men vill man slå rekord i CB är på alla sätt mer effektivt mer fler långsamma kärnor.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Hade varit bra för bärbara, men för stationära vet jag inte om det är så aktuellt om inte elpriset rusar i höjden.

Permalänk
Medlem

Stämmer infon att intels kommande CPU med 10kärnor ska komma Q1 2020. Isåfall så har de inte många dagar på sig. Idag är det bara 22 dagar kvar.

Visa signatur

Ryzen 5800X ROG STRIX X570-f GAMING FlareX DDR43600 cl 14-14-14-34 EVGA FTW3 Ultra RTX 3090

Permalänk
Medlem

Intel gör en Bulldozer... Nice!

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem
Skrivet av Xinpei:

Intel gör en Bulldozer... Nice!

Haha, ja det verkar fan inte bättre.
Att denna teknik är bra i telefoner, och kan vara bra för bärbara datorer är en sak.
Men jag vill då rakt inte se skiten i desktop, där föredrar jag nuvarande HT teknik istället.

/Lifooz

Visa signatur

Deepcool Matrexx 30 & MSI Z87-G43 Gaming!
Intel Inside Core I7 4790K med AMD Radeon R9 390!
Rubbet strömförsörjs av Corsair RM750X!