Färre trådar, mer prestanda i Lunar Lake

2024-03-12 09:02

Melding Plague

Registrerad: Dec 1999

●

Färre trådar, mer prestanda i Lunar Lake

Att bara köra en tråd per fysisk processorkärna ser ut att fungera väldigt bra i Intels kommande processorfamilj för strömsnåla bärbara.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Rapportera Redigera

Citera flera Citera

2024-03-12 09:18

Permalänk

Ryzer

Medlem ★

Plats: Falkenberg
Registrerad: Nov 2009

●

Låter lovande, hoppas dom kan hitta prestandaökningar likt detta i dom stationära processorerna också.

Rapportera Redigera

Citera flera Citera (3)

2024-03-12 09:26

Permalänk

Dinkefing

Medlem

Plats: Örebro
Registrerad: Sep 2019

●

De kommer tillverkas på TMSC 3nm. De kommer inte bli billiga varken för slutkonsumenten eller Intel.

Har för mig att AMD Zen 5 kommer tillverkas i 4nm men vara betydligt billigare. De kommer däremot inte få 50% bättre prestanda i MT.

Rapportera Redigera

Citera flera Citera

2024-03-12 10:25

Permalänk

medbor

Medlem ★

Like-magnet

Registrerad: Okt 2011

●

Så Intel har inte lyckats lösa säkerhetsproblemen med SMT så nu när de skippar det blir det en ny funktion… blir lite trött att man alltid måste vända allt till sin egen fördel

Rapportera Redigera

Citera flera Citera (10)

2024-03-12 10:48

Permalänk

mpat

Medlem ★

Registrerad: Okt 2016

●

Skrivet av medbor:

Så Intel har inte lyckats lösa säkerhetsproblemen med SMT så nu när de skippar det blir det en ny funktion… blir lite trött att man alltid måste vända allt till sin egen fördel

Gå till inlägget

Tror inte att det är därför de gör det. Intel är en tillverkare som gör extremt mycket simuleringar på verkliga arbetssituationer, och det de säkert har insett är att "ingen" användare av bärbara datorer behöver så många trådar som de erbjuder. När de bara småpetar på gamla designer så går antalet trådar upp, för det är en uppenbar grej att öka (fler kärnor på 14e generationen än 12e, till exempel), men när de gör en större omdesign så väljer de att ta bort HT.

Nu sitter jag själv på en 12-kärnig med SMT så jag är väl ett dåligt exempel att folk inte behöver en massa trådar, men jag valde den modellen av ett annat skäl (cache - 5800X3D kom inte förrän rätt mycket senare).

Visa signatur

5900X | 6700XT

Rapportera Redigera

Citera flera Citera (1)

2024-03-12 11:57

Permalänk

LPG

Medlem ★

Plats: Västra Götaland
Registrerad: Maj 2013

●

Skrivet av Nyhet:

och nya ”Battlemage” Xe2-LPG-grafikkärnor.

Gå till inlägget

Detta låter även spännande. Hoppas bara de inte hänger på swec, jag vill inte byta nick

Visa signatur

Ryzen 7 5800X3D | RX 7900 XT

Rapportera Redigera

Citera flera Citera (5)

2024-03-12 12:04

Permalänk

ajp_anton

Medlem ★

Plats: Sthlm ➜ Hfors
Registrerad: Jun 2004

●

Skrivet av mpat:

Tror inte att det är därför de gör det. Intel är en tillverkare som gör extremt mycket simuleringar på verkliga arbetssituationer, och det de säkert har insett är att "ingen" användare av bärbara datorer behöver så många trådar som de erbjuder.

Gå till inlägget

Vet inte hur pålitlig Moore's Law Is Dead -kanalen är, men vad jag följt honom hittills så har det mesta verkat stämma. Och enligt hans Intel-kontakter så har de helt enkelt inte hunnit få HT att fungera med den nya arkitekturen, så de kommer skippa den. De hoppas kunna få till det till nästa generation.

Rapportera Redigera

Citera flera Citera (2)

2024-03-12 13:07

Permalänk

mpat

Medlem ★

Registrerad: Okt 2016

●

Skrivet av ajp_anton:

Vet inte hur pålitlig Moore's Law Is Dead -kanalen är, men vad jag följt honom hittills så har det mesta verkat stämma. Och enligt hans Intel-kontakter så har de helt enkelt inte hunnit få HT att fungera med den nya arkitekturen, så de kommer skippa den. De hoppas kunna få till det till nästa generation.

Gå till inlägget

Kan och kan, det är bara en fråga om prioritering. När Intel hade en kärna i Pentium 4 Northwood och AMD var på gång med sina första tvåkärniga, då var det viktigt. Kan man lösa 8 trådar i ett litet chip utan HT, då är det mycket mindre viktigt.

Visa signatur

5900X | 6700XT

Rapportera Redigera

Citera flera Citera (1)

2024-03-12 13:08

Permalänk

Söderbäck

Hedersmedlem ★

Plats: Malmö 🌆
Registrerad: Apr 2007

●

Skrivet av Dinkefing:

De kommer tillverkas på TMSC 3nm. De kommer inte bli billiga varken för slutkonsumenten eller Intel.

Har för mig att AMD Zen 5 kommer tillverkas i 4nm men vara betydligt billigare. De kommer däremot inte få 50% bättre prestanda i MT.

Gå till inlägget

Va? Jag kan inte något om kommande tillverkningsteknik här (not saying ist wrong) - men Intel har en egen tillverkningskedja för processorer.
Ska de inte använda den för produktion av sina processorer?

Visa signatur

🎮 → Node 304 • Ryzen 5 2600 + Nh-D14 • Gainward RTX 2070 • 32GB DDR4 • MSI B450I Gaming Plus AC
🖥️ → Acer Nitro XV273K Pbmiipphzx • 🥽 → VR: Samsung HMD Odyssey+
🎧 → Steelseries arctic 7 2019
🖱️ → Logitech g603 | ⌨️ → Logitech MX Keys
💻 → Lenovo Yoga slim 7 pro 14" Oled

Rapportera Redigera

Citera flera Citera (2)

2024-03-12 13:16

Permalänk

Dinkefing

Medlem

Plats: Örebro
Registrerad: Sep 2019

●

Skrivet av Söderbäck:

Va? Jag kan inte något om kommande tillverkningsteknik här (not saying ist wrong) - men Intel har en egen tillverkningskedja för processorer.
Ska de inte använda den för produktion av sina processorer?

Gå till inlägget

Nej Lunar Lake kommer tillverkas på TMSC's 3nm nod kallad N3B. Både cpu och gpu-tilen och soc:en kommer tillverkas i N3B. Så Intel kommer få ett försprång mot Zen 5. Men är inte helt klart om Zen 5 kör 4nm eller 3nm. Zen 5C varianten ryktas tillverkas i 3nm. Så tiden får utvisa när vi börjar närma oss.

Rapportera Redigera

Citera flera Citera (1)

2024-03-12 13:26

Permalänk

Joppis

Medlem ★

Plats: 127.0.0.1
Registrerad: Apr 2008

●

Ryktena säger ju att även Arrow Lake skippar SMT. Gissar att Arrow Lake kommer i höst och Lunar Lake följer i slutet av året?

Visa signatur

Rapportera Redigera

Citera flera Citera

2024-03-12 14:00

Permalänk

mpat

Medlem ★

Registrerad: Okt 2016

●

Skrivet av Dinkefing:

Nej Lunar Lake kommer tillverkas på TMSC's 3nm nod kallad N3B. Både cpu och gpu-tilen och soc:en kommer tillverkas i N3B. Så Intel kommer få ett försprång mot Zen 5. Men är inte helt klart om Zen 5 kör 4nm eller 3nm. Zen 5C varianten ryktas tillverkas i 3nm. Så tiden får utvisa när vi börjar närma oss.

Gå till inlägget

AMDs officiella roadmap säger "4nm | 3nm" för Zen 5, Zen 5c och Zen 5 med Vcache. Den enda tolkning jag kan göra är att de kommer att utveckla den kärnan på bägge de processerna och använda olika processer beroende på vilken produkt det rör sig om:

https://www.tomshardware.com/news/amd-shares-new-cpu-core-roa...

Jag vet att de inte är kompatibla (på så sätt som 5nm och 4nm är, eller 7nm och 6nm är), men det är ju vad AMD säger. Om man läser noggrant i ryktena så kan man ana att det är specifikt desktop-processorerna Ryzen 8000 som kommer på 4nm, medan Epyc hamnar på 3nm. Var de bärbara hamnar återstår att se, men kanske 3nm på dem också.

Visa signatur

5900X | 6700XT

Rapportera Redigera

Citera flera Citera (1)

2024-03-12 14:43

Permalänk

DasIch

Medlem ★

Plats: Stockholm
Registrerad: Aug 2001

●

Skrivet av ajp_anton:

Vet inte hur pålitlig Moore's Law Is Dead -kanalen är, men vad jag följt honom hittills så har det mesta verkat stämma. Och enligt hans Intel-kontakter så har de helt enkelt inte hunnit få HT att fungera med den nya arkitekturen, så de kommer skippa den. De hoppas kunna få till det till nästa generation.

Gå till inlägget

MLID är en nolla som bör ignoreras helt.

Problemet med HT är att det inte alltid är mer effektivt eller ens snabbare. Det kan i vissa fall påverka prestandan negativt och dessutom leda till högre latens. Samtidigt tar det upp 5% av kiselytan.

Mest troligt har alltså Intel valt detta för att det är den mest effektiva lösningen.

Rapportera Redigera

Citera flera Citera (5)

2024-03-12 18:00

Permalänk

GuessWho

Medlem ★

Plats: Västkusten
Registrerad: Aug 2010

●

Skrivet av LPG:

Detta låter även spännande. Hoppas bara de inte hänger på swec, jag vill inte byta nick

Gå till inlägget

Tycker också det låter spännande med uppföljare till Arc Alchemist.
De borde ju få till en bättre lansering med Battlemage än Alchemist.

Rapportera Redigera

Citera flera Citera

2024-03-12 21:14

Permalänk

Dyluck

Medlem ★

Plats: Offline
Registrerad: Nov 2001

●

HT var grymt på en single core cpu, efter det har den nog mest agerat flaskhals. Utökning av register iom APM och AMX kommer göra HT dyrare och svårare att implementera. Som lök på laxen är det en halvdassig implementation från Intel så ser det bara positivt att den plockas bort.

Avsaknaden av HT innebär också också en halvering av "cores" så tror inte det är helt frivilligt.

Visa signatur

How do 'Do Not Walk on the Grass' signs get there ?

Rapportera Redigera

Citera flera Citera

2024-03-13 01:21

Permalänk

D.

Medlem ★

Plats: Norr
Registrerad: Dec 2004

●

P>E>HT

Fler P-kärnor i kombination med några E-kärnor lär väl vara tillräckligt, möjligtvis även för att det ev kan tillåta högre frekvenser.

Med endast en el två kärnor gav HT enormt mycket för användarupplevelsen, men ju fler fysiska kärnor desto mindre nytta av HT.

Rapportera Redigera

Citera flera Citera (1)

2024-03-13 03:23

Permalänk

Mordekai

Medlem ★

Registrerad: Mar 2015

●

ÄNTLIGEN! Senaste veckan har jag suttit timtal och väntat på geometrisk beräkningar som bara kan utföras sekventiellt. Jag skulle lätt nöja mig med en fjärdedels kärnor med dubbla prestandan. 2P-cores och 4 E-Cores med dubbla single-core prestandan av 14900K skulle jag lätt pynta 20K för. Med bibehållet cache och IO såklart. Dvs 4ggr cache/kärna, 4ggr minnesbandbredd/kärna... You get the idea. Dvs halva prestandan i Cinebench multitrådat, världens kanske sämsta benchmark.

Rapportera Redigera

Citera flera Citera

2024-03-13 08:30

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av DasIch:

Problemet med HT är att det inte alltid är mer effektivt eller ens snabbare. Det kan i vissa fall påverka prestandan negativt och dessutom leda till högre latens. Samtidigt tar det upp 5% av kiselytan.

Mest troligt har alltså Intel valt detta för att det är den mest effektiva lösningen.

Gå till inlägget

Sett enbart till prestanda har man börjat lära sig rätt väl var HT fungerar och var de inte fungerar. Just fallet där det kan paja prestanda handlar nästan uteslutanden om beräknings-tunga fall där working-set är tillräckligt litet för att få plats i CPU-cache (någon nivå) men där det inte får plats när två trådar är aktiva. I det läget ger HT både sämre prestanda och högre strömförbrukning.

Fallen där det fungerar riktigt bra är där working-set är långt större än vad som får plats i cache. Då blir man nästan helt begränsad av latens mot RAM. Flera trådar per kärna betyder betyder sämre prestanda per tråd -> färre cykler per minnestransaktion sett från en specifik CPU-tråd -> effektivt sett lägre latens mot RAM givet CPU-trådens maximala kapacitet. I detta fall kan HT ge väl över 50 % prestandaboost. Dock nära nog totalt irrelevant för en desktop-applikationer.

Huvudproblemet med HT är nog inte kretsyta, det är att värdet minskar med ökande antal kärnor (tillräckligt många kärnor så blir bandbredd mot RAM en flaskhals och då hjälper inte HT alls) och sedan har SMT vissa typer av säkerhetsproblem från hur den fungerar.

Såg ett tag ut som AMD designat runt vissa av sårbarheterna, men nu har man visat att det fundamentala problemet finns kvar och är bara angreppssättet som behövdes justeras. Vissa sårbarheter fungerar bara på AMD och vissa bara på Intel, men de angriper samma fundamentala problem med SMT: när flera trådar så tätt delar resurser kommer man få implicit information kring vad "den andra tråden" gör tillräckligt snabbt för att det ska bli ett potentiellt problem.

Förstår man begränsningar hos SMT är det ändå värdefullt i flertalet fall, primärt kring servers. T.ex. så säkerställer molnleverantörerna att en enskild kund kör allt själv på varje fysisk kärna, så de läckor som kan uppstå är då ett problem den kunden kan hantera då det bara händer mellan dennes applikationer.

Som @Dyluck nämner: tror också att borttagandet av HT hänger ihop med APX. Det kommer vara den största förändringen av x86 ISA någonsin och en bieffekten det medför är att kostanden för flera CPU-trådar kommer gå upp. Ovanpå det är hela poängen med APX att kunna få liknande instruktionsparallelism som vi redan ser hos ARM64, lyckas det blir HT långt mindre värdefullt. Givet pull-requests till LLVM pekar mycket på att första CPU-modellerna med APX-stöd kommer under 2025 (så Arrow Lake / Lunar Lake ser ut att inte få stödet).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (2)

Färre trådar, mer prestanda i Lunar Lake

Färre trådar, mer prestanda i Lunar Lake

Externa nyheter

Spelnyheter från FZ