Färre trådar, mer prestanda i Lunar Lake

Permalänk
Melding Plague

Färre trådar, mer prestanda i Lunar Lake

Att bara köra en tråd per fysisk processorkärna ser ut att fungera väldigt bra i Intels kommande processorfamilj för strömsnåla bärbara.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Låter lovande, hoppas dom kan hitta prestandaökningar likt detta i dom stationära processorerna också.

Permalänk

De kommer tillverkas på TMSC 3nm. De kommer inte bli billiga varken för slutkonsumenten eller Intel.

Har för mig att AMD Zen 5 kommer tillverkas i 4nm men vara betydligt billigare. De kommer däremot inte få 50% bättre prestanda i MT.

Permalänk
Medlem

Så Intel har inte lyckats lösa säkerhetsproblemen med SMT så nu när de skippar det blir det en ny funktion… blir lite trött att man alltid måste vända allt till sin egen fördel

Permalänk
Medlem
Skrivet av medbor:

Så Intel har inte lyckats lösa säkerhetsproblemen med SMT så nu när de skippar det blir det en ny funktion… blir lite trött att man alltid måste vända allt till sin egen fördel

Tror inte att det är därför de gör det. Intel är en tillverkare som gör extremt mycket simuleringar på verkliga arbetssituationer, och det de säkert har insett är att "ingen" användare av bärbara datorer behöver så många trådar som de erbjuder. När de bara småpetar på gamla designer så går antalet trådar upp, för det är en uppenbar grej att öka (fler kärnor på 14e generationen än 12e, till exempel), men när de gör en större omdesign så väljer de att ta bort HT.

Nu sitter jag själv på en 12-kärnig med SMT så jag är väl ett dåligt exempel att folk inte behöver en massa trådar, men jag valde den modellen av ett annat skäl (cache - 5800X3D kom inte förrän rätt mycket senare).

Visa signatur

5900X | 6700XT

Permalänk
Medlem
Skrivet av Nyhet:

och nya ”Battlemage” Xe2-LPG-grafikkärnor.

Detta låter även spännande. Hoppas bara de inte hänger på swec, jag vill inte byta nick

Visa signatur

Ryzen 7 5800X3D | RX 7900 XT

Permalänk
Medlem
Skrivet av mpat:

Tror inte att det är därför de gör det. Intel är en tillverkare som gör extremt mycket simuleringar på verkliga arbetssituationer, och det de säkert har insett är att "ingen" användare av bärbara datorer behöver så många trådar som de erbjuder.

Vet inte hur pålitlig Moore's Law Is Dead -kanalen är, men vad jag följt honom hittills så har det mesta verkat stämma. Och enligt hans Intel-kontakter så har de helt enkelt inte hunnit få HT att fungera med den nya arkitekturen, så de kommer skippa den. De hoppas kunna få till det till nästa generation.

Permalänk
Medlem
Skrivet av ajp_anton:

Vet inte hur pålitlig Moore's Law Is Dead -kanalen är, men vad jag följt honom hittills så har det mesta verkat stämma. Och enligt hans Intel-kontakter så har de helt enkelt inte hunnit få HT att fungera med den nya arkitekturen, så de kommer skippa den. De hoppas kunna få till det till nästa generation.

Kan och kan, det är bara en fråga om prioritering. När Intel hade en kärna i Pentium 4 Northwood och AMD var på gång med sina första tvåkärniga, då var det viktigt. Kan man lösa 8 trådar i ett litet chip utan HT, då är det mycket mindre viktigt.

Visa signatur

5900X | 6700XT

Permalänk
Hedersmedlem
Skrivet av Dinkefing:

De kommer tillverkas på TMSC 3nm. De kommer inte bli billiga varken för slutkonsumenten eller Intel.

Har för mig att AMD Zen 5 kommer tillverkas i 4nm men vara betydligt billigare. De kommer däremot inte få 50% bättre prestanda i MT.

Va? Jag kan inte något om kommande tillverkningsteknik här (not saying ist wrong) - men Intel har en egen tillverkningskedja för processorer.
Ska de inte använda den för produktion av sina processorer?

Visa signatur

🎮 → Node 304 • Ryzen 5 2600 + Nh-D14 • Gainward RTX 2070 • 32GB DDR4 • MSI B450I Gaming Plus AC
🖥️ → Acer Nitro XV273K Pbmiipphzx • 🥽 → VR: Samsung HMD Odyssey+
🎧 → Steelseries arctic 7 2019
🖱️ → Logitech g603 | ⌨️ → Logitech MX Keys
💻 → Lenovo Yoga slim 7 pro 14" Oled

Permalänk
Skrivet av Söderbäck:

Va? Jag kan inte något om kommande tillverkningsteknik här (not saying ist wrong) - men Intel har en egen tillverkningskedja för processorer.
Ska de inte använda den för produktion av sina processorer?

Nej Lunar Lake kommer tillverkas på TMSC's 3nm nod kallad N3B. Både cpu och gpu-tilen och soc:en kommer tillverkas i N3B. Så Intel kommer få ett försprång mot Zen 5. Men är inte helt klart om Zen 5 kör 4nm eller 3nm. Zen 5C varianten ryktas tillverkas i 3nm. Så tiden får utvisa när vi börjar närma oss.

Permalänk
Medlem

Ryktena säger ju att även Arrow Lake skippar SMT. Gissar att Arrow Lake kommer i höst och Lunar Lake följer i slutet av året?

Visa signatur

Windows 11 Pro | Intel i7 8700 | ASUS Prime Z370-P | Corsair 16GB 3000MHz | ASUS GTX 1080 | Fractal Design Define S | Corsair RM750x | Hyper 212 EVO

Permalänk
Medlem
Skrivet av Dinkefing:

Nej Lunar Lake kommer tillverkas på TMSC's 3nm nod kallad N3B. Både cpu och gpu-tilen och soc:en kommer tillverkas i N3B. Så Intel kommer få ett försprång mot Zen 5. Men är inte helt klart om Zen 5 kör 4nm eller 3nm. Zen 5C varianten ryktas tillverkas i 3nm. Så tiden får utvisa när vi börjar närma oss.

AMDs officiella roadmap säger "4nm | 3nm" för Zen 5, Zen 5c och Zen 5 med Vcache. Den enda tolkning jag kan göra är att de kommer att utveckla den kärnan på bägge de processerna och använda olika processer beroende på vilken produkt det rör sig om:

https://www.tomshardware.com/news/amd-shares-new-cpu-core-roa...

Jag vet att de inte är kompatibla (på så sätt som 5nm och 4nm är, eller 7nm och 6nm är), men det är ju vad AMD säger. Om man läser noggrant i ryktena så kan man ana att det är specifikt desktop-processorerna Ryzen 8000 som kommer på 4nm, medan Epyc hamnar på 3nm. Var de bärbara hamnar återstår att se, men kanske 3nm på dem också.

Visa signatur

5900X | 6700XT

Permalänk
Medlem
Skrivet av ajp_anton:

Vet inte hur pålitlig Moore's Law Is Dead -kanalen är, men vad jag följt honom hittills så har det mesta verkat stämma. Och enligt hans Intel-kontakter så har de helt enkelt inte hunnit få HT att fungera med den nya arkitekturen, så de kommer skippa den. De hoppas kunna få till det till nästa generation.

MLID är en nolla som bör ignoreras helt.

Problemet med HT är att det inte alltid är mer effektivt eller ens snabbare. Det kan i vissa fall påverka prestandan negativt och dessutom leda till högre latens. Samtidigt tar det upp 5% av kiselytan.

Mest troligt har alltså Intel valt detta för att det är den mest effektiva lösningen.

Permalänk
Medlem
Skrivet av LPG:

Detta låter även spännande. Hoppas bara de inte hänger på swec, jag vill inte byta nick

Tycker också det låter spännande med uppföljare till Arc Alchemist.
De borde ju få till en bättre lansering med Battlemage än Alchemist.

Permalänk
Medlem

HT var grymt på en single core cpu, efter det har den nog mest agerat flaskhals. Utökning av register iom APM och AMX kommer göra HT dyrare och svårare att implementera. Som lök på laxen är det en halvdassig implementation från Intel så ser det bara positivt att den plockas bort.

Avsaknaden av HT innebär också också en halvering av "cores" så tror inte det är helt frivilligt.

Visa signatur

How do 'Do Not Walk on the Grass' signs get there ?

Permalänk
Medlem

P>E>HT

Fler P-kärnor i kombination med några E-kärnor lär väl vara tillräckligt, möjligtvis även för att det ev kan tillåta högre frekvenser.

Med endast en el två kärnor gav HT enormt mycket för användarupplevelsen, men ju fler fysiska kärnor desto mindre nytta av HT.

Permalänk
Medlem

ÄNTLIGEN! Senaste veckan har jag suttit timtal och väntat på geometrisk beräkningar som bara kan utföras sekventiellt. Jag skulle lätt nöja mig med en fjärdedels kärnor med dubbla prestandan. 2P-cores och 4 E-Cores med dubbla single-core prestandan av 14900K skulle jag lätt pynta 20K för. Med bibehållet cache och IO såklart. Dvs 4ggr cache/kärna, 4ggr minnesbandbredd/kärna... You get the idea. Dvs halva prestandan i Cinebench multitrådat, världens kanske sämsta benchmark.

Permalänk
Datavetare
Skrivet av DasIch:

Problemet med HT är att det inte alltid är mer effektivt eller ens snabbare. Det kan i vissa fall påverka prestandan negativt och dessutom leda till högre latens. Samtidigt tar det upp 5% av kiselytan.

Mest troligt har alltså Intel valt detta för att det är den mest effektiva lösningen.

Sett enbart till prestanda har man börjat lära sig rätt väl var HT fungerar och var de inte fungerar. Just fallet där det kan paja prestanda handlar nästan uteslutanden om beräknings-tunga fall där working-set är tillräckligt litet för att få plats i CPU-cache (någon nivå) men där det inte får plats när två trådar är aktiva. I det läget ger HT både sämre prestanda och högre strömförbrukning.

Fallen där det fungerar riktigt bra är där working-set är långt större än vad som får plats i cache. Då blir man nästan helt begränsad av latens mot RAM. Flera trådar per kärna betyder betyder sämre prestanda per tråd -> färre cykler per minnestransaktion sett från en specifik CPU-tråd -> effektivt sett lägre latens mot RAM givet CPU-trådens maximala kapacitet. I detta fall kan HT ge väl över 50 % prestandaboost. Dock nära nog totalt irrelevant för en desktop-applikationer.

Huvudproblemet med HT är nog inte kretsyta, det är att värdet minskar med ökande antal kärnor (tillräckligt många kärnor så blir bandbredd mot RAM en flaskhals och då hjälper inte HT alls) och sedan har SMT vissa typer av säkerhetsproblem från hur den fungerar.

Såg ett tag ut som AMD designat runt vissa av sårbarheterna, men nu har man visat att det fundamentala problemet finns kvar och är bara angreppssättet som behövdes justeras. Vissa sårbarheter fungerar bara på AMD och vissa bara på Intel, men de angriper samma fundamentala problem med SMT: när flera trådar så tätt delar resurser kommer man få implicit information kring vad "den andra tråden" gör tillräckligt snabbt för att det ska bli ett potentiellt problem.

Förstår man begränsningar hos SMT är det ändå värdefullt i flertalet fall, primärt kring servers. T.ex. så säkerställer molnleverantörerna att en enskild kund kör allt själv på varje fysisk kärna, så de läckor som kan uppstå är då ett problem den kunden kan hantera då det bara händer mellan dennes applikationer.

Som @Dyluck nämner: tror också att borttagandet av HT hänger ihop med APX. Det kommer vara den största förändringen av x86 ISA någonsin och en bieffekten det medför är att kostanden för flera CPU-trådar kommer gå upp. Ovanpå det är hela poängen med APX att kunna få liknande instruktionsparallelism som vi redan ser hos ARM64, lyckas det blir HT långt mindre värdefullt. Givet pull-requests till LLVM pekar mycket på att första CPU-modellerna med APX-stöd kommer under 2025 (så Arrow Lake / Lunar Lake ser ut att inte få stödet).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer