Vill du vara del av diskussionerna i forumet, ställa frågor eller hjälpa andra? Registrera dig här!

Intel Lakefield imponerar inte i prestandatest

Intel Lakefield imponerar inte i prestandatest

Femkärniga hybridprocessorn som blandar Sunny Cove- och Tremont-kärnor lider av låg enkeltrådad prestanda.

Läs hela artikeln här

Att tile-baserade renderare misslyckas med en så udda processorlösning är inte konstigt. Ungefär samma sak händer i t ex blender när man väljer blandad CPU+GPU-rendering. Grafikkortets enda "tråd" är ungefär 4-5 gånger snabbare än processorns (i mitt fall) 24 trådar, så är det få tiles kommer en väldigt stor andel av totalen att gå på "långsamma" trådar. I blender löser man det genom att ha väldigt små tiles, men i Cinebench är storleken låst.

Haha alltid funderat på hur det förhandlats med microsoft om en förändring i schemaläggaren.

Kärnor som "är bättre än andra" har ju funnits sen Intel Turbo Boost 3.0 (Skylake X och jag tror även nya mainstream-processorerna har dessa) och då har Intel skeppat sin egen lilla systemapp som ska dirigera jobb till specifika kärnor. Väldigt inelegant lösning. Kanske är tanken att den appen ska installeras med Lakefield-system också men hoppas egentligen på att Windows förändras snart istället.

Skrivet av cyklonen:

Att tile-baserade renderare misslyckas med en så udda processorlösning är inte konstigt. Ungefär samma sak händer i t ex blender när man väljer blandad CPU+GPU-rendering. Grafikkortets enda "tråd" är ungefär 4-5 gånger snabbare än processorns (i mitt fall) 24 trådar, så är det få tiles kommer en väldigt stor andel av totalen att gå på "långsamma" trådar. I blender löser man det genom att ha väldigt små tiles, men i Cinebench är storleken låst.

Fast nu handlade det väl om det test som enbart belastar en kärna och att det ändå spreds över de klena kärnorna när det inte skulle gjort det. Säkert något som kommer korrigeras med windows patch eller drivare från Intel.

Allt har har nog runnit ut i sjön. 😉

Skrivet av tellus82:

Fast nu handlade det väl om det test som enbart belastar en kärna och att det ändå spreds över de klena kärnorna när det inte skulle gjort det. Säkert något som kommer korrigeras med windows patch eller drivare från Intel.

Ah, missade det.

Synd att det inte fungerar bättre, jag tycker arkitekturen med en huvudkärna och flera hjälpkärnor låter sund.
Problemet borde dock ligga i mjukvaran. Skulle det här få fart kanske vi kan få se tripp-trapp-trull kärnkluster.

Schemaläggaren var något man fnulade mycket med när man kangade Android roms, en inte helt oviktig funktion

Ser definitivt ett användingsområde som casual surfdator till mormor till exempel. Om batteritiden är extrem och prislappen väldigt låg. Det är ju trots allt Atom kärnor? Vanliga laptops är för tunga, för varma, eller för dyra.

Hoppas dessa ger ett budget-segment inom ultraportabla.

*edit*
14000 för en galaxy book s? Vad betalar man för?

Senast redigerat 2020-06-26 22:16

Fast intel har ju varit tydliga med att det är dags att sluta titta på prestandasiffror... 🙄

För min 3900X växlar den kärnor också istället för att köra på den snabbaste så det verkar ju mer vara ett beteende hos Cinebench

Låt oss få se om intel kan få fart på microsoft att göra om sin hantering av kärnor. Nått som AMD fick jobba mycket för.

Skrivet av str8forthakill:

Ser definitivt ett användingsområde som casual surfdator till mormor till exempel. Om batteritiden är extrem och prislappen väldigt låg. Det är ju trots allt Atom kärnor? Vanliga laptops är för tunga, för varma, eller för dyra.

Hoppas dessa ger ett budget-segment inom ultraportabla.

*edit*
14000 för en galaxy book s? Vad betalar man för?

OT men asså 14k är ju ingenting?
Du får ju knappt en mobiltelefon under 12k i dagens läge.
En vanlig thinkpad får man ge över 30k för osv.

Tycker 14k verkar vara relativt prisvärt

Skrivet av flukke:

OT men asså 14k är ju ingenting?
Du får ju knappt en mobiltelefon under 12k i dagens läge.
En vanlig thinkpad får man ge över 30k för osv.

Tycker 14k verkar vara relativt prisvärt

Jag tycker i alla fall 14k är mycket pengar men visst det finns mycket dyrare bärbara datorer också. Nu har jag inte använt datorn själv så svårt att avgöra vad den bör kosta.

Vad har du för extrema krav om du knappt får en telefon för 12k? Skulle säga att telefoner för 5-6000 är riktigt bra
Exempelvis nya modellen av iPhone se.

Edit missade ett "inte"

Senast redigerat 2020-06-27 01:29
Skrivet av jOnÄTÄn:

Jag tycker i alla fall 14k är mycket pengar men visst det finns mycket dyrare bärbara datorer också. Nu har jag använt datorn själv så svårt att avgöra vad den bör kosta.

Vad har du för extrema krav om du knappt får en telefon för 12k? Skulle säga att telefoner för 5-6000 är riktigt bra
Exempelvis nya modellen av iPhone se.

Ja 14k är inte ett pangpris för denna prestanda, du kan exempelvis få en MS surface platta eller ultrabook för mindre pengar med en i5 4c8t (icke atom baserad) och de är inte heller superprisvärda direkt.

Blir bättre, den har en UFS SSD dessutom...

Vänta bara. Snart kommer Intel ut med tester där de "bevisar" att denna minsann klår Ryzen 9 4900hs i "real world tests".

så atom cpuer är tillbaka... fast nu är de plötsligt "premium"

Skrivet av Herr Kantarell:

För min 3900X växlar den kärnor också istället för att köra på den snabbaste så det verkar ju mer vara ett beteende hos Cinebench

Ett icke-problem i processorer där alla kärnor har samma prestanda. Gigantiskt problem i processorer likt Lakefield där enbart en kärna finns för att dra de tunga lassen.

Skrivet av Herr Kantarell:

För min 3900X växlar den kärnor också istället för att köra på den snabbaste så det verkar ju mer vara ett beteende hos Cinebench

Troligen så är det för att sprida ut energin över substraten, rätt bra faktiskt Om det inte skett så skulle det totala resultatet blivit lägre om en eller några få kärnor nått upp till max temp och klockat ner.

Däremot så är det förödande på Intels lösning med 1 Sunny Cove + 4 Tremont, verkar nästan som att Sunny Cove slår i taket och att Tremont kärnorna tar över för att sänka enrgi/temp.
Något jag i enfald trodde att intels "Hardware Guided Scheduling" tog hand om...

För bärbara enheter är designen i Lakefield det bästa sättet att skapa något som både reagerar bra på interaktiv användning (som nästan enbart behöver maximal enkeltrådprestanda) samtidigt som man har OK hantering av fall som kan skalas över kärnor (många långsamma kärnor är mer energieffektivt än få starka för dessa fall).

Ställer mig lite frågan till hur vanligt det ändå är att köra något som har någon större skalning över CPU-kärnor på ultra tunna bärbara, men finns säkert någon som ser ett fall. Gissar att PR-värdet är huvudpunkten, att försöka sälja en telefon som inte har 8 CPU-kärnor är tydligen rätt hopplöst i vissa regioner... (Testa monitorera en modern Android-telefon, försökte det själv och lyckades aldrig använda mer än 3 kärnor i något läge på en Samsung S10+ genom att använda de appar jag brukar köra, ofta används bara 1 kärna).

Att designa programvara för asymmetriska system är svårt. Att ha två typer av CPU-kärnor är ändå i detta kontext bland det enklare att få till, Linux löser det hela bl.a. genom att hela tiden försöka klassificera trådar som "compute-bound" eller "I/O-bound". Den senare klassen bör alltid få förtur till de CPU-kärnor med lägst svarstid, d.v.s. de "stora" kärnorna.

Windows verkar just nu köra OS-schemaläggarvärldens motsvarighet till sorteringsvärldens Bogosort med avseende på hantering av asymmetriska CPU-kärnor...

Skrivet av Herr Kantarell:

För min 3900X växlar den kärnor också istället för att köra på den snabbaste så det verkar ju mer vara ett beteende hos Cinebench

Cinebench har inget med saken att göra, det handlar om Windows schemaläggare. Kör jag enkeltrådfallet på Windows blir belastningen en jämn smet över kärnorna (vilket måste betyda att lasten hoppar runt flera gånger per sekund). Samma fall på Ubuntu (+Wine) så håller sig lasten på samma kärna nästan hela tiden, var 3-4 byten under hela körningen.

Skrivet av Meantek:

Ett icke-problem i processorer där alla kärnor har samma prestanda. Gigantiskt problem i processorer likt Lakefield där enbart en kärna finns för att dra de tunga lassen.

Det kan vara ett icke-problem, det beror på vad programmet gör samt hur systemet är designat. En av de absolut dyraste operationerna sett till energi är dataförflyttning. För Cinebench, där "working-set" är så litet att hela körningen nästan uteslutande körs från CPU-cache, är just denna aspekt irrelevant.

Men rent generellt vill man hålla en beräkning lokalt där data finns. Nvidia är väldigt medveten om detta, CUDA (programvaran) kräver att en beräkning som jobbar på ett viss datamängd stannar inom samma SM.

Det trista den här informationen också då säger är att Windows on ARM även lyckades göra en soptippsbrand av big.LITTLE, är det något man lyckats få rätt? Hade faktiskt förvänta mig att just den här aspekten inte skulle vara ett problem för Lakefield då Microsoft borde ha löst detta när man skapade Surface X, den har fyra "stora" kärnor och fyra "små" kärnor -> presterar sämre än den borde p.g.a. av detta problem.

Hur kan inte Microsoft få till detta när man kan titta på Linux där problemet löstest rätt tidigt i big.LITTLE eran? Gissningsvis har även Apple också löst detta då Iphone/Ipad kört en sådana konfiguration ett par generationer, vilket då betyder att man redan löst det för MacOS då iOS och MacOS kör samma OS-kärna.

Skrivet av Bengt-Arne:

Troligen så är det för att sprida ut energin över substraten, rätt bra faktiskt Om det inte skett så skulle det totala resultatet blivit lägre om en eller några få kärnor nått upp till max temp och klockat ner.

Tvärtom faktiskt, att flytta runt beräkningar försämrar energieffektiviteten i det allmänna fallet (kvittar för just CB då det har ett minimalt "working-set" per tråd). Testade lite snabbt att låsa resp. inte låsa CB15 single-thread till en specifik kärna. På en SP4 (i7-6650U) gjorde det noll skillnad, vilket pekar på att värme är ett icke-problem i detta fall -> man borde få samma prestanda då alla kärnor är likvärdiga.

På 3900X ser man någon enstaka procent skillnad mellan att köra på den "bästa" kärnan vs låta det hoppa runt. 3900X har ju fyra CCX som inte delar någon cache, så där kan kostnaden i energi bli en faktor för vissa program om beräkningen skulle hoppa runt.

Vet inte hur smart det är av Intel att starta ett flerfronts-krig när de redan förlorar mot AMD där de traditionellt vart starka. Riskerar att bli ett mediokert alternativ i samtliga scenarion.

Skrivet av flukke:

En vanlig thinkpad får man ge över 30k för osv.

Det beror ju så klart vad du är ute efter men skulle nog ändå säga att en Thinkpad för 30k är i överkant.

Det har väl knappt aldrig körts program på detta i Windows. Så känns som att microsoft och Intel ska kunna fixa detta. Känns som att det är ett måste med tanke på Apples övergång till ARM. Låter som detta skulle kunna konkurrera om det blir gjort rätt

Skrivet av flukke:

OT men asså 14k är ju ingenting?
Du får ju knappt en mobiltelefon under 12k i dagens läge.
En vanlig thinkpad får man ge över 30k för osv.

Tycker 14k verkar vara relativt prisvärt

Går knappt att få en telefon för under 12k? Och 14k är ingenting?
Nu lugnar vi oss lite va.

Jag köpte då min Pixel 3a för ca 200 euro. Skulle aldrig falla mig in att betala en spänn över 4000 kr för en mobil.

Skrivet av flukke:

OT men asså 14k är ju ingenting?
Du får ju knappt en mobiltelefon under 12k i dagens läge.
En vanlig thinkpad får man ge över 30k för osv.

Tycker 14k verkar vara relativt prisvärt

Jösses, är du ens medveten om vilken extrambubbla du lever i om du ser på det sådär?

@Yoshman Då måste väl varje rendering av varje tile (?) vara en ny tråd och som avslutas iom att den är färdig.
Finns mängder av program som har affinity och fortsätter att köra på samma kärna.
Annars är det ju en väldigt dålig idé att byta kärna (context switching) när man redan har laddat program och cache minnen på en.

Telecom kunden jag jobbar åt nu har haft ett stort problem med detta.

Presterar väl ungefär som förväntat dvs inget vidare.

Tycker laptop med U serien är ett bättre köp om man inte behöver så lätt laptop som möjligt.
och finns väl laptops runt kilot med bra prestanda, och vem behöver lättare än så.

Skrivet av Herr Kantarell:

@Yoshman Då måste väl varje rendering av varje tile (?) vara en ny tråd och som avslutas iom att den är färdig.
Finns mängder av program som har affinity och fortsätter att köra på samma kärna.
Annars är det ju en väldigt dålig idé att byta kärna (context switching) när man redan har laddat program och cache minnen på en.

Telecom kunden jag jobbar åt nu har haft ett stort problem med detta.

Rätt uppenbart att Cinebench inte använder sig av explicit CPU-trådaffinitet. Det normala sättet att hantera den typ av arbetslast man har i Cinebench är via något form av work-stealing. D.v.s. varje "tile" hanteras som ett separat jobb, dessa jobb hanteras sedan av en trådpool som typiskt är en OS-tråd per CPU-tråd. Så OS-trådarna startar och dör inte per tile, de återanvänds till hela scenen är färdig.

Man kan tycka att det då är rimligt att låsa varje OS-tråd till en specifik CPU-tråd. I just detta fall hade nog det enkelt kunna lösa problemet, framförallt då en sådan lösning också gör det trivialt att prioritera vissa kärnor över andra (så jobben hanteras i första hand av "stora" kärnor). Men då ignorerar man att det kanske finns andra saker som kör på systemet, bara ta två program som kör just denna policy för att inse att man då lätt hamnar i ett läge där båda programmen kör på den enda "stora" kärnan medan resten står oanvända.

Man har ett OS just för att det ser hela systemet och därmed kan ta beslut som är optimalt för systemet som helhet. Applikationer ska bara bry sig om sin del av världen, annars måste ju varje applikation också implementera delar av ett OS vilket är kod-duplicering -> dåligt.

Skrivet av Yoshman:

Rätt uppenbart att Cinebench inte använder sig av explicit CPU-trådaffinitet. Det normala sättet att hantera den typ av arbetslast man har i Cinebench är via något form av work-stealing. D.v.s. varje "tile" hanteras som ett separat jobb, dessa jobb hanteras sedan av en trådpool som typiskt är en OS-tråd per CPU-tråd. Så OS-trådarna startar och dör inte per tile, de återanvänds till hela scenen är färdig.

OKej låter ju vettigt! Tack för infon!

Skrivet av flukke:

OT men asså 14k är ju ingenting?
Du får ju knappt en mobiltelefon under 12k i dagens läge.
En vanlig thinkpad får man ge över 30k för osv.

Tycker 14k verkar vara relativt prisvärt

Är rätt säker på att min MacBook Pro Late 2014 presterar bättre än vad nya Galaxy Book S gör, en idag 6 år gammal dator alltså som jag fick för 4000:- för ca. 1 år sedan, istället för 14,000:- med detta "skräpet" till CPU & UFS-SSD (kan vara en okej hastighet på disken om det är UFS 3.1 vi snackar, annars bläääh).

Sedan finns det en myriad av bra telefoner ute för 7000:- och neråt, gav 6200:- för en ny ROG Phone II som exempel. En kompis plockade upp OnePlus 7T Pro för drygt 5k nyligen med. Kan man nöja sig med fjolårets flaggskepp eller årets "midrange - High-midrange" så finns det bra telefoner från allt mellan 3.5-7k.

Så... Ser inte hur Samsungs nya Galaxy Book S är prisvärd någonstans? Du betalar i alla fall inte för prestandan. Så det ska vara att det är i särklass en förhimla bra batteritid och det enda man gör är att sitta i Word isåfall