Intel Skylake fryser vid komplexa beräkningar

Permalänk
Melding Plague

Intel Skylake fryser vid komplexa beräkningar

Efter upptäckten att Intels Skylake-processorer riskerar böjas med vissa kylare uppdagas en bugg i själva kislet, som kraschar systemet vid komplexa beräkningar.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Oj, är det minsta man kan säga, men skönt iaf OM det löser sig med en bios uppdatering. Så det inte blir som med samsungs 840 evo

Visa signatur

Lurkar - läser mycket skriver lite. Vill du få min uppmärksamhet är det citat eller pm som gäller.
Jag anser att AIO-kylare har en plats i världen men det är INTE i fullstora ATX-system.

Permalänk
Avstängd
Skrivet av Litenskit:

Oj, är det minsta man kan säga, men skönt iaf OM det löser sig med en bios uppdatering. Så det inte blir som med samsungs 840 evo

Öh, jag tror du överskattar problemet. Detta är väldigt lätt att lösa med en bios-uppdatering.

Det är ingen trasig hårdvara eller underdimensionerade delar.

Visa signatur

R7 3700X | X570 Aorus Master | 32GB | EVGA 1080 Ti FTW3 | Noctua NH-D15S | FD Meshify C Copper
R7 1700 | X370 Gaming-ITX | 16GB | RX Vega 64 LE | Noctua U12S | Node 304
2 x HPE ProLiant Microserver Gen 8 | 1265L V2 | 16GB | 20TB

Permalänk
Medlem

Jag skulle gärna vilja se om denna mikrokod-uppdatering kan påverka prestandan negativt i vanliga fall.
Kanske bättre att vänta på nästa stepping? =/ Jag som bestämde idag att jag skulle införskaffa en till skylake

Permalänk
Relik 📜

Vad tror ni, en uppdatering av mikrokod som samtidigt råkar ta bort stödet för inofficiell överklockning av icke-K? Bara att välja! #foliehatten

Visa signatur

För övrigt anser jag att Karthago bör förstöras.
▪ Nöje #1 -> i5-11400F - B560M-ITX/ac - RTX 3070 - 16 GB DDR4
▪ Nöje #2 -> R5 5600 - Prime B450-Plus - RX 6750 XT - 16 GB DDR4
▪ Mobilt -> HP Pavilion Aero - R5 5625U - 16 GB DDR4
▪ Konsol -> Steam Deck, Xbox Series S

Permalänk
Medlem
Skrivet av emilakered:

Vad tror ni, en uppdatering av mikrokod som samtidigt råkar ta bort stödet för inofficiell överklockning av icke-K? Bara att välja! #foliehatten

Skulle precis skriva detta!
Lagom allvarligt fel för att vanliga användare inte skulle bry sig och sen ett fel som specifikt drabbar många överklockare som stresstestar i Prime.. Fiffigt Intel, fiffigt.

Skickades från m.sweclockers.com

Visa signatur

Storburk: Ryzen 7 3700X, MSI B450M Mortar, FD Define Mini, CM M2 Silent 720W, 32 GB, ASUS RX 580 8GB, NVME SSD + HDD - HTPC: Ryzen 5 2400G, 16 GB, NVME SSD, BeQuiet 550W - Bärbar: ASUS F3SR, Core2Duo@2,6-3,1Ghz 4 GB, SSD

Permalänk
Datavetare
Skrivet av SeF.Typh00n:

Öh, jag tror du överskattar problemet. Detta är väldigt lätt att lösa med en bios-uppdatering.

Det är ingen trasig hårdvara eller underdimensionerade delar.

Vissa problem kan inte lösas med mikrokoduppdatering, ett exempel finns ju i artikeln: TSX (man löste kraschen men till "kostnaden" att tappa TSX). Värt att nämna ändå är att TSX inte är trasigt för alla Haswell/Broadwell, man fixade detta problem innan lanseringen av Haswell Xeon E5/E7. Är främst för servers där TSX kan ha en poäng, man använder automatisk TSX i Linux om CPUn har stöd och kärnan är "tillräckligt" ny.

Om det finns en fix för problemet i Skylake borde det även finnas en exakt förklaring till vilken instruktion / kombination av instruktioner som orsakar problem i Skylake, ser inget om detta varken här eller i den länkade ArsTechnica artikeln. Någon som vet?

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Avstängd

Testar inte Intel själva med Prime95? :s

Dom kanske släpper en ny stepping där dom fixar det.
Hoppas att Kaby Lake och Cannon Lake blir renare.

Permalänk
Medlem

Det är något med Skylake som alltid får mig att rygga tillbaka och välja en äldre CPU-arkitektur (t.ex. Haswell Refresh) för nya byggen. Känns inte som att det var en riktigt färdig produkt utan att det fortfarande ligger i Beta-stadiet. Och precis som @emilakered skriver så kan detta ge ett skäl för Intel att samtidigt lägga till en mikrokod för att stoppa all överklockning av icke-K CPU:erna

Visa signatur

12c/24t 4.0GHz (Zen2) • 2x16GiB 3200MHz C14 • RTX 2080 FE 1965MHz 7000MHz • X570 I PW • Ghost S1 MKII

Permalänk
Avstängd
Skrivet av Yoshman:

Vissa problem kan inte lösas med mikrokoduppdatering, ett exempel finns ju i artikeln: TSX (man löste kraschen men till "kostnaden" att tappa TSX). Värt att nämna ändå är att TSX inte är trasigt för alla Haswell/Broadwell, man fixade detta problem innan lanseringen av Haswell Xeon E5/E7. Är främst för servers där TSX kan ha en poäng, man använder automatisk TSX i Linux om CPUn har stöd och kärnan är "tillräckligt" ny.

Om det finns en fix för problemet i Skylake borde det även finnas en exakt förklaring till vilken instruktion / kombination av instruktioner som orsakar problem i Skylake, ser inget om detta varken här eller i den länkade ArsTechnica artikeln. Någon som vet?

Nej det förstås, jag syftade mest på detta specifika problemet

Visa signatur

R7 3700X | X570 Aorus Master | 32GB | EVGA 1080 Ti FTW3 | Noctua NH-D15S | FD Meshify C Copper
R7 1700 | X370 Gaming-ITX | 16GB | RX Vega 64 LE | Noctua U12S | Node 304
2 x HPE ProLiant Microserver Gen 8 | 1265L V2 | 16GB | 20TB

Permalänk
Hjälpsam

Senast jag kollade implementeras mikrokoden via en kretslogik i CPU:n, i Phenoms fall med TLB-buggen, var "lösningen" att slå av L3 cachen, vilket slog hårt mot prestandan.
I Phenoms fall var "boten värre än soten" för de flesta av oss.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Avstängd

Då blir det inte en Skylake :), hoppas på Zen levererar.

En Zen på 1,8GHZ spöar skiten ur en Skylake på 3,5GHZ. (Drömmar)

Visa signatur

-Filma inte med din mobil vertikalt-

Permalänk
Avstängd

Jeg kom tilfeldigvis over denne videoen i dag:
https://www.youtube.com/watch?v=eDmv0sDB1Ak (When hardware must "just work" - An inside look at x86 CPU design [32c3])

Permalänk
Medlem
Skrivet av Nyhet:

Intel Skylake fryser vid komplexa beräkningar

Detta är ju genialiskt! Att ingen tänkt på att processorn ska kyla ner sig själv vid belastning tidigare. Det är ju så uppenbart nu i efterhand.

Visa signatur

Spela Swemantle! Du vet att du vill.

Ibland har jag fel, men då är det någon annans fel.

Permalänk
Medlem
Skrivet av SolidReactor:

Kanske bättre att vänta på nästa stepping? =/ Jag som bestämde idag att jag skulle införskaffa en till skylake

Vadå, ska du köra prime95 24/7? Ja då är det nog bäst att vänta, Skylake är ju sjukt opålitliga just nu.

Skickades från m.sweclockers.com

Visa signatur

Ryzen 5 1600, Gigabyte 1070, MSI B350M MORTAR, Crucial 16GB, Samsung EVO 500GB, Define Mini C, Corsair RM550x (╯°□°)╯​︵ ┻━┻

Permalänk

@LemonIllusion: HAHA! Bästa idag!

Permalänk
Medlem
Skrivet av Yoshman:

Om det finns en fix för problemet i Skylake borde det även finnas en exakt förklaring till vilken instruktion / kombination av instruktioner som orsakar problem i Skylake, ser inget om detta varken här eller i den länkade ArsTechnica artikeln. Någon som vet?

Det jag läste vara att felet bara uppstår om man kör med AVX1 (AVX2-varianten går bra) av vissa instruktioner, så man måste ha en specifik version av prime95 (inte för gammal, för då saknas AVX1-stöd, och inte för ny, för då används AVX2 istället), och det är alltså en specifik kombination av instruktioner som används i FFT:n, med vissa specifika bittmönster som indata och en minimal loop-storlek (därav exponenten, som ju är rätt stor), som går fel.

Mer än så vet jag inte, men det som händer iaf är tydligen att tråden låser sig i en minnessynkinstruktion som körs under tiden som istället för efter avx-1 instruktioner, eller något åt det hållet. Man måste använda alla trådar fullt ut, hypertrådning måste vara på, alla load/store enheter måste vara lastade, och man måste trigga en TLB-miss, det är inte direkt 100% chans att det hänger, nej, så rubriken på den här artikeln är aningens missvisande, eftersom det låter som den alltid hänger om man lastar burken.

Fast ska man jaga klick så ska man.

Just det gör det intressant att en firmwareuppdatering av CPU:n (för det är ju det "bios"-uppdateringen är, de ändrar firmwaren som laddas i CPU:n, så egentligen går en linux-uppdatering lika bra, t.ex.) fixar problemet, eller kanske styrs kompilationen från x86-bytekod till native-instruktioner av fimwaren, så de kan ändra på vilka microops som faktiskt används?

Permalänk
Datavetare
Skrivet av Ratatosk:

Senast jag kollade implementeras mikrokoden via en kretslogik i CPU:n, i Phenoms fall med TLB-buggen, var "lösningen" att slå av L3 cachen, vilket slog hårt mot prestandan.
I Phenoms fall var "boten värre än soten" för de flesta av oss.

Var inte L3 man slog av även om L2/L3 var involverad i det problem som kunde krascha systemet. Vad man slog av var TLB (translation lookaside buffer), en cache för att översätta från virtuella till fysiska adresser. Det intressanta här var att denna bug inte kunde fixas med mikrokod, men det var möjligt att hantera det i OSet och fanns en (inofficiellt) patch till Linux som löste problemet nästan helt utan prestandaförlust.

Får rätt mig själv ovan: TSX fixades inte till Haswell Xeon E5 utan bara till Haswell Xeon E7, det är däremot fixat i Broadwell Xeon E5 och därmed rimligen även fixat i Broadwell-baserade E-serien. "Fixen" i detta fall var trivial, för att använda något som TSX måste OSet fråga CPUn vilka finesser den stödjer (vissa CPUer saknar ju TSX by-design) så "fixen" är att bara släcker den flagga som säger att TSX stöds. Denna information ligger i själva CPUn och fungerar därför i alla OS utan någon speciell drivare (mer än att man vet hur man läser ut denna information från CPUn, i Linux kan man lista detta med cat /proc/cpuinfo och kolla om flags innehåller TSX).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Marticus:

Vadå, ska du köra prime95 24/7? Ja då är det nog bäst att vänta, Skylake är ju sjukt opålitliga just nu.

Skickades från m.sweclockers.com

Nej, synd att du inte kan läsa mitt inlägg. Onödig spydig kommentar.

Citat:

Jag skulle gärna vilja se om denna mikrokod-uppdatering kan påverka prestandan negativt i vanliga fall.

Prime95 användning är inte ett "vanligt fall", det är ett stresstest. Finns en risk/chans att denna mikrokoduppdatering kanske stänger av en del cache eller instruktioner eller lägger till "omvägar" för att undvika buggen. Hursom vill jag veta om detta kan bli negativt i vanliga fall.

Permalänk
Inaktiv

Den kanske blir slöare än 4790 nu så den inte ska krascha.

Permalänk
Medlem
Skrivet av SolidReactor:

Nej, synd att du inte kan läsa mitt inlägg. Onödig spydig kommentar.

Prime95 användning är inte ett "vanligt fall", det är ett stresstest. Finns en risk/chans att denna mikrokoduppdatering kanske stänger av en del cache eller instruktioner eller lägger till "omvägar" för att undvika buggen. Hursom vill jag veta om detta kan bli negativt i vanliga fall.

Skulle bli ett jäkla liv om normalt användande blir lidande, så tror knappast att en uppdatering pga ett isolerat problem kommer köra över normalt användande. Men du är välkommen att göra en höna av en fjäder och fundera på att döma bort processorarkitekturen helt.

Skickades från m.sweclockers.com

Visa signatur

Ryzen 5 1600, Gigabyte 1070, MSI B350M MORTAR, Crucial 16GB, Samsung EVO 500GB, Define Mini C, Corsair RM550x (╯°□°)╯​︵ ┻━┻

Permalänk
Medlem

Som jag har förstått så gäller det 'bara' med HT så 6600K klarar sig från just denna bug.

Skickades från m.sweclockers.com

Permalänk
Bildexpert 📺

Lite avslappnande om matematiken bakom och jakten på mersenneprimtal (och vad tusan det handlar om).

Är ju lite prispengar i potten 100.000 dollar till den som först finner ett mersenneprimtal som är 100 miljoner siffror långt. Fast inte för dig med en Skylake då.

Permalänk

Det är väll bara att stänga av fläkten så blir den varm och slipper den frysa....

Visa signatur

Core i7 2600@4Ghz - 16GB Corsair Vengenace@1600Mhz - 90GB Corsair Force3 SSD - WD 1TB HDD - EVGA GTX970@1501Mhz - Corsair TX650 PSU - AcerXB270HU 144Hz/GSYNC/1440p - Biltema högtalare med subwoofer. MSI P67A G45 MB *-*-* 11000 poäng Firestrike, 3050 poäng Unigine Heaven, default 2560x1440 *-*-* Windows 7 64. Byggd 2011

Permalänk
Medlem

Om den fryser kanske man inte ska ha så effektiv kylning på trots allt.
Edit: Typiskt, någon hann före.

Visa signatur

7800X3D • 4080S • 32GB • 2TB • 1440p 165 Hz
3700X • 3070 • 32GB • 2TB • 1080p 144Hz

Permalänk
Medlem

Inte likt Intel att göra en sån miss, sist var väll z68 kortens sata-portar.

Ha det gött

Visa signatur

Intel 7700k | Asus StrixF | Asus 2080 Super Strix | Corsair Vengeance 16Gb 3000Mhz | 1,7Tb Ssd | Corsiar Rmx650w | Corsair H115i | Acer XB271HU 165Hz G-Sync | Corsair air 540 | Xbox One X | Ps4 Pro

Permalänk
Medlem
Skrivet av Marticus:

Skulle bli ett jäkla liv om normalt användande blir lidande, så tror knappast att en uppdatering pga ett isolerat problem kommer köra över normalt användande. Men du är välkommen att göra en höna av en fjäder och fundera på att döma bort processorarkitekturen helt.

Skickades från m.sweclockers.com

Enda jag har skrivit om är att jag vill veta om denna mikrokod kommer att påverka prestandan negativt vid vanliga fall. Hur kopplar du denna kommentar från mig till att jag vill döma ut en hel processorarkitektur? Den som gör en höna utav en fjäder är tydligtvis du. Lägg ner.

Permalänk
Medlem
Skrivet av Ars Technica:

While the flaw would rarely have been encountered by average users, extensive media coverage ultimately led to Intel recalling the defective processors.

Jaha, så blir det pris-spik igen då eller?

Visa signatur

W10 Pro N | i7 6700K @ 4.7 GHz | NH-D15 | GTX 980 Ti HOF | ASUS Z170 Pro Gaming | 16GB 3000Mhz CL15 | Samsung 850 EVO 500GB | 3x HDD ~8TB | Define S | EVGA 750W G2 | Logitech g502 | Corsair K70 Red | Beyerdynamic DT 770 Pro 250Ω | Sound Blaster Z | BenQ XL2430T 144Hz + GW2250HM 60Hz
» Youtube: https://www.youtube.com/c/Phreec

Permalänk
Medlem
Skrivet av Icte:

Det är något med Skylake som alltid får mig att rygga tillbaka och välja en äldre CPU-arkitektur (t.ex. Haswell Refresh) för nya byggen. Känns inte som att det var en riktigt färdig produkt utan att det fortfarande ligger i Beta-stadiet. Och precis som @emilakered skriver så kan detta ge ett skäl för Intel att samtidigt lägga till en mikrokod för att stoppa all överklockning av icke-K CPU:erna

Tycker faktiskt samma sak. Där är för mycket lappning och problem redan innan, och nu plötsligt kan inte ens CPUn räkna rätt.
Och de som tror jag pratar skit, ta en titt på BIOS revisionerna på moderkorten till Skylake. Har aldrig på senaste 10 åren sett så enormt många BIOS uppdateringar på ynka 3 månader som skylake har fått.

Så personligen väntar jag till plattformens buggar bankats ut, och då kan jag lika gärna vänta på att Skylakes bugg bankas ut den med.

@cardeci En CPU som räknar fel är som ett RAM minne som bitflippar... mao, totalt värdelös, oavsett hur osannolikt det är. Man förutsätter alltid att en dator kan räkna rätt och hantera alla tal, kan den inte så behövs det fixas annars kan du inte lita ett dugg på beräkningarna från den, för hur vet du att det är rätt?

Om de nu kan "fixa" via microkod så är ju frågan vad som påverkas, för de måste ju stänga av eller ändra något i CPUerna för att fixa hårdvarufelet.

Permalänk
Inaktiv

Kanske blir någon dipp ner till 1500 strecket får vi hoppas då