AMD Ryzen 3000 "Matisse" – samlingstråd

Permalänk
Medlem
Skrivet av makatech:

Det kallas manuell PBO trots att Ryzen Master visar det som Auto Overclock? (när man kör PBO satt till manual i bios)

Det kommer stå Auto OC så fort du pillar på/aktiverar Auto OC delen i PBO och PBO är såklart aktivt med Auto OC funktionen aktiv.

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Medlem

Körde memtest86 under natten och fick 2 errors med mina nya 3600CL16,

Vad är chansen att minnena är trasiga jämfört med att CPU inte klarar FCLK 1800?

Permalänk
Medlem
Skrivet av LeVvE:

Körde memtest86 under natten och fick 2 errors med mina nya 3600CL16,

Vad är chansen att minnena är trasiga jämfört med att CPU inte klarar FCLK 1800?

Lägg upp en bild från RM så kan vi se lite vad som spökar, om möjligt ta en från HWiNFO med Ryzen sektionen synlig också. CLDO_VDDG, CLDO_VDDP och SoC spänning påverkar stabilitet en hel del vid 3600 och uppåt, kör man för låg eller hög på endera kan man få sporadiska fel.

Ett sätt att se ifall man har för låg SoC är att köra maximum heat torture test i prime95, det belastar cache mycket hårt och då det för över info via IO die hela tiden & minneskontrollern så sätts hela den delen av processorn under hård last samtidigt som kärnorna är under 100% load. Det gör att detta test är mycket bra för & se just ifall SoC är låg, large data sets kan vara bra & se generell minnesstabilitet. Sen kan man köra blend under längre tid ifall man vill vara 100% säker på stabilitet.

Sen har vi dram spänning och VDDP samt referens dram spänning som alla kan tweakas med gott resultat, något timing kan också vara hårt satt per auto

Edit: glömde fråga vilket moderkort du kör på?

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Hedersmedlem
Skrivet av LeVvE:

Körde memtest86 under natten och fick 2 errors med mina nya 3600CL16,

Vad är chansen att minnena är trasiga jämfört med att CPU inte klarar FCLK 1800?

Jag skulle testa att öka spänningen på minnet liten smula, typ till 1.37V. Kolla om detta gör skillnad.

Visa signatur

Stalin var så gammal att de fick Len´in. ;)

Permalänk
Medlem
Skrivet av tellus82:

Lägg upp en bild från RM så kan vi se lite vad som spökar, om möjligt ta en från HWiNFO med Ryzen sektionen synlig också. CLDO_VDDG, CLDO_VDDP och SoC spänning påverkar stabilitet en hel del vid 3600 och uppåt, kör man för låg eller hög på endera kan man få sporadiska fel.

Ett sätt att se ifall man har för låg SoC är att köra maximum heat torture test i prime95, det belastar cache mycket hårt och då det för över info via IO die hela tiden & minneskontrollern så sätts hela den delen av processorn under hård last samtidigt som kärnorna är under 100% load. Det gör att detta test är mycket bra för & se just ifall SoC är låg, large data sets kan vara bra & se generell minnesstabilitet. Sen kan man köra blend under längre tid ifall man vill vara 100% säker på stabilitet.

Sen har vi dram spänning och VDDP samt referens dram spänning som alla kan tweakas med gott resultat, något timing kan också vara hårt satt per auto

Edit: glömde fråga vilket moderkort du kör på?

Enda jag gjort är att aktivera XMP med manuell DRAM voltage för utan att sätta manuellt så var coldboot alltid 2133MHz.

Permalänk
Datavetare
Skrivet av tellus82:

En bild säger mer än tusen ord men jag läger till flertalet så kanske du förstår poängen, dessa bör innehålla allt du behöver veta och peak current draw här är alltså 95A, vilket är helt jävla bone stock under extrem belastning, det blir inte mer stock än så här.
https://i.imgur.com/r8z6bCZ.png
https://i.imgur.com/mYolAqn.png
https://i.imgur.com/WfM06fy.png
https://i.imgur.com/BarXH1n.png

Att du tycker det är löjligt att en VRM kan orsaka låga frekvenser säger en del om din kunskap i ämnet, sluta gör kopplingar som inte finns eller ignorera de som kan finnas.

Droppa neggo-aggresso-attityden tack, det gör det lite trevligare att vara här.

Att du inte råkar ha problemet är faktiskt inte bevis för att alla som eventuellt har ett problem är kompletta idioter... Och för de flesta lär Prime95 vara ett icke-problem oavsett (det är en rätt udda last som få kommer använda i praktiken). Själv råkar jag vara lite intresserad av orsak då jag delvis använder datorn till SGEMM/DGEMM laster (även om allt fler av dessa lämpar sig bättre för GPGPU, så lär nog bli ett icke-problem även för mig med tiden).

I overclock-tråden uppträdde detta problem på t.ex. Asus Strix X470-F, hipstergamer har samma beteende på ett Aorus X570 Ultra. Review hos ComputerBase verkar gjorts på MSI X570 Godlike, Overclockers använde MSI X570 Godlike & ASUS ROG Crosshair VIII Hero, TechPowerUp använde ASRock X570 Taichi. Ändå såg alla beteendet med att totaleffekt gick ned 20-30 W i Prime95,

De som rapporterar låga frekvenser i Prime95 och mätt effekt har just noterat egenheten att systemet drar mindre effekt i vad som borde vara ett stress test. Vad man kan förvänta sig är högre totaleffekt, eller om man slår i ström och/eller värmebarriärer, samma totaleffekt som t.ex. CB20 och Blender.

Du har konsekvent också ignorerat att fallet där jag inte når basfrekvens i DGEMM är fallet där uppmätt GFLOPS stämmer väldigt bra överens med Puget System (som använde sig av Gigabyte X570 AORUS ULTRA) mätningar. Slår man på PBO (som nog bör undvikas för just denna typ av last då det finns flera som rapporterat höga CPU-temperaturer och i vissa fall även instabilitet/omboot) ser man ju högre rapporterade frekvenser och högre faktiskt GFLOPS (även på mitt knäckebrödsmoderkort!).

Tycker du det verkar rimligt att en 3900X ska hamna marginellt efter 9900K i något som skalar i princip perfekt med CPU-kärnor och där 3900X har 50 % fler kärnor (det är vad Puget systems mätning visade)? Är samma teoretiska FLOPS/MHz i båda CPUern, men förutsätter i princip att Skylake har högre faktiskt kapacitet, men fördelen borde inte var stor.

Att du inte har problem är gissningsvis ett positivt tecken, det ökar chansen att de som har problem har det p.g.a. ett relativt generellt problem i nuvarande firmware.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av LeVvE:

Enda jag gjort är att aktivera XMP med manuell DRAM voltage för utan att sätta manuellt så var coldboot alltid 2133MHz.

https://i.imgur.com/GHIJbZK.png
https://i.imgur.com/SlayRpo.png

Din CLDO_VDDG är lite hög, inte galet men hög, kan sänkas till 1V eller om möjligt 0.95-0.975, din CLDO_VDDP är däremot hög rakt av och bör inte vara så hög, 0.9V är lagom på denna. SoC är lite låg istället och normalt brukar 1.1V behövas för 3600MT/s / 1800MHz men detta varierar från kisel till kisel, try & error som gäller och moderkort sätter inte dessa till bra värden per automatik även om de borde göra det. Sen har du RTT_WR satt till RZQ/3 och det bör vara OFF istället, likaså RTT_Park som är satt till RZQ/1, det bör vara RZQ/5 (48ohm). RTT kan dock vara lite moderkorts specifikt så inte alltid dessa gillas at ändras alls men rent generellt bör man bara köra RZQ/5 på RTT_Park

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Medlem
Skrivet av Yoshman:

Droppa neggo-aggresso-attityden tack, det gör det lite trevligare att vara här.

Att du inte råkar ha problemet är faktiskt inte bevis för att alla som eventuellt har ett problem är kompletta idioter... Och för de flesta lär Prime95 vara ett icke-problem oavsett (det är en rätt udda last som få kommer använda i praktiken). Själv råkar jag vara lite intresserad av orsak då jag delvis använder datorn till SGEMM/DGEMM laster (även om allt fler av dessa lämpar sig bättre för GPGPU, så lär nog bli ett icke-problem även för mig med tiden).

I overclock-tråden uppträdde detta problem på t.ex. Asus Strix X470-F, hipstergamer har samma beteende på ett Aorus X570 Ultra. Review hos ComputerBase verkar gjorts på MSI X570 Godlike, Overclockers använde MSI X570 Godlike & ASUS ROG Crosshair VIII Hero, TechPowerUp använde ASRock X570 Taichi. Ändå såg alla beteendet med att totaleffekt gick ned 20-30 W i Prime95,

De som rapporterar låga frekvenser i Prime95 och mätt effekt har just noterat egenheten att systemet drar mindre effekt i vad som borde vara ett stress test. Vad man kan förvänta sig är högre totaleffekt, eller om man slår i ström och/eller värmebarriärer, samma totaleffekt som t.ex. CB20 och Blender.

Du har konsekvent också ignorerat att fallet där jag inte når basfrekvens i DGEMM är fallet där uppmätt GFLOPS stämmer väldigt bra överens med Puget System (som använde sig av Gigabyte X570 AORUS ULTRA) mätningar. Slår man på PBO (som nog bör undvikas för just denna typ av last då det finns flera som rapporterat höga CPU-temperaturer och i vissa fall även instabilitet/omboot).

Tycker du det verkar rimligt att en 3900X ska hamna marginellt efter 9900K i något som skalar i princip perfekt med CPU-kärnor och där 3900X har 50 % fler kärnor (det är vad Puget systems mätning visade)? Är samma teoretiska FLOPS/MHz i båda CPUern, men förutsätter i princip att Skylake har högre faktiskt kapacitet, men fördelen borde inte var stor.

Min neggo attityd kommer sig av att du direkt anklagade mig och alla andra här för att blåljuga enbart för att du inte sett samma beteende på dina prylar & sen cherry pickade resultat från testare världen runt. Sen har du inte en gång bekräftat eller dementerat vad din CPU håller för temperatur under dina test eskapader och nu menar jag riktig Tdie temp & inte moderkortets CPU temp som kan vara precis vad som helst.

Om du slutar påstå att folk ljuger så kan jag vara trevlig annars kommer jag inte tilldela dig ett uns trevlighet.

Att folk ser lägre "effekt" alltså, watt beror på att det temp throttlar och ampere throttlar, detta gör att man får lägre vcore samtidigt som TDC griper in & håller processorn till 95A, det gör att beroende på vcore så kommer man sannolikt inte träffa 142W PPT utan falla kort från den. Kör du CBR20 exempelvis så kan processorn hålla högre vcore och samtidigt hålla upp mot 95A TDC eller till och med gå upp mot EDC beroende på temp förhållanden, detta gör att man ligger konstant mot PPT i CBR20.

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Medlem

@Yoshman:

Fråga: Vad är det du kör din 3900X på för bräda egentligen, klarar den kraven för en 3900X? Undrar också vilken kylare du har på den, är det stockkylaren (den som följer med)?

Permalänk
Skrivet av tellus82:

Dina RTT värden är lite fel, RTT_nom och RTT_wr bör bägge vara OFF och RTT_park ska vara RZQ/5 (48ohm), din VDDG är mycket för hög, du kan gott sänka den till 1V eller mindre ändå, 0.95-0.975V brukar vara lagom vid 3600MT/s / 1800MHz, din CLDO_VDDP är helt åt helvete för hög, sänk den till 0.9V direkt, möjligen 0.925V som mest, brukar man aldrig behöva pilla på och så hög som du har där är på intet sätt bra. Din ProcODT kan vara lite låg med 4 moduler så du kan prova att gå upp till 40 eller mer.

Hmm såg ditt andra inlägg om cldo_vddp och cldovdd.
Kollade mina värden och såg att dom också var för höga.
Intressant då det enda jag ändrat i bios är att slå på pbo, xmp och justerat flältkurvan.

Har också ett msi x570 med senaste beta abba bios, det kanske är den som spökar?

Kan för höga värden av cldo_vddp och cldo_vddg orsaka bluescreens? Fick ett par igår som jag inte hade med tidigare stabila bios

Skickades från m.sweclockers.com

Visa signatur

Fractal Design Define S | AMD Ryzen 3700x |Dark Rock pro 4| MSI x570 Gaming Edge WIFI | Corsair LPX 32GB | AMD RX 5700 XT |

Permalänk
Medlem
Skrivet av trisse_123:

Hmm såg ditt andra inlägg om cldo_vddp och cldovdd.
Kollade mina värden och såg att dom också var för höga.
Intressant då det enda jag ändrat i bios är att slå på pbo, xmp och justerat flältkurvan.

Har också ett msi x570 med senaste beta abba bios, det kanske är den som spökar?

Kan för höga värden av cldo_vddp och cldo_vddg orsaka bluescreens? Fick ett par igår som jag inte hade med tidigare stabila bios

Skickades från m.sweclockers.com

Ja för höga spänningar kan definitivt orsaka blåskärmar, ingen tvekan alls. Speciellt SoC, CLDO_VDDG och CLDO_VDDP

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Medlem
Skrivet av tellus82:

Ja för höga spänningar kan definitivt orsaka blåskärmar, ingen tvekan alls.

Mixtrade lite i går att försöka sänka DRAM voltage på min 3600MT/s setup och det blev också fina sporadiska blåskärmar, jag är tillbaka på DRAM volt 1.4 men hoppas jag slipper höja mer.

1.37 volt etc som vissa här verkar kunna köra sina minnen på i 3600-3800MT/s är bara att fetglömma för mig, det beror nog väldigt mycket på vilket minne och binning man har men kanske även på moderkortet. (samt självklart även på vilka timings man försöker sig på)

Inte mixtrat med SoC ännu, kör 1.1 men ska väl roa mig med att försöka sänka den.

Permalänk
Medlem
Skrivet av hipstergamer:

För mig verkar inte Prime95 kunna kräma ur mycket stress alls ur min 3900X. All-core boost går inte högre än 3700, detta på alla stresstest man kan välja. Använder jag fel version eller är det inställningar jag måste ändra?

https://i.imgur.com/tVgHNX8.png

Skrivet av Yoshman:

Du ser med andra ord exakt det jag ser med Octave/OpenBLAS körandes SGEMM/DGEMM: i "ren stock" kan inte 3900X hålla basfrekvens i AVX/FMA laster.

Det är rätt många som rapporterat samma problem. Finns en del "men min maskin håller minsan >3,8 GHz", men verkar som de flesta (antagligen alla) som får detta resultat missat delen med "ren stock". Många high-end moderkort verkar ha AutoAC påslaget som förval och många användare har testat med PBO aktiverat trots att frågan handlar om "stock".

Här är ett exempel på någon som endast ser 3,6 GHz i Prime95 i "stock". Är ungefär vad jag ser i DGEMM, Prime95 ligger faktiskt lite högre, runt 3,7 GHz vilket är vad du också verkar se.

Jag ser >3,8 GHz om jag slår på PBO (både för Prime95 och Octave (båda för Linux)). Har inte lämnat systemet körandes DGEMM speciellt länge, men verkar som vissa sett att deras system helt sonika bootar om efter ett tag om de kör med PBO aktiverat när de kör Prime95 "Small FFTs" (som är den elakaste varianten, "Smallest FFTs" är inte fullt lika elakt).

Precis som Overclocker, TechPowerUp och ComputerBase ser alla dessa precis det jag ser (vet inte om du mätt effekt från väggen): systemet drar mindre ström i AVX/FMA tunga laster som Prime95 jämfört med t.ex. Blender, CB20 och i mitt fall även kompilering.

Har laddat ner källkoden till Prime95 och specifikt kikat på filen prime95/factor64.mac. Många säger "AVX2" men så vitt jag ser finns ingen AVX2 där (AVX2 är primärt 256-bitars vektorinstruktioner för heltal), utan det är AVX/FMA d.v.s. exakt samma typ av instruktioner som OpenBLAS kommer köra vid SGEMM/DGEMM.

TL;DR över kring detta verkar vara att även om AMDs uttalande om att Zen2 inte har en AVX-offset frekvens likt Linux är tekniskt korrekt, så verkar det tyvärr vara så att just nu fixar inte 3900X ens basfrekvens i AVX/FMA laster i "stock" utförande. Lär visa sig om det är ett HW-problem eller om även detta är ett firmwareproblem. Värt att notera är att 3700X drar ungefär samma effekt i Prime95 som andra tunga laster, 3600 drar mer i Prime95, så 3900X sticker ut med att dra 20-30 W mindre i Prime95.

Ser ut som man hamnar i TDC begränsningen på 95A då... På min ASUS C7H bräda kan jag köra 3.8 GHZ i stock med stock-kylaren... men på den fungerar inte TDC, visar i stort sett 0 oberoende av last.

Rapporterad VRM-ström ökar med temperaturen på processorn och den överstiger 95A rätt ordentligt efter en stunds körning av dgemm:

i början:

$ sensors | grep CPU CPU Core Voltage: +1.06 V CPU SOC Voltage: +1.06 V CPU Core Voltage: +1.07 V CPU SOC Voltage: +1.08 V CPU Fan: 1906 RPM CPU OPT: 0 RPM CPU Temperature: +63.0°C CPU Socket Temperature: +41.0°C CPU VRM Temperature: +35.0°C CPU VRM Output Current: +97.00 A

Efter en stunds körning:

$ sensors | grep CPU CPU Core Voltage: +1.07 V CPU SOC Voltage: +1.06 V CPU Core Voltage: +1.09 V CPU SOC Voltage: +1.08 V CPU Fan: 2872 RPM CPU OPT: 0 RPM CPU Temperature: +82.0°C CPU Socket Temperature: +61.0°C CPU VRM Temperature: +53.0°C CPU VRM Output Current: +105.00 A

Resultatet från körningen:

$ ./dgemm3.m From 8000 To 40000 Step=4000 Loops=2 SIZE FLOPS TIME 8000x8000 : 480.19 GFlops 4.264969 sec 12000x12000 : 520.37 GFlops 13.282753 sec 16000x16000 : 513.37 GFlops 31.914848 sec 20000x20000 : 529.94 GFlops 60.384750 sec 24000x24000 : 527.48 GFlops 104.830872 sec 28000x28000 : 531.57 GFlops 165.185028 sec 32000x32000 : 532.28 GFlops 246.248505 sec 36000x36000 : 534.82 GFlops 348.949265 sec 40000x40000 : 534.56 GFlops 478.902863 sec

Som synes så ligger den på 3.8 GHz hela tiden:

..men det är inga marginaler, har inte fått chassit ännu, så står på sin kartong fortfarande.

Permalänk
Medlem

Jag sitter och hoppas på att det kommer en Threadripper-version av 3000-serien. Med tanke på att Epyc 7742 visar intressanta siffror i Passmark så finns det en chans att det kan bli intressanta prestanda om en Threadripper kommer.

Permalänk
Medlem

@SAFA:

Kör du stock & PB?

Är ju klart Ampere limiterad där för CPU, 97A & 105A! Du kör ju i taket för TDC där. Är ju 95A stock om man inte aktiverar PBO och man får det att faktiskt fungera.
PBO har en del konstigheter inbyggt som inte släpper din CPU fri oavsett om den når eller inte nåt dina gränser på PPT, TDC & EDC eller temperatur.

AVX2, AVX är mycket Ampere hungriga och drar upp temperaturen hårt på dessa cpu:er. De klockar då ner sig ganska kraftigt.

Permalänk
Medlem
Skrivet av Nighthog:

@SAFA:

Kör du stock & PB?

Är ju klart Ampere limiterad där för CPU, 97A & 105A! Du kör ju i taket för TDC där. Är ju 95A stock om man inte aktiverar PBO och man får det att faktiskt fungera.
PBO har en del konstigheter inbyggt som inte släpper din CPU fri oavsett om den når eller inte nåt dina gränser på PPT, TDC & EDC eller temperatur.

AVX2, AVX är mycket Ampere hungriga och drar upp temperaturen hårt på dessa cpu:er. De klockar då ner sig ganska kraftigt.

Du kan se över 95A även i ren stock om PB kan gå upp mot EDC, det beror på belastning, temp och spänningar, även i Prime95 kan man se detta beteende när det byter beräkning och man ser en "lättare" belastning medans beräkningen förbereds, load är konstant 100% men vad det belastar skiljer sig en del. Därför kan processorn kliva över TDC om förhållanden tillåter det även under riktigt grisig last då få om några beräkningar är 100% konstanta även om load är 100% all core.

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Medlem

@tellus82:

Har inte personligen sett att de går över de satta värdena, de är och bör vara "hårda" och inte överskridas. Dock kan det finnas viss feltolerans på de avlästa värdena. Har inte sett något Moderkort som är helt korrekt i värdena den avger för en i HWiNFO. Har sett att de blir fel om man kör OC på olika sätt mot stock som oftast är ganska rimligt.

De gränser som ses i Ryzen Master är nog mer korrekta på PPT, TDC & EDC. Om de slår ä taket så slår de i taket och processorn begränsas på i varierande grad. Dock går det för Moderkortsmakarna att "trixa" med värdena som man sett Asus gjorde vid launch men sedan korrigerade till större grad.

PBO ska ju kunna justera gränserna men det är buggigt och fungerar inte på ett enkelt sätt som man skulle tro. Beroende på hur du sätter saker i AMD_CBS & AMD_OVERCLOCKING beter det sig på mycket varierande sätt. Oftast till negativ grad att det blir sämre än stock.
Advanced & Manuel är inte enkelt att få fungera bra.

Permalänk
Medlem
Skrivet av Nighthog:

@tellus82:

Har inte personligen sett att de går över de satta värdena, de är och bör vara "hårda" och inte överskridas. Dock kan det finnas viss feltolerans på de avlästa värdena. Har inte sett något Moderkort som är helt korrekt i värdena den avger för en i HWiNFO. Har sett att de blir fel om man kör OC på olika sätt mot stock som oftast är ganska rimligt.

De gränser som ses i Ryzen Master är nog mer korrekta på PPT, TDC & EDC. Om de slår ä taket så slår de i taket och processorn begränsas på i varierande grad. Dock går det för Moderkortsmakarna att "trixa" med värdena som man sett Asus gjorde vid launch men sedan korrigerade till större grad.

PBO ska ju kunna justera gränserna men det är buggigt och fungerar inte på ett enkelt sätt som man skulle tro. Beroende på hur du sätter saker i AMD_CBS & AMD_OVERCLOCKING beter det sig på mycket varierande sätt. Oftast till negativ grad att det blir sämre än stock.
Advanced & Manuel är inte enkelt att få fungera bra.

Jo upp mot EDC kan det gå, det är helt tveklöst, om belastning & temp tillåter det, annars skulle inte EDC finnas till att börja med.

Här syns en timmes Prime95 körning och ett par intressanta saker visar sig, dels att jag fått ett par drops så lågt som 3750MHz och en ner till 3725MHz men samtidigt har jag peakar på upp till 4225MHz, detta alltså 100% load i konstant Prime95 torture test maximum heat. Det jag finner mer intressant är att snitt hastighet under 1 timme ligger på strax över 3800MHz vilket är precis vad den ska ligga på. Sen kan man se att i snitt håller sig min processor till just TDC men med peakar upp mot ~105A och dalar ner mot ~80A men i snitt ligger den praktiskt taget på just TDC. Peakar och dalar såg ut att ske just i byte av beräkning när en är färdig & nästa förbereds medans det låg rätt stadigt under själva beräkningen när ingen tråd var i process att starta en ny beräkning.

Det som visas här i HWiNFO motsvarar nästan exakt det som ampere klampning visar & effekt mätning före psu så jag har få orsaker att misstro detta.

Edit: Ta också med i beräkningen att jag har en mycket hög SoC här på 1.125V, detta påverkar också frekvenser negativt.

Edit2: Detta med rumstemp på 24,7 C

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Medlem

Det är alldeles för många "PBO" val i bios, särskilt med tanke på att dom flesta har tveksam real world funktionalitet .

Skickades från m.sweclockers.com

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Permalänk
Medlem
Skrivet av tellus82:

Min neggo attityd kommer sig av att du direkt anklagade mig och alla andra här för att blåljuga enbart för att du inte sett samma beteende på dina prylar & sen cherry pickade resultat från testare världen runt. Sen har du inte en gång bekräftat eller dementerat vad din CPU håller för temperatur under dina test eskapader och nu menar jag riktig Tdie temp & inte moderkortets CPU temp som kan vara precis vad som helst.

Om du slutar påstå att folk ljuger så kan jag vara trevlig annars kommer jag inte tilldela dig ett uns trevlighet.

Att folk ser lägre "effekt" alltså, watt beror på att det temp throttlar och ampere throttlar, detta gör att man får lägre vcore samtidigt som TDC griper in & håller processorn till 95A, det gör att beroende på vcore så kommer man sannolikt inte träffa 142W PPT utan falla kort från den. Kör du CBR20 exempelvis så kan processorn hålla högre vcore och samtidigt hålla upp mot 95A TDC eller till och med gå upp mot EDC beroende på temp förhållanden, detta gör att man ligger konstant mot PPT i CBR20.

Fråga till Yoshman / Tellus - Beteendet låter som en flaskhals någonstans i systemet, vilket får CPUn att gå in i en waitstate, vilket ser så klart ut som 100% belastning, men power draw går ner, så vi vet CPUn använder inte alla transistorer.(vi har diskuterat detta tidigare ang OpenBLAS). Vi vet att Ryzen3 CPUerna har bara halva minnesbandbredd för writes. Kan det vara så denna specifika load skapar många writes av den typen som kommer maxxa transaktionshastigheten (inte nödvändigtvis bandbredd) av minnena hos de olika testarna? Det behövs inte stor skillnad i minnesoptimering mellan någon som får ca 3600 Mhz och någon som får 3900 Mhz, och vi vet att Tellus har pli på sina minnen. Förslag - Tellus - Orkar du köra om testet i något fånigt som 2133 Mhz o se resultatet?

Tack!

Permalänk
Medlem

@ehsnils: TR4-3 är basically bekräftad, kommer i två olika varianter, en som är "som 1 & 2" med 4 kanaler / 32 Cores, och en med 8 kanaler / mer cores. Den senare är typ en rakt av högre klockad EPYC. Inga datum, men officiella stats / announcement förväntas innan årets slut, min gissning Oktober, cirka när Intel kommer släppa Comet Lake - X refresh av -X serien.

Permalänk
Medlem
Skrivet av DJ_Datte:

Fråga till Yoshman / Tellus - Beteendet låter som en flaskhals någonstans i systemet, vilket får CPUn att gå in i en waitstate, vilket ser så klart ut som 100% belastning, men power draw går ner, så vi vet CPUn använder inte alla transistorer.(vi har diskuterat detta tidigare ang OpenBLAS). Vi vet att Ryzen3 CPUerna har bara halva minnesbandbredd för writes. Kan det vara så denna specifika load skapar många writes av den typen som kommer maxxa transaktionshastigheten (inte nödvändigtvis bandbredd) av minnena hos de olika testarna? Det behövs inte stor skillnad i minnesoptimering mellan någon som får ca 3600 Mhz och någon som får 3900 Mhz, och vi vet att Tellus har pli på sina minnen. Förslag - Tellus - Orkar du köra om testet i något fånigt som 2133 Mhz o se resultatet?

Tack!

Tja, helt omöjligt är det inte, tyvärr får jag inte Octave att belasta hela processorn själv så jag får lite svårt att prova just detta, hur jag än gör vill inte octave nyttja mer än max 40% av processorns kärnor/trådar och någon lust att multiboota har jag inte heller direkt. Rent praktiskt borde dock inte en 3900x vara fullt så påverkad av writes men om det begränsas av single ccd writes även på en 3900x så kan det ligga en del i det, det kan även vara något cache specifikt som ligger till grund för det.

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Medlem
Skrivet av tellus82:

Jo upp mot EDC kan det gå, det är helt tveklöst, om belastning & temp tillåter det, annars skulle inte EDC finnas till att börja med.

Här syns en timmes Prime95 körning och ett par intressanta saker visar sig, dels att jag fått ett par drops så lågt som 3750MHz och en ner till 3725MHz men samtidigt har jag peakar på upp till 4225MHz, detta alltså 100% load i konstant Prime95 torture test maximum heat. Det jag finner mer intressant är att snitt hastighet under 1 timme ligger på strax över 3800MHz vilket är precis vad den ska ligga på. Sen kan man se att i snitt håller sig min processor till just TDC men med peakar upp mot ~105A och dalar ner mot ~80A men i snitt ligger den praktiskt taget på just TDC. Peakar och dalar såg ut att ske just i byte av beräkning när en är färdig & nästa förbereds medans det låg rätt stadigt under själva beräkningen när ingen tråd var i process att starta en ny beräkning.

https://i.imgur.com/DbyJbUO.png

Det som visas här i HWiNFO motsvarar nästan exakt det som ampere klampning visar & effekt mätning före psu så jag har få orsaker att misstro detta.

Edit: Ta också med i beräkningen att jag har en mycket hög SoC här på 1.125V, detta påverkar också frekvenser negativt.

Edit2: Detta med rumstemp på 24,7 C

Det är just CPU Core Current (SVI2 TFN) som inte är alltid rätt för ens moderkort i HWiNFO beroende på modell.
Med Aorus Xtreme måste jag justera värdet 1.50x för att hamna nära vad TDC i Ryzen Master avger annars är det totalt fel, visar för lite.
Enda värdet som alltid är korrekt är CPU Package Power (SMU) resten har jag sett blir fel eller är fel standard eller med OC.
EDC har jag inte sett att hur jag ska tolka vad det är gräns för, har bara sett den nå sin gräns stock med PB i Ryzen Master med AVX last före de andra värdena. Den Maxar då ganska enkelt. Dock verkar inte justering på EDC hjälpa för att ge bättre prestanda i de fall jag försökte en tid tillbaka. Inte testat med ABBA än dock om det var fixat.

Permalänk
Medlem
Skrivet av tellus82:

Tja, helt omöjligt är det inte, tyvärr får jag inte Octave att belasta hela processorn själv så jag får lite svårt att prova just detta, hur jag än gör vill inte octave nyttja mer än max 40% av processorns kärnor/trådar och någon lust att multiboota har jag inte heller direkt. Rent praktiskt borde dock inte en 3900x vara fullt så påverkad av writes men om det begränsas av single ccd writes även på en 3900x så kan det ligga en del i det, det kan även vara något cache specifikt som ligger till grund för det.

Fast menade inte Yoshman att samma sak händer i Prime95 /m small FFT (AVX/FMA load)? Testa i Prime?

Permalänk
Medlem
Skrivet av Nighthog:

Det är just CPU Core Current (SVI2 TFN) som inte är alltid rätt för ens moderkort i HWiNFO beroende på modell.
Med Aorus Xtreme måste jag justera värdet 1.50x för att hamna nära vad TDC i Ryzen Master avger annars är det totalt fel, visar för lite.
Enda värdet som alltid är korrekt är CPU Package Power (SMU) resten har jag sett blir fel eller är fel standard eller med OC.
EDC har jag inte sett att hur jag ska tolka vad det är gräns för, har bara sett den nå sin gräns stock med PB i Ryzen Master med AVX last före de andra värdena. Den Maxar då ganska enkelt. Dock verkar inte justering på EDC hjälpa för att ge bättre prestanda i de fall jag försökte en tid tillbaka. Inte testat med ABBA än dock om det var fixat.

Nä avläsning kan variera rätt duktigt från hårdvara till hårdvara men interna avläsningen i processorn felar sällan och SVi2 är just intern avläsning i processorn, inte moderkortet, långt mer troligt att uppgivna ampere värden är galna och det är därför som PPT kan bli tokigt i förhållande till vad vcore är och vad ampere egentligen är, PPT är egentligen Package Power rapporterat av SMU och inte CPU+SoC via SVI2

Edit: missförstod dig lite/ läste för fort, att det visar fel ampere värden är inte ovanligt som du säger även på SVi2, spänning däremot visar sällan fel och PPT verkar för det mesta visas korrekt även den.

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Medlem
Skrivet av DJ_Datte:

Fast menade inte Yoshman att samma sak händer i Prime95 /m small FFT (AVX/FMA load)? Testa i Prime?

Nej att all FMA/AVX last reagerar lika kan vi lägga därhän på en gång för det gör det inte, det blir extremt beroende på storlek på jobb och vilken typ av beräkning som utförs, just DGEMM verkar vara en smula speciell med hur det belastar processorn så att dra slutsatser från det & applicera på all AVX/FMA fungerar helt enkelt inte.

Det jag däremot vet själv är att spännigar har en direkt inverkan på hur PB beter sig, alltså stock Precision Boost, sätter jag en högre SoC spänning så kommer frekvenser tryckas ner, sätter jag en hög CLDO_VDDG så kommer frekvenser tryckas ner, detta då bägge dessa ökar temp och effektuttag. Inga massiva skillnader men definitivt mätbara skillnader. Sen ska vi inte glömma vcore, den har en enorm inverkan på hur en stock Zen2 boostar eller inte boostar, för hög eller låg & du kommer se riktigt låga frekvenser, samma om man har massiv vdroop eller rippel på vcore, då kan boost bete sig mycket märkligt och är det något som kan orsaka droop & rippel så är det grisig all core last i form av FMA/AVX, speciellt på enklare moderkort eller felinställda high end bord.

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Datavetare
Skrivet av tellus82:

Min neggo attityd kommer sig av att du direkt anklagade mig och alla andra här för att blåljuga enbart för att du inte sett samma beteende på dina prylar & sen cherry pickade resultat från testare världen runt. Sen har du inte en gång bekräftat eller dementerat vad din CPU håller för temperatur under dina test eskapader och nu menar jag riktig Tdie temp & inte moderkortets CPU temp som kan vara precis vad som helst.

Om du slutar påstå att folk ljuger så kan jag vara trevlig annars kommer jag inte tilldela dig ett uns trevlighet.

Att folk ser lägre "effekt" alltså, watt beror på att det temp throttlar och ampere throttlar, detta gör att man får lägre vcore samtidigt som TDC griper in & håller processorn till 95A, det gör att beroende på vcore så kommer man sannolikt inte träffa 142W PPT utan falla kort från den. Kör du CBR20 exempelvis så kan processorn hålla högre vcore och samtidigt hålla upp mot 95A TDC eller till och med gå upp mot EDC beroende på temp förhållanden, detta gör att man ligger konstant mot PPT i CBR20.

Chilla mannen. Fakta är att den enda som anklagat någon för att ljuga i denna diskussion är du själv. Jag har pekat på att de förklaringar du gett inte är konsekvent med all data som redan fanns tillgänglig i diskussionen, om du tar det som ett personangrepp kanske du bör fundera om du kanske inte har en ohälsosam känslomässig kopplig till AMD...

OK. Anta att det temperatur- eller ström-throttlar. Givet termodynamikens första huvudsats och det faktum att all tillförd elenergi till en CPU kommer bli värme.

Och för att ta ur mitt "knäckebrödsmoderkort" ur ekvationen, låt oss enbart tittat på resultatet som bl.a. TechPowerUp, ComputerBase och Overclockers fick i sina 3900X tester där Prime95 resulterade i 20-30 W lägre effekt än andra inte alls lika AVX-tunga laster.

Hur förklarar man då att CPUn drar 20-30 W längre i vad som borde vara ett stresstest? Om det är TDC (95A) som sätter gränsen, vilket är fullt möjligt, varför ser man då inte samma uppmätt effekt i CB20/Blender som i Prime95? Fysiken säger att det kan bara finnas ett par möjliga förklaringen

  • Enda drar Prime95 mindre än 95A eller så drar Blender/CB20 mer än 95A (i så fall varför går man över den gränsen här?)

  • Skulle också kunna vara så att Vcore är betydligt lägre när man kör Prime95 då effekt är P = U * I, kanske är förklaringen och kanske bara är vissa moderkort där detta händer?

  • Den trista förklaringen skulle vara att effekten i Prime95 genereras i en väldigt liten del av kretsen så att flaskhalsen blir hur fort utvecklad värme kan transporteras bort. Det som gör denna förklaring osannolik är att alla system borde se samma effekt här och lite svårt att förklara hur aktivering PBO/AutoOC då kan ge högre frekvens.

Det som gör det hela ännu lurigare att förstå är att TechPowerUp och ComputerBase även testat 3600 och 3700X. Dessa två CPUer uppför sig inte som 3900X, utan där får man det mer väntade utfallet att Prime95 drar lika eller mer effekt jämfört med CB20/Blender.

Jag är noll intresse av att irritera dig, jag vill bara försöka förstå det observerade beteendet. Hade det varit isolerat till mitt system hade jag utan omsvep köpt förklaringen att moderkortet är flaskhalsen. Problemet är det finns fall där man ser samma sak med high-end X570 moderkort.

Skrivet av makatech:

@Yoshman:

Fråga: Vad är det du kör din 3900X på för bräda egentligen, klarar den kraven för en 3900X? Undrar också vilken kylare du har på den, är det stockkylaren (den som följer med)?

Det är ett riktigt cheepo-moderkort, ASRock AB350M Pro4. Då det är ett 300-serien chipset finns inget krav från AMD att det ska fungera, det är upp till moderkortstillverkarna att avgöra. 3900X är med på listad över officiellt stödda CPU-modeller.

Kör också med stockkylaren, mest för att jag har datorn i en bra bit från där jag sitter så kvittar att CPU-fläkten går på högvarv (har ställt in en väldigt aggressiv fläktkurva). Systemet står faktiskt i ett kylt serverrum, IR-bilder visar att värme knappast är ett problem här. Bilder finns länkade i detta inlägg, varmaste området kring VRM när man kör Octave/DGEMM-loop är under 60°C då luften är AC-kyld.

Skrivet av SAFA:

Ser ut som man hamnar i TDC begränsningen på 95A då... På min ASUS C7H bräda kan jag köra 3.8 GHZ i stock med stock-kylaren... men på den fungerar inte TDC, visar i stort sett 0 oberoende av last.

Rapporterad VRM-ström ökar med temperaturen på processorn och den överstiger 95A rätt ordentligt efter en stunds körning av dgemm:

i början:

$ sensors | grep CPU CPU Core Voltage: +1.06 V CPU SOC Voltage: +1.06 V CPU Core Voltage: +1.07 V CPU SOC Voltage: +1.08 V CPU Fan: 1906 RPM CPU OPT: 0 RPM CPU Temperature: +63.0°C CPU Socket Temperature: +41.0°C CPU VRM Temperature: +35.0°C CPU VRM Output Current: +97.00 A

Efter en stunds körning:

$ sensors | grep CPU CPU Core Voltage: +1.07 V CPU SOC Voltage: +1.06 V CPU Core Voltage: +1.09 V CPU SOC Voltage: +1.08 V CPU Fan: 2872 RPM CPU OPT: 0 RPM CPU Temperature: +82.0°C CPU Socket Temperature: +61.0°C CPU VRM Temperature: +53.0°C CPU VRM Output Current: +105.00 A

Resultatet från körningen:

$ ./dgemm3.m From 8000 To 40000 Step=4000 Loops=2 SIZE FLOPS TIME 8000x8000 : 480.19 GFlops 4.264969 sec 12000x12000 : 520.37 GFlops 13.282753 sec 16000x16000 : 513.37 GFlops 31.914848 sec 20000x20000 : 529.94 GFlops 60.384750 sec 24000x24000 : 527.48 GFlops 104.830872 sec 28000x28000 : 531.57 GFlops 165.185028 sec 32000x32000 : 532.28 GFlops 246.248505 sec 36000x36000 : 534.82 GFlops 348.949265 sec 40000x40000 : 534.56 GFlops 478.902863 sec

Som synes så ligger den på 3.8 GHz hela tiden:
https://imgur.com/pv9UN3K.png
..men det är inga marginaler, har inte fått chassit ännu, så står på sin kartong fortfarande.

Aktiverar jag PBO håller sig frekvensen >=3,8 GHz även för mig. Ska man tro siffrorna du mäter här drar det ju 105A, inte 95A, så det kan förklara det hela.

Kravet för AM4 när det används ihop med en 105 W TDP CPU är att

  • PPT på minst 142W

  • TDC på minst 95A

Den enda egentliga fråga jag initialt stälde vad: vad betyder AMDs "basfrekvens", kan man t.ex. anta att ett system som uppfyller ovan kan hålla minst basfrekvens i AVX/FMA laster?

Har lite svårt att förstå varför vissa här verkar ta en sådan fråga som en personlig förolämplig. Om det känns bättre så lovar t.ex. inte Intel att deras CPUer fixar basfrekvens om AVX512 används, det som garanteras är minst basfrekvens minus offset. AMD har ju påpekat att 3000-serien inte har en AVX-offset, så då infinner sig just frågan: vad säger egentligen basfrekvensen?

Skrivet av tellus82:

Nej att all FMA/AVX last reagerar lika kan vi lägga därhän på en gång för det gör det inte, det blir extremt beroende på storlek på jobb och vilken typ av beräkning som utförs, just DGEMM verkar vara en smula speciell med hur det belastar processorn så att dra slutsatser från det & applicera på all AVX/FMA fungerar helt enkelt inte.

Flippa inte över detta nu, men vill bara belysa att DGEMM (och SGEMM) inte på något sätt är "en smula speciellt". Det är tvärtom den största orsaken till varför CPUer idag har SIMD och FMA och orsaken till varför GPUer fungerar som de gör.

Matrismultiplikation följer detta

vad det översätts till om man har AVX/FMA är en serie av FMA-instruktioner helt utan hopp. Ju större matriser, ju längre blir serien av FMA.

Detta är orsaken till att man kan nå så extremt nära teoretisk maximal GFLOPS även i praktiken. Skylake-S når med bibliotek som OpenBLAS och MKL >=95 % av sitt teoretiska max.

Och var egentligen här jag började reagera när jag såg resultatet Puget Systems fick.
9900K presterar >95 % av sitt teoretiska max där.
9900X presterar ~80 % av teoretisk max om man räknar med basfrekvens, men då den kör AVX512 är faktiskt frekvens lägre.
2990WX presterar ~80 % av teoretisk max
3900X får endast 67 % av teoretisk max!!!

Kör jag DGEMM på en kärna och multiplicerar det med 12 (antalet kärnor då multiplikation av stora matriser skalar nära nog perfekt både med SIMD-lanes och kärnor) får man en mer rimlig 85 % av teoretisk max räknat mot basfrekvens och 77 % mot uppmätt frekvens. 75-80 % av teoretisk max känns som vad man skulle kunna förvänta sig, det är i nivå med Haswell som var Intels första AVX/FMA design.

Men finns en viktig teknisk skillnad i hur Prime95 använder AVX/FMA jämfört med SGEMM/DGEMM, en skillnad som kan förklara varför Skylake ser högre värmeutveckling i Prime95 men det kan inte förklara eventuella skillnader för Zen2.

"Huvudloopen" för DGEMM är en serien FMA. Det finns två sådana ALUs i Skylake medan Zen/Zen+/Zen2 kombinerar en MUL med en ADD kapabel pipeline för att få en FMA. Finns totalt fyra flyttalspipeliens i Zen/Zen2, så när två FMA körs är alla fyra pipelines upptagna.

Så för Zen/Zen2 borde Prime95 och SGEMM/DGEMM belasta rätt likvärdigt, om något lastar Prime95 lite mindre då ungefär var 3:e instruktion är en ADD/SUB som då bara låser upp två av fyra pipliens, koden är i grunden en lång serie av FMA/FMA/ADD/FMA/FMA/ADD... i Prime95.

För Intel hanteras SUB/ADD i en separat pipeline från FMA, så SGEMM/DGEMM kan egentligen bara utnyttja två av tre pipelines men Prime95 passar precis så att alla tre pipelines hela tiden kan jobba -> mer transistorer aktiveras!

Prime95 är en hyfsat "speciell" arbetslast. SGEMM/DGEMM är exakt vad SSE/AVX/FMA designades för!

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Jag har inte lyckas få min CPU under 4050 Mhz vad är det för last jag ska försöka på för att den skall gå under detta?

Permalänk
Medlem
Skrivet av Yoshman:

Chilla mannen. Fakta är att den enda som anklagat någon för att ljuga i denna diskussion är du själv. Jag har pekat på att de förklaringar du gett inte är konsekvent med all data som redan fanns tillgänglig i diskussionen, om du tar det som ett personangrepp kanske du bör fundera om du kanske inte har en ohälsosam känslomässig kopplig till AMD...

OK. Anta att det temperatur- eller ström-throttlar. Givet termodynamikens första huvudsats och det faktum att all tillförd elenergi till en CPU kommer bli värme.

Och för att ta ur mitt "knäckebrödsmoderkort" ur ekvationen, låt oss enbart tittat på resultatet som bl.a. TechPowerUp, ComputerBase och Overclockers fick i sina 3900X tester där Prime95 resulterade i 20-30 W lägre effekt än andra inte alls lika AVX-tunga laster.

Hur förklarar man då att CPUn drar 20-30 W längre i vad som borde vara ett stresstest? Om det är TDC (95A) som sätter gränsen, vilket är fullt möjligt, varför ser man då inte samma uppmätt effekt i CB20/Blender som i Prime95? Fysiken säger att det kan bara finnas ett par möjliga förklaringen

  • Enda drar Prime95 mindre än 95A eller så drar Blender/CB20 mer än 95A (i så fall varför går man över den gränsen här?)

  • Skulle också kunna vara så att Vcore är betydligt lägre när man kör Prime95 då effekt är P = U * I, kanske är förklaringen och kanske bara är vissa moderkort där detta händer?

  • Den trista förklaringen skulle vara att effekten i Prime95 genereras i en väldigt liten del av kretsen så att flaskhalsen blir hur fort utvecklad värme kan transporteras bort. Det som gör denna förklaring osannolik är att alla system borde se samma effekt här och lite svårt att förklara hur aktivering PBO/AutoOC då kan ge högre frekvens.

Det som gör det hela ännu lurigare att förstå är att TechPowerUp och ComputerBase även testat 3600 och 3700X. Dessa två CPUer uppför sig inte som 3900X, utan där får man det mer väntade utfallet att Prime95 drar lika eller mer effekt jämfört med CB20/Blender.

Jag är noll intresse av att irritera dig, jag vill bara försöka förstå det observerade beteendet. Hade det varit isolerat till mitt system hade jag utan omsvep köpt förklaringen att moderkortet är flaskhalsen. Problemet är det finns fall där man ser samma sak med high-end X570 moderkort.

Det är ett riktigt cheepo-moderkort, ASRock AB350M Pro4. Då det är ett 300-serien chipset finns inget krav från AMD att det ska fungera, det är upp till moderkortstillverkarna att avgöra. 3900X är med på listad över officiellt stödda CPU-modeller.

Kör också med stockkylaren, mest för att jag har datorn i en bra bit från där jag sitter så kvittar att CPU-fläkten går på högvarv (har ställt in en väldigt aggressiv fläktkurva). Systemet står faktiskt i ett kylt serverrum, IR-bilder visar att värme knappast är ett problem här. Bilder finns länkade i detta inlägg, varmaste området kring VRM när man kör Octave/DGEMM-loop är under 60°C då luften är AC-kyld.

Aktiverar jag PBO håller sig frekvensen >=3,8 GHz även för mig. Ska man tro siffrorna du mäter här drar det ju 105A, inte 95A, så det kan förklara det hela.

Kravet för AM4 när det används ihop med en 105 W TDP CPU är att

  • PPT på minst 142W

  • TDC på minst 95A

Den enda egentliga fråga jag initialt stälde vad: vad betyder AMDs "basfrekvens", kan man t.ex. anta att ett system som uppfyller ovan kan hålla minst basfrekvens i AVX/FMA laster?

Har lite svårt att förstå varför vissa här verkar ta en sådan fråga som en personlig förolämplig. Om det känns bättre så lovar t.ex. inte Intel att deras CPUer fixar basfrekvens om AVX512 används, det som garanteras är minst basfrekvens minus offset. AMD har ju påpekat att 3000-serien inte har en AVX-offset, så då infinner sig just frågan: vad säger egentligen basfrekvensen?

Flippa inte över detta nu, men vill bara belysa att DGEMM (och SGEMM) inte på något sätt är "en smula speciellt". Det är tvärtom den största orsaken till varför CPUer idag har SIMD och FMA och orsaken till varför GPUer fungerar som de gör.

Matrismultiplikation följer detta
https://wikimedia.org/api/rest_v1/media/math/render/svg/3cfeccef1c8c7e6da0ddf08daed8dbf3c6f50c5e
vad det översätts till om man har AVX/FMA är en serie av FMA-instruktioner helt utan hopp. Ju större matriser, ju längre blir serien av FMA.

Detta är orsaken till att man kan nå så extremt nära teoretisk maximal GFLOPS även i praktiken. Skylake-S når med bibliotek som OpenBLAS och MKL >=95 % av sitt teoretiska max.

Och var egentligen här jag började reagera när jag såg resultatet Puget Systems fick.
9900K presterar >95 % av sitt teoretiska max där.
9900X presterar ~80 % av teoretisk max om man räknar med basfrekvens, men då den kör AVX512 är faktiskt frekvens lägre.
2990WX presterar ~80 % av teoretisk max
3900X får endast 67 % av teoretisk max!!!

Kör jag DGEMM på en kärna och multiplicerar det med 12 (antalet kärnor då multiplikation av stora matriser skalar nära nog perfekt både med SIMD-lanes och kärnor) får man en mer rimlig 85 % av teoretisk max räknat mot basfrekvens och 77 % mot uppmätt frekvens. 75-80 % av teoretisk max känns som vad man skulle kunna förvänta sig, det är i nivå med Haswell som var Intels första AVX/FMA design.

Men finns en viktig teknisk skillnad i hur Prime95 använder AVX/FMA jämfört med SGEMM/DGEMM, en skillnad som kan förklara varför Skylake ser högre värmeutveckling i Prime95 men det kan inte förklara eventuella skillnader för Zen2.

"Huvudloopen" för DGEMM är en serien FMA. Det finns två sådana ALUs i Skylake medan Zen/Zen+/Zen2 kombinerar en MUL med en ADD kapabel pipeline för att få en FMA. Finns totalt fyra flyttalspipeliens i Zen/Zen2, så när två FMA körs är alla fyra pipelines upptagna.

Så för Zen/Zen2 borde Prime95 och SGEMM/DGEMM belasta rätt likvärdigt, om något lastar Prime95 lite mindre då ungefär var 3:e instruktion är en ADD/SUB som då bara låser upp två av fyra pipliens, koden är i grunden en lång serie av FMA/FMA/ADD/FMA/FMA/ADD... i Prime95.

För Intel hanteras SUB/ADD i en separat pipeline från FMA, så SGEMM/DGEMM kan egentligen bara utnyttja två av tre pipelines men Prime95 passar precis så att alla tre pipelines hela tiden kan jobba -> mer transistorer aktiveras!

Prime95 är en hyfsat "speciell" arbetslast. SGEMM/DGEMM är exakt vad SSE/AVX/FMA designades för!

Nähä, du har inte påstått att någon här inne ljugit om att köra stock inställningar, OK, det är på den nivån du vill hålla det.

Citat:

Finns en del "men min maskin håller minsan >3,8 GHz", men verkar som de flesta (antagligen alla) som får detta resultat missat delen med "ren stock". Många high-end moderkort verkar ha AutoAC påslaget som förval och många användare har testat med PBO aktiverat trots att frågan handlar om "stock".

Vad menar du med detta då?

Sen verkar du ha noll begrepp om att det finns mer än en ampere gräns för Zen2, läs på läs rätt för nu börjar du bli rent dumdryg med personliga påhopp. Sen säger du fortfarande inget om processorns temp utan att du med IR kanera säger att det inte är några problem, inser du själv hur långt från sanningen du är nu, intern CPU temp kan vara extremt mycket högre. Jag har redan förklarat i detalj för dig hur det funkar men du vill inte lyssna, på två separata ställen har jag beskrivit vad som händer under all core avx/fma last men det verkar inte gå in, jag förklarar inte för dig en tredje gång.

Sen påverkar jobbens storlek långt mer än du verkar vilja erkänna, varför du inte vill det de vet jag icke.

Edit: Jag föreslår att du dunkar in win10 på din maskin & kör en timmes Prime95 och rapporterar Tdie temp när du gör det, gissningsvis går det inte svalt på en fläck, då kan du samtidigt passa på & se hur Prime95 beter sig med precision boost i samband med att prime95 gör färdigt ett jobb & gå vidare till nästa, varenda gång det inträffar frångår PB TDC limit och tillåts gå upp mot EDC limit detta då det skiljer rätt markant i hur tung denna process är jämfört beräkningsjobben, detta har jag redan förklarat men åter igen verkar du helt ignorera det, vad krävs för dig, en video med ampere klampa på 8 pin samtidigt som prime rullar? Du har gett oss direkt felaktiga antaganden om & om igen ("så verkar det tyvärr vara så att just nu fixar inte 3900X ens basfrekvens i AVX/FMA laster i "stock" utförande. Lär visa sig om det är ett HW-problem eller om även detta är ett firmwareproblem.") och jag har påvisat att de är just felaktiga antaganden om & om igen. Sen repeterar du ändå dessa antaganden, någon stans längs vägen så tappar de flesta både lust & ork att hjälpa dig komma till roten med varför din burk beter sig som den gör.

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Medlem
Skrivet av tellus82:

Dina RTT värden är lite fel, RTT_nom och RTT_wr bör bägge vara OFF och RTT_park ska vara RZQ/5 (48ohm), din VDDG är mycket för hög, du kan gott sänka den till 1V eller mindre ändå, 0.95-0.975V brukar vara lagom vid 3600MT/s / 1800MHz, din CLDO_VDDP är helt åt helvete för hög, sänk den till 0.9V direkt, möjligen 0.925V som mest, brukar man aldrig behöva pilla på och så hög som du har där är på intet sätt bra. Din ProcODT kan vara lite låg med 4 moduler så du kan prova att gå upp till 40 eller mer.

Ska hitta bara - alla voltages är auto. suck.

Visa signatur

R7 5800X. MSI X570 Unify. 2x16 G.Skill Ripjaws V. RTX2080Ti. MP600. Custom Loop 360+280 i Meshify S2, 1260 på balkongen.