Specifikationer för AMD Ryzen 5 3500 skymtas – sex kärnor utan flertrådsteknik

Permalänk
Medlem
Skrivet av Lordsqueak:

Jo precis, något som saknas i tester är hur single thread performance ser ut när den "andra" thread är belastad.
Vi vet ju att HT eller SMT inte ger 200% CPU, och att single thread performance är samma när bara en thread används, men hur ser det egentligen ut när hela cpu belastas, hur mycket påverkar det single thread performance.

Du menar att man kör två trådar på tex core0 medans de andra är idle?
I så fall har ju inte schemaläggaren jobbat som det är tänkt, men har testat lite på AMD och Intel upp till 7000 serien men med alla kärnor då istället. Bäst är ju när de olika trådarna gör olika saker, tex en gör heltal och en gör flyttal. Det jag kört tester på är mest heltal: gnu-mp

TL;dr: Intel säger väl typiskt "upp till" 135% med två trådar mot en per kärna... ser dock "ned till" 90%.

Här ser man tex sämre resultat med alla 8 trådar jämfört med 4, 90% prestanda med 8 trådar mot 4:

1.11270: mz-bench-kabylake-Intel_Core_i7_7700HQ_CPU-1x3799.9MHz-1-of-1.mzb 3.48993: mz-bench-kabylake-Intel_Core_i7_7700HQ_CPU-8x3399.9MHz-1-of-8.mzb 3.89069: mz-bench-kabylake-Intel_Core_i7_7700HQ_CPU-4x3399.9MHz-1-of-4.mzb

Samma med denna, viktigt kolla att den inte klockar ned sig under testet, 92% prestanda med 4 trådar mot 2:

1.00000: mz-bench-skylake-Intel_Core_i7_6600U_CPU-1x3402.6MHz-1-of-1.mzb 1.56910: mz-bench-skylake-Intel_Core_i7_6600U_CPU-4x3199.9MHz-1-of-4.mzb 1.71242: mz-bench-skylake-Intel_Core_i7_6600U_CPU-2x3200.4MHz-1-of-2.mzb

På en utan HT ser man att poängen ökar med en faktor 3.997 med 4 istället för 1 tråd:

0.38405: mz-bench-core2-Intel_Core_2_Quad_CPU_Q6600-1x2394.1MHz-1-of-1.mzb 1.53490: mz-bench-core2-Intel_Core_2_Quad_CPU_Q6600-4x2394.1MHz-1-of-4.mzb

AMD Phenom: 5.89X prestanda med 6 trådar mot 1, här har vi nog lite begränsning pga minnesbandbredd:

0.63058: mz-bench-amdfam10-AMD_Phenom_II_X6_1090T_Processor-1x3200.0MHz-of-1.mzb 3.71457: mz-bench-amdfam10-AMD_Phenom_II_X6_1090T_Processor-6x3200.0MHz-of-6.mzb

FX_8350: Fyra eller åtta kärnor har ju diskuterats, 164% prestanda med 8 mot 4 trådar:

0.62690: mz-bench-bdver2-AMD_FX_8350_Eight_Core_Processor-1x4000.0MHz-1-of-1.mzb 2.43836: mz-bench-bdver2-AMD_FX_8350_Eight_Core_Processor-4x4000.0MHz-1-of-4.mzb 3.96630: mz-bench-bdver2-AMD_FX_8350_Eight_Core_Processor-8x4000.0MHz-1-of-8.mzb

Threadripper: 125% prestanda med 32 trådar mot 16:

0.89163: mz-bench-k8-AMD_Ryzen_Threadripper_1950X_16_Core_Processor-1x3600.0MHz-1-of-1.mzb 14.01648: mz-bench-k8-AMD_Ryzen_Threadripper_1950X_16_Core_Processor-16x3600.0MHz-1-of-16.mzb 17.59785: mz-bench-k8-AMD_Ryzen_Threadripper_1950X_16_Core_Processor-32x3600.0MHz-1-of-32.mzb

Ryzen 3900x: Nu börjar det bli trixigt, klockar ju efter antal kärnor och kylning, olika kärnor klockar olika högt mm, men ca 130% prestanda med 24 trådar mot 12:

1.21662: mz-bench-k8-ryzen3-AMD_Ryzen_9_3900X_12_Core_Processor-1x4567.2MHz-1-of-1.mzb 12.62102: mz-bench-k8-ryzen3-AMD_Ryzen_9_3900X_12_Core_Processor-12x-ca4228.5-MHz-1-of-12.mzb 16.43752: mz-bench-k8-ryzen3-AMD_Ryzen_9_3900X_12_Core_Processor-24x-ca4016.7-MHz-1-of-24.mzb

Permalänk
Medlem
Skrivet av ajp_anton:

Men Intel har ju endast toppmodellen med HT aktiverat, vilket inte är realistiskt ur en yield-synpunkt.

Nu är det ju dock inte bara HT som stängs av på dom modellerna, utan också L3. Dom använder helt enkelt ett enda SKU för att fånga upp både L3 defekter samt HT problem. Det skulle bli förbannat många SKUs om dom också skulle lägga till full L3 utan HT samt HT med mindre L3, deras produkt lineup är tillräckligt bloatad som det är redan!

Permalänk
Inaktiv

@Xinpei: Ja så blev det nu förra generationen men det är ju inte så att CPUer utan HT presterar sämre heller, i alla fall inte i spel.

Permalänk
Medlem
Skrivet av anon201296:

Nu får skitpratet om att endast Intel tar extra betalt för HT ett slut förhoppningsvis.

Skillnaden enligt mig är att Intel tar extra betalt för HT.
AMD tar mindre betalt utan SMT (läs: HT fast för AMD).

Finns en relevant skillnad mellan dessa förfaranden.

Skickades från m.sweclockers.com

Visa signatur

3800X@PBO (4,3GHz) | Prime x370-pro | 16GB G.Skill Ripjaws V 3600Mhz @ 3600 Mhz(16-16-16-36-52) | Zotac 1080 Ti AMP Extreme | MG279Q | QPAD-1339 | Ownit 1000/1000.

Permalänk
Medlem
Skrivet av SAFA:

Du menar att man kör två trådar på tex core0 medans de andra är idle?
I så fall har ju inte schemaläggaren jobbat som det är tänkt, men har testat lite på AMD och Intel upp till 7000 serien men med alla kärnor då istället. Bäst är ju när de olika trådarna gör olika saker, tex en gör heltal och en gör flyttal. Det jag kört tester på är mest heltal: gnu-mp

Jo, jag menar singletråds prestanda, när de andra trådarna också jobbar,, med något,, nyttigt helst.
Det jag är nyfiken på är helt enkelt vad singletrådsprogram har för prestanda när hela cpu jobbar med massa annat samtidigt. för det är ju något vi aldrig brukar se i tester. Ett exempel på varför detta kan vara av intresse är tex, om man spelar ett singletrådat spel, och streamar eller spelar in video samtidigt. men det kan ju lika gärna vara windowsupdate som drar igång. Vi vet ju att en core kommer att gå lite långsammare om den får jobba med HT eller SMT samtidigt på andra tråden.

Nu när vi äntligen börjar få cores så det räcker och blir över, så är det ju egentligen ganska onödigt att köra HT eller SMT, om man nu har cores så det räcker utan. Vi förutsätter ju att schemaläggaren gör sitt jobb som den ska.. men det gör den ju inte alltid. Och det är väl omöjligt att få den att köra optimalt i ALLA tänkbara scenarion. så förr eller senare så kommer något att köras på samma core, på andra tråden". vilket innebär lagg och annat.
En annan tanke är ju att CPU'n kör lite svalare och kan därför hålla bättre klocks?

Permalänk
Avstängd
Skrivet av Bael:

Du menar 3st kärnor (moduler) där varje kärna (modul) har 2st exekveringsenheter?

jag ser det som en reverse SMT i uppbyggnaden av Bulldozer (faildozer). vilket är en av anledningarna till varför arkitekturen presterade så dåligt. Det blev som en flaskhals för CPUn.

Visa signatur

New: Asus x370 prime pro, Ryzen 1700 (@3.925ghz) , Ripjaws V 16GB 3600 MHz (@3200mhz 14c). https://valid.x86.fr/curj7r
Radeon VII.

Permalänk
Avstängd
Skrivet av anon201296:

Nu får skitpratet om att endast Intel tar extra betalt för HT ett slut förhoppningsvis.

Förr i tiden kallades vad Intel gör för ocker.
I sverige kan det ge 2 års fängelse.

Köpte ryzen pga att jag betalade hälften vad Intel begärde för samma prestanda.
En av orsakerna att Intel är helt körda de närmaste åren.
3500 med 6 kärnor mellan 1 500-2000kr, vilket aldrig skulle skett med Intel.

Visa signatur

Träna bort dyslexin. Ryzen 3600 - asus B350plus - Msi Vega56 - Acer 1440p 144hz - M.2 ssd - asus essence stx - Sennheiser hd600 - Corsair 750w - 16gb ram 3ghz - atcs 840 - luftkylt - Felsökning? (Lär dig Googla)

Permalänk
Medlem
Skrivet av _Merc_:

jag ser det som en reverse SMT i uppbyggnaden av Bulldozer (faildozer). vilket är en av anledningarna till varför arkitekturen presterade så dåligt. Det blev som en flaskhals för CPUn.

Vadå fail, mina FX 8150 8350 och 9590 fungerade fint (ett par nu i drift, utlånade) till det jag använde dem för.

Visa signatur

LianLiPC-V355bequiet!E9-480W-MSIB350M-MortarW10-WD-BlackSN750Ryzen7™2700MSI RX6500XTSONY-65"TV-ZD9
Övriga datorer ej i drift

Permalänk
Avstängd
Skrivet av Jarl:

Vadå fail, mina FX 8150 8350 och 9590 fungerade fint (ett par nu i drift, utlånade) till det jag använde dem för.

Faildozer är smeknamnet på CPU arkitekturen som slog ut AMD ifrån CPU marknaden tills Ryzen. Dom fungerar nog väldigt bra, en av anledningarna till varför jag inte köpte en bulldozer varför att den gav bluescreen i Total war shogun 2 de första 4-6 månaderna innan dem fixade det.

Visa signatur

New: Asus x370 prime pro, Ryzen 1700 (@3.925ghz) , Ripjaws V 16GB 3600 MHz (@3200mhz 14c). https://valid.x86.fr/curj7r
Radeon VII.

Permalänk
Skrivet av Xinpei:

Så skulle jag uppfatta konstiga saker om ett företag? För att jag kritisk när ett företag säljer mindre för mer? Du måste skämta?

KOM IGEN SJÄLV??? Läs vad jag skrev!

Bara vräka och köpa. MEN KOM IHÅG! INGET KRAV PÅ ATT BETALA 5000kr för att får HT!!!

1151-socket

https://ark.intel.com/content/www/us/en/ark/products/series/134861/intel-xeon-e-processor.html

Vad gäller att sälja mindre så vad gör AMD:s boost speed på förpackningarna och på deras produktbeskrivningar egentligen?
Vi väntar på på 3950X 4,7Ghz Boost...och hoppas inte få mindre än det man betalar för.

Permalänk
Skrivet av Flopper:

Förr i tiden kallades vad Intel gör för ocker.
I sverige kan det ge 2 års fängelse.

Köpte ryzen pga att jag betalade hälften vad Intel begärde för samma prestanda.
En av orsakerna att Intel är helt körda de närmaste åren.
3500 med 6 kärnor mellan 1 500-2000kr, vilket aldrig skulle skett med Intel.

redan november 2017 så kom det 8400 med 6 kärnor för under 200€. Minns själv att både 8350k och 8400 kostade 199€ i början. 8400 så lågt som 169€ lite senare.

Permalänk
Medlem
Skrivet av HC-8315:

På vilket sätt skulle detta vara ett dåligt beslut av AMD? De är ju bara en del av binning-processen. Att slänga alla chip med skadad SMT är ju kapitalförstöring. Jag ser iaf inga problem med att AMD släpper en ren hexacore, så länge priset hamnar rätt.

Pga. att man mer eller mindre marknadsfört sig som "Att få SMT oberoende pris".

Skrivet av Dual-Tjur:

KOM IGEN SJÄLV??? Läs vad jag skrev!

Bara vräka och köpa. MEN KOM IHÅG! INGET KRAV PÅ ATT BETALA 5000kr för att får HT!!!

1151-socket

https://ark.intel.com/content/www/us/en/ark/products/series/134861/intel-xeon-e-processor.html

Vad gäller att sälja mindre så vad gör AMD:s boost speed på förpackningarna och på deras produktbeskrivningar egentligen?
Vi väntar på på 3950X 4,7Ghz Boost...och hoppas inte få mindre än det man betalar för.

Visst är det problematiskt att alla 3950X inte boostar i 4,7 GHz MEN det finns fall där de gjort det medan det inte finns ett enda fall där man kan få HT om man inte köper en 9900K ny. Så din jämförelse är bara skum.

Angående krav så finns det indirekta krav att man måste betala över 5000:- för HT. Iallafall om man ska välja en Intel processor idagsläget. Att du "tvingas" dra upp en serverprocessor är ett klart fall av att du saknar argument.

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem
Skrivet av Jygge:

Frågan om det blir så stor skillnad 6 kärnor 6 trådar vs 6 kärnor 12 trådar Intel hade problem med sin första ht cpu var första tråden i full last så fungera inte den andra tråden.. Kan tänka mig att det gäller än i dag.

Finns fortfarabde aplikationer som är enkeltrådiga, eller nära på... Dom flesta om inte alla 3D-CAD motorer verkar endast dra nytta av en kärna, det är endast vid stmmulering och liknande som fler kärnor nyttjas och då är det ett tredjeparts pluggin.

Dassault Systèmes - SolidWorks (Parametric)
Kupbotek - KeyCreator
Autodesk - Inventor (Parametric)
PTC - CoCreate, nu Creo Elements/Direct

Alla ovan vet jag med säkerhet att dom endast använder en tråd.

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem
Skrivet av _Merc_:

vi får inte glömma FX 6100 och 6300 fast dem var 6kärnor 3 trådar.......

3-trådar?

Hur?

Var det inte 3 moduler och 6 trådar?

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Avstängd
Skrivet av Xinpei:

Pga. att man mer eller mindre marknadsfört sig som "Att få SMT oberoende pris".

Visst är det problematiskt att alla 3950X inte boostar i 4,7 GHz MEN det finns fall där de gjort det medan det inte finns ett enda fall där man kan få HT om man inte köper en 9900K ny. Så din jämförelse är bara skum.

Angående krav så finns det indirekta krav att man måste betala över 5000:- för HT. Iallafall om man ska välja en Intel processor idagsläget. Att du "tvingas" dra upp en serverprocessor är ett klart fall av att du saknar argument.

Så med tanke på att man redan med första generationen av Ryzen sålde processorer utan SMT inte existerade eller? Eller ens deras A och Athlon serier som har modeller utan SMT. och för att inte glömma deras Ryzen 3 2200G och 3200G som inte heller har SMT.
Måste också flika in med att HT inte är öronmärkt för i9-9900K hos Intel. Visst, inte direkt några fartmonster, men HT finns hos deras Pentium serie också. Denna till exempel: https://ark.intel.com/content/www/us/en/ark/products/135457/i... och för att inte tala om deras bärbara processorer.
Du får helt enkelt ge dig nu angående HT och SMT. Med ditt resonemang så skulle man i princip behöva slänga alla chip med skadat SMT eller berörda delar på kretsen som påverkar SMT i nån form behövas slängas i soporna. Både trams och ekonomiskt ohållbart att göra så. Binning finns av en anledning vare sig du gillar de eller ej. Dock till AMDs fördel så behåller dom SMT på fler modeller än vad Intel gör. Men sen är ju Intels HT-teknik idag en säkerhetsrist.
Personligen hade de ja vart trevligt om Intel hade HT upplåst på i5 och i7 också. Men inte till den premie Intel har på sina processorer.

Visa signatur

🖥Phanteks Enthoo Evolv iTX . Phanteks AMP 650W. AMD R5 3600X. msi B450I GAMING PLUS AC. 32gB HyperX Fury RGB 3200MHz. msi RX 5700 XT GAMING. 1TB Kingston A2000.
AOC G2460FQ. Logitech G903. Logitech G840 XL. Logitech G513. Logitech PRO Gaming Headset. Luxorparts Headphone Stand. LG BP50NB40.

Permalänk
Inaktiv

@Flopper: Jag försvarar inte Intel på något vis men tycker det är löjligt hur AMD blir hyllad av fanboys på t.ex. Youtube

Edit: Och en bra produkt kan man ta betalt för, det är inget konstigt. Du kan ju köpa skor för 600kr eller 10000kr som är ungefär samma kvalite men du betalar för märket.

Permalänk
Inaktiv

@Skrutto: Det är ju samma sak

Permalänk
Medlem

Då blir det en tävling mot i5 - 6/6 då?

Visa signatur

MSI X99A GODLIKE GAMING | i7-6950X 4.3GHz | 64GB RAM 3200MHz | RTX 2080

Nintendo Switch | PlayStation 5 | Xbox Series X

Min FZ Profil

Permalänk
Datavetare
Skrivet av SAFA:

Du menar att man kör två trådar på tex core0 medans de andra är idle?
I så fall har ju inte schemaläggaren jobbat som det är tänkt, men har testat lite på AMD och Intel upp till 7000 serien men med alla kärnor då istället. Bäst är ju när de olika trådarna gör olika saker, tex en gör heltal och en gör flyttal. Det jag kört tester på är mest heltal: gnu-mp

TL;dr: Intel säger väl typiskt "upp till" 135% med två trådar mot en per kärna... ser dock "ned till" 90%.

Här ser man tex sämre resultat med alla 8 trådar jämfört med 4, 90% prestanda med 8 trådar mot 4:

1.11270: mz-bench-kabylake-Intel_Core_i7_7700HQ_CPU-1x3799.9MHz-1-of-1.mzb 3.48993: mz-bench-kabylake-Intel_Core_i7_7700HQ_CPU-8x3399.9MHz-1-of-8.mzb 3.89069: mz-bench-kabylake-Intel_Core_i7_7700HQ_CPU-4x3399.9MHz-1-of-4.mzb

Samma med denna, viktigt kolla att den inte klockar ned sig under testet, 92% prestanda med 4 trådar mot 2:

1.00000: mz-bench-skylake-Intel_Core_i7_6600U_CPU-1x3402.6MHz-1-of-1.mzb 1.56910: mz-bench-skylake-Intel_Core_i7_6600U_CPU-4x3199.9MHz-1-of-4.mzb 1.71242: mz-bench-skylake-Intel_Core_i7_6600U_CPU-2x3200.4MHz-1-of-2.mzb

På en utan HT ser man att poängen ökar med en faktor 3.997 med 4 istället för 1 tråd:

0.38405: mz-bench-core2-Intel_Core_2_Quad_CPU_Q6600-1x2394.1MHz-1-of-1.mzb 1.53490: mz-bench-core2-Intel_Core_2_Quad_CPU_Q6600-4x2394.1MHz-1-of-4.mzb

AMD Phenom: 5.89X prestanda med 6 trådar mot 1, här har vi nog lite begränsning pga minnesbandbredd:

0.63058: mz-bench-amdfam10-AMD_Phenom_II_X6_1090T_Processor-1x3200.0MHz-of-1.mzb 3.71457: mz-bench-amdfam10-AMD_Phenom_II_X6_1090T_Processor-6x3200.0MHz-of-6.mzb

FX_8350: Fyra eller åtta kärnor har ju diskuterats, 164% prestanda med 8 mot 4 trådar:

0.62690: mz-bench-bdver2-AMD_FX_8350_Eight_Core_Processor-1x4000.0MHz-1-of-1.mzb 2.43836: mz-bench-bdver2-AMD_FX_8350_Eight_Core_Processor-4x4000.0MHz-1-of-4.mzb 3.96630: mz-bench-bdver2-AMD_FX_8350_Eight_Core_Processor-8x4000.0MHz-1-of-8.mzb

Threadripper: 125% prestanda med 32 trådar mot 16:

0.89163: mz-bench-k8-AMD_Ryzen_Threadripper_1950X_16_Core_Processor-1x3600.0MHz-1-of-1.mzb 14.01648: mz-bench-k8-AMD_Ryzen_Threadripper_1950X_16_Core_Processor-16x3600.0MHz-1-of-16.mzb 17.59785: mz-bench-k8-AMD_Ryzen_Threadripper_1950X_16_Core_Processor-32x3600.0MHz-1-of-32.mzb

Ryzen 3900x: Nu börjar det bli trixigt, klockar ju efter antal kärnor och kylning, olika kärnor klockar olika högt mm, men ca 130% prestanda med 24 trådar mot 12:

1.21662: mz-bench-k8-ryzen3-AMD_Ryzen_9_3900X_12_Core_Processor-1x4567.2MHz-1-of-1.mzb 12.62102: mz-bench-k8-ryzen3-AMD_Ryzen_9_3900X_12_Core_Processor-12x-ca4228.5-MHz-1-of-12.mzb 16.43752: mz-bench-k8-ryzen3-AMD_Ryzen_9_3900X_12_Core_Processor-24x-ca4016.7-MHz-1-of-24.mzb

Du nämner gnu-mp, är det denna benchmark du kört?

För jag kan rätt mycket reproducera ditt resultat på mina bärbara, i7-5600U samt i7-6650U. I båda fallen presterar de bättre när man kör 2C/2T jämfört med 2C/4T, fast i båda fallen beror det på att de throttlar i det senare fallet medan de precis klarar sig att hålla temperaturen runt 90°C när man kör 2C/2T. (Får 94-97 % av prestanda med 2C/4T mot 2C/2T).

Givet vad testet gör och givet att det rätt mycket körs helt ur CPU-cache borde det vara väldigt osannolikt att SMT/HT ger sämre aggregerad prestanda. Testar jag ISO-frekvens på Xeon 2690 (Sandy Bridge) samt Xeon Gold 6140 (Skylake SP) får man ett betydligt mer väntat resultat, HT ger 27 % boost för SNB och 33 % för SKL (127 % resp 133 % för att använda din representation).

Det mest välkända fallet där SMT nästan alltid ger sämre resultat är Linpack (multiplikation av stora matriser). Problemet där är att effektiv cache-storlek per CPU-tråd halveras och just i detta fall ger detta ett större negativt bidrag än vinsten att kunna mer effektivt nyttja CPUs beräkningsenheter.

hardware.fr (tyvärr har de nu gått i graven) gjorde riktigt bra SMT tester när första generationen Ryzen lanserades. För "vanliga" program som kan utnyttja många kärnor ger SMT nästan alltid ett positivt tillskott, från 5-40 % vare sig det handlar om AMD eller Intel. Däremot såg både Intel och AMD noll eller en svag försämring av SMT i spel då det handlade om 8C CPUer

Dold text

SMT är på det stora hela ett plåster. Ett riktigt bra plåster, men det är ändå något som man i den bästa av världar skulle må bäst om man slapp. För x86 väger fördelar nästan alltid upp nackdelarna med SMT med 64-bitars ARM nog lär kunna ducka SMT ett tag till.

Fördelen med SMT är att man ökar mängden beräkningar per fysisk CPU-kärna. I x86 börjar det bli extremt svårt att öka IPC på en enda tråd då det finns massor med implicita beroenden mellan instruktioner. Kör man två oberoende instruktionsströmmar genom en och samma CPU-kärna finns det mer potentiell parallellism att extrahera. 64-bitars ARM kan ducka detta (än så länge) då man specifikt designat ISA för att minimera implicita beroenden mellan instruktioner.

Nackdelen med SMT är att IPC per CPU-tråd minskar rätt ordentligt. I fall som är triviala att parallellisera, som t.ex. Cinebench, spelar detta ingen roll. I icke-triviala fall, som t.ex. spel, finns risken att lägsta FPS begränsas av hur snabbt någon viss beräkning kan utföras och SMT ökar tiden att utföra varje specifik uppgift.

Så spel gynnas av SMT om det är total beräkningskraft som är flaskhals (ofta går genomsnittlig FPS upp), de missgynnas av SMT om flaskhalsen är en beräkningskraft hos en specifik tråd (därför lägsta FPS ibland påverkas positivt av att stänga av SMT på CPUer med >=6C). Detta är dock bara relevant när inte GPU är primär flaskhals.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av jOnÄTÄn:

Om du kollar på intel så vinner i stort sett alltid modellen med 6c/6t över modellen med 4c/8t. Borde bli ungefär likadana resultat med AMD.

Vilka modeller jämförde du? Jag försökte göra samma sak men kom inte fram till något vettigt då den senaste/bästa 4c/8t från Intel är 7700k(?) och deras första 6c/6t är i5 8600k(?). Och där skiljer det ju redan en del mellan genearationerna.

Och om jag inte är helt borta så är faktiskt SMT aningen bättre än HT, kolla t.ex 8700k vs 3600x så kan du se hur 8700k vinner i allt från single core till 8-core enligt den där benchen men tappar på 12-core+ då SMT/HT får jobba ordentligt. Kan iofs ha med hur kärnorna överklockar sig däremot också. Rätta mig gärna om jag har fel här däremot.

Skrivet av Bengt-Arne:

3-trådar?

Hur?

Var det inte 3 moduler och 6 trådar?

Uppenbarligen skrev han fel. 3 100% riktiga cores, eller rättare sagt moduler som du säger och 6 trådar. Föregångaren Phenom II 1090T osv hade däremot 6 cores som några andra redan påpekat.

Permalänk
Datavetare
Skrivet av 4.0:

Och om jag inte är helt borta så är faktiskt SMT aningen bättre än HT

HT är bara Intels produktnamn på deras SMT implementation. SMT är alltså namnet på tekniken där man gör det möjligt att köra flera trådar genom samma CPU-kärna.

Vidare är det inte alls så att högre genomsnittlig tillskott från SMT är lika med "bättre implementation". Hur stor utdelning SMT ger beror primärt på hur mycket outnyttjad kraft det finns kvar i form av beräkningsenheter när en CPU-tråd jobbar.

För Intels del har ingen CPU kommit nära utdelningen av SMT som man såg i första generationens Atom. Där fick man regelmässigt ~50 % boost, det knappast för att man hade en superimplementation av HT utan primärt för att den designen var horribelt usel på att hålla sig sysselsatt när bara en CPU-tråd användes. Andra generationen (Silvermont) var ju så mycket bättre designad att man sedan dess ansett SMT meningslöst för Atom.

Ställer man Skylake och Zen2 mot varandra så ser den senare i genomsnitt ett större tillskott från SMT. I just detta fall är detta också positivt, då Zen2 i genomsnitt får mer gjort per cykel förutsatt att båda trådarna jobbar!

Skylake är i genomsnitt bättre än Zen2 på att utnyttja sina beräkningsenheter när bara en CPU-tråd används.

Ju mer effektivt en CPU kan utnyttja sina beräkningsenheter när bara en CPU-tråd per kärna används ju bättre. Detta är vad man helst vill optimera för. Tyvärr har x86 rätt mycket åkt in i en vägg här.

Zen2 har mer beräkningsresurser, mer cache etc på nästan alla punkter jämfört med Skylake. Att man ändå ligger lite efter när bara en CPU-tråd per kärna används är därför ett svaghetstecken, men det är riktigt positivt att det ändå ger utdelning när SMT kommer in i bilden!

Detta fenomen ser man t.ex. i SweClockers test vid samma frekves

SMT är "bra" om det ger en totalt hög kapacitet hos en CPU som även presterar så bra man kan förvänta sig när bara en CPU-tråd jobbar. Hög utdelning från SMT kan man ju som sagt få genom att starta på en usel nivå när en tråd jobbar (första Atom...).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av 4.0:

Vilka modeller jämförde du? Jag försökte göra samma sak men kom inte fram till något vettigt då den senaste/bästa 4c/8t från Intel är 7700k(?) och deras första 6c/6t är i5 8600k(?). Och där skiljer det ju redan en del mellan genearationerna.

https://www.sweclockers.com/test/27954-amd-ryzen-5-3600x-och-... 9600k/8600k mot 7700k när alla tre körs i 2,8ghz där vinner de 6 kärniga i alla tester.

Jag är rätt säker på att en r5 3500 med 6 kärnor utan SMT är bättre än om den hade haft 4 kärnor med SMT.

Visa signatur

Ryzen 5 7600
Rx 6650xt
32Gb

Permalänk
Medlem
Skrivet av jOnÄTÄn:

https://www.sweclockers.com/test/27954-amd-ryzen-5-3600x-och-... 9600k/8600k mot 7700k när alla tre körs i 2,8ghz där vinner de 6 kärniga i alla tester.

Jag är rätt säker på att en r5 3500 med 6 kärnor utan SMT är bättre än om den hade haft 4 kärnor med SMT.

Från det där testet känns det som att den förbättrade IPCn mellan generationerna kommer väga upp skillnaden utan problem. Det ser extremt jämt ut åtminstone mellan 4c/8t och 6c/6t.

Permalänk
Medlem
Skrivet av Lordsqueak:

Jo, jag menar singletråds prestanda, när de andra trådarna också jobbar,, med något,, nyttigt helst.
Det jag är nyfiken på är helt enkelt vad singletrådsprogram har för prestanda när hela cpu jobbar med massa annat samtidigt. för det är ju något vi aldrig brukar se i tester. Ett exempel på varför detta kan vara av intresse är tex, om man spelar ett singletrådat spel, och streamar eller spelar in video samtidigt. men det kan ju lika gärna vara windowsupdate som drar igång. Vi vet ju att en core kommer att gå lite långsammare om den får jobba med HT eller SMT samtidigt på andra tråden.

Nu när vi äntligen börjar få cores så det räcker och blir över, så är det ju egentligen ganska onödigt att köra HT eller SMT, om man nu har cores så det räcker utan. Vi förutsätter ju att schemaläggaren gör sitt jobb som den ska.. men det gör den ju inte alltid. Och det är väl omöjligt att få den att köra optimalt i ALLA tänkbara scenarion. så förr eller senare så kommer något att köras på samma core, på andra tråden". vilket innebär lagg och annat.
En annan tanke är ju att CPU'n kör lite svalare och kan därför hålla bättre klocks?

Ok, då är det jag postade tidigare relevant. Dvs då schemaläggaren får slut på riktiga kärnor kan ju nästa tråd läggas på den kärna där enkeltrådsapplikationen körs. Prestanda på den kommer då rasa från 100% till nånstans 45% till 70% av det den var innan.

Även innan det läggs en HT tråd på den kan man tappa prestanda pga att minnesbandbredden börjar begränsa, cache-minnet inte räcker till, HDD/SDD flaskar. Man har ju redan tappat boosten på den kärnan iom att det är flera kärnor som jobbar.

Permalänk
Medlem
Skrivet av 4.0:

Från det där testet känns det som att den förbättrade IPCn mellan generationerna kommer väga upp skillnaden utan problem. Det ser extremt jämt ut åtminstone mellan 4c/8t och 6c/6t.

Det är väl inga skillnader mellan generationerna? En cpu ur 6000 serien presterar väl i stort sett likadant som en ur 9000 serien om du jämför med samma antal kärnor och trådar när de körs i samma frekvens? (lite variation pga snabbare minne på de senare osv.) Tror även en skylake modell med 6 kärnor utan HT skulle slå en 7700k om de var hyfsat lika i frekvens.

Visa signatur

Ryzen 5 7600
Rx 6650xt
32Gb

Permalänk
Medlem
Skrivet av Yoshman:

Du nämner gnu-mp, är det denna benchmark du kört?

För jag kan rätt mycket reproducera ditt resultat på mina bärbara, i7-5600U samt i7-6650U. I båda fallen presterar de bättre när man kör 2C/2T jämfört med 2C/4T, fast i båda fallen beror det på att de throttlar i det senare fallet medan de precis klarar sig att hålla temperaturen runt 90°C när man kör 2C/2T. (Får 94-97 % av prestanda med 2C/4T mot 2C/2T).

Nej, det är en egen benchmark på ett program jag kört rätt mycket... Det använder nästan bara multiply, add och compare där multiply lär vara det tunga.

Har kollat temps under körning och det har inte throttlat där vad jag kunde se... sen givetvis throttlar eller klockar cpun ned sig blir det ju ännu större prestandatapp.

Cachen blir ju mindre per tråd vilket så klart också spelar roll som du skriver.

Permalänk
Datavetare
Skrivet av SAFA:

Nej, det är en egen benchmark på ett program jag kört rätt mycket... Det använder nästan bara multiply, add och compare där multiply lär vara det tunga.

Har kollat temps under körning och det har inte throttlat där vad jag kunde se... sen givetvis throttlar eller klockar cpun ned sig blir det ju ännu större prestandatapp.

Cachen blir ju mindre per tråd vilket så klart också spelar roll som du skriver.

Temperatur är bara en av flera orsaker varför en mobil-CPU drar ned frekvens.

Givet att du kör en kombination av multiplikation och addition har jag inga tvivel om att Zen och definitivt Zen2 presterar bättre per cykel jämfört med Skylake.

Men givet att du ser 25-30 % boost från SMT i Zen/Zen2 och givet hur stor skillnad jag någonsin tidigare sett/läst om verkar det extremt osannolikt att Skylake (eller någon Core-modell) skulle se negativ skalning.

Om du kör Linux är mitt tips att använda perf-stat. Där får du genomsnittlig IPC i stället för att försöka räkna baklänges från något rapporterat resultat som beror på IPC. perf-stat rapporterar också genomsnittlig frekvens under mätningen.

Kör jag det på mina laptops så får även de förväntad (positiv) skalning från SMT. Förväntat då "multiply" fallet har <0,5 % L1D$ missar även om man kör med tiotalsmiljoner bitars precision.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Temperatur är bara en av flera orsaker varför en mobil-CPU drar ned frekvens.

Givet att du kör en kombination av multiplikation och addition har jag inga tvivel om att Zen och definitivt Zen2 presterar bättre per cykel jämfört med Skylake.

Men givet att du ser 25-30 % boost från SMT i Zen/Zen2 och givet hur stor skillnad jag någonsin tidigare sett/läst om verkar det extremt osannolikt att Skylake (eller någon Core-modell) skulle se negativ skalning.

Om du kör Linux är mitt tips att använda perf-stat. Där får du genomsnittlig IPC i stället för att försöka räkna baklänges från något rapporterat resultat som beror på IPC. perf-stat rapporterar också genomsnittlig frekvens under mätningen.

Kör jag det på mina laptops så får även de förväntad (positiv) skalning från SMT. Förväntat då "multiply" fallet har <0,5 % L1D$ missar även om man kör med tiotalsmiljoner bitars precision.

Vet vi diskuterade detta i ett tidigare inlägg, se:

#17759653

Som synes av den översta bilden är det bara vid ett visst område antal bitar som man tappar prestanda, med flyttal och tillräckligt många bitar blir det vinst med HT.

Sista bilden visar att den klockade ned sig lite efter ett tag, men det är ungerfär samma med 2 resp 4 trådar.

Jag får även liknande beteende på en stationär Xeon server, drygt 8% tapp med alla trådar:

0.82637: mz-bench-haswell-Intel_Xeon_CPU_E5_2637_v3-1x3710.8MHz-1-of-1.mzb 5.84877: mz-bench-haswell-Intel_Xeon_CPU_E5_2637_v3-16x3600.0MHz-1-of-16.mzb 6.40662: mz-bench-haswell-Intel_Xeon_CPU_E5_2637_v3-8x3601.9MHz-1-of-8.mzb

Permalänk
Datavetare
Skrivet av SAFA:

Vet vi diskuterade detta i ett tidigare inlägg, se:

#17759653

Som synes av den översta bilden är det bara vid ett visst område antal bitar som man tappar prestanda, med flyttal och tillräckligt många bitar blir det vinst med HT.

Sista bilden visar att den klockade ned sig lite efter ett tag, men det är ungerfär samma med 2 resp 4 trådar.

Jag får även liknande beteende på en stationär Xeon server, drygt 8% tapp med alla trådar:

0.82637: mz-bench-haswell-Intel_Xeon_CPU_E5_2637_v3-1x3710.8MHz-1-of-1.mzb 5.84877: mz-bench-haswell-Intel_Xeon_CPU_E5_2637_v3-16x3600.0MHz-1-of-16.mzb 6.40662: mz-bench-haswell-Intel_Xeon_CPU_E5_2637_v3-8x3601.9MHz-1-of-8.mzb

Har du "mz-bench..:" tillgänglig via github eller liknande? För om du hittat något fall där Zen faktiskt ser 25-30 % boost samtidigt som Core-serien ser negativ skalning är det ett fall jag väldigt gärna skulle vilka sätta mig i!!!

När det kommer till SMT implementation är ju likheterna betydligt större än skillnaderna mellan Zen och Core, så en sådan skillnad måste ju ha rätt unika orsaker.

Det bästa jag kunde göra nu var att köra mäta precis alla de fall som gmbench testar för multiplicering. Resultat är rätt mycket exakt vad man kunde vänta sig. Över de fall som testas varierar faktisk skalningen med SMT en hel del, men är rätt mycket samma fall där både Intel och AMD ser stor resp. liten vinst.

Zen+ (2700X)

  • lägsta: 6 %

  • genomsnittlig: 14 %

  • högsta: 37 %

Skylake (6770HQ)

  • lägsta: 2 %

  • genomsnittlig: 11 %

  • högsta: 34 %

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Har du "mz-bench..:" tillgänglig via github eller liknande? För om du hittat något fall där Zen faktiskt ser 25-30 % boost samtidigt som Core-serien ser negativ skalning är det ett fall jag väldigt gärna skulle vilka sätta mig i!!!

När det kommer till SMT implementation är ju likheterna betydligt större än skillnaderna mellan Zen och Core, så en sådan skillnad måste ju ha rätt unika orsaker.

Det bästa jag kunde göra nu var att köra mäta precis alla de fall som gmbench testar för multiplicering. Resultat är rätt mycket exakt vad man kunde vänta sig. Över de fall som testas varierar faktisk skalningen med SMT en hel del, men är rätt mycket samma fall där både Intel och AMD ser stor resp. liten vinst.

Zen+ (2700X)

  • lägsta: 6 %

  • genomsnittlig: 14 %

  • högsta: 37 %

Skylake (6770HQ)

  • lägsta: 2 %

  • genomsnittlig: 11 %

  • högsta: 34 %

La upp en liten mek-vänligare version här:

https://www.dropbox.com/s/f25o0matinal4t5/mzb-test.tar.gz?dl=...

La även till ett program för att logga klockfrekvens under körningen (det är varmare nu) och det visar sig att processorn klockar ner mer med två trådar aktiva än fyra.
Lite data från en körning på en Intel(R) Core(TM) i7-6600U CPU @ 2.60GHz finns med.