Snabbtest: Mass Effect: Andromeda med AMD Ryzen och Intel Kaby Lake

Permalänk
Medlem

Finns det någon chans att få ut sweclockers frametimes från testerna?
Är nyfiken på att själv visualisera och dra data ur dem.

Visa signatur

Arch | 1440p 165Hz IPS | 7800X3D | 1080ti | 64GB@6GHz | SN850 2TB

Permalänk
Hjälpsam
Skrivet av Vapo:

Nä, har inga länkar. Men jag kan bekräfta att det går att utföra samtidiga uppgifter på min Intel propp. Går säkert lika bra med Ryzen. Kanske tom bättre på en Ryzen, om man själv har en jädrigt bra simultankapacitet och en massa skärmar att utföra allt på vid ett och samma tillfälle...ja, samtidigt som man spelar

Men nog får din CPU svettas lite mer, än en åttakärnig får.
https://www.youtube.com/watch?v=Rb0yfX8161M

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Hjälpsam
Skrivet av fredrik831:

En fråga till redaktionen: När ni gjorde testet med avstängda kärnor, hur stängde ni av kärnor? Blev det en 2+2 uppsättning eller 4+0?

De svarade på den frågan här.
#16735927

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Datavetare
Skrivet av rowas:

Är det bara jag som finner det intressant att allt över 8c/t ger 0 extra prestanda?
(Yes yes, MOSTLY 0 extra prestanda)
Det gör ju att R7 har minimala skillnader på upplösningar man normalt spelar i, men fortfarande har halva(figuratively speaking) sin prestanda kvar till att göra annat som kan tänkas behöva lite kraft medans man spelar (streaming etc etc).

Nu kan det absolut vara så att någon enskild CPU-tråd blir flaskhals och det är orsaken till att spelet inte uppvisar någon skillnad i prestanda mellan 8C/8T och 8C/16T.

Men kan också vara så att spelet använder CPUn på ett sätt som så att SMT inte ger något för just Ryzen. Anledningen att SMT överhuvudtaget fungerar är för att det i många fall finns outnyttjade resurser i CPUn p.g.a. saker som beroenden mellan instruktioner, cache-missar etc.

Har man två instruktionsströmmar genom samma CPU-kärna löser man beroendeproblematiken, finns nu alltid minst två instruktioner som är helt oberoende då de kommer från olika instruktionsströmmar. Om en tråd "stallar" på en cache-miss kan ju den andra utnyttja CPU-resurserna under tiden.

Men finns också fall där SMT kan skada prestanda. Om redan en CPU-tråd är begränsad av någon specifik resurs, t.ex. L2$ eller någon viss ALU-pipline, så förvärrar man bara denna begränsning om man kör en till CPU-tråd som är begränsad av samma resurs (sista är viktigt, SMT är i princip alltid positivt om trådarna jobbar med vitt skilda saker).

Om SMT är positivt eller ej kan skilja rätt radikalt mellan olika CPU-modeller, även om det finns mer likheter än skillnaden mellan Zen och Core så finns det ett par saker som är väsentligt annorlunda. Här och här finns en rad mätningar på effekten av SMT hos Zen och Broadwell, finns ett par fall där effekten av SMT skiljer sig rätt ordentligt.

TL;DR detta kan vara ett exempel där SMT ger en boost för Core men inte för Zen. Svårt att veta utan att ha tester med 4C/4T och 4C/8T på Ryzen, vi vet ju att Core får en 15-20 % boost av HT i denna titel vid 4C.

Skrivet av Ratatosk:

Ok då tar vi det igen;

Vad är det som är så märkvärdigt med Ryzen?

Svar;
1. En åttakärnig Ryzen puttrar på i tomgång i spel som får en i5a att gråta och be om nåd.
https://www.youtube.com/watch?v=Rb0yfX8161M

2. Om ni hållit er uppdaterade och läst nyheterna här på Sweclockers, hade ni vetat att AMD släpper sina sex och fyrkärninga Ryzen om tre veckor, till mycket bra priser.
http://www.sweclockers.com/nyhet/23515-amd-tillkannager-ryzen...

3. IPC blir inte speciellt snabbare per generation, om de som gör program behöver mer karaft, finns det bara en väg att gå, fler kärnor.
Det finns alltså goda chanser att det lönar sig med mer ärn fyra plus HT i framtiden.

4. Man kan göra en massa annat samtidigt som man spelar, många gör så, de har igång chattprogram youtube, spotify, webbläsaren och en massa annan skit, samtidigt som de spelar.

5. Är man det minsta, intresserad av teknik, speciellt i datorteknik, är det häftigt att kunna köpa en åttakärning CPU för en bråkdel av det pris de hade förr.
Förstår ni inte detta? ni klarar er lika bra med en SSD som en M:2, era kraftaggregat är antagligen överspecade, ni behöver inte ha snyggt initu er datorlåda.

Att mäta last på alla CPU-kärnor i spel kan vara rolig kuriosa, men resultatet är relativt värdelöst. Gäller inte bara spel, gäller alla multitrådade program. Att CPUn är totalt sett belastad till säg 25 % och ger resultat R betyder inte alls att man kan nå 4*R vid 100 % CPU-belastning. Är en läxa jag lärt mig den hårda vägen, när man hade en CPU-tråd fungerade sådana mätningar hyfsat väl (i alla fall till dess att CPU-frekvensen började bli dynamisk) men går inte alls att räkna så på SMP-system.

I båda fallen för ProjectCARS så är GPUn flaskhals nästa hela tiden. Rätt säker på att varken R7-1800X och i7-6950X ligger på 100 % CPU-last här, men ändå är CPUn till viss del en flaskhals då resultatet absolut varierar med CPU-kraft. Så om fallet du länkar skulle ändas till att ha en väsentligt starkare GPU går det inte alls att säga hur de två systemen kommer reagera.

Och för att återknyta till SMT ovan. Enligt detta ger ProjectCARS marginellt högre FPS med SMT avslaget på R7-1800X.

Dold text

fast man får mindre FPS-varians och antagligen en bättre upplevelse när SMT är påslaget.

Dold text

Angående IPC, Ryzen har komplicerat IPC jämförelser rätt ordentligt... Bulldozer-serien och Core-serien hade relativt snarlik relativ IPC oavsett typ av last, den stora skiljelinjen mellan dessa var hur de presterade i få-trådat vs fall när alla CPU-trådar används.

Är lite mindre skillnad i få-trådat vs vältrådat, men fortfarande så att få-trådade fallet relativt sett ger högre IPC på Core. Men nu är den också en rätt rejäl skillnad i relativ IPC beroende på om programmet jobbar med skalära flyttal (t.ex. Cinebench och Blender, här är det jämt skägg mellan Zen och Broadwell), skalära heltal (t.ex. spel, kompilering och web/office, här har Core ett övertag och Skylake har faktiskt 10-25 % övertag mot Broadwell) samt vektoriserade tal (t.ex. Matlab, Matematica och HPC, haswell och har ~100 % högre IPC här).

Detta syns t.ex. i TechPowerUps Ryzen 1800X test. Testat över kategorierna "Arithmetic CPU", "Media Encoding", "Productivity and Compression", "Rendering and Simulation" samt "Web Performance" varierar de individuella resultaten rätt radikalt.

Genomsnittet är nästan komiskt

Dold text

R7 1800X och i7-7700K prestera i genomsnitt identiskt över fallen listade ovan (spel är exkluderade, finns en separat jämförelse för det). Har aldrig varit så viktigt som nu att förstå vilka begränsningar ens eget datoranvändande har om man vill välja den optimala CPUn, gör man något krävande kan det vara en väldigt stor skillnad på att välja "rätt" och välja "fel" CPU!

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk

Ryzen verkar hänga med bra, vilket är trevligt. Hade gärna sett en i5:a (och varför inte en gamma FX-processor) att jämföra med.

Sen är ju kanske GPU-test viktigare i sammanhanget. Sitter mest o spelar i TV-soffan nuförtiden, så jag är ju alltid intresserad att veta hur mitt system klarar 1080p @ 60Hz.

Visa signatur

i5 8400 / Gigabyte B360N Wifi / GTX 1080 / CoolerMaster NR200P / EVGA SuperNova GM 650 / Corsair Vengance LPX 16 GB DDR4 @ 2666mhz / Sandisk A110 & OCZ Trion 150 / Noctua NH-L12S

Permalänk
Hjälpsam

@Yoshman: Lite som jag var inne på här.
#16735914
Men nog är det mysigt att se hur Ryzen nästan spinner på tomgång i testerna?

Angående nyttoprogram, det är säkert många av dessa, som ganska snart kommer att att optimeras även för Ryzen, i alla fall de större titlarna.
Nyttorogram är ju tänkta att leva i ett par år.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Medlem

Vilken hastighet kördes ram-minnena på? Det ger sjukt mycket prestanda för Ryzen med snabbare ram!

Visa signatur

Ryzen 5 5600, Geforce 1080

Permalänk
Medlem
Skrivet av Ratatosk:

Såg ett test på youtube där han även visade CPU belastning, den var jädrigt mycket lägre för Ryzen än för i7 7700k.
Hittar tyvärr inte länken, men det bör finnas några ute.
edit
Hittade detta test för enbart Ryzen, rätt så mycket CPU-kraft kvar till annat.
https://www.youtube.com/watch?v=NtNm7h7-LNY
edit Vad killen i videon tjatar! var tvungen att stänga av ljudet.

edit
Ok den här är nedan är ganska orättvis mot Intel, det är Ryzen mot en stackars i5a.
https://www.youtube.com/watch?v=Rb0yfX8161M

30-50% cpu aktivitet på ryzen och redan över 50-60c :D. Titta vilka vackra temperaturer i5 6600k har. 100% och 43c. Älskar den processorn, idlar på 30c hemma hos mig.

Vill inte ens veta temperaturerna på ryzen när man kör prime, kan inte vara en rolig upplevelse.

Dessutom så är det en ganska stor prisskillnad mellan i56600 och ryz1700. Samt inte enorm skillnad mellan FPS. Min gissning är att ryzen aldrig kommer kunna köra uppemot 100% när man spelar, pga optimizering samt grafikkorts bottleneck. Dessutom behöver man inte 100+fps i spel, så 6600k fungerar perfekt.

Videon bevisar det jag sagt tidigare, INGEN behöver ryzen förutom exempelvis renderare och spelutvecklare.

Permalänk
Medlem
Skrivet av Ratatosk:

1. En åttakärnig Ryzen puttrar på i tomgång i spel som får en i5a att gråta och be om nåd.

Du kan inte mäta CPU-användning på det sättet. Svaret är simpelt, ta ett spel som nyttjar en kärna. Jämför sedan en CPU med en kärna på 2GHz och en CPU med två kärnor på 1GHz.
Systemet med single core kommer visa 100% och systemet med två kärnor kommer visa 50%. Vilket går snabbast?

Windows är notoriskt dåligt för att visa upp detta beteende i activity monitor, om du hittar en process som maxar en kärna kommer det se ut som att alla kärnor är lågt lastade, vilket inte är sanningen.

Vidare är spel inte enkla att parallellisera, det är inte som ett renderingsjobb där man kan klyva upp bilden i flera delar. Vissa trådar kommer kräva mer prestanda än andra, vilket gör att CPU-utilization inte är ett relevant mätetal, bara frametimes är, för det visar hur länge spelet låser och stannar.

Skrivet av Ratatosk:

3. IPC blir inte speciellt snabbare per generation, om de som gör program behöver mer karaft, finns det bara en väg att gå, fler kärnor.
Det finns alltså goda chanser att det lönar sig med mer ärn fyra plus HT i framtiden.

Samtidigt är IPC kung nu och det kommer alltså inte att förändras så länge applikationerna inte är enkla att parallellisera, vilket spel inte är. Visst kan du dela upp det i olika uppgifter, men så länge en tråd är tyngre än de andra så är IPC kung igen.

Skrivet av Ratatosk:

4. Man kan göra en massa annat samtidigt som man spelar, många gör så, de har igång chattprogram youtube, spotify, webbläsaren och en massa annan skit, samtidigt som de spelar.

Absolut, gör man det kan det finnas ett värde i fler kärnor mot att ha lägre IPC. Men vill man ha högsta prestandan väljer man hög IPC och stänger bakgrundsprogrammen.

Skrivet av Ratatosk:

5. Är man det minsta, intresserad av teknik, speciellt i datorteknik, är det häftigt att kunna köpa en åttakärning CPU för en bråkdel av det pris de hade förr.

I min tablet sitter det en fyrkärnig Atom, den kostade en bråkdel mot vad min gamla server med två cpuer kostade. Visst kan det kännas fräckt när man öppnar activity monitor eller ser maskinen boota, men sen ska den ju användas med.

Skrivet av Ratatosk:

Förstår ni inte detta? ni klarar er lika bra med en SSD som en M:2, era kraftaggregat är antagligen överspecade, ni behöver inte ha snyggt initu er datorlåda.

Fast det är inte rättvisa jämförelser. En vettigare hade kunnat vara om du vill ha 600w platinum med lite ripple eller 1200w bronze med massa rippel. En vanlig SSD som presterar utmärkt vid QD1 eller en M2 som behöver QD32 för att gå om den vanliga SSDn.
Visst är det fräckt med överdimensionerade komponenter, men så länge ditt användarfall fungerar sämre är det bara tufft och inget mer.

Visa signatur

Arch | 1440p 165Hz IPS | 7800X3D | 1080ti | 64GB@6GHz | SN850 2TB

Permalänk
Medlem

Den där videon som ratatosk länkat här är rätt värdelöst dessutom.

Såklart att ryzen visar cirka hälften av cpu användningen när den har dubbelt så många kärnor. Nästan alla spel har bara stöd för 4 kärnor, så ryzen har 4 kärnor som inte gör ett skit när man kör spelen.

Och titta tempsen..

Permalänk
Hjälpsam

Tempsen beror på en sämre kylare, inte effektförbrukningen.
Ni känner väl till att en bra kylare, sänker temperaturen?

Angående låg belastning på många kärnor.
#16735914

@clappen tråkigt att du inte gillade videon, jag som trodde att du skulle gilla den.
Här är länken igen, i fall någon missat den.
https://www.youtube.com/watch?v=Rb0yfX8161M

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Hjälpsam

@sniglom: Tack för ett bra svar.
Atom är absolut också intressant teknik, även så Pentium G4560.
Jag har föresten köpt en Raspberry pi 3, fast jag ännu inte klurat ut vad jag skall använda den till.
Vi är ju inte överens vad gäller en del, jag nöjer mig att konstatera att så är fallet.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Skrivet av Klena:

Att 1280*720 ens är relevant idag? Spelar inte fler på 4k än vad de spelar på 720P inom PC-världen då.

720p test är mer för att skratta åt konsoler 720p var aldrig riktigt en relevant upplösning på PC, HD = 1080p, samt 1600x900 & 1366x768 har alltid varit mer vanliga än 720p då många skärmar innan 1080p verkligen blev en utbredd standard samt fortfarande många laptops använder. Skulle gissa att flera använder 1440p än 720p idag som game:ar på PC om man inte tittar på siffror från de som streamar från en PC med en 1080p skärm till en 720p TV, annars kan jag inte tänka mig att det är relevant.
När man pratar relevans baserat på användningssiffror så går de:
1080>768>1440>2160>900>720

Visa signatur

PC #1 CPU: R5 1600 @3.8 Motherboard: B350-A PRIME GPU: EVGA 1080 Ti
PC #2 CPU: i7 3770K @4.2 Motherboard: P8P67 GPU: AMD R9 290X

Permalänk
Datavetare
Skrivet av Ratatosk:

Angående nyttoprogram, det är säkert många av dessa, som ganska snart kommer att att optimeras även för Ryzen, i alla fall de större titlarna.
Nyttorogram är ju tänkta att leva i ett par år.

Vad betyder ens "optimeras även för Ryzen"?

I princip noll av dagens program är på något sätt specialoptimerade för någon CPU-modell. Att handoptimera för specifika x86-modeller blev i det närmaste meningslöst i samma veva som de fick out-of-order execution (Pentium Pro för Intel och K6 för AMD).

Det som helt bestämmer om ett program fungerar väl på en viss CPU är typen av problem som är flaskhals i varje enskilt fall. Den enda typ av optimering som förekommer är att vissa program handoptimerats för SIMD (SSE/AVX), men även detta börjar allt mer hanteras automatiskt via bättre sätt att beskriva programlogik så att en kompilator kan generera SIMD-instruktioner på en nära optimalt sätt.

Vanlig C++/C#/Java är uruselt på att beskriva problemet på ett sätt så en kompilator kan avgöra om SIMD kan användas. För GPUer (som idag är princip är enormt breda SIMD CPUer) löste man detta via OpenCL och CUDA, men ingen av dessa är en jättebra match för SIMD på CPU (fungerar OK, men SIMD på CPUer har styrkor som inte kan utnyttjas i OpenCL/CUDA).

Exempel:
Cinebench - skalar perfekt med CPU-kärnor och är helt begränsat av kapacitet för skalära flyttal, optimal CPU-design är så många CPU-kärnor som möjligt med "bred" FPU. Zen är en perfekt match för dessa laster, vilket också syns i resultaten.

Kompilering - skalar nästan helt perfekt (minimal begränsning från I/O) och är helt begränsat av kapacitet för skalära heltal, optimal design är många kärnor (I/O blir i något läge den dominanta flaskhalsen, så skalar typiskt till 6-12 kärnor beroende på hur starka kärnor man har).

Spel - skalar med kärnor men inte alls linjärt. Är helt begränsat av kapacitet för skalära heltal (så länge GPU-delen inte är flaskhals). Hur väl spel skalar med kärnor beror till viss del på hur låg kostnaden är för core-to-core kommunikation

Matlab - nästan allt beskrivs m.h.a. matriser, en perfekt match för SSE/AVX och FMA.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Hjälpsam
Skrivet av Yoshman:

Vad betyder ens "optimeras även för Ryzen"?

I princip noll av dagens program är på något sätt specialoptimerade för någon CPU-modell. Att handoptimera för specifika x86-modeller blev i det närmaste meningslöst i samma veva som de fick out-of-order execution (Pentium Pro för Intel och K6 för AMD).

Det som helt bestämmer om ett program fungerar väl på en viss CPU är typen av problem som är flaskhals i varje enskilt fall. Den enda typ av optimering som förekommer är att vissa program handoptimerats för SIMD (SSE/AVX), men även detta börjar allt mer hanteras automatiskt via bättre sätt att beskriva programlogik så att en kompilator kan generera SIMD-instruktioner på en nära optimalt sätt.

Vanlig C++/C#/Java är uruselt på att beskriva problemet på ett sätt så en kompilator kan avgöra om SIMD kan användas. För GPUer (som idag är princip är enormt breda SIMD CPUer) löste man detta via OpenCL och CUDA, men ingen av dessa är en jättebra match för SIMD på CPU (fungerar OK, men SIMD på CPUer har styrkor som inte kan utnyttjas i OpenCL/CUDA).

Exempel:
Cinebench - skalar perfekt med CPU-kärnor och är helt begränsat av kapacitet för skalära flyttal, optimal CPU-design är så många CPU-kärnor som möjligt med "bred" FPU. Zen är en perfekt match för dessa laster, vilket också syns i resultaten.

Kompilering - skalar nästan helt perfekt (minimal begränsning från I/O) och är helt begränsat av kapacitet för skalära heltal, optimal design är många kärnor (I/O blir i något läge den dominanta flaskhalsen, så skalar typiskt till 6-12 kärnor beroende på hur starka kärnor man har).

Spel - skalar med kärnor men inte alls linjärt. Är helt begränsat av kapacitet för skalära heltal (så länge GPU-delen inte är flaskhals). Hur väl spel skalar med kärnor beror till viss del på hur låg kostnaden är för core-to-core kommunikation

Matlab - nästan allt beskrivs m.h.a. matriser, en perfekt match för SSE/AVX och FMA.

Du kommer väl ihåg hur uselt just AMD, presterade i Blender för Windows? det åtgärdades via en uppdatering, jag antar att denna innehöll vissa optimeringar.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Datavetare
Skrivet av Ratatosk:

Du kommer väl ihåg hur uselt just AMD, presterade i Blender för Windows? det åtgärdades via en uppdatering, jag antar att denna innehöll vissa optimeringar.

Om du menar senaste version av Blender så infördes en del AVX-optimeringar, tidigare version använde nästan bara skalära heltal med lite vektoriserad SSE pudrat på toppen. Vet att Bulldozer-serien fick en väldigt bra skjuts i senaste versionen (mer så än Ryzen), vilket är rätt intressant. Men Haswell och senare fick också en boost, större boost än Zen, så numera är i7-6900K snabbare än R7-1800X i Blenders "Ryzen test".

Och det är ett lysande exempel på vilken typ av optimeringar som görs: man optimerar genom att dra nytta av specifika funktioner/utökningar för x86, man optimerar inte mot specifika CPU-modeller. Alla CPUer som implementerar AVX lär se en boost, vilket är betydligt mer värdefullt än att bara optimera för en viss CPU-modell.

Problemet i detta fall är att det fortfarande handlar om handskriven AVX via compiler-instricts, hade man använt lite moderna metoder hade man också fått en boost på ARM (via NEON) och POWER (via AltiVec). Tyvärr inte helt lätt att införa något sådant i existerande kodbas där man tidigare redan använt compiler-instricts för SSE optimeringar.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Hjälpsam

@Yoshman: Japp Bulldozer fick en rejäl skjuts, via...

Optimeringar!

Dold text

edit Skall optimeringar göras rätt skall de givetvis inte göras mot en viss CPU-modell, utan genom att fråga vad befintlig CPU klarar.
Tyvärr görs det väl inte alltid så.
Man kan tex undra varför tex Winrar fungerar så dåligt på Ryzen när inte 7zip gör det.
https://www.techpowerup.com/reviews/AMD/Ryzen_7_1800X/7.html

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk

Sandy Bridge i3 med 3,2 GHz kan köra Andromeda, men med en Kaby Lake i3 7350k med 5.0GHz utan HT så startar inte spelet? Hahaha

Visa signatur

PC #1 CPU: R5 1600 @3.8 Motherboard: B350-A PRIME GPU: EVGA 1080 Ti
PC #2 CPU: i7 3770K @4.2 Motherboard: P8P67 GPU: AMD R9 290X

Permalänk
Datavetare
Skrivet av Ratatosk:

@Yoshman: Japp Bulldozer fick en rejäl skjuts, via...

Optimeringar!

Dold text

edit Skall optimeringar göras rätt skall de givetvis inte göras mot en viss CPU-modell, utan genom att fråga vad befintlig CPU klarar.
Tyvärr görs det väl inte alltid så.
Man kan tex undra varför tex Winrar fungerar så dåligt på Ryzen när inte 7zip gör det.
https://www.techpowerup.com/reviews/AMD/Ryzen_7_1800X/7.html

Var mest "optimera mot Ryzen" jag invände mot. Hur skulle man ens praktiskt kunna göra det idag?

Att lägga in stöd för SIMD där det är möjligt bör man absolut göra. Tar man rendering som exempel är det ett problem som absolut kan dra nytta av SIMD, det rätt ordentligt. Idag skalar dessa program i princip perfekt med CPU-kärnor, men då de flesta fortfarande inte vektoriserat sin back-ends lämnar man rejält med prestanda på bordet. Teoretiskt ger AVX+FMA3 upp till 16 gånger högre prestanda på Bulldozer, Zen och pre-Haswell och upp till 32 gånger högre prestanda för Haswell och senare (i praktiken når man aldrig dit, men går absolut att öka prestanda med en eller ett par heltalsfaktorer).

Fallet winrar vs 7zip är ett utmärkt exempel på att just problemställningen som dikterar hur väl något fungerar på en viss CPU. Algoritmen som winrar använder behöver relativt mycket synkronisering mellan CPU-trådar medan 7zip använder en algoritm som är långt mer "embarrassing parallel".

Och det var min poäng, är främst det problem som dikterar om det fungerar bra eller dåligt med en viss CPU-design. Är sällan man kan göra speciellt mycket optimeringar, utom det uppenbara att helt byta algoritm till något som fungerar bättre (om det är möjligt, vilket inte alls är säkert).

Tittar man på spel så finns en del saker man inte kommer ifrån. Det kommer krävas en hel del kommunikation mellan CPU-trådar, så kommer aldrig skala perfekt med CPU-kärnor och det skalar bättre ju billigare kommunikationen mellan CPU-kärnor är. Spel är nästan uteslutande beroende av heltalsberäkningar (logik), flyttalstuggandet är senan länge flyttat till GPU i detta fall.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Hjälpsam
Skrivet av Yoshman:

Var mest "optimera mot Ryzen" jag invände mot. Hur skulle man ens praktiskt kunna göra det idag?

Att lägga in stöd för SIMD där det är möjligt bör man absolut göra. Tar man rendering som exempel är det ett problem som absolut kan dra nytta av SIMD, det rätt ordentligt. Idag skalar dessa program i princip perfekt med CPU-kärnor, men då de flesta fortfarande inte vektoriserat sin back-ends lämnar man rejält med prestanda på bordet. Teoretiskt ger AVX+FMA3 upp till 16 gånger högre prestanda på Bulldozer, Zen och pre-Haswell och upp till 32 gånger högre prestanda för Haswell och senare (i praktiken når man aldrig dit, men går absolut att öka prestanda med en eller ett par heltalsfaktorer).

Fallet winrar vs 7zip är ett utmärkt exempel på att just problemställningen som dikterar hur väl något fungerar på en viss CPU. Algoritmen som winrar använder behöver relativt mycket synkronisering mellan CPU-trådar medan 7zip använder en algoritm som är långt mer "embarrassing parallel".

Och det var min poäng, är främst det problem som dikterar om det fungerar bra eller dåligt med en viss CPU-design. Är sällan man kan göra speciellt mycket optimeringar, utom det uppenbara att helt byta algoritm till något som fungerar bättre (om det är möjligt, vilket inte alls är säkert).

Tittar man på spel så finns en del saker man inte kommer ifrån. Det kommer krävas en hel del kommunikation mellan CPU-trådar, så kommer aldrig skala perfekt med CPU-kärnor och det skalar bättre ju billigare kommunikationen mellan CPU-kärnor är. Spel är nästan uteslutande beroende av heltalsberäkningar (logik), flyttalstuggandet är senan länge flyttat till GPU i detta fall.

Jag är helt införståd med att optimeringar ofta inte låter sig göras på ett enkelt sätt.
De fall jag är inne på, är som du har nämnt, att man i vissa fall inte använt, vissa effektiva kodvägar med instruktioner som Ryzen har stöd för.

Att effektivt dela upp körning på många kärnor, om det alls är görligt, anser jag handlar om design, det är Winzip och 7zip utmärkta exempel på, Winzip är äldre och har nog inte konstruerats för detta från början, att effektivisera där kräver en ny design från början.
7zip är modernare och har designats för multikörning från början.

Samma sak gäller nog spel, det måste skapas en strategi för hur saker kan delas upp och hur dessa skall synkroniseras.
De objekt som har en massiv kommunikation sins emellan läggs tex i samma subsystem och exekveras under samma process.

Det duger heller inte att låta saker vara allt för beroende av andras resultat under samma tidslucka, då är det bättre att använda värden från föregående tidslucka, på så sätt kan dessa objekt exikvera parallellt, oftast är nogranheten tillräcklig ändå.

Tex om f=F(a), g=G(f) och h=H(g) är beroende av varandra så att h=H(G(F(x))), använder man föregående tidluckas värden för f och g.
Då kan f=F(aT), g=G(fT-1) och h=H(gT-1), exikvera parallellt, T är nuvarande tidslucka och T-1 föregående.

Allt detta och mer av vad som krävs, är ingen raketforskning, men det kräver ofta en rejäl omdesign om man inte har gjort så från början.
Redan nu verkar dock många spel använda mer än fyra kärnor, för detta krävs ett tankesätt och design som främjar multikörning, att gå från ingen multikörning alls, till fyra trådar, kräver mycket mer, än att går från fyra till sexton, nu finns strategin redan på plats, anden har släppts ur flaskan.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Medlem
Skrivet av Ratatosk:

Men nog får din CPU svettas lite mer, än en åttakärnig får.
https://www.youtube.com/watch?v=Rb0yfX8161M

Självklart får den det, ibland. Fast den håller sig sval och fin ändå med Noctua 14S fläkten @ 4,5 Ghz
Hade jag köpt allt nytt idag kanske det hade blivit en Ryzen 5 till påsk. Den verkar bli väldigt prisvärd för mobo/cpu/fläkt sett mot vad jag anser vara sweetspot för minsta/snitt FPS och ställd mot samma kostnad för i5 7600K.
Fast jag hade nog klarat mig på en G4560 också, då jag bara kör 1080 och ändå är i den åldern där man börjar fundera på glasögon...och (funderar och svär över) varför reaktionerna är så mycket större hos den yngre generationen med bra mycket "sämre" dator än vad jag har

Visa signatur

Vinterdatorn 2016 (。◕‿◕。)
| Fractal Design Define S | Asus Z170 Pro Gaming > i5 6600K > Noctua U14S | RX480 4GB + RX570 4GB | EVO850 250 + 512 GB SSD'er | 2x8GB Corsair 3000MHz | Supernova G2 650W | AOC G2460PF 24" |

Permalänk
Hjälpsam
Skrivet av Vapo:

Självklart får den det, ibland. Fast den håller sig sval och fin ändå med Noctua 14S fläkten @ 4,5 Ghz
Hade jag köpt allt nytt idag kanske det hade blivit en Ryzen 5 till påsk. Den verkar bli väldigt prisvärd för mobo/cpu/fläkt sett mot vad jag anser vara sweetspot för minsta/snitt FPS och ställd mot samma kostnad för i5 7600K.
Fast jag hade nog klarat mig på en G4560 också, då jag bara kör 1080 och ändå är i den åldern där man börjar fundera på glasögon...och (funderar och svär över) varför reaktionerna är så mycket större hos den yngre generationen med bra mycket "sämre" dator än vad jag har

G4560 är onekligen en väldigt trevlig CPU, med lite lägre prestanda i burken, får man ju också något att skylla på.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Datavetare
Skrivet av Ratatosk:

Jag är helt införståd med att optimeringar ofta inte låter sig göras på ett enkelt sätt.
De fall jag är inne på, är som du har nämnt, att man i vissa fall inte använt, vissa effektiva kodvägar med instruktioner som Ryzen har stöd för.

Att effektivt dela upp körning på många kärnor, om det alls är görligt, anser jag handlar om design, det är Winzip och 7zip utmärkta exempel på, Winzip är äldre och har nog inte konstruerats för detta från början, att effektivisera där kräver en ny design från början.
7zip är modernare och har designats för multikörning från början.

Samma sak gäller nog spel, det måste skapas en strategi för hur saker kan delas upp och hur dessa skall synkroniseras.
De objekt som har en massiv kommunikation sins emellan läggs tex i samma subsystem och exekveras under samma process.

Det duger heller inte att låta saker vara allt för beroende av andras resultat under samma tidslucka, då är det bättre att använda värden från föregående tidslucka, på så sätt kan dessa objekt exikvera parallellt, oftast är nogranheten tillräcklig ändå.

Tex om f=F(a), g=G(f) och h=H(g) är beroende av varandra så att h=H(G(F(x))), använder man föregående tidluckas värden för f och g.
Då kan f=F(aT), g=G(fT-1) och h=H(gT-1), exikvera parallellt, T är nuvarande tidslucka och T-1 föregående.

Allt detta och mer av vad som krävs, är ingen raketforskning, men det kräver ofta en rejäl omdesign om man inte har gjort så från början.
Redan nu verkar dock många spel använda mer än fyra kärnor, för detta krävs ett tankesätt och design som främjar multikörning, att gå från ingen multikörning alls, till fyra trådar, kräver mycket mer, än att går från fyra till sexton, nu finns strategin redan på plats, anden har släppts ur flaskan.

Skulle säga att moderna spelmotorer som skalar förbi dual-core använder i princip alltid någon form av "work stealing". Men en sådan design kan man i teorin stödja hur många CPU-trådar som helst, i praktiken kommer man ändå bli begränsad av att det finns serialiseringpunkter. Några exempel är att GPUer endast har en grafikkö, DX12/Vulkan låter vilken tråd som helst posta där men då det handlar om en delad HW-resurs måste access synkroniseras mellan trådar (DX12 gör det automatiskt, Vulkan dokumenterar att applikationen måste göra explicit synkronisering).

Hur väl spel kan skala med kärnor dikteras därför av hur lång tid man måste spendera i dessa synkroniseringsregioner, detta beställer p värdet i Amdahls lag. Att de spel som skalar bäst med kärnor har väldigt snarlikt värde på p ger en vink om att vi kanske inte kan förvänta oss jättemycket bättre skalning med kärnor.

Men redan idag får man ju upp till 20 % högre prestanda av att gå från 4C till 6C, upp till 33 % om man går från 4C till 8C. Det stora lyftet är, vilket också syns i resultaten, är att ovan ger en maximal boost på 50 % när man går från 2C till 4C. Alla dessa är om IPC och frekvens är konstant över alla fall.

Rent generellt kring multitrådning så är det rätt vanligt att de mest effektiva algoritmerna inte alls skalar bra med CPU-kärnor. Så man måste då ta beslutet om maximal effektivitet är prioritet (vilket betyder välj den bästa algoritmen även om det betyder dålig skalning med kärnor) eller om maximal total throughput givet tillräckligt med kärnor (vilket betyder att man äter upp CPU-kraft som skulle kunna användas av andra saker som kanske körs parallellt).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Spelprestanda problemet är ganska uppenbart, dagens spel nyttjar bara hälften av de tillgängliga trådarna i Ryzen 7, frågan är när spel blir ännu mer flertrådiga.

Får C2D vs C2Q vibbar

Visa signatur

AMD R7700/ASRock X670E/GSkill 32GB DDR5 6000cl32/XFX RX6800/Kingston Fury 2TB NVMe/Corsair RM850e
KIDS: i7 4790K/16GB/GF1070Ti/1TB NVMe #2: i7 4790K/16GB/GF970/1TB SSD
CLUB: i5 6600K/16GB/GF980/1TB SSD #2: i7 2600K/16GB/GF680/256GB SSD #3: Q9550/4GB/GF770/500GB SSD
HTPC: E8400/4GB/R4600/2TB HDD SONY VAIO: i3 2310M/6GB/R6470M/500GB SSD
AMIGA A4000/PPC, A4000/060, A1200/060, A600/030, A500/020, A1000 etc.

Permalänk
Avstängd
Skrivet av anon200632:

Jag tänkte köpa Ryzen men insåg sedan att min i3 6300 med HT @ 4.6GHz får runt samma fps i spel som 1700 så jag klarar mig några år till med mina i7 maskiner.

Kan göra massa samtidigt som jag spelar med i7orna det är inga problem.

Känner du inte att du kommer att utnyttja alla åtta kärnor så är din 7700K perfekt för jobbet. Ser inga alls orsaker att byta processor.

Skrivet av Kenneth:

Det är lite oklart faktiskt, vi stängde av kärnorna via Ryzen Master som inte riktigt säger vilka som stängs av. Men jag antar att den stänger av en kärna var per CCX och inte börjar med ett helt kluster.

För bara en minut sedan visade Jonas (som är tillbaka från semester) vart man kunde stänga av det i UEFI, som låg begravt under 3 sub-menyer med det logiska namnet Downcore Control. Där man kan välja specifikt vilka kärnor per CCX som ska stängas av, och även det vi kommer använda i framtiden

Kan man stänga av hela kluster via UEFI? Eller är det bara max en kärna per CCX kluster? Ifall man skulle kunna stänga av hela kluster och i praktiken göra en sexkärnig processor till fyrkärnig och därför slippa behovet av kommunikation av dessa? Visst låter det lite som att köpa en ferrari för att dra släpvagnen men man skulle ju iallafall teoretiskt slippa flaskhalsen som uppkommer när olika kluster kommunicerar med varandra.

Skrivet av Yoshman:

Hur kan någon klaga på att man tar med 1280x720 resultaten? Det var möjligt att köra hela spelet och rendera till /dev/null (d.v.s. effektivt skicka alla GPU-kommandon i ett svart hål, fast alla ska skickas av CPUn) vore det en ännu mer intressant datapunkt.

Varför? Jo, för man vill ha svar från två huvudspår i dessa tester:

  • Hur påverkar CPUn spelet, d.v.s. hur skalar det med CPU-kärnor, hur pass väl fungerar det på en viss modell etc. I detta fall vill man att GPU-delen påverkar utfallet så lite som möjligt.

  • Hur påverkar GPUn spelet, d.v.s. hur mycket GPU-kraft behövs i en viss upplösning, för en viss FPS etc. I detta fall vill man ha en så stark CPU att den aldrig är en flaskhals.

Naturligtvis hade det varit ännu bättre om alla tänkbara konfigurationer testas, men har man fallen när CPUn är primär flaskhals respektive fallet när GPUn är primär flaskhals går det hyfsat bra att extrapolera till sin egen konfiguration.

Testerna där man köra samma CPU med 2C/4T till 8C/16T i 1280x720 är t.ex. guld, med detta är det möjligt att hyfsat bra beräkna hur pass väl spelmotorn skalar med CPU-kärnor och beskriva detta m.h.a. Amdahls lag. Har man gjort det går det sedan att relativt väl bilda sig en uppfattning om hur spelmotorn skalar med CPU-kärnor bara man har en datapunkt från en annan modell.

Förutsatt att 1280x720 resultatet för i7-7700K fortfarande är CPU-bundet går det t.ex. att skatta prestanda på en framtida 6C/12T modell baserade på Kaby Lake med informationen ovan.

Anpassar man Amdahls lag till mätningarna med R7 1800X med olika antal kärnor aktiverade får man att värdet på p (hur stor andel av spelmotorn kan dra nytta av alla kärnor) är ca 0,74.

Ett p värde på 0,74 är rätt bra, ligger i linje med andra moderna spelmotorer som skalar rätt väl med kärnor. Rätt intressant att moderna spel med bra CPU-skalning ligger ett rätt smalt spann, 0,7-0,8 (runt 0,8 är vad DX12 titlarna brukar ligga på). Detta kan vara en indikation på att begränsningarna för att skala med CPU-kärnor kan ligga i delar som spelmotorerna inte längre rår på, t.ex. i DirectX eller andra delar som spel måste nyttja.

Så hur presterar en fiktiv 6C/12T Kaby Lake @ 4,4 GHz all-core turbo?

FPS2 = FPS1 * (A / (1 - p + p / c2)) / (A / (1 - p + p / c1))

Där FPS1 är FPS värdet för den modell vi vet, c1 är antal CPU-kärnor i den modellen. FPS2 är det förväntade värdet och c2 är antal CPU-kärnor i den modell vi vill veta prestanda för. Notera att detta bara fungerar om SMT är endera av på alla modeller eller på på alla modeller, går att skatta effekten av SMT men kräver mer data att utgå från då.

Notera att värdet på A är irrelevant, det är en konstant som går att förkorta bort. A är skalningen från Amdals lag till FPS-värdet som gäller för just detta titel (går att beräkna om man vill).

FPS(6C/12T) = 160 * (1 - 0,74 + 0,74 / 4) / (1 - 0,74 + 0,74 / 6) = 186

Och rent praktiskt. Sitter man på en högfrekvensskärm kanske man väljer att dra ner grafikinställningarna i 1920x1080 för att nå sitt FPS-mål. I ett sådant läge är också 1280x720 resultatet användbara, kommer vara ungefär samma CPU-kraft som krävs för att nå en visst FPS värde då effekten från grafikinställningar för CPUn är rätt svag (dock inte helt noll så är nog bra att man kör 1280x720 "ultra" här).

Haha. It takes Yoshman för att göra ett enkelt svar komplicerat. Det hade räckt med "720p mätts för att skapa en flaskhals som ligger på CPU och inte GPU vilket hade varit fallet vid högre upplösningar".

Skrivet av Vapo:

Så hur många trådar behövs för detta? Varken Skype/Spotify/Chrome simultant verkar döda min icke-Ryzen-cpu när jag spelar. Kanske hade jag tur med silikonlotteriet bara...

Dra upp 30 flikar i Chrome och se din dator gråta. Eller vad sägs om Xsplit i 1080p@60 FPS stream?

Skrivet av sniglom:

Samtidigt är IPC kung nu och det kommer alltså inte att förändras så länge applikationerna inte är enkla att parallellisera, vilket spel inte är. Visst kan du dela upp det i olika uppgifter, men så länge en tråd är tyngre än de andra så är IPC kung igen.

Korrekt och i klock för klock (IPC) så är Ryzen bara 10% efter KBL där man lägger sig på just över Skylakeprestanda (Källa: Sweclockers).

Det Intel har som framgång och som gör skillnaden större är KB-L riktigt fina överklockningspotential. Inte bara att den kommer i 4,5 GHz direkt ur box utan att man även kan pressa den upp emot 5 GHz med vanlig luftkylning.

Faktum är att AMD är där Intel var när de lanserade Nahalem. Bra prestanda men knappast någon superöverklockare (Modernt sett) utan den stora överklockningspotentialen kom med Sandybridge som var den förfinade arkitekturen. Lyckas AMD med Zen 2 och få den att likna Sandybridge så kommer de kommande generationerna bli extremt intressanta oberoende om man håller på AMD eller Intel.

Visa signatur

||NZXT H440 Black/Red||Intel i5 2500k @ 4,2GHz ||Noctua NH-D14 ||GA-Z77X-UD3H ||8 gb Corsair Vengeance 1600mhz DDR3 ||MSI GeForce GTX 970 ||OCZ Agility 3 120GB SSD ||Samsung Spinpoint F3 1TB ||Corsair HX750W||
Software is like sex, it's better when it's free. - Linus Torvalds

Permalänk
Benchmaskin 🍞
Skrivet av Tumnus:

Kan man stänga av hela kluster via UEFI? Eller är det bara max en kärna per CCX kluster? Ifall man skulle kunna stänga av hela kluster och i praktiken göra en sexkärnig processor till fyrkärnig och därför slippa behovet av kommunikation av dessa? Visst låter det lite som att köpa en ferrari för att dra släpvagnen men man skulle ju iallafall teoretiskt slippa flaskhalsen som uppkommer när olika kluster kommunicerar med varandra.

Ja, det går att stänga av i en del olika konfigurationer, bland annat hela kluster.

Permalänk
Medlem

Mer tester

@Kenneth: Skulle man inte kunna få tester med streaming ?. Det pratas väldigt mycket att Amd prollen blir bättre . Men blir den det ? . många vill kunna göra detta när man spelar .

Visa signatur

Dator 1 5800x 32 GB ram B550 plus TUF Kingston 3000 2048 GB EVO 870 QVO 4TB ASUS 370 ti TUF RM 750 X Corsair 4000D Airflow Noctua NH-D15S WIN 10 ASUS PG279Q skärm

Permalänk
Medlem
Skrivet av Tumnus:

Dra upp 30 flikar i Chrome och se din dator gråta. Eller vad sägs om Xsplit i 1080p@60 FPS stream?

But why? Jag kanske är gammaldags som kör bokmärken och bara växlar mellan två eller ett par flikar. Känns onödigt att köpa hårdvara för att kunna driva (prestanda-dränerande) mjukvara som kan användas på ett bättre sätt.

Visa signatur

Vinterdatorn 2016 (。◕‿◕。)
| Fractal Design Define S | Asus Z170 Pro Gaming > i5 6600K > Noctua U14S | RX480 4GB + RX570 4GB | EVO850 250 + 512 GB SSD'er | 2x8GB Corsair 3000MHz | Supernova G2 650W | AOC G2460PF 24" |

Permalänk
Avstängd
Skrivet av Vapo:

But why? Jag kanske är gammaldags som kör bokmärken och bara växlar mellan två eller ett par flikar. Känns onödigt att köpa hårdvara för att kunna driva (prestanda-dränerande) mjukvara som kan användas på ett bättre sätt.

Smidigt, brukar ha ett tiotal flikar så det går snabbt att komma till favoritställena. Bokmärkesdelen är fylld och inte smidig när det gäller att snabbt växla sida.

Permalänk
Medlem
Skrivet av Србо:

Smidigt, brukar ha ett tiotal flikar så det går snabbt att komma till favoritställena. Bokmärkesdelen är fylld och inte smidig när det gäller att snabbt växla sida.

Går väl lika snabbt att hitta ett bokmärke som att hitta en specifik flik utav 30?

Att placera bokmärken i mappar via kategori måste väl vara lättare än att navigera bland dom där?
Nu sa du 10, men det var tal på 30 först. T.ex 10 flikar borde väl inte döda en vanlig I5a heller?

Visa signatur

sweclockers prestandaindex

Efter 10 kommer 11.
Efter 99 kommer 100.