Ang Ryzen's spelprestanda (matchar 7700K idag, presterar bättre i morgondagen)

2017-04-06 16:34

Medlem

Plats: Märsta
Registrerad: Mar 2006

●

En intressant sak är ju hur spelutvecklare ska hantera att Ryzen har två CCX, hur dom skall kunna använda mer än 4 kärnor/8 trådar utan att introducera ordentlig latens:

https://arstechnica.co.uk/gadgets/2017/03/amd-ryzen-gaming-pe...
The other piece of the puzzle is the games themselves. AMD says that it has identified "some simple changes that can improve a game's understanding of the "Zen" core/cache topology," though the company has said that it will not share what those details are with us. The operating system may be doing things right, but the operating system doesn't inspect the workload of each individual thread, so it can still make mistakes.

For example, if two threads are operating on the same set of shared data, they should probably be put on the same CCX to avoid having to transfer data across that relatively slow link. Windows can't readily detect this shared data and won't see that the two threads are spending an excessive amount of time waiting for memory. If there are enough compute-bound threads that Windows has to schedule them on both CCXes, there's a chance that these two threads will be separated, one on one CCX, the other on the other. The developer who created the app, however, can do things such as restricting the pair of threads to one CCX or the other, ensuring that they'll always be on the same side of the Infinity Fabric link.

As an added complication, the right strategy may well vary depending on the nature of an application. Software that's hungry for bandwidth might be better off using some threads on one CCX, some threads on the other CCX, so that it has two sets of threads that can use the full bandwidth of the level 3 cache. Software that's highly sensitive to latency, however, may be better placing all its threads on one CCX and ignoring the other entirely. Doing the right thing will require careful examination of the software and how it uses cache, threading, and memory.

Rapportera Redigera

Citera flera Citera (3)

2017-04-06 18:42

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av tellus82:

Du har helt enkelt inte fattat problemet, jag kan inte förklara det bättre för dig, kika på de övriga videor som släppts angående detta, adoredtv och Hardware Unboxed. Att du sedan Inte förstår att buggen enbart uppstår med nv/ryzen kombon och dx12 där prestanda absolut inte motsvarar vad som de fakto bör vara.

Du låter mer och mer som någon som ursäktar nVidia in i det sista...
Tänk på detta, om det vore ett enkelt overhead problem som drabbar alla processorer på samma sätt så skulle Intel cpun reagera exakt likadant, varför? Jo därför att bägge plattformarna jobbar redan under konstant CPU limiterade förhållanden. Använd en smula logik... Att jag sedan Inte enbart kikar på frametime mätningen beror på att väldigt få ställen rapporterar just dessa under cpu benchmarks, då denna bugg ger störst genomslag på medel och max fps som man av en händelse normalt använder vid testande så ger buggen direkt ofördelaktigt negativa resultat för ryzen i CPU benchmarks. Ett resultat som garanterat kan förbättras genom att nVidia ser över buggen/problemet.
Vad i detta förstår du inte?

Edit:Om nVidia valt en design i mjuk och hårdvara som skapar en ohållbart hög overhead på just Ryzen, är det då AMDs fel eller nVidias fel? Vem bör fixa denna oproportionerligt stora overhead, AMD eller nVidia?
Om man gör CPU benchmark testande vilken gpu bör man då använda för att påvisa processorns riktiga och ovinklade prestanda, AMD eller nVidia?

Gå till inlägget

Du skrev detta tidigare

"Alltså, i 720p testerna med cpu limitering presterar nvidia sämre i dx12 än det borde relativt dx11 bara på ryzen samtidigt som detta inte händer på intel, dessutom presterar nvidia sämre relativt amd på ryzen med lägre minneshastighet även i dx11, deltat mellan rx480 och 1060 ökar, med AMD gpu så sker detta inte på intel eller ryzen, deltat mellan gpuerna krymper/ökar på ett sätt som det inte ska göra, kom ihåg bägge var kraftigt cpu limiterade och fps skulle inte dykt på kombon nvidia/ryzen om allt funkar bra."

Vilket överhuvudtaget inte stämmer överens med den video du själv länkade som referens. Den relativa skillnaden mellan DX12 och DX11 är väldigt snarlik för 7700K och 1700X.

Och nu hävdar du att jag inte förstår problemet, dina svar är rätt inkoherenta med data du själv postar. Din försvar för detta är alltså att jag tydligen borde fattat att det inte var DEN videon man ska titta på utan något helt annat som tydlige visar problemet i "rätt" ljus.

På vilket sätt ursäktar jag Nvidia? Det är ett torrt konstaterande att Nvidia gör delar i programvara som AMD gör i HW. Är ju knappast någon nyhet att programvarubaserade lösningar är långt mer flexibla, men de kräver självklart med CPU-kraft då det är, well, programvara... Vad det gäller DX11 borde det vid det här laget vara rätt välkänd fakta att AMD aldrig kunnat utnyttja CGN på ett bra sätt i den APIn.

Både Nvidia (Fermi) och AMD (GCN) trodde ju väldigt hårt på att GPGPU skulle bli rejält populärt, båda dessa GPU-arkitekturer var väldigt inriktade på GPGPU (då aktuell DX-version inte kunde använda en rad funktioner man introducerade i dessa designer). Verkar som Nvidia rätt tidigt insåg att GPGPU inte kom att användas i någon relevant utsträckning på konsument GPUer, så man strippade bort dessa finesser till stor del för att kunna lägga transistorer på annat. AMD verkar ta det steget först med Vega (vi vet snart).

Skrivet av Stoff3th3m4n:

Vi har i flera år sett en viss person vända och vrida på precis allt till Intels och Nvidias fördel. Så är du förvånad? Blir väldigt svårt med trovärdigheten tycker jag. Kör själv enbart Intel och Nvidia i dagsläget, och t om jag ser hur det ser ut i argumentationen.

Tycker också att det är extremt tydligt att något är "off" gällande Ryzen tillsammans med Nvidiakort. Det behöver man inte vara någon raketforskare för att se i de test som länkats.

Vi får helt enkelt se om fler testare och recensenter plockar upp detta och utreder. Hade personligen gärna sett Sweclockers göra ett nytt test med andra minneshastigheter samt grafikkort nu när det är så mycket snack om detta.

Gå till inlägget

Hur ser det ut i argumentationen då? Peka ut vilka påståenden som är fel. Och för den delen, påverkas din trovärdighet av att du "Kör själv enbart med Intel och Nvidia"?

Själv är jag övertygad att ARM kommer "vinna" i slutändan, jag tjänar brutalt mycket pengar på att skriva kod just för ARM system. ARM är Intels värsta fiende. Förändrar det på något sätt de fakta jag pekar på? Ser överhuvudtaget inte varför det skulle ändra något alls.

Några fakta som tydligen sticker i ögonen och enligt dig gör det väldigt svårt med trovärdigheten:

Spel jobbar främst med skalära heltal, Skylake har ~40 % högre IPC där jämfört med Zen. Går bl.a. att se i WebXPRT (enkeltrådat) och kompilering (perfekt skalning över kärnor).
Spel skalar inte i närheten perfekt med ökande antal CPU-kärnor
Nvidia gör mer i programvara jämfört med AMD på GPU-sidan, system med Nvidia GPUer kommer därför tidigare bli CPU-bundna

Vad av ovan är skrämmande kontroversiellt att det tydligen helt äventyrar min trovärdighet?

Om ovan ändå kan accepteras som att vara korrekt: är inte det överlägset enklaste förklaring för de observationer vissa youtuber då gjort helt enkelt att om man gör ett spel CPU-bundet så kommer 7700K prestera bättre då en 7700K i stock är ~50 % starkare per CPU-kärna jämfört med Ryzen 7 @ 4,0 GHz?

Då AMD gör mer i HW kommer man bli CPU-bunden vid högre FPS.

Att det inte krävs en fullskalig komplott mot datorvärldens Messias verkar för vissa vara en total omöjlighet.

Skrivet av tellus82:

Fast det är inte mer rimligt än någon annan teori, det kan likagärna vara att nvidia sprider ut någon form av cpu arbete för dx12 på för många trådar med just Ryzen vilket skapar en onödigt stor overhead, så stor att den ger negativ prestanda jämfört med 4-8 trådar vid cpu limiterade förhållanden. Antingen att det äter för mycet minesbandbredd eller ren cpu tid eller att det bara orsakar stalls i köerna. En enkel lösning här är att nvidia limiterar antalet trådar som skapas så att overhead hålls nere på en nivå så det inte orsakar negativ prestandaökning.

Ingen av oss här kan säga att vi vet exakt varför detta sker men ingen här kan säga att det inte sker, det är mer än överbevisat just nu av helt fristående testare som inte har något med varandra att göra, dom har till och med varit direkt osams.

En lösning på detta problem/bug från nVidias sida är väl ändå inget som skulle kunna vara negativt för någon, eller tycker ni det? Om förhållandena vore rakt motsatta och det var bara intel processorer som var drabbade skulle ni se det på samma sätt då?

Gå till inlägget

Det som gör den teorin rätt osannolik, d.v.s. Nvidia sprider ut arbete för DX12, är ju att det finns en rad officiella uttalande från Nvidia som säger att applikationen måste göra all form av balansering mellan CPU-kärnor i DX12 för drivern kommer aldrig skapa egna trådar. Varför skulle det fungera på något annat sätt än vad Nvidia hävdar i sina egna optimeringsguider?

Vad är det för fel på den betydligt mycket enklare förklaringen ovan? Eller konspirerar kompilatortillverkare och de som tillverkar webbläsare också mot AMD.

OBS: säger inte att det finns optimeringar att göra som kan gynna Ryzen, säger bara att de resultat kring DX12 som presenteras känns ju så uppenbart enkla att förklara om man bara accepterar att Nvidias GPUer är designande på ett sätt som gör dem mer beroende av en snabb CPU + Ryzen har inte alls lika bra IPC relativt Core-serien när det handlar om skalära heltal som den har för skalära flyttal, spel använder nästan bara skalära heltal.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (9)

2017-04-06 19:11

Permalänk

Uzanar

Entusiast ★

Plats: Linköping
Registrerad: Mar 2012

●

Skrivet av Yoshman:

Nvidia gör mer i programvara jämfört med AMD på GPU-sidan, system med Nvidia GPUer kommer därför tidigare bli CPU-bundna

Gå till inlägget

Nu ger jag mig in direkt i korselden här men i så fall undrar jag hur det kom sig att GTX 1060 ibland presterade avsevärt bättre än RX 480 vid launch med samma CPU när det gällde lite äldre CPU'er.
Det talar i så fall emot det? https://www.youtube.com/watch?v=pjZ3MmxP0Fg

Visa signatur

Den digitala högborgen: [Fractal Design Meshify C] ≈ [Corsair RM850x] ≈ [GeForce RTX 3080] ≈ [AMD Ryzen 7 7800X3D ≈ [Noctua NH-U14S] ≈ [G.Skill Flare X5 32GB@6GHz/CL30] ≈ [MSI MAG B650 TOMAHAWK] ≈ [Kingston Fury Renegade 2 TB] ≈

Rapportera Redigera

Citera flera Citera (1)

2017-04-06 19:17

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av Uzanar:

Nu ger jag mig in direkt i korselden här men i så fall undrar jag hur det kom sig att GTX 1060 ibland presterade avsevärt bättre än RX 480 vid launch med samma CPU när det gällde lite äldre CPU'er.
Det talar i så fall emot det? https://www.youtube.com/watch?v=pjZ3MmxP0Fg

Gå till inlägget

Så länge man inte är CPU-bunden finns det egentligen bara fördelar med Nvidias design. Den är mer flexibel (gäller ju för alla lösningar, HW-implementation är mer effektiv när den är en perfekt match medan en lösning i programvara kan anpassas till alla tänkbara fall) och man kunde lägga transistorer på andra saker än en HW-scheduler.

Videon visar ju att även med riktigt krävande spel är det först vid 1280x720 med "medium" inställningar som man blir CPU-bunden. I princip alla tester av 1060 och 480 gjordes ju i 1920x1080 "ultra" och uppåt, typiskt med väldigt starka CPUer. Man är i det läget inte i närheten av att vara CPU-bunden.

BTW: TomsHardware har precis gjort en revisit av 480 och 1060, där mäter man prestanda för dessa modeller idag för den som är intresserad.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (2)

2017-04-06 19:23

Permalänk

Uzanar

Entusiast ★

Plats: Linköping
Registrerad: Mar 2012

●

Skrivet av Yoshman:

Videon visar ju att även med riktigt krävande spel är det först vid 1280x720 med "medium" inställningar som man blir CPU-bunden. I princip alla tester av 1060 och 480 gjordes ju i 1920x1080 "ultra" och uppåt, typiskt med väldigt starka CPUer. Man är i det läget inte i närheten av att vara CPU-bunden.

Gå till inlägget

Hmmm, tittade du verkligen på videon nu? Samtliga tester är gjorda i just 1080p@Ultra eller motsvarande.
Skillnader syns väldigt väl med dessa inställningar som till exempel vid 2:44 https://youtu.be/pjZ3MmxP0Fg?t=2m44s där GTX 1060/i5 750 levererar en stadig 60FPS+ utan någon drop under 60FPS medans ett RX 480 med samma CPU levererar suboptimal prestanda.

Nu är det här gamla CPU'er för all del, men det jag ville åt var helt enkelt att du påstod en nackdel för Nvidia med hänsyn till CPU-kraften man behöver. Videon säger precis tvärtom med en fördel för Nvidia.

Visa signatur

Den digitala högborgen: [Fractal Design Meshify C] ≈ [Corsair RM850x] ≈ [GeForce RTX 3080] ≈ [AMD Ryzen 7 7800X3D ≈ [Noctua NH-U14S] ≈ [G.Skill Flare X5 32GB@6GHz/CL30] ≈ [MSI MAG B650 TOMAHAWK] ≈ [Kingston Fury Renegade 2 TB] ≈

Rapportera Redigera

Citera flera Citera (1)

2017-04-06 19:36

Permalänk

Herr Kantarell

Medlem ★

Plats: Stockholm
Registrerad: Aug 2007

●

@Yoshman @tellus82 vid 2.53

Visa signatur

Ryzen 9 5950X, 32GB 3600MHz CL16, SN850 500GB SN750 2TB, B550 ROG, 3090 24 GB
Har haft dessa GPUer: Tseng ET6000, Matrox M3D, 3DFX Voodoo 1-3, nVidia Riva 128, TNT, TNT2, Geforce 256 SDR+DDR, Geforce 2mx, 3, GT 8600m, GTX460 SLI, GTX580, GTX670 SLI, 1080 ti, 2080 ti, 3090 AMD Radeon 9200, 4850 CF, 6950@70, 6870 CF, 7850 CF, R9 390, R9 Nano, Vega 64, RX 6800 XT
Lista beg. priser GPUer ESD for dummies

Rapportera Redigera

Citera flera Citera (4)

2017-04-06 19:39

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av axello:

En intressant sak är ju hur spelutvecklare ska hantera att Ryzen har två CCX, hur dom skall kunna använda mer än 4 kärnor/8 trådar utan att introducera ordentlig latens:

https://arstechnica.co.uk/gadgets/2017/03/amd-ryzen-gaming-pe...
The other piece of the puzzle is the games themselves. AMD says that it has identified "some simple changes that can improve a game's understanding of the "Zen" core/cache topology," though the company has said that it will not share what those details are with us. The operating system may be doing things right, but the operating system doesn't inspect the workload of each individual thread, so it can still make mistakes.

For example, if two threads are operating on the same set of shared data, they should probably be put on the same CCX to avoid having to transfer data across that relatively slow link. Windows can't readily detect this shared data and won't see that the two threads are spending an excessive amount of time waiting for memory. If there are enough compute-bound threads that Windows has to schedule them on both CCXes, there's a chance that these two threads will be separated, one on one CCX, the other on the other. The developer who created the app, however, can do things such as restricting the pair of threads to one CCX or the other, ensuring that they'll always be on the same side of the Infinity Fabric link.

As an added complication, the right strategy may well vary depending on the nature of an application. Software that's hungry for bandwidth might be better off using some threads on one CCX, some threads on the other CCX, so that it has two sets of threads that can use the full bandwidth of the level 3 cache. Software that's highly sensitive to latency, however, may be better placing all its threads on one CCX and ignoring the other entirely. Doing the right thing will require careful examination of the software and how it uses cache, threading, and memory.

Gå till inlägget

Fetmarkerade låter bekant...

Just ja, var exakt vad jag skrev när när folk hävdade att Windows scheduler var totalpaj för Ryzen. D.v.s. ett OS kan inte veta vilka OS-trådar som kommunicerar med varandra och är därför totalt omöjligt för en OS-scheduler att göra mycket mer än att se till att jämt sprida lasten så en CPU-tråd per fysisk kärna är lastad för att sedan börja använda den andra tråden. Ändå blev man dumförklarad där också, begrep tydligen inte i vilken maskopi Microsoft och andra hade mot AMD kring Windows scheduler.

Är inte alltid optimalt att första sprida över alla fysiska kärnor, har man två trådar som jobbar väldigt tight så kan det vara en fördel att alltid lägga dem på samma fysiska kärna (har skrivit mellanprogramvara för backbone routers som gör just sådana saker). För alla dessa mindre vanliga fall har ju både Windows och Linux standardfunktioner så applikationer kan styra hur trådar schemaläggs på existerande uppsättning CPU-trådar.

Sista stycket känns ändå: ja, det är teoretiskt möjligt men väldigt dyrt då det bara är relevant för en CPU-mikroarkitektur. Är ju inte ens säkert att sådana optimeringar är vettiga för nästa generation Zen (även om det är rätt sannolikt).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (3)

2017-04-06 19:54

Permalänk

tellus82

Medlem ★

Plats: Sälen
Registrerad: Maj 2004