AMD "Renoir" för stationära datorer spöar "Matisse" i minnesprestanda

2020-06-30 16:30

Permalänk

Nyhet

Melding Plague

Registrerad: Dec 1999

●

AMD "Renoir" för stationära datorer spöar "Matisse" i minnesprestanda

En mindre mängd cacheminne och färre kärnor hjälper till att sänka minneslatenser till under 50 nanosekunder.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Rapportera Redigera

Citera flera Citera

2020-06-30 17:01

Permalänk

osgorth

Medlem ★

Plats: Märsta
Registrerad: Aug 2008

●

4333 CL14 !? Inte dåligt klockat det minnet inte, haha.. Spännande.

Visa signatur

Fractal Define 7, Aorus X570 Xtreme, Ryzen 5950X, Fractal Celsius+ S36, 64GB TridentZ Neo CL14/3600 RAM, MSI RTX 3090 Suprim X, 5TB NVMe SSD + 12TB SATA SSD + 64TB Seagate IronWolf Pro HD, Fractal Ion+ 860W Platinum, LG 32GP850 + LG 42C2 OLED

Rapportera Redigera

Citera flera Citera (3)

2020-06-30 17:12

Permalänk

Ratatosk

Hjälpsam ★

Plats: Karlskoga
Registrerad: Jan 2007

●

Kanske AMD planerade ett hybridship med GDDR5M till Kavari, det rann dock ur sanden när Elpida gick i konkurs.
https://www.hardware.fr/news/13530/ces-gddr5m-victime-deboire...
En APU hade kunnat bli något helt annat än den är i dag.

Visa signatur

Rapportera Redigera

Citera flera Citera (2)

2020-06-30 17:14

Permalänk

Cadzon

Medlem

Plats: Malmö
Registrerad: Okt 2013

●

Och i jämförelse med Intel då?

Rapportera Redigera

Citera flera Citera (2)

2020-06-30 17:16

Permalänk

medbor

Medlem ★

Like-magnet

Registrerad: Okt 2011

●

Bådar gott för gaming om man bara kan skrämma upp frekvensen på kärnorna mycket! 8 kärnor räcker gott för det

Rapportera Redigera

Citera flera Citera (1)

2020-06-30 17:22

Permalänk

the squonk

Medlem ★

Plats: Stockholm
Registrerad: Mar 2004

●

Anledningen att Zen 2 inte skalar med minnen är att det inte går att köra IF 1:1 över 1900MHz, den ändrar till en multipel. Annars har Zen 2 runt 65ns latency redan vid 3600-3733MHz minnen. Hade IF gått att köra högre hade det gått att komma nära resultatet i artikeln med en vanlig Zen 2.

Så den stora nyheten är inte latency, utan att IF går att köra fort.

Sen att man har tokklockat RAM med 1.8V Vdimm och troligen vattenkylning på RAM bör beaktas

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Rapportera Redigera

Citera flera Citera (2)

2020-06-30 17:26

Permalänk

medbor

Medlem ★

Like-magnet

Registrerad: Okt 2011

●

Skrivet av the squonk:

Anledningen att Zen 2 inte skalar med minnen är att det inte går att köra IF 1:1 över 1900MHz, den ändrar till en multipel. Annars har Zen 2 runt 65ns latency redan vid 3600-3733MHz minnen. Hade IF gått att köra högre hade det gått att komma nära resultatet i artikeln med en vanlig Zen 2.

Så den stora nyheten är inte latency, utan att IF går att köra fort.

Sen att man har tokklockat RAM med 1.8V Vdimm och troligen vattenkylning på RAM bör beaktas

Gå till inlägget

Eftersom IO/die inte är ett separat chip så slipper man ett extra hopp över infinity fabric också, så inte bara IF-länkens hastighet

Rapportera Redigera

Citera flera Citera (5)

2020-06-30 17:34

Permalänk

the squonk

Medlem ★

Plats: Stockholm
Registrerad: Mar 2004

●

Skrivet av medbor:

Eftersom IO/die inte är ett separat chip så slipper man ett extra hopp över infinity fabric också, så inte bara IF-länkens hastighet

Gå till inlägget

Det är sant, Zen 3 kommer troligen inte att ha riktigt lika bra latency. Sen att det är liten mängd L3 minskar också latensen. Men störst del är nog den mycket höga IF-frekvensen imho.

Något som är intressant är att många nya B550-moderkort listar 5100MHz som maximal minnes OC, varför kan man undra?

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Rapportera Redigera

Citera flera Citera (2)

2020-06-30 17:57

Permalänk

medbor

Medlem ★

Like-magnet

Registrerad: Okt 2011

●

Skrivet av the squonk:

Det är sant, Zen 3 kommer troligen inte att ha riktigt lika bra latency. Sen att det är liten mängd L3 minskar också latensen. Men störst del är nog den mycket höga IF-frekvensen imho.

Något som är intressant är att många nya B550-moderkort listar 5100MHz som maximal minnes OC, varför kan man undra?

Gå till inlägget

Man kan ju alltid drömma och hoppas!

Jag har inte undersökt maximal if-frekvens närmare på mobila zen2, men den kan absolut stödja högre frekvenser

Rapportera Redigera

Citera flera Citera (1)

2020-06-30 18:10

Permalänk

draanexle

Medlem ★

Registrerad: Jul 2012

●

Skrivet av the squonk:

Det är sant, Zen 3 kommer troligen inte att ha riktigt lika bra latency. Sen att det är liten mängd L3 minskar också latensen. Men störst del är nog den mycket höga IF-frekvensen imho.

Något som är intressant är att många nya B550-moderkort listar 5100MHz som maximal minnes OC, varför kan man undra?

Gå till inlägget

En av anledningarna till varför jag börjat kika på B550 moderkort på sistone.

Mitt X470 dog plötsligt och hade väldigt tur där webhallen gav mig full retur. Vet dock inte om det har o göra med för att det var knappt ett år gammalt, men kul i vilket fall som helst.

Bara svårt att välja då priserna är så knasiga. Om man vill ha lite bättre B550 så är man redan inne på x570 priser.

Och dum som jag är så tycker jag att de prisvärda b450 msi max ser fula ut :')

Visa signatur

MB: Asus Rog B550-F WiFi | CPU: Ryzen 5, 3600
GPU: RTX 4070TiS PNY Verto | Chassi: FD Meshify 2 compact
Ram: G.skill Trident Z, 14-14-14-34, 3200 Mhz, 2x 8gb

Rapportera Redigera

Citera flera Citera

2020-06-30 18:27

Permalänk

Confusion

Medlem

Plats: Malmö
Registrerad: Jan 2004

●

Någon som kan förklara för en gammal gubbe hur mindre cache-minne ger lägre minneslatenser?
Min naiva bild av hur det funkar får det inte att gå ihop, om det inte är något med arkitekturen att göra eller specifika tester (som att man hämtar data som inte finns i cache).
Färre kärnor kan jag ju tänkta mig sänker latensen om de delar cache, eftersom det blir _mer_ cache för varje kärna och högre sannolikhet att man behöver gå via slöare minne för att få fram datan.

Tacksam för förtydligande.

Rapportera Redigera

Citera flera Citera

2020-06-30 18:30

Permalänk

mpat

Medlem ★

Registrerad: Okt 2016

●

Skrivet av Cadzon:

Och i jämförelse med Intel då?

Gå till inlägget

https://www.anandtech.com/show/14664/testing-intel-ice-lake-1...

Kolla 9900K där. Ser ut att vara strax över 60ns (full random, så att Intel’s prefetcher inte stör).

Visa signatur

5900X | 6700XT

Rapportera Redigera

Citera flera Citera

2020-06-30 18:43

Permalänk

the squonk

Medlem ★

Plats: Stockholm
Registrerad: Mar 2004

●

Min 6700K med 3200MHz minne är nere på 43ns, så en hel del bättre just i det avseendet ....

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Rapportera Redigera

Citera flera Citera

2020-06-30 18:45

Permalänk

the squonk

Medlem ★

Plats: Stockholm
Registrerad: Mar 2004

●

Skrivet av Confusion:

Någon som kan förklara för en gammal gubbe hur mindre cache-minne ger lägre minneslatenser?
Min naiva bild av hur det funkar får det inte att gå ihop, om det inte är något med arkitekturen att göra eller specifika tester (som att man hämtar data som inte finns i cache).
Färre kärnor kan jag ju tänkta mig sänker latensen om de delar cache, eftersom det blir _mer_ cache för varje kärna och högre sannolikhet att man behöver gå via slöare minne för att få fram datan.

Tacksam för förtydligande.

Gå till inlägget

Det går snabbare att hämta data ur ett mindre cache eftersom det inte är lika mycket att söka igenom = kortare söktid. Det går också snabbare att flusha. Nu pratar vi nanosekunder, men ändå snabbare. Sen att prestanda kan bli lidande eftersom det inte går att lagra lika mycket i det är en helt annan sak.

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Rapportera Redigera

Citera flera Citera (1)

2020-06-30 18:49

Permalänk

the squonk

Medlem ★

Plats: Stockholm
Registrerad: Mar 2004

●

Skrivet av draanexle:

En av anledningarna till varför jag börjat kika på B550 moderkort på sistone.

Mitt X470 dog plötsligt och hade väldigt tur där webhallen gav mig full retur. Vet dock inte om det har o göra med för att det var knappt ett år gammalt, men kul i vilket fall som helst.

Bara svårt att välja då priserna är så knasiga. Om man vill ha lite bättre B550 så är man redan inne på x570 priser.

Och dum som jag är så tycker jag att de prisvärda b450 msi max ser fula ut :')

Gå till inlägget

Har ett Asus Strix B550-F, rätt strippat på finesser med det viktiga finns och framförallt vad det verkar väl lämpat för OC. När Kitguru testade med all core OC på 3950X presterade det samma i alla tester som X570 Crosshair VIII som kostar över 5000Kr. Det var tom bättre i något test. Känner mig nöjd med det kortet, behöver inte en massa extra jox. Vill man ha lite bättre I/O kan man satsa på TUF X570-Plus som elektriskt är i stort sett samma kort fast med X570.

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Rapportera Redigera

Citera flera Citera

2020-06-30 18:51

Permalänk

mpat

Medlem ★

Registrerad: Okt 2016

●

Skrivet av Confusion:

Någon som kan förklara för en gammal gubbe hur mindre cache-minne ger lägre minneslatenser?
Min naiva bild av hur det funkar får det inte att gå ihop, om det inte är något med arkitekturen att göra eller specifika tester (som att man hämtar data som inte finns i cache).
Färre kärnor kan jag ju tänkta mig sänker latensen om de delar cache, eftersom det blir _mer_ cache för varje kärna och högre sannolikhet att man behöver gå via slöare minne för att få fram datan.

Tacksam för förtydligande.

Gå till inlägget

Enkelt uttryckt: fler ställen att kolla på.

Något längre: säg att du har 10 000 mappar, numrerade från 0 till 9999, i ett lager. Eftersom det tar tid att gå ut på lagret, väljer du att ha de 100 senaste inne på ditt kontor - en cache. Om du bara använder de 100 senaste rakt av, måste du kolla igenom 100 mappar varenda gång du får en fråga för att se om den du vill ha finns där innan du ens går ut på lagret och hämtar något. Inte så effektivt.

Ett annat sätt hade varit att du tittar på de två sista siffrorna, och sparar i cachen efter detta. Du gör helt enkelt platser numrerade 0-99, och när du sparar en mapp så sparar du den i ett fack som motsvarar de två sista siffrorna i numret. Mapp nummer 1234 sparas alltså i fack nummer 34, och mapp nummer 5678 i fack 78. När det kommer in en fråga om mapp nummer 2222, behöver du bara titta i fack nummer 22 för att se om du har den på kontoret, och annars får du gå ut på lagret. Detta innebär att din latency går ner.

Problemet här är att om du har två mappar med samma slutsiffror som används ofta, så kommer de inte att cachas. Mapp nummer 1122 och mapp nummer 3322 hamnar ju i samma fack, så om man ofta läser bägge två så gör cachen ingen nytta. En lösning då är att göra cachen tvåfaldig (eng. 2-way). Du sparar helt enkelt de två senaste som slutar på varje nummer. Nu har du en cache som är dubbelt så stor, och risken att du får gå ut på lagret är mindre. Nackdelen är dock att du nu måste titta på två ställen innan du går ut på lagret - din latency har gått upp lite. I praktiken märks inte alltid detta eftersom latency är i hela klockcykler, men någonstans går man över en gräns och får lägga på en cykel. Många cachar är 4-way eller 8-way idag.

Men varför måste det bli så, om jag ökar storleken på cachen? Varför kan jag inte bara göra varje ”way” dubbelt så stor? För en människa är det naturligtvis lättare att titta på slutsiffror, men datorn kör ju med binära tal, så varje dubbling måste ju fungera? Det är här x86 visar sitt fula tryne. Jag var inne på detta i ARM-tråden tidigare idag och det är fortfarande komplext med varför, men i korthet: om en ”way” är större än en sida i det virtuella minnessystemet, så måste man hämta flera värden ur cachen och sedan, när svaret från TLBn kommer, kasta bort alla utom ett. Det drar bandbredd och det kostar energi, och det vill man gärna undvika.

Visa signatur

5900X | 6700XT

Rapportera Redigera

Citera flera Citera (12)

2020-06-30 19:07

Permalänk

marcusOCZ

Medlem ★

Plats: Trondheim, Norge
Registrerad: Feb 2005

●

Skrivet av Cadzon:

Och i jämförelse med Intel då?

Gå till inlägget

Samma 4233 och cl14 och samma sekundära och tertiära på Intel borde ge ca 35ns, eller ca 34% mindre latency i samma test.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--RTX 2080Ti--Gigabyte Z690 Aorus Master--4X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B
Skärmar: Neo G8 4K 240hz--Huawei 3440x1440 165hz

Rapportera Redigera

Citera flera Citera (1)

2020-06-30 19:35

Permalänk

medbor

Medlem ★

Like-magnet

Registrerad: Okt 2011

●

4233 MT -> 1/4.233 ns = 0.236ns per cykel

Teoretisk gräns vid 14 cycles CAS latency är då
3.3ns

Jag kanske är ute och cyklar men är det inte lite segt att ligga på 10-15 ggr responstiden?

Rapportera Redigera

Citera flera Citera

2020-06-30 20:19

Permalänk

mpat

Medlem ★

Registrerad: Okt 2016

●

Skrivet av medbor:

4233 MT -> 1/4.233 ns = 0.236ns per cykel

Teoretisk gräns vid 14 cycles CAS latency är då
3.3ns

Jag kanske är ute och cyklar men är det inte lite segt att ligga på 10-15 ggr responstiden?

Gå till inlägget

CAS = Column Access Strobe = tiden det tar att få tillbaka data från att du skickat kolumn-adressen - om du redan har rätt rad aktiv! Gör du en slumpvis läsning så är det inte så.

Visa signatur

5900X | 6700XT

Rapportera Redigera

Citera flera Citera

2020-06-30 20:26

Permalänk

medbor

Medlem ★

Like-magnet

Registrerad: Okt 2011

●

Skrivet av mpat:

CAS = Column Access Strobe = tiden det tar att få tillbaka data från att du skickat kolumn-adressen - om du redan har rätt rad aktiv! Gör du en slumpvis läsning så är det inte så.

Gå till inlägget

Ok, bra att veta!

Vad blir då en rimligt slumpmässig access i cykler då? Jag räknade med 14 för att det gavs i exemplet, tror dock inte det är över 100, men jag kan ha fel

Rapportera Redigera

Citera flera Citera

2020-06-30 20:38

Permalänk

mpat

Medlem ★

Registrerad: Okt 2016

●

Skrivet av medbor:

Ok, bra att veta!

Vad blir då en rimligt slumpmässig access i cykler då? Jag räknade med 14 för att det gavs i exemplet, tror dock inte det är över 100, men jag kan ha fel

Gå till inlägget

Du får lägga ihop ett antal saker. För det första måste du lägga till latencyn för sista cachen i processorn, eftersom den inte försöker söka i minnet förrän den inte hittar något där. Den beskrivs vanligen i cykler, så multiplicera med processorns klockfrekvens. Därefter får du lägga ihop de tre siffrorna i minnes-specen (om det t.ex står 14-15-16 så tar du 14+15+16 och får 45) för att få antalet cykler som det tar att få upp första slumpvisa bitten. Detta får då multipliceras med den verkliga klockfrekvensen för minnet - jag tror att du hade den effektiva frekvensen förra gången, vilken är dubbelt så stor eftersom det är DDR. Där någonstans hamnar väl det teoretiska värdet.

Visa signatur

5900X | 6700XT

Rapportera Redigera

Citera flera Citera

2020-06-30 20:42

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av marcusOCZ:

Samma 4233 och cl14 och samma sekundära och tertiära på Intel borde ge ca 35ns, eller ca 34% mindre latency i samma test.

Gå till inlägget

Någonstans där ja

Intels minneslatens beror på faktorer som

antal kärnor, latensen över ring-bussen är linjärt proportionellt mot antal kärnor. Zen kör med en crossbar så där är latens oberoende av antal kärnor (däremot är antalet transistorer man behöver i en x-bar kvadratiskt mot antal anslutningar, finns inga gratisluncher...)
"uncore" frekvens, d.v.s. frekvensen man kör bl.a. ringbussen på

Däremot undrar jag vad det är som AIDA64 verkligen mäter, hittar ingen superbra beskrivning.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (4)

2020-06-30 20:50

Permalänk

the squonk

Medlem ★

Plats: Stockholm
Registrerad: Mar 2004

●

@Yoshman: I fallet Ryzen så är ju intercore latency nästan mer intressant, det är det som flaskas av IF, det går tydligen att se i Sisoft Sandra.

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Rapportera Redigera

Citera flera Citera

2020-06-30 21:24

Permalänk

perost

Medlem ★

Plats: Linköping
Registrerad: Jun 2007

●

Skrivet av medbor:

4233 MT -> 1/4.233 ns = 0.236ns per cykel

Teoretisk gräns vid 14 cycles CAS latency är då
3.3ns

Gå till inlägget

CL anges i klockcykler, inte överföringscykler, och DDR4-4233 har en klockcykel på 0.472ns eftersom klockfrekvensen ligger på 2116.5 MHz. Minnet i artikeln var iofs. DDR4-4333, vilket ger en klockcykel på 0.462ns, men det spelar väl kanske ingen större roll för frågeställningen.

Rapportera Redigera

Citera flera Citera (1)

2020-06-30 21:38

Permalänk

the squonk

Medlem ★

Plats: Stockholm
Registrerad: Mar 2004

●

Skrivet av perost:

CL anges i klockcykler, inte överföringscykler, och DDR4-4233 har en klockcykel på 0.472ns eftersom klockfrekvensen ligger på 2116.5 MHz. Minnet i artikeln var iofs. DDR4-4333, vilket ger en klockcykel på 0.462ns, men det spelar väl kanske ingen större roll för frågeställningen.

Gå till inlägget

Det var i vilket fall extremklockat minne och inte speciellt indikativt för vilken prestanda vi kommer att få se inledningsvis.

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Rapportera Redigera

Citera flera Citera

2020-06-30 22:02

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av Confusion:

Någon som kan förklara för en gammal gubbe hur mindre cache-minne ger lägre minneslatenser?
Min naiva bild av hur det funkar får det inte att gå ihop, om det inte är något med arkitekturen att göra eller specifika tester (som att man hämtar data som inte finns i cache).
Färre kärnor kan jag ju tänkta mig sänker latensen om de delar cache, eftersom det blir _mer_ cache för varje kärna och högre sannolikhet att man behöver gå via slöare minne för att få fram datan.

Tacksam för förtydligande.

Gå till inlägget

Som vissa nämnt så påverkar storleken på cachen. Men. Jag skulle vilja påstå att det är helt fel uttryckt i artikeln. Det är inte tack vare den mindre cachen vi ser den stora skillnaden i latens, utan för att det är en enda krets. I Matisse, alltså vanliga Zen 2-processorer, så är minneskontroller i en separat krets. Det är ett extra hopp till minnet. I Renoir så är CPU, nordbrygga inklusive minneskontroller, och GPU i samma krets. Det ger kortare latenser. Det kan vara så att de anser att de klarar sig med mindre L3 just för att det är så mycket kortare latens till RAM. Det kan alltså vara så att L3 är litet för att RAM-latensen är låg mer än att latens är låg för att L3 är litet.

https://www.sweclockers.com/test/27760-amd-ryzen-9-3900x-och-...

Tycker även att man kunde uttryckt tydligare att man i de modeller som har mer än 2 CCX, alltså CPU-kluster, så har man två kretsar med processorkärnor. Alltså två chiplets.

Rapportera Redigera

Citera flera Citera (3)

2020-06-30 22:02

Permalänk

marcusOCZ

Medlem ★

Plats: Trondheim, Norge
Registrerad: Feb 2005

●

Skrivet av the squonk:

Det var i vilket fall extremklockat minne och inte speciellt indikativt för vilken prestanda vi kommer att få se inledningsvis.

Gå till inlägget

Nej, men det ger en pekpinne på vad som är möjligt med Renoir på Desktop. Det är ett jättesprång jämfört med Zen2 vi har idag.

Tyvärr är det fortfarande alltför lite.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--RTX 2080Ti--Gigabyte Z690 Aorus Master--4X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B
Skärmar: Neo G8 4K 240hz--Huawei 3440x1440 165hz

Rapportera Redigera

Citera flera Citera

2020-06-30 22:05

Permalänk

marcusOCZ

Medlem ★

Plats: Trondheim, Norge
Registrerad: Feb 2005

●

Skrivet av Aleshi:

Som vissa nämnt så påverkar storleken på cachen. Men. Jag skulle vilja påstå att det är helt fel uttryckt i artikeln. Det är inte tack vare den mindre cachen vi ser den stora skillnaden i latens, utan för att det är en enda krets. I Matisse, alltså vanliga Zen 2-processorer, så är minneskontroller i en separat krets. Det är ett extra hopp till minnet. I Renoir så är CPU, nordbrygga inklusive minneskontroller, och GPU i samma krets. Det ger kortare latenser. Det kan vara så att de anser att de klarar sig med mindre L3 just för att det är så mycket kortare latens till RAM. Det kan alltså vara så att L3 är litet för att RAM-latensen är låg mer än att latens är låg för att L3 är litet.

https://cdn.sweclockers.com/artikel/bild/72039?l=eyJyZXNvdXJjZSI6IlwvYXJ0aWtlbFwvYmlsZFwvNzIwMzkiLCJmaWx0ZXJzIjpbInQ9YXJ0aWNsZUZ1bGwiXSwicGFyYW1zIjp7ImNhY2hlQnVzdGVyIjoiMjAyMDA0MDgifSwia2V5IjoiMzU5MGU4NDNjNDBmYmE2OTJkM2Q3Y2M2MzBlYTRjYmMifQ%3D%3D
https://www.sweclockers.com/test/27760-amd-ryzen-9-3900x-och-...

Tycker även att man kunde uttryckt tydligare att man i de modeller som har mer än 2 CCX, alltså CPU-kluster, så har man två kretsar med processorkärnor. Alltså två chiplets.
https://cdn.sweclockers.com/artikel/bild/72040?l=eyJyZXNvdXJjZSI6IlwvYXJ0aWtlbFwvYmlsZFwvNzIwNDAiLCJmaWx0ZXJzIjpbInQ9YXJ0aWNsZUZ1bGwiXSwicGFyYW1zIjp7ImNhY2hlQnVzdGVyIjoiMjAyMDA0MDgifSwia2V5IjoiYWEzMzI0Yzc2NGY2MTQ5ODI1NGJjMzBmNmNiZTliZjgifQ%3D%3D

Gå till inlägget

Blir spännande att se vad just L3 gör faktist. @Yoshman har en cpu från en generation där det var just cache som var förändringen i princip (och priset på den tiden). Det gav faktist ganska rejäla resultat i spel vill jag minnas.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--RTX 2080Ti--Gigabyte Z690 Aorus Master--4X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B
Skärmar: Neo G8 4K 240hz--Huawei 3440x1440 165hz

Rapportera Redigera

Citera flera Citera

2020-06-30 22:12

Permalänk

the squonk

Medlem ★

Plats: Stockholm
Registrerad: Mar 2004

●

Skrivet av marcusOCZ:

Tyvärr är det fortfarande alltför lite.

Gå till inlägget

För att få lägre latens än Intel, ja, men för att förbättra generell prestanda och kanske passera Intel i allt annat än latens så är det lovande. Som sagts ovan, min 6700K från 2015 har galet låg latens till minnet men det är inget direkt fartmonster i alla applikationer för det.

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Rapportera Redigera

Citera flera Citera (2)

2020-06-30 22:17

Permalänk

the squonk

Medlem ★

Plats: Stockholm
Registrerad: Mar 2004

●

Skrivet av marcusOCZ:

Blir spännande att se vad just L3 gör faktist. @Yoshman har en cpu från en generation där det var just cache som var förändringen i princip (och priset på den tiden). Det gav faktist ganska rejäla resultat i spel vill jag minnas.

Gå till inlägget

Broadwell med extra L4 cache, det var antagligen för dyrt att använda wafers för L4 för att fortsätta, men det fungerade bra ända tills DDR4 kom upp lite i fart och gjorde den relativt långsamma L4 mer eller mindre onödig.

Nu har ju Zen 3 en intressant förbättring i cache i och med att varje CCD får gemensamt cache för ingående CCX. Zen 2 har ett cache för varje CCX.

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Rapportera Redigera

Citera flera Citera (1)

AMD "Renoir" för stationära datorer spöar "Matisse" i minnesprestanda

AMD "Renoir" för stationära datorer spöar "Matisse" i minnesprestanda

Externa nyheter

Spelnyheter från FZ