Navi Första rykten *navi Tråden*

Permalänk
Medlem
Skrivet av mpat:

En cache är i allmänhet inte till för att ge störa bandbredd utan för att ge lägre latency. Man kan peta dit en cache för att få större bandbredd - det är vad Crystalwell, Intels cache på diverse Skylake-varianter med bättre GPU, gör - men det är inte det vanliga. Sådana försök har historiskt gått halvbra.

OBS att kopiera Crystalwell rakt av inte kommer att räcka - den bandbredden är på tok för låg. AMD behöver något väsentligt maffigare. Om de har gjort något intelligent i samma anda som Maxwell (dvs, organisera processen så att man kan utnyttja en cache bättre än GPUer normalt sett gör) så kan det bli bra, men det är ett stort ”om” det.

Intressant då en cache miss skapar större latens än vad ram minne någonsin ger i latens.
Hmm... Nu tetades jag

Uppriktigt så har vi båda rätt då en cache uppgift täcker båda, om det är latency eller bandbredd.
Lång latency eller låg bandbredd ger i slutändan samma resultat, en väntan på att begärd data blir tillgänglig för bearbetning. Vilket ju är grunden till att cache kom till i första hand, minska väntan på att data för bearbetning blir tillgänglig.

Oavsett så är det inte frågan om en ny Crystalwell, förutom då kanske storleken (128 MB) och att det är en cache

Hur IF cache är implementerar är inte känt (ännu), men känner att det kan bli något bra av vad som diskuterats i tråden och det lilla man lyckats snappa upp i det vilda.

Vi får helt enkelt vänta och se...

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem

@Radolov:

[PATCH 1/4] drm/amdgpu: add the GC 10.3 VRS registers
https://lists.freedesktop.org/archives/amd-gfx/2020-September...

[PATCH 2/4] drm/amdgpu: add VCN 3.0 AV1 registers
https://lists.freedesktop.org/archives/amd-gfx/2020-September...

[PATCH 3/4] drm/amdgpu: use the AV1 defines for VCN 3.0
https://lists.freedesktop.org/archives/amd-gfx/2020-September...

[PATCH 4/4] drm/amdgpu: add device ID for sienna_cichlid (v2)
https://lists.freedesktop.org/archives/amd-gfx/2020-September...

+ /* Sienna_Cichlid */
+ {0x1002, 0x73A0, PCI_ANY_ID, PCI_ANY_ID, 0, 0, CHIP_SIENNA_CICHLID},
+ {0x1002, 0x73A2, PCI_ANY_ID, PCI_ANY_ID, 0, 0, CHIP_SIENNA_CICHLID},
+ {0x1002, 0x73A3, PCI_ANY_ID, PCI_ANY_ID, 0, 0, CHIP_SIENNA_CICHLID},
+ {0x1002, 0x73AB, PCI_ANY_ID, PCI_ANY_ID, 0, 0, CHIP_SIENNA_CICHLID},
+ {0x1002, 0x73AE, PCI_ANY_ID, PCI_ANY_ID, 0, 0, CHIP_SIENNA_CICHLID},
+ {0x1002, 0x73BF, PCI_ANY_ID, PCI_ANY_ID, 0, 0, CHIP_SIENNA_CICHLID},

SIENNA_CICHLID = Navi 21

Navy Flounder = Navi 22

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem

@Bengt-Arne: Yes. Jag vet om dessa saker och har vetat om dem från den dagen de kom upp. Ni behöver inte posta varenda patent från AMD om grafikkort eller uppdateringar om RDNA2. När jag sa att jag inte sett uppdateringarna, så menade jag att jag inte märkt just gfx1030 och 1031 target. Jag hade dock märkt RT uppdateringen, men det var den som fick mig att undersöka mer.

Permalänk
Medlem
Skrivet av Radolov:

@Bengt-Arne: Yes. Jag vet om dessa saker och har vetat om dem från den dagen de kom upp. Ni behöver inte posta varenda patent från AMD om grafikkort eller uppdateringar om RDNA2. När jag sa att jag inte sett uppdateringarna, så menade jag att jag inte märkt just gfx1030 och 1031 target. Jag hade dock märkt RT uppdateringen, men det var den som fick mig att undersöka mer.

OK!

Taggade dig då jag vet att du djupdyker, men tänkte att det kan vara intressant även för andra att veta om.

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem
Skrivet av Bengt-Arne:

OK!

Taggade dig då jag vet att du djupdyker, men tänkte att det kan vara intressant även för andra att veta om.

Du får jättegärna posta det för andra. Jag läser det ändå.

Än har jag inte djupdykt i denna tråd. Ni kommer märka när jag djupdyker.

Permalänk
Medlem
Skrivet av Radolov:

Du får jättegärna posta det för andra. Jag läser det ändå.

Än har jag inte djupdykt i denna tråd. Ni kommer märka när jag djupdyker.

Vad tror du jag försöker

Uppriktigt så menades djupdykning i ämnet.

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Inaktiv
Skrivet av mpat:

OBS att kopiera Crystalwell rakt av inte kommer att räcka - den bandbredden är på tok för låg. AMD behöver något väsentligt maffigare.

Ja, crystalwell var ju iallafall ursprungligen specad till 50GB/s både in och ut (full duplex), det är inte så ruskigt mycket i dagsläget. Har funderat på om det så kallade "infinity cache" (om det ens existerar) kanske är HBM med bara en enda våning. Infinity fabric är ju PCIe i grund och botten, var samma sak med crossfire-bryggorna på äldre GPUer. Så om de tar existerande IP behöver de inte uppfinna något nytt, och med endast en våning slipper man den kostsamma processen att stapla kretsar.

En cache behöver ju inte heller vara flera gigabyte stor, likt en framebuffer måste vara, så man skulle kunna klara sig med en enda våning. Buss-logiken och DRAM-matrisen skulle få plats på samma chip, och likt HBM samtidigt kunna ge ordentlig prestanda med mycket liten användning av GPUn för anslutningen till cachen.

Bara en tanke... Det stämmer förmodligen inte.

Permalänk
Medlem
Skrivet av Bengt-Arne:

Halo produkt nämndes flera månader före Nvidias presentation, jag är inte säker på att AMD då räknade med att Nvidia skulle gä över 10000 beräkningsenheter. Visst dom räknade med en bra ökning med tanke på minskad nod, men så mycket tror jag inte många ens kom på att gissa. Eller drömma om...

Fast det är ju sanning med lite modifikation. Nvidia gjorde om deras cuda kärnor en del så dom är mer flexibla och en kärna i 30-serien presterar inte i närheten av vad en från 20-serien gör i spel. 3080 har dubbla antalet mot för 2080ti men långt ifrån dubbla prestandan.
Om jag förstått allt rätt så kunde kärnorna i 20-serien köra bara fp+int och i 30-serien kan dom köra fp+fp eller fp+int. Vilket är anledningen till det knasigt höga teoretiska beräkningskraften (som är fp beräkningar) och varför ökningen av cuda kärnor var så enorm.

Som sagt. Lite missvisande med antalet cuda kärnor och den teoretiska beräkningskraften i 30-serien pga hur dom hanterar beräkningar med ampere arkitekturen.

Visa signatur

▐ AMD Ryzen 5 5600X @4,725GHz 1,285V▐ PNY GeForce RTX 3070 8GB XLR8 @2,12GHz▐
▐ MSI MPG B550 Gaming Plus▐ Corsair Vengeance LPX DDR4 32GB (2x16GB) @3800MT/s▐
▐ Transcend 128GB SSD▐ Intel SSD 660p 1TB▐ 2,5" SSD 1,5TB▐ Fractal Design Integra M 650W▐

Permalänk
Medlem
Skrivet av zeg:

Fast det är ju sanning med lite modifikation. Nvidia gjorde om deras cuda kärnor en del så dom är mer flexibla och en kärna i 30-serien presterar inte i närheten av vad en från 20-serien gör i spel. 3080 har dubbla antalet mot för 2080ti men långt ifrån dubbla prestandan.
Om jag förstått allt rätt så kunde kärnorna i 20-serien köra bara fp+int och i 30-serien kan dom köra fp+fp eller fp+int. Vilket är anledningen till det knasigt höga teoretiska beräkningskraften (som är fp beräkningar) och varför ökningen av cuda kärnor var så enorm.

Som sagt. Lite missvisande med antalet cuda kärnor och den teoretiska beräkningskraften i 30-serien pga hur dom hanterar beräkningar med ampere arkitekturen.

Det stämmer att 30 serien även klarar fp + fp, men som du även skriver så kan dom även köra fp + int som i 20 serien.
Så ja, 30 serien borde teoretiskt ha dubbla beräkningskraften i flyttal per kärna. Något som inte avspeglas i spelprestanda.

Samtidigt, används fp + fp i spel från dag ett?
Misstänker att det fortfarande är fp + int som gäller och därmed samma som för 20 serien. Om där nu inte är gjort någon större förändring som sänker hastigheten på fp + int.

Jag misstänker uppriktigt att den största biten ändå är att prestandan inte skalar linjärt med antalet kärnor så det börjar att plana ut i nyttjande. Likt AMD's problem med GCN, dom gick ju inte över 4096 shader processors (64 CU). Då prestanda vinsten på GCN skulle varit ninimal...

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem
Skrivet av anon132576:

Ja, crystalwell var ju iallafall ursprungligen specad till 50GB/s både in och ut (full duplex), det är inte så ruskigt mycket i dagsläget. Har funderat på om det så kallade "infinity cache" (om det ens existerar) kanske är HBM med bara en enda våning. Infinity fabric är ju PCIe i grund och botten, var samma sak med crossfire-bryggorna på äldre GPUer. Så om de tar existerande IP behöver de inte uppfinna något nytt, och med endast en våning slipper man den kostsamma processen att stapla kretsar.

En cache behöver ju inte heller vara flera gigabyte stor, likt en framebuffer måste vara, så man skulle kunna klara sig med en enda våning. Buss-logiken och DRAM-matrisen skulle få plats på samma chip, och likt HBM samtidigt kunna ge ordentlig prestanda med mycket liten användning av GPUn för anslutningen till cachen.

Bara en tanke... Det stämmer förmodligen inte.

HBM(1) har upp till 8 minnessubstrat (på bilden är det Core Die x) packade ovanpå en (kontroller) PHY.

HBM2 har upp till 8 minnessubstrat packade ovanpå en (kontroller) PHY.

HBM2E har 12 minnessubstrat pacakde ovanpå en (kontroller) PHY.

Ursprunget till tanken på HBM var att minska på den ständigt ökade effekten (Watt) som huvudsakligen är ett resultat av högre bandbredd.
Analogt, klockar man en CPU så ökar den använda effekten.

En stor del av den ökade energiåtgången sker i interfacet/PHY (minnets I/O) mellan minne och brukare, normalt CPU och/eller GPU.

All kommunikation sker i interfacet/PHY som är underst i HBM stacken, i sin tur så är bandbredd och kapacitet helt avhängit mängden minnessubstrat i HBM stacken.

Så att köra med ett minnessubstrat på ett HBMx skulle ge en 1/8 av bandbredden för HBM(1) och HBM2, för HBM2E skulle det betyda 1/12 av bandbredden.

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Inaktiv
Skrivet av Bengt-Arne:

Så att köra med ett minnessubstrat på ett HBMx skulle ge en 1/8 av bandbredden för HBM(1) och HBM2, för HBM2E skulle det betyda 1/12 av bandbredden.

Tack för historielektionen om HBM, men jag känner redan till allt det där. Poängen var inte att man skulle använda HBM specifikt, bara gränssnittet för HBM, mot en specialdesignad kiselbricka med DRAM och gränssnitt tillsammans (likt crystalwell exempelvis.)

Och man behöver inte alls stapla fulla staplar med HBM2 för att få max prestanda, Vega 10 har 2 staplar med endast 4GB DRAM vardera och ger ändå full bandbredd mot GPUn. Eller, tja, nedklockat lite för HBM2 var ungt på den tiden och inte alla staplar AMD köpte in pallar 1000MHz... Samsungs HBM2 gör det tydligen, men mina vegor har, öh, Micron tror jag? De tenderar att blåskärma och har sig om man klockar upp minnet.

Permalänk
Medlem
Skrivet av anon132576:

Tack för historielektionen om HBM, men jag känner redan till allt det där. Poängen var inte att man skulle använda HBM specifikt, bara gränssnittet för HBM, mot en specialdesignad kiselbricka med DRAM och gränssnitt tillsammans (likt crystalwell exempelvis.)

Och man behöver inte alls stapla fulla staplar med HBM2 för att få max prestanda, Vega 10 har 2 staplar med endast 4GB DRAM vardera och ger ändå full bandbredd mot GPUn. Eller, tja, nedklockat lite för HBM2 var ungt på den tiden och inte alla staplar AMD köpte in pallar 1000MHz... Samsungs HBM2 gör det tydligen, men mina vegor har, öh, Micron tror jag? De tenderar att blåskärma och har sig om man klockar upp minnet.

Vet vi än om AMDs nya kort kommer använda HBM eller GDDR? + @Bengt-Arne

Visa signatur

Ryzen 9 5950X, 32GB 3600MHz CL16, SN850 500GB SN750 2TB, B550 ROG, 3090 24 GB
Har haft dessa GPUer: Tseng ET6000, Matrox M3D, 3DFX Voodoo 1-3, nVidia Riva 128, TNT, TNT2, Geforce 256 SDR+DDR, Geforce 2mx, 3, GT 8600m, GTX460 SLI, GTX580, GTX670 SLI, 1080 ti, 2080 ti, 3090 AMD Radeon 9200, 4850 CF, 6950@70, 6870 CF, 7850 CF, R9 390, R9 Nano, Vega 64, RX 6800 XT
Lista beg. priser GPUer ESD for dummies

Permalänk
Inaktiv
Skrivet av Herr Kantarell:

Vet vi än om AMDs nya kort kommer använda HBM eller GDDR?

Det jag hört glunkas är att "big navi" ska komma i två varianter, en med GDDR6 (gissningsvis konsument/gejmingversionen) och en med HBM (gissningsvis prosumer - dvs Apple iMac Pro typ - och proffs, typ AMD Firepro, Mac Pro.)

Men detta får väl betraktas som rykten, då inget officiellt bekräftats från trista AMD!

Permalänk
Medlem
Skrivet av Herr Kantarell:

Vet vi än om AMDs nya kort kommer använda HBM eller GDDR? + @Bengt-Arne

Allt pekar hitintills mot GDDR6!

Läckan gällande kortet med en CPU kylare (hemmapularens våta dröm) var bestyckat med GDDR6, senare när man såg baksidan på AMD's referenskylare med tre fläktar så överensstämde det exakt med fästhål och kortlayout.

Själv är jag rätt övertygad att det blir DDR6 överlag, en orsak är att minneskontrollers för HBM, GDDR5/6 och GDDR6X är så skilda i funktion att det skulle kosta för mycket i både kretsyta och produktionskostnad.

Att göra en minneskontroller för GDDR5 och GDDR6 är möjligt då interfacet är mycket snarlikt, men ser absolur ingen nytta i GDDR5 då där inte är någon vinst i varken kostnad eller prestanda.

Skulle AMD använda HBM och då troligen HBM2E eller kanske HBM Next framöver så är det på beräkningskort..

@anon132576:
Du menar denna?
Har inte förväxlat två st HBM2 minne till att vara endast två minnessubstrat
Minnessubstrat är inte det samma som två minneskretsar.

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem
Skrivet av anon132576:

Ja, crystalwell var ju iallafall ursprungligen specad till 50GB/s både in och ut (full duplex), det är inte så ruskigt mycket i dagsläget. Har funderat på om det så kallade "infinity cache" (om det ens existerar) kanske är HBM med bara en enda våning. Infinity fabric är ju PCIe i grund och botten, var samma sak med crossfire-bryggorna på äldre GPUer. Så om de tar existerande IP behöver de inte uppfinna något nytt, och med endast en våning slipper man den kostsamma processen att stapla kretsar.

En cache behöver ju inte heller vara flera gigabyte stor, likt en framebuffer måste vara, så man skulle kunna klara sig med en enda våning. Buss-logiken och DRAM-matrisen skulle få plats på samma chip, och likt HBM samtidigt kunna ge ordentlig prestanda med mycket liten användning av GPUn för anslutningen till cachen.

Bara en tanke... Det stämmer förmodligen inte.

Har funderat på det också, men jag får inte ihop det. Om man gör det på traditionellt sätt, dvs med en interposer, så har man redan dragit på sig den stora kostnaden för att köra HBM så då kan man ju lika gärna köra HBM, strunta i cache och spara en massa energi. Om man gör det som en SOC med minnet på baksidan så kan man inte kyla chippet. Det som möjligen går i så fall är att det är minnet underst och alla kontakter från GPU till GDDR6 går igenom minnet (TSV). AMD har ju lite erfarenhet av att packa tätt från mobil-chippen till Apple, så det kanske är möjligt?

En annan variant är att AMD har fått till något som EMIB för att föra över datan, och en tredje är att coachen helt tråkigt finns på samma chip men är DRAM istället för SRAM för att få plats med mer.

Visa signatur

5900X | 6700XT

Permalänk
Inaktiv
Skrivet av Bengt-Arne:

Har inte förväxlat två st HBM2 minne till att vara endast två minnessubstrat

Har inte förväxlat någonting. Två staplar med vardera 4 minneschip. Enklare än så kan det inte bli.

Permalänk
Medlem
Skrivet av anon132576:

Har inte förväxlat någonting. Två staplar med vardera 4 minneschip. Enklare än så kan det inte bli.

Du menar två HBM med fyra minnessubstrat ovanpå controller/PHY per HBM?

Mitt svar var på detta som du skrev:
Har funderat på om det så kallade "infinity cache" (om det ens existerar) kanske är HBM med bara en enda våning.

Som jag uppfattade som att du menade ETT minnessubstrat ovanpå controller/PHY, vi pratar ändå om 128 MB cache.
Där jag påpekade att endast ETT minnessubstrat skulle minska hastigheten.

Del av ditt svar var ett kryptiska:
Och man behöver inte alls stapla fulla staplar med HBM2 för att få max prestanda, Vega 10 har 2 staplar med endast 4GB DRAM vardera och ger ändå full bandbredd mot GPUn.

Här antar jag att du menar två HBM, HBM2 har dubbla hastigheten i förhållande till första generationen HBM. Därav så kunde två HBM2 användas istället för fyra HBM med bibehållen bandbredd.

HBM startade med fyra minnessubstrat och har sen dess inte haft mindre än fyra minnessubstrat.
HBM(1) som var det först HBM AMD använde, hade 256 MB per substrat vilket gav ett HBM på 4x256 MB = 1 GB, där använde dom fyra HBM(1) för att få 4 GB.
HBM2 var nästa generation med dubbla hastigheten, därav så användes endast två HBM2 (blev billigare chiplet). Minnesmängden per minnessubstrat var nu 1 GB vilket gav 4x1 GB = 4 GB eller 8x1 GB = 8 GB om man staplade 8 minnessubstrat
JIDEC släppte sen HBM2E som är en utökning/revision av HBM2 som tillåter upp till 12 st minnessubstrat för idag 12x2 GB = 24 GB på ett HBM2E.

Oavsett så kan man börja med att fråga sig:
1 - Är det möjligt att göra ett HBM på 128 MB - JA
2 - Hur blir bandbredden? - Dålig, väldigt dålig pga. HBM's natur.

1.
Att göra ett specialminne för en GPU krets betyder en låg volym, ovanpå det så är det ett minnessubstrat som endast är i storleksordning av ett halvt minnessubstrat i förhållande till första generationen HBM, i förhållande till dagens så är det en faktor av 1 till 8 (1/8) som ska läggas på en kontroller/PHY i fullstorlek. Hur dyrt blir inte det?

2.
HBM har ett lågt klockat inteface av natur, hastigheten nås främst med en bred buss och överlag en mindre sammanlagd latens vid random access, delvis pga. stapling . Där är mer men då bli det teknisk jumbo jumbo... så det avstår vi...

Det reser frågor:
Kan ett nerskalat minnessubstrat bibehålla hastigheten? Ja!, men inte som HBM av orsaken att det då måste bryta med i princip allt som gör HBM till HBM.
Så svaret för HBM är ett direkt NEJ!

Är kunden beredd att betala mer för en produkt som inte ger mervärde?

Men det viktigaste av allt är ändå typen av minne som HBMx, GDDRx, DDRx med flera är, "Dynamic Random Access Memory" som är ett minne designat för att vara billigt och enkelt, är i princip en kondensator som får en periodisk refresh för att behålla sitt värde ett eller noll.

För cache minne så är SRAM "Static Random Access Memory" snabbare och med mindre latenser än vad DRAM någonsin kan uppnå, men även dyrare per minnescell då det krävs minst 5 transistorer, för DRAM så krävs en transistor och en kondensator.

SRAM är minst 10 gånger snabbare än DRAM, vi smakar på det igen minst 10 gånger snabbare
Det är som att en EU moped skulle göra 450 km/h

DRAM is at least ten times slower than SRAM. SRAM is faster and typically used for cache

Så användning av HBM som cache kommer aldrig att hända

stavning
Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem

Ny video från RGT som i princip är 99% likadan som förut. ZzzZzz

Jag skriver ner de nya bitarna.
RDNA2 är väldigt energieffektiv och skalbar.
Han har hört från två personer att klockfrekvenserna är höga, i vissa fall 30% högre än nuvarande RDNA.
6800-kortet verkar vara kortet som AMD pushar mest internt och tror att den konkurrerar mycket väl med 3080.
Han frågade om uppskalning och raytracing-prestanda och fick bara svaret "Yes".

Permalänk
Medlem
Skrivet av Radolov:

Ny video från RGT som i princip är 99% likadan som förut. ZzzZzz

Jag skriver ner de nya bitarna.
RDNA2 är väldigt energieffektiv och skalbar.
Han har hört från två personer att klockfrekvenserna är höga, i vissa fall 30% högre än nuvarande RDNA.
6800-kortet verkar vara kortet som AMD pushar mest internt och tror att den konkurrerar mycket väl med 3080.
Han frågade om uppskalning och raytracing-prestanda och fick bara svaret "Yes".

Känns som det mesta av hans videos är stönande och undanflykter till varför han inte kan säga mer. Om man skulle kunna klippa bort så är det bara någon minut kvar av riktig content...

Permalänk
Hjälpsam
Skrivet av zeg:

Vi får hoppas AMD lyckas och det låter ju lovande på alla sätt. Speciellt när vi redan har spec för RDNA2 i konsolerna att gå på så vet vi redan att dom kommer kunna konkurrera med nvidia rätt bra denna gång.
Frågan är om dom kommer lyckas ta prestandakronan och det verkar inte omöjligt.

Räknar man lite snabbt så skulle en GPU med 80 CUs som körs i 2,3GHz och behåller ungefär samma utnyttjande av beräkningskraft (jag gissar att RDNA2 kommer bli bättre på det än RDNA) som i RDNA lägga sig på 3090 nivå.
Allt detta kommer troligtvis också vara till betydligt bättre energieffektivitet än 30-serien.

Själv tänker jag inte spendera mycket mer än 5000kr så är ointresserad av toppen men vore ändå roligt om AMD lyckas igen.
Och Navi 21 med 16GB för $549 låter som en bra kandidat, speciellt om det presterar i närheten av 3080.

Men hur realistiskt låter ett sådant pris?
Om nu AMD har ett kort med 1,6 gånger mer minne än 3080 och det presterar ungefär lika bra, varför skulle då AMD sälja detta billigare?

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Skrivet av Ratatosk:

Men hur realistiskt låter ett sådant pris?
Om nu AMD har ett kort med 1,6 gånger mer minne än 3080 och det presterar ungefär lika bra, varför skulle då AMD sälja detta billigare?

På rak arm, det enda jag skulle kunna tänka mig är marketshare, och strategi. De vet säkert om att det kommer släppas Ti/Super-kort vid behov. Prissätter man rätt från början kommer dessa Ti-kort varken göra från eller till om man ser till pris/prestanda.

Visa signatur

i7 6700k @4,1 base - 4,4 Turbo | XFX 590X Fatboy | Gigabyte Z270 D3 | 2x16 GB Corsair Vengence 3200MHz Cl 16| Intel 750 400GB |EVO 970 1 TB Steamdrive| 64TB thin provision

Permalänk
Medlem
Skrivet av Ratatosk:

Men hur realistiskt låter ett sådant pris?
Om nu AMD har ett kort med 1,6 gånger mer minne än 3080 och det presterar ungefär lika bra, varför skulle då AMD sälja detta billigare?

AMD har lägre produktionskostnader och kan fortfarande göra bättre/samma vinst med lägre pris, kanske?

Visa signatur

Har numera en Laptop från gigabyte.

Permalänk
Medlem
Skrivet av Ratatosk:

Men hur realistiskt låter ett sådant pris?
Om nu AMD har ett kort med 1,6 gånger mer minne än 3080 och det presterar ungefär lika bra, varför skulle då AMD sälja detta billigare?

Skrev i närheten av 3080, sen är nog inte AMD på samma nivå när det kommer till RT och AI som blir lite av en tradeoff. Och som skrivits redan så får nog AMD fram sina kort billigare både genom att kretsen är billigare men också så verkar dom använda gddr6.

Visa signatur

▐ AMD Ryzen 5 5600X @4,725GHz 1,285V▐ PNY GeForce RTX 3070 8GB XLR8 @2,12GHz▐
▐ MSI MPG B550 Gaming Plus▐ Corsair Vengeance LPX DDR4 32GB (2x16GB) @3800MT/s▐
▐ Transcend 128GB SSD▐ Intel SSD 660p 1TB▐ 2,5" SSD 1,5TB▐ Fractal Design Integra M 650W▐

Permalänk
Hjälpsam

Ett svart moln på himmelen är tillgång till kretsar, TMC är ju som bekant hårt bokade.
Hoppas verkligen att det löser sig, en ljsupunkt är ju såklart att Nvidia inte tar upp produktion, iom flytten till Samsung.
En fördel för Nvidia där, tillgången på kretsar bör bli bra.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Medlem
Skrivet av Bengt-Arne:

Du menar två HBM med fyra minnessubstrat ovanpå controller/PHY per HBM?

Mitt svar var på detta som du skrev:
Har funderat på om det så kallade "infinity cache" (om det ens existerar) kanske är HBM med bara en enda våning.

Som jag uppfattade som att du menade ETT minnessubstrat ovanpå controller/PHY, vi pratar ändå om 128 MB cache.
Där jag påpekade att endast ETT minnessubstrat skulle minska hastigheten.

Del av ditt svar var ett kryptiska:
Och man behöver inte alls stapla fulla staplar med HBM2 för att få max prestanda, Vega 10 har 2 staplar med endast 4GB DRAM vardera och ger ändå full bandbredd mot GPUn.

Här antar jag att du menar två HBM, HBM2 har dubbla hastigheten i förhållande till första generationen HBM. Därav så kunde två HBM2 användas istället för fyra HBM med bibehållen bandbredd.

HBM startade med fyra minnessubstrat och har sen dess inte haft mindre än fyra minnessubstrat.
HBM(1) som var det först HBM AMD använde, hade 256 MB per substrat vilket gav ett HBM på 4x256 MB = 1 GB, där använde dom fyra HBM(1) för att få 4 GB.
HBM2 var nästa generation med dubbla hastigheten, därav så användes endast två HBM2 (blev billigare chiplet). Minnesmängden per minnessubstrat var nu 1 GB vilket gav 4x1 GB = 4 GB eller 8x1 GB = 8 GB om man staplade 8 minnessubstrat
JIDEC släppte sen HBM2E som är en utökning/revision av HBM2 som tillåter upp till 12 st minnessubstrat för idag 12x2 GB = 24 GB på ett HBM2E.

Oavsett så kan man börja med att fråga sig:
1 - Är det möjligt att göra ett HBM på 128 MB - JA
2 - Hur blir bandbredden? - Dålig, väldigt dålig pga. HBM's natur.

1.
Att göra ett specialminne för en GPU krets betyder en låg volym, ovanpå det så är det ett minnessubstrat som endast är i storleksordning av ett halvt minnessubstrat i förhållande till första generationen HBM, i förhållande till dagens så är det en faktor av 1 till 8 (1/8) som ska läggas på en kontroller/PHY i fullstorlek. Hur dyrt blir inte det?

2.
HBM har ett lågt klockat inteface av natur, hastigheten nås främst med en bred buss och överlag en mindre sammanlagd latens vid random access, delvis pga. stapling . Där är mer men då bli det teknisk jumbo jumbo... så det avstår vi...

Det reser frågor:
Kan ett nerskalat minnessubstrat bibehålla hastigheten? Ja!, men inte som HBM av orsaken att det då måste bryta med i princip allt som gör HBM till HBM.
Så svaret för HBM är ett direkt NEJ!

Är kunden beredd att betala mer för en produkt som inte ger mervärde?

Men det viktigaste av allt är ändå typen av minne som HBMx, GDDRx, DDRx med flera är, "Dynamic Random Access Memory" som är ett minne designat för att vara billigt och enkelt, är i princip en kondensator som får en periodisk refresh för att behålla sitt värde ett eller noll.

För cache minne så är SRAM "Static Random Access Memory" snabbare och med mindre latenser än vad DRAM någonsin kan uppnå, men även dyrare per minnescell då det krävs minst 5 transistorer, för DRAM så krävs en transistor och en kondensator.

SRAM är minst 10 gånger snabbare än DRAM, vi smakar på det igen minst 10 gånger snabbare
Det är som att en EU moped skulle göra 450 km/h

DRAM is at least ten times slower than SRAM. SRAM is faster and typically used for cache

Så användning av HBM som cache kommer aldrig att hända

Jag har för mig att Vega korten har 45MB SRAM vilket är rätt smaskigt

45MB inte 65MB
Visa signatur

Ryzen 9 5950X, 32GB 3600MHz CL16, SN850 500GB SN750 2TB, B550 ROG, 3090 24 GB
Har haft dessa GPUer: Tseng ET6000, Matrox M3D, 3DFX Voodoo 1-3, nVidia Riva 128, TNT, TNT2, Geforce 256 SDR+DDR, Geforce 2mx, 3, GT 8600m, GTX460 SLI, GTX580, GTX670 SLI, 1080 ti, 2080 ti, 3090 AMD Radeon 9200, 4850 CF, 6950@70, 6870 CF, 7850 CF, R9 390, R9 Nano, Vega 64, RX 6800 XT
Lista beg. priser GPUer ESD for dummies

Permalänk
Medlem
Skrivet av Herr Kantarell:

Jag har för mig att Vega korten har 45MB SRAM vilket är rätt smaskigt

https://www.guru3d.com/index.php?ct=articles&action=file&id=33561

Vet inte helt hur dom räknar dom 45 MB, varje Vector ALU har 64 KB Local Data Share samt 16 KB L1 ECC cache.

Har uppriktigt inte gett mig till att räkna ihop den totala mängden

Oavsett så är cache spritt ut/fördelat över hela kretsen, hmm... Hoppas du förstår vad jag menar

Tar man och för över det till Navi så kommer den antagligen ihop med 128 MB Infinity Fabric cache ha närmar 200 MB cache totalt.

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem
Skrivet av Bengt-Arne:

Vet inte helt hur dom räknar dom 45 MB, varje Vector ALU har 64 KB Local Data Share samt 16 KB L1 ECC cache.

Har uppriktigt inte gett mig till att räkna ihop den totala mängden

Oavsett så är cache spritt ut/fördelat över hela kretsen, hmm... Hoppas du förstår vad jag menar

https://tpucdn.com/gpu-specs/images/g/800-cu-diagram.jpg

Tar man och för över det till Navi så kommer den antagligen ihop med 128 MB Infinity Fabric cache ha närmar 200 MB cache totalt.

Första Navi hade ju mindre cache efterssom VEGA var mer compute-orienterad än optimerad för spel.
Vi får väl se hur det går för Navi 2

Visa signatur

Ryzen 9 5950X, 32GB 3600MHz CL16, SN850 500GB SN750 2TB, B550 ROG, 3090 24 GB
Har haft dessa GPUer: Tseng ET6000, Matrox M3D, 3DFX Voodoo 1-3, nVidia Riva 128, TNT, TNT2, Geforce 256 SDR+DDR, Geforce 2mx, 3, GT 8600m, GTX460 SLI, GTX580, GTX670 SLI, 1080 ti, 2080 ti, 3090 AMD Radeon 9200, 4850 CF, 6950@70, 6870 CF, 7850 CF, R9 390, R9 Nano, Vega 64, RX 6800 XT
Lista beg. priser GPUer ESD for dummies

Permalänk
Medlem
Skrivet av Bengt-Arne:

Tar man och för över det till Navi så kommer den antagligen ihop med 128 MB Infinity Fabric cache ha närmar 200 MB cache totalt.

Hallå! Heter det inte "Gamecache" ?!!

Visa signatur

🖥️ AMD Ryzen 3700x, MSI B350 Mortar Arctic, Corsair lpx 3200, Sapphire 6900XT Nitro, Mbpro 15, MacMini.

Permalänk
Medlem
Skrivet av jacozz:

Hallå! Heter det inte "Gamecache" ?!!

Nu ska vi inte blanda GPU och CPU, då blir det en Apu... Hmm...

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem
Skrivet av Herr Kantarell:

Första Navi hade ju mindre cache efterssom VEGA var mer compute-orienterad än optimerad för spel.
Vi får väl se hur det går för Navi 2

Själv är jag lite kluven i tankarna runt vad Vega var, om det var mer mot Compute eller grafik. Där var flaskhalsar som hindrade i båda fallen även om Wave 64 antagligen fungerade bättre i Compute.

Navi har ju istället 2x Wave 32 som kan kombineras (köras i parallell) för Wave 64.

Ja! Man är spänd på vad RDNA 2 har att erbjuda. Dj... AMD att hålla en på sträckbänken till den 28/10

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!