Inlägg

Inlägg som erixon har skrivit i forumet
Av erixon

Problemet med AMDs APUer (exklusive APU i Xbox och PS) är enligt vad jag kan förstå den snåla bandbredden till minnet.

Som exempel kan vi jämföra Radeon 780m vs Rx 6400

780m

6400

Shading Units

768

768

TMUs

48

48

ROPs

32

32

Compute Units

12

12

L0 Cache

32KB per WGP

32KB per WGP

L1 Cache

128KB per Array

128KB per Array

L2 Cache

2MB

1MB

L3 Cache

0

16MB

Bandwidth

(5600MT)89.6GB/s delat med CPU

128GB/s

På papper är det väldigt lika bägge är RDNA 2.0 samma antal TMUs mm.
Det som skiljer dem åt är minne och cache, samnt att 6400 är på 6nm medans 780m är 4nm.

Att 780m är på 4nm innebär att kan klockas högre än 6400, ändå ser det ut som om 6400 går ut som segrare.

Lite "data" för att stödja min tes.

Spel

780m avg fps

6400 avg fps

780m ~Mhz

6400 ~Mhz

780m ~W

6400+12400F ~W

Cyberpunk 2077

52FPS

66FPS

ca 2700Mhz

ca 2300Mhz

ca 65w

ca 34w+31w

Red Dead Redemption 2

45FPS

78FPS

ca 2800Mhz

ca 2300Mhz

ca 51w

ca 39w+30w

Forza Horizon 5

55FPS

56FPS

ca 2800Mhz

ca 2300Mhz

ca 55w

ca 30w+22w

GTA 5

113FPS

183FPS

ca 2800Mhz

ca 2100Mhz

ca 58w

ca 33w+38w

Fortnite

79FPS

105FPS

ca 2800Mhz

ca 2300Mhz

ca 64w

ca 39w+31w

Så för att AMD kunna göra en "moster" APU måste de lösa bandbredden... HBM kanse?

Av erixon
Skrivet av Mordekai:

De kan visa vilken upplösning som helst, i Y-led ritas den upp med ett antal linjer, i X-led finns ingen upplösning öht.
Återigen, signalen är analog har sync per linje och field, ingen information om udda eller jämna linjer, tvn ritar varannan udda, varannan jämn vare sig du vill eller inte (PAL composite och RF).
Om du sänker frekvensen till 25Hz och ritar samma fram två fields i rad blir det fortfarande inte en progressiv signal.

Apparater med annan signalering kunde visa äkta progressiv signal men det fanns ingen sådan signalöverföring på de klassiska konsolerna.

Frågan var skickar ut, inte renderar internt. PAL tillåter inte signalering av valfria uppdateringsfrekvenser eller antal linjer eller position på linjer, det finns en tolerans på synken, det betyder inte att det är "udda" uppdateringsfrekvens.

Eller så skippar du vartannat field, får 25Hz och halva ljusstyrkan med en jäkla flimmrig bild.

Klart att signalen har information om udda och jämna "field" hur tror du att den skulle set ut om lägger "fel" överst?
Detta gör med en så kallad halv linje, därför har PAL 312.5 linjer per "field".

Det flesta gamla konsoler som exempel vis NES är att de skippar halvlinjen, vilket gör att analoga TV med CRT ritar linjerna på samma ställe, det gör de för minimera "flickering". Vilket jag skulle kalla för progressiv.

Det innebär också att uppdaterings frekvensen blir lite annorlunda delvis ca 0.16% fel (0.5/312.5).

Mer kan du läs här (för NTSC, men samma tänk gäller för PAL)
UZEBOX video primer

Av erixon

Intressant lösning
Kan inte direkt se några nackdelar.
Där emot kan jag se fördelar med en och samma krets till B650 och x670, vilket ger lägre lagerkostnader samt tillverknings kostnader (om konsumenten får ta del av besparingen åter står att se).

För ska man helt krasst se på saken så erbjuder "högre tier" chipset endast mer I/O, de andra funktionera är låst med mjukvara eller sämre komponenter runt om kring (typ strömförsörjning).

Och angående fläkt på chipset så tror jag inte att AMD gör samma misstag igen, dess utom är det lättare kyla två små kretsar än en stor.

Av erixon
Skrivet av NutCracker:

Körde en ny test, kunde då konstatera att det inte ör som jag angav tidigare, en nedväxling till PCIe 1.1 (detta gäller när kortet är idle). Så jag har funderat lite ytterligare och kommit fram till följande.

Har man som i testet ett grafikkort vilket jobbar i PCIe 4.0 x16, då kan data maximalt (teoretiskt) färdas i 31.508 GB/s genom en buss som har stöd för dessa specifikationer, men sätter du det kortet i en PCIe 3.0 x4-buss, så kan genomströmningen bli maximalt (teoretiskt) 3.938 GB/s, bara 1/8-del av hastigheten. Mao så är 3DMark PCI Express feature testen inte alls förvånande. När det sen kommer till de övriga testerna kan det nog vara som så, att de skyfflar mycket mer data över bussen än vad 3DMark Firestrike gör, och detta bidrar därmed till betydligt sämre resultat i dessa tester. Det gäller mao att hitta ett optimalt kort för boxen, exempelvis AMDs Radeon RX 6600 XT skulle kunna vara ett tänkbart bra alternativ, det är visserligen ett PCIe 4.0, men dock ett x4-kort. Jag tycker att även mitt val av ett 2060S är hyfsat optimalt. Det kort som användes i testet är ett riktigt dåligt val för en eGPU-box (åtminstone för detta ändamål, uppenbarligen de flesta spel), om man nu inte som jag gör med mitt, använder det för rendering av video, boxen medger att jag kan flytta den funktionen mellan maskiner.

6600XT har PCIe 4.0 x8 och inte x4! (jag tror att du har blandat hop det med 6500xt) och även där kan man se att man tappar prestanda om man kör med PCIe 3.0 x8.
Hardware Unboxed 6600XT PCIe 4.0 x8 vs PCIe 3.0 x8 vilket är ca 5% i snitt och DOOM tappar hela 25%, skulle man halvera bandbredden så tror jag att tappet skulle bli än större.

Sedan lär det knappast hjälpa med att man går via flera kretsar.
Normalt:
CPU -> GPU
Via Thunderbolt:
CPU -> chipset (Z690) -> Thunderbolt 3 Controller -> Thunderbolt till pcie -> GPU
Vilket lär öka latensen samt ta en del av bandbredden pga latensen.

Det kan hända att resultatet är bättre på bärbara datorer efter som jag tror att vissa chipset stöder Thunderbolt direkt men jag kan ha fel.

Men det kan vara "fel" kabel också som ger det dåliga resultatet (finns tydligen ganska många 20Gbit/s Thunderbolt 3 kablar)
och 20Gbps / 8 ~ 2.5Gbyte/s vilket inte är långt i från 2.33Gbyte/s som sweclockers får.

Skulle kanske vara bra om sweclockers kunde testa med exempel PCIe SSD i stället för grafikortet och se vad överförings hastigheten blir för utesluta eventuella fel.

Det är bara en spekulation från min sida =p

Av erixon

Jag tror framför allt att navi24 är främst skapad för bärbar datorer där storlek och effekt förbrukning är viktigt men även pris.
Efter som nästan alla cpu till bärbara har inbyggd encoder varför slösa utrymme på en "onödig" extra encoder?
Sedan är PCIe 4.0 snart standar på nya cpu som säljs så 4x blir mindre problem. Så marknaden med gamla datorer med PCIe 3.0 är nog förhållande vis liten.

Hur mycket yta AMD spara svårt att säga men jämför man med navi14 som är på 158mm² och navi24 141mm², vilket innebär att man får ut fler kretsar per wafer. Och 6nm är inte vad jag förstått inte en nod krympning utan tillverknings "förbättring", man kan även jämföra transistor antalet mellan navi14 (6.4e9 transistorer) och navi24 (5.4e9 transistorer).
Så ytan har minskat trots att man klämt in ett 16MB cash i navi24.

Angående 6500xt bara släps med 4GB är nog ett av de få sätt man kan gör kortet mindre attraktiv för mining.

Tråkigt nog tror jag att kommer vara ett av de mer prisvärda kort man kommer kunna köpa under 2022, men det åter står att se vad kortet landar på.

Av erixon
Skrivet av Kaleid:

Sen om det inte måste vara MSI så går det att fortfarande hitta billigare:
https://www.webhallen.com/se/product/338672-Sapphire-Pulse-Ra...

Och nu är de slut....

Av erixon
Skrivet av infigo:

Tycker att postmord och andra instanser istället borde se till returer inte är miljöbovar då. De säger själva att de är väldigt oeffektivt..
Från säg zalando eller HM till kund så går det ofta i grupp och delar upp sig. Lastbilen (eller annan fraktmetod) måste ju åka till zalandos lager och hämta tröjan från lagret, om den inte har med sig returer dit utan kör ytterligare en lastbil för det så är det ju postmords fel...inte vi som beställer att de är inkompetenta.
Inte för att jag returnerar saker...tror alldrig det har hänt, men jag handlar online av just anledningen att jag KAN göra det om något inte stämmer. Ta inte bort det...då åker jag ju istället 2 mil enkel resa i min 20 år gamla bil för att känna på det...och kanske inte ens köper. Det är väl en grymt större miljöbov än att en tom lasbil tar varan tillbaka till lagret nästa gång den ska åt det hållet och hämta nya tröjor åt någon annan

Som jag har fattat är inte returnera tillbaka till säljaren som är problemet, utan att att säljaren (framför allt klädkedjor) skickar kläderna till låglöneland för att fräscha till kläderna och paketera om varan (typ Kina, Indien mm).
En del fall säljs kläderna till u-land där en del säljs lokalt och resten eldas upp eller hamnar på deponi.

Jag kan tänka mig att en del elektronik gör liknade resa, men jag tror att mindre vanligt.

Så har jag fattat i alla fall... men jag kan missat något...

Av erixon
Skrivet av Snabbt_o_Hårt:

Om man spånar lite på prestanda DG1 gjorde 5900 poäng i 3DMark's Fire Strike (med 96 EU) AMD's Radeon RX 460 (5924 poäng)
Kanske inte så imponerande men nu ska Intels Xe-arkitektur skala väldigt bra med fler EU's, så:

(5900/96)x512=31466

RTX 3090 = 19902

6900 XT = 19042

DG1 = 75W

(75W/96)x512 = 400W

Så hur bra prestandan blir när man måste dra ner W effekten till en rimlig nivå åter står att se, eller kommer Intel gå all in med ett 400W kort?
Gamla GDDR6 och minnes bandbredd kommer säkert hålla dem till baka, AMD gjorde ett riktigt bra språng där med senaste RDNA2 sett till komprimering och bandbredd.

Jag tror att du jämför äpplen och päron, DG1 fick ca 5900 Grafikpoäng.
RXT3090 fick 48600 Grafikpoäng
6900XT fick 55700 Grafikpoäng
enligt sweclockers.

Så om följer din beräkning så landar den ungefär med 3060Ti (30000 grafikpoäng).
Men jag skulle tro att den hamnar mer runt ca 25000-27000 grafikpoäng delvis runt 5700xt och 2070super.

Så vi får hoppas att priset blir bra annars har svårt se hur de ska kunna vara attraktiva (Vid en normal marknad)

Av erixon
Skrivet av medbor:

Min stora fundering är varför kretsen är så stor. Kvadratmillimeter per cu har ju ökat med 50%. På större syskonen var det ju i princip oförändrat mot 5700XT...

Visst InfinityCache och Raytracing, men en markant ökning...

Information som finns är väl rykten. Och 40CU verkar enligt min mening för lite för en buss på 192bitar, jag skulle snarare tro på ca 50 CU skulle vara mer balanserad med minnesbandbredden. Det skulle förklara storleken på "kretsytan".

Att dessutom gå från 6800 60CU till 6700XT "40CU" skulle lämna ett stort glapp som AMD skulle ha svårt att fylla utan att använda en dyr Navi21 krets jämfört mot billigare Navi22. Det är också möjligt att 6700 har 40CU vilket skulle vara mer rimligt.
Typ
80CU 6900XT
72CU 6800XT
60CU 6800
50CU 6700XT "gissar"
40CU 6700 "gissar"

Angående InfinityCache tror jag att storleken är kopplad till minnes bredden delvis 256bitar -> 128MiB L3 och 196bitar -> 96MiB.

Men det är bara mina spekulationer.

Av erixon

Jag tror att man släpper just 1050ti beror på att den tillverkas av Samsung på 14nm medans 1060 till 1080ti tillverkas på TMSC 16nm, jag skulle tro att Samsung har kapacitet men inte TMSC annars tror jag att de gladeligen hade kickat igång tillverkningen på 1060 och 1070ti.

AMD verkar också "öka" tillverka rx580/rx570 som tillverkas av Samsung, jag baserar den killgissningen på följande nyhet "Asrock avslöjar 12 GB minne för Radeon RX 6600 XT" så verkar Asrock "lansera" "nya" RX580 och RX570.
Men som sagt det är ren spekulation från min sida och jag kan ha missuppfatta en del saker.

Av erixon

Jag fattar inte varför man inte köper typ ett äkta 500w agg, typ EVGA W1 500 för ca 50kr mer.

Nätaggregat i den här prisklassen är redan väldigt prispressade så enda sättet att få ned priset är att fula sig på något vis, exempel att marknadsförs som 500w men är ett 400w agg.

Jag tycker att bra Sweclockers lägger tid kolla dessa, men jag skulle villa ha en ny utmärkelse typ "Vilseledande" men det kanske redan finns?

Av erixon
Citat:

Nvidias lösning är dessutom bestyckad med 2 GB GDDR5-minne, vilket ger högre bandbredd till grafikdelen ställt mot Gen 12 i Intel Core i7-1165G7.

Nej, inte vad jag vet så har MX350 endast 64bitar @ 7000MHz GDDR5 vilket ger 56GB/s mot "LPDDR4X-primärminne i hastigheten 4 266 MHz" vilket ger 68GB/s.
I för sig delar CPU och iGPU på bandbredden men det finns även fördelar som att cpu kan skriva direkt till GPU minnet (efter som det är samma minne).

Men alltid roligt att minimum grafik prestandan höjs

Av erixon
Skrivet av Yoshman:

Inser att Intel vill visa lite spelprestanda för att peka på att de nu jobbar mer aktivt med en GPU. Men visar inte detta precis vad alla andra "starka" iGPUer visat innan: begränsningar i TDP och minnesbandbredd jämfört med även enklare dGPUer gör att iGPUer bara kommer fungera ihop med enklare titlar.

För att sätta detta i relation till iGPU i Ryzen 4900HS

"AdoredTV editor Matthew Connatser commented that his Asus ROG Zephyrus G14 with AMD Ryzen 9 4900HS, running Battlefield V with the same settings, achieved an average 25fps in the same scene."

Så det är ett riktigt bra resultat för att vara en iGPU, framförallt om Intel körde på en 1165G7 som har cTDP på 12-25 W, d.v.s. man lär i så fall kört på 25 W (finns rykten om en 1168G7 på 28 W TDP, vet inte vilken cTDP den maximalt har). 4900HS är en 35 W TDP krets. Går ändå inte att komma ifrån att ~30 FPS är inte superspännande.

Det skulle vara roligt veta vad för minne de använder. Om de använder exempelvis LPDDR4(X) 4266 eller vanligt DDR4 3200. Med LPDDR4(X) skulle bandbredden vara ca 30% högre vilket skulle kunna ge en fördel (men behöver inte vara det). Skulle va roligt att jämföra 4800u med LPDDR4 4266 vs DDR4 3200 se om det gör någon skillnad.
MX250 med GDDR5 på 25W ligger väl på ungefär 23FPS i BFV 1920x1080 high och har ungefär samma bandbredd som DDR4.
LPDDR4 4266 @ 128Bitar ~ 68GB/s
DDR4 3200 @ 128Bitar ~51.2GB/s
GDDR5 7000 @ 64Bitar ~56GB/s

Som sagt skulle vara roligt och veta vad som är störst flaskhalsen TDP eller bandbredden.

Skrivet av Yoshman:

Så GPGPU är den killer-app:en "stark" iGPU letat efter, för att det ska realiseras krävs egentligen långt mer jobb på programvarusidan än på kiselsidan! Intel kan ha fått till den delen med oneAPI.

Skulle vara på tiden, känns om det finns en ganska stor outnyttjad potential

Av erixon

@xyllian: Jag håller med dig om att det är missledande, men jag tror att anledningen till TF32 är att den tar upp 32bitar i minnet även om man bara "räknar" med 19bitar.
Men som jag fattar så behövs ingen konvertering mellan TF32 och FP32 vilket spar konverterings steg och man kan lättare blanda TF32 och FP32 instruktioner och få ut mer prestanda när man kräver lite extra precision jämfört med ren FP16.

Det är vad jag tror...

Av erixon
Skrivet av Shiprat:

Bra att de är ärliga mer eller mindre vad gäller strömförbrukning, trist att de valde att minska CU's för att bara matcha tidigare prestanda med bättre effektivitet. Får se hur allt detta uttrycker sig i verkliga tester, baserat på vad de publicerat så känns fortfarande en intel 35-45w TDP med ett nvidia MX eller 1650 som sweet-spot för gaminglaptops.

Vega 11 var grymt minnesbandbredd strypt, trots att har teoretisk FP på 1,9Tflops så klås den av RX 550 som endast 1,2Tflops (mycket troligt vis tack vare RX 550 högre minnesbandbredd).

Jag skulle tro att 7nm Vega med endast 8CU och LPDDR4x ger en bättre balans mellan beräkningskraft och minnesbandbredd, Delvis man slösar inte bort kisel yta till en minimal nytta.

Av erixon

Jag tycker att det nästa är värre att de minskar på CU på lägre modellerna, det är på de som en "bra" inbyggd GPU gör mest nytta. Med de dyrare cpu så är det väl ganska vanligt att man parar ihop med ett diskret GPU.

Av erixon

@ipac: Nej, tyvärr måste jag ha missat

Av erixon

@ipac: Bilden är renderad för marknadsföring, så jag skulle kunna tro att kan se annorlunda ut när den kommer ut.

Av erixon
Skrivet av jOnÄTÄn:

Varför skulle det vara så? Kortet är väl inte ens i närheten av att begränsas av x16 3,0?

Jag tror han syftar på att kortet endast är 8x (elektriskt inkopplade) men jag tvivlar att det är så stor skillnad.

Av erixon
Skrivet av AndreaX:

Njae.. är det inte ungefär vad Google menar att Stadia levererar, nu.

Nja Stadia ligger på 10,7Tf och spekuleras om att det är special variant av Vega 56.
Medans "Anaconda" ligger på 12Tf och ryktet säger att den bygger på navi.

Så ungefär Vega 56 vs 5700xt som är överklockat med 20% typ (5700xt ligger på 9,7Tf).