Nvidia Ampere – en teknisk djupdykning

Permalänk
Melding Plague

Nvidia Ampere – en teknisk djupdykning

Nvidia ger insyn i hur Ampere-arkitekturen förbättrar ray tracing, och framstegen som görs med nytillkomna funktioner som RTX IO.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Ett förtydligande som kan vara värt att göra är att RTX IO även kommer att fungera på Turing och inte endast på Ampere. Dock mer begränsat då Turing "endast" har pcie3.

Permalänk
Medlem

Multiplicera Turing-kärnor med 1.7/3 för att få motsvarande prestanda/kärna för Ampere. Ett typ exempel på varför prestanda
ej skalar linjärt mot antal kärnor, oavsett motsvarande ökning av frekvens eller ej; Ampere har inte bandbredden och ökning av de andra komponenter i övrigt.

Permalänk
Medlem
Skrivet av meanh:

Ett förtydligande som kan vara värt att göra är att RTX IO även kommer att fungera på Turing och inte endast på Ampere. Dock mer begränsat då Turing "endast" har pcie3.

Stämmer det här verkligen? Trodde att RTX IO enbart är software och borde därför inte vara någon skillnad mellan arkitekturerna.

Permalänk
Medlem

Trevlig genomgång av vissa delar såklart, men känns inte som man förstår helheten ändå. Känns som att antalet cuda-kärnor knappt skalar alls med spelprestanda, så många andra flaskhalsar är nog i vägen. Men vilka är dom och varför gör man denna dubblering ändå när den knappt hjälper för spel?

Allting de pratade om med latens handlade ju bara om att de nu kan köra RT parallellt med shaders, vilket såklart förbättrar både latens och bildfrekvens, men att jämföra med SoftwareRT på Pascal kändes så krystat att jag knappt finner ord... det är alltså ingen förbättring värd att nämna här om man inte kör RT, vilket väldigt få gör som det är redan eftersom det helt dödar all framerate.

Märks nu mer än någonsin hur mycket av en Beta-produkt 2000-serien var och hur rätt alla hade som skrattade åt priserna och prestandan...

Hade jag ägt 2000-serien nu hade jag varit sjukt arg och aldrig mer köpt Nvidia efter detta...

Permalänk
Medlem
Skrivet av obadja:

Stämmer det här verkligen? Trodde att RTX IO enbart är software och borde därför inte vara någon skillnad mellan arkitekturerna.

Det handlar ju om dataöverföring på PCIe alltså kan det påverka till viss del, men största vinsten är ju att GPU kan packa upp rådatan och cpu inte behöver packa upp och skicka vidare vilket sparar mycket cpu-kraft. Min känsla är därför att PCIe gen knappt borde göra skillnad

Permalänk
Medlem
Skrivet av medbor:

Trevlig genomgång av vissa delar såklart, men känns inte som man förstår helheten ändå. Känns som att antalet cuda-kärnor knappt skalar alls med spelprestanda, så många andra flaskhalsar är nog i vägen. Men vilka är dom och varför gör man denna dubblering ändå när den knappt hjälper för spel?

Allting de pratade om med latens handlade ju bara om att de nu kan köra RT parallellt med shaders, vilket såklart förbättrar både latens och bildfrekvens, men att jämföra med SoftwareRT på Pascal kändes så krystat att jag knappt finner ord... det är alltså ingen förbättring värd att nämna här om man inte kör RT, vilket väldigt få gör som det är redan eftersom det helt dödar all framerate.

Märks nu mer än någonsin hur mycket av en Beta-produkt 2000-serien var och hur rätt alla hade som skrattade åt priserna och prestandan...

Hade jag ägt 2000-serien nu hade jag varit sjukt arg och aldrig mer köpt Nvidia efter detta...

Mjo det är ju lite av en smäll i käften för någon som betalat skitmycket för t.ex. 2080Ti nyligen, ingen verkar bry sig.

De konkurrerar med sina egna produkter och skiter i vad konsumenten tycker så länge man är bättre än konkurrenten.

Alltid bra med förbättrade produkter men nu är det konsumenterna som betalar, RTX var från början en nisch som lovade 100+ titlar, måste ha slutat med 10 vettiga, ingen bryr sig.

Permalänk

"CUDA-kärnorna i ett SM-kluster har utökats till att nu kunna hantera antingen två flyttalsberäkningar (FP32) eller en FP32- och en integerberäkning (INT32) per klockcykel. En SM-enhet bestyckas med fyra kluster av 32 CUDA-kärnor, och dessa kan nu alltså utföra totalt 128 aritmetiska adderingsberäkningar (FMA), upp från 64 för SM-enheterna i Turing. "

Är det inte lite fel formulerat? Vad är för övrigt "aritmetiska adderingsberäkningar"? De kan väl göra mer än att bara "plussa"?
Totala antalet operationer i varje SM är väl fortfarande totalt 128 som tidigare men att numera kan de utgöras av upp till 100% flyttalsberäkningar mot tidigare max 50%. Andelen helttalsberäkningar är fortfarande max 50%.

Generellt när det gäller artiklar av denna typ där arkitekturer skal analyseras så upplever jag de som dåliga där skribenten uppenbarligen inte behärskar terminologin helt och formuleringarna är luddiga.
Talesättet "det dunkelt sagda är det dunkelt tänkta" poppar upp i mitt huvud?
Kan ni inte be Yoshman korrekturläsa vad ni skriver? Eller bättre anställa honom att skriva denna typ av artiklar. Jag scrollar oftast ner till hans inlägg i kommentarsfältet för att få en tydlig,lättläst och insiktsfull förklaring på vad denna typ av artikel egentligen försöker förmedla.

Permalänk
Medlem
Skrivet av GuuFi:

Mjo det är ju lite av en smäll i käften för någon som betalat skitmycket för t.ex. 2080Ti nyligen, ingen verkar bry sig.

De konkurrerar med sina egna produkter och skiter i vad konsumenten tycker så länge man är bättre än konkurrenten.

Alltid bra med förbättrade produkter men nu är det konsumenterna som betalar, RTX var från början en nisch som lovade 100+ titlar, måste ha slutat med 10 vettiga, ingen bryr sig.

Well, sa vid lanseringen att Turing kändes som att betala för att bli beta-testare, men köpte till slut då min gamla gpu dog och jag ville inte ta ett kliv neråt i prestanda medan jag väntade. Men det pris jag nu kan tänka mig att jag skulle få för mitt 2080S lär vara så dåligt att jag sannolikt inte kommer sälja det alls om jag uppdaterar, när haman på hyllan som reserv eller för andra projekt eller något. Rätt fånigt.

Visa signatur

Gamingrigg: MEG x570 ACE, 5950X, Ripjaws V 32GB 4000MT/S CL16, 6800XT Red Devil LE, HX1200i.
Laptop: XPS 9570 x GTX 1050 x 8300h + 16GB Vengeance 2666Mhz + Intel AX200
Valheim server: i7-8559 + Iris Plus 655 + 32GB + 256GB
Printers? Yes. Ender 5, Creality LD-002R, Velleman VM8600, Velleman K8200

Permalänk

Vet redaktionen möjligtvis om referenskylaren kommer vara semipassiv?

Visa signatur
Permalänk
Medlem
Skrivet av GuuFi:

Mjo det är ju lite av en smäll i käften för någon som betalat skitmycket för t.ex. 2080Ti nyligen, ingen verkar bry sig.

De konkurrerar med sina egna produkter och skiter i vad konsumenten tycker så länge man är bättre än konkurrenten.

Alltid bra med förbättrade produkter men nu är det konsumenterna som betalar, RTX var från början en nisch som lovade 100+ titlar, måste ha slutat med 10 vettiga, ingen bryr sig.

Men hur kan folk inte vara sura över att detta? Jaja... som alltid är det väl med fanboys? Lite som med MAGA-gänget men mindre extremt såklart

Permalänk
Medlem

Den här artikeln och en god stark kopp kaffe på en lördagsmorgon sitter fint.

Permalänk
Medlem
Skrivet av medbor:

Men hur kan folk inte vara sura över att detta? Jaja... som alltid är det väl med fanboys? Lite som med MAGA-gänget men mindre extremt såklart

Priserna på Turing pumpades upp med coin-brytningen därtill var korten bäst på marknaden vid lanseringen och är fortfarande riktigt bra. Sen om folk uppgraderade från Pascal med rätt liten prestandaökning kan man fundera om det var klokt beslut, nu ger dock uppgradering från de äldre korten rejält prestandalyft värt de tusentals kronor man får lägga ut tycker åtminstone jag.

Visa signatur

CPU: Intel i9-12900K Cooler: Asus TUF Gaming LC 240 ARGB MB: Asus TUF Gaming Z690 Plus Wifi D4 GPU: Asus TUF GeForce RTX 3080 Ti 12GB Case: In Win D-Frame HD: Intel Optane 900P 280GB, WD Black SN850 1TB Mem: Kingston Fury Beast RGB 3600MHz CL17 32GB PSU: Corsair AX760 OS: Win11 Pro

Permalänk
Medlem
Skrivet av medbor:

Men hur kan folk inte vara sura över att detta? Jaja... som alltid är det väl med fanboys? Lite som med MAGA-gänget men mindre extremt såklart

Jag är inte sur, jag har inget Nvidia-kort.

Men förstår absolut de som är bittra över hur Nvidia hanterat övergången till nästa generation.

Som sagt, just nu konkurrerar de mot sig själva aka sin befintliga kunder, inget att vara sur över men visst får man vara bitter om man bitit i det sura äpplet som är Nvidias förra generation som hade sjukt överpris för något som knappt existerar i spel, RTX.

Permalänk
Medlem

Ja, jag är då peppad. Uppgraderar jag till ett RTX 3080 från mitt GTX 1060 6GB så kommer jag, enligt mina beräkningar, att få ungefär 5 gånger prestandan för ungefär 5 gånger högre pris...

Permalänk

Skulle någonsin kunna förklara lite mer hur RTX IO hänger ihop med vad jag har för SSD disk? Jag trodde det var en fristående sak och inte hängde ihop med lagringsdisken.

Visa signatur

Fractal Design Define R5 - SuperNOVA 750 G2 750w - KFA2 GeForce RTX 3080 SG - G.Skill Flare X Black DDR4 3400mhz CL14 - Ryzen 3600 - MSI B450 Tomahawk Max - Samsung 850 Series EVO 500gb - Samsung 970 Evo Plus 1TB - Acer 27" Predator XB271HU

Permalänk
Medlem
Skrivet av meanh:

Ett förtydligande som kan vara värt att göra är att RTX IO även kommer att fungera på Turing och inte endast på Ampere. Dock mer begränsat då Turing "endast" har pcie3.

Är det verkligen PCIe3 aom begränsar. 16 banor PCIe3 borde kunna leverera 16 GB/s. Så snabba sekundärlagringsenheter har vi ju inte än.

Permalänk
Medlem
Skrivet av Callister:

Skulle någonsin kunna förklara lite mer hur RTX IO hänger ihop med vad jag har för SSD disk? Jag trodde det var en fristående sak och inte hängde ihop med lagringsdisken.

Vet inte riktigt vad du menar men det måste vara en NVMe SSD så grafikkortet kan, om operativsystemet tillåter, gå direkt till SSDn och fråga om datat den behöver.

Permalänk
Medlem
Skrivet av medbor:

Det handlar ju om dataöverföring på PCIe alltså kan det påverka till viss del, men största vinsten är ju att GPU kan packa upp rådatan och cpu inte behöver packa upp och skicka vidare vilket sparar mycket cpu-kraft. Min känsla är därför att PCIe gen knappt borde göra skillnad

Håller med att PCIe-generation borde dpela mindre roll. Men är det verkligen CPU-kraft man vill spara med detta. Det är väl inte för att befria CPUn från beräkningar så att den kan arbeta med annat. Det är väl snarare att ta över en uppgift som CPUn är mindre lämpad för? Sen får vi se hur väl detta funkar praktiken.

Permalänk
Medlem

Jag har fortfarande en magkänsla att något inte stämmer, det känns lite väl bra.

Visa signatur

CPU: 5600x
GPU: 3080
RAM: 32GB

Sluta gömma din identitet, skaffa en till istället

Permalänk
Medlem
Skrivet av lhugo:

Är det verkligen PCIe3 aom begränsar. 16 banor PCIe3 borde kunna leverera 16 GB/s. Så snabba sekundärlagringsenheter har vi ju inte än.

Fast din pcie3 ssd har max tillgång till 4 banor (max 3,5GB/s) medans en pcie4 ssd på sina 4 banor har dubbla bandbredden (max 7GB/s)

Edit: Sedan tror jag inte detta blir någon jätteskillnad i praktiken, men en begränsning gentemot Ampere är det likväl.

Permalänk
Medlem
Skrivet av lhugo:

Håller med att PCIe-generation borde dpela mindre roll. Men är det verkligen CPU-kraft man vill spara med detta. Det är väl inte för att befria CPUn från beräkningar så att den kan arbeta med annat. Det är väl snarare att ta över en uppgift som CPUn är mindre lämpad för? Sen får vi se hur väl detta funkar praktiken.

Även moderkortet kommer ha en påverkan då M.2-portarna antingen är begränsade vid 3500MB/sec (PCIE-gen3) eller 7000MB/sec (PCIE-gen4), sen är ju SSD:n i sig en begränsning då låååångt från alla SSD:s maxar PCIE-gen3.

Oavsett så kommer det bli stor skillnad från idag oavsett om man har Turing eller Ampere och en hyfsad SSD!

Visa signatur

Ryzen 7 5800X3D || Powercolor AMD Radeon RX 6800 16Gb || G.Skill Flare X 16GB 3200MHz CL14 || Gigabyte B550I Aorus Pro AX || LG 27GL850 QHD IPS 144 Hz || Samsung SSD 970 EVO Plus 1TB || Samsung SSD 960 EVO 250GB || Corsair SF600 || Louqe Ghost S1 Limestone || 2xMedium Tophat med 2xNF-F12 + 2xNF-A12x25 || Noctua NH-L12

Permalänk
Medlem

Fattar inte riktigt

1000ms/60 önskade fps = 16,6ms processtid per frame. Med siffrorna i artikeln så får jag det till att dagens RTX kort pre 3 serien, max kan prestera knappa 30 fps eller lägre för raytracade frames?

// LZ

Permalänk
Medlem
Skrivet av Tea42BBS:

Fattar inte riktigt

1000ms/60 önskade fps = 16,6ms processtid per frame. Med siffrorna i artikeln så får jag det till att dagens RTX kort pre 3 serien, max kan prestera knappa 30 fps eller lägre för raytracade frames?

// LZ

Beror väl dels på om den väntar till en frame är helt klar innan den börjar på nästa, det vet jag ingenting om hur det fungerar. Men sedan så finns det väl såklart simplare mer lågupplösta frames att räkna på än den de har i exemplet.

Permalänk
Lyxfällan 🎮

@meanh: helt rätt, kan vara bra att förtydliga så att det inte verkar vara förbehållet Ampere, lade till ett stycke om det. Bra fångat! 👍

Visa signatur

"We're with the press, hired geeks!"
Raoul Duke, Fear n' Loathing in Las Vegas

Permalänk
Medlem
Skrivet av meanh:

Fast din pcie3 ssd har max tillgång till 4 banor (max 3,5GB/s) medans en pcie4 ssd på sina 4 banor har dubbla bandbredden (max 7GB/s)

Edit: Sedan tror jag inte detta blir någon jätteskillnad i praktiken, men en begränsning gentemot Ampere är det likväl.

Det är väl ganska få SSD idag för vettiga pengar (som folk alltså köper till speldatorer) som är PCIe4 eller presterar märkbart över 3000MB/s.

Det som kommer begränsa prestandan är SSDn helt klart, men PCIe generationen är nästan irrelevant med tanke på att de flesta diskar ligger på 2000-2500MB/s max

Permalänk
Medlem
Skrivet av medbor:

Men hur kan folk inte vara sura över att detta? Jaja... som alltid är det väl med fanboys? Lite som med MAGA-gänget men mindre extremt såklart

Jag undrar snarare hur folk kan vara sura över detta. Turing var första generationen av ny teknik, där vanlig rastrering och RT fick konkurrera om utrymme på en gigantisk krets, och ett pris som var mycket högre än tidigare. Det har varit givet redan från början att nästa generation kommer ge stora förbättringar - även vad gäller pris/prestanda.

Det här är saker som alla bör ha förstått och det är inte Nvidia fel om man inte gjort det.

Skrivet av Callister:

Skulle någonsin kunna förklara lite mer hur RTX IO hänger ihop med vad jag har för SSD disk? Jag trodde det var en fristående sak och inte hängde ihop med lagringsdisken.

RTX IO gör det möjligt att streama resurser komprimerat från SSD;n direkt till GPU;n där Tensor-kärnorna packar upp dem. Fördelarna är att det frigör resurser hos CPU;n och att VRAM kan fyllas väldigt snabbt, vilket gör det möjligt att använda mycket större resurser då man inte behöver hålla lika mycket i VRAM och att man kan reducera laddningstider.

Permalänk
Medlem
Skrivet av medbor:

Men hur kan folk inte vara sura över att detta? Jaja... som alltid är det väl med fanboys? Lite som med MAGA-gänget men mindre extremt såklart

Vad är det att vara sur över? Jag visste att risken var stor att nästa serie med RTX skulle vara mycket billigare när jag köpte mitt 2080ti, att sätta ett högt pris på något med en ny häftig teknik som dom kan hypa är inget ovanligt, plus att som någon annan sa, bitcoin-mining hade drivit upp priserna redan innan.

Man kan inte vara arg över att nästa generation av delar till en PC är mycket bättre än den förra eftersom företagen envisas med att släppa förbättrade versioner av allt hela tiden, en månad eller två efter att man köpt det "värsta" så finns det något bättre igen.

Lovar att 3080ti kommer avtäckas i slutet av det här året eller i början på nästa. Ska alla som köpt 3080 vara arga då?

Visa signatur

R7 7800X3D | 4070Ti | 32GB DDR5 6000mhz | 1TB SSD | 1TB M.2

Permalänk
Medlem
Skrivet av meanh:

Fast din pcie3 ssd har max tillgång till 4 banor (max 3,5GB/s) medans en pcie4 ssd på sina 4 banor har dubbla bandbredden (max 7GB/s)

Edit: Sedan tror jag inte detta blir någon jätteskillnad i praktiken, men en begränsning gentemot Ampere är det likväl.

Men kan man inte tänka sig att folk sitter på PCIe gen 4 SSD med Turing-GPU? Det gäller ju alla de som kör ryzen 3000 serien på 500-chippen. Då borde väl full bandbredd PCie 4, 4 banor kunna utnyttjas? Eller funkar inte bussen på det viset?

Permalänk
Medlem

Folk är bara bra dumma att tro att deras 2080 Ti helt plötsligt är dåliga nu när 3000 serien är presenterad..

Köpte mitt 2080 Ti Strix för 9000 förra hösten på tradera (desperat utav pengar troligtvis därav summan), tvekar lite nu när man kan få ett likadant för nästan halva priset och köra SLI istället för 3080.

Själv är man nöjd med 120 fps i BF V (som man lirar till 99.9 % trots att det är slut), men även Doom Eternal och lite RTS.

Visa signatur

Intel i5 12600K | 128 GB DDR4 3600 Mhz
ASUS TUF Z690-PLUS D4 | ASUS TUF VG32VQ 32" 1440p
XFX 6900 XT Merc 319 Black Limited
HP ProLiant DL380p Gen8 | HP MicroServer Gen 8 |
Mikrotik 10 GbE Networking