Nvidia Ampere – en teknisk djupdykning

2020-09-04 23:00

Melding Plague

Registrerad: Dec 1999

●

Nvidia Ampere – en teknisk djupdykning

Nvidia ger insyn i hur Ampere-arkitekturen förbättrar ray tracing, och framstegen som görs med nytillkomna funktioner som RTX IO.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Rapportera Redigera

Citera flera Citera (2)

2020-09-04 23:21

Permalänk

meanh

Medlem ★

Plats: Horndal
Registrerad: Mar 2005

●

Ett förtydligande som kan vara värt att göra är att RTX IO även kommer att fungera på Turing och inte endast på Ampere. Dock mer begränsat då Turing "endast" har pcie3.

Rapportera Redigera

Citera flera Citera (7)

2020-09-05 00:00

Permalänk

scara

Medlem

Plats: Stockholm
Registrerad: Sep 2010

●

Multiplicera Turing-kärnor med 1.7/3 för att få motsvarande prestanda/kärna för Ampere. Ett typ exempel på varför prestanda
ej skalar linjärt mot antal kärnor, oavsett motsvarande ökning av frekvens eller ej; Ampere har inte bandbredden och ökning av de andra komponenter i övrigt.

Rapportera Redigera

Citera flera Citera (1)

2020-09-05 00:33

Permalänk

obadja

Medlem

Plats: stockholm
Registrerad: Mar 2011

●

Skrivet av meanh:

Ett förtydligande som kan vara värt att göra är att RTX IO även kommer att fungera på Turing och inte endast på Ampere. Dock mer begränsat då Turing "endast" har pcie3.

Gå till inlägget

Stämmer det här verkligen? Trodde att RTX IO enbart är software och borde därför inte vara någon skillnad mellan arkitekturerna.

Rapportera Redigera

Citera flera Citera

2020-09-05 00:36

Permalänk

medbor

Medlem ★

Like-magnet

Registrerad: Okt 2011

●

Trevlig genomgång av vissa delar såklart, men känns inte som man förstår helheten ändå. Känns som att antalet cuda-kärnor knappt skalar alls med spelprestanda, så många andra flaskhalsar är nog i vägen. Men vilka är dom och varför gör man denna dubblering ändå när den knappt hjälper för spel?

Allting de pratade om med latens handlade ju bara om att de nu kan köra RT parallellt med shaders, vilket såklart förbättrar både latens och bildfrekvens, men att jämföra med SoftwareRT på Pascal kändes så krystat att jag knappt finner ord... det är alltså ingen förbättring värd att nämna här om man inte kör RT, vilket väldigt få gör som det är redan eftersom det helt dödar all framerate.

Märks nu mer än någonsin hur mycket av en Beta-produkt 2000-serien var och hur rätt alla hade som skrattade åt priserna och prestandan...

Hade jag ägt 2000-serien nu hade jag varit sjukt arg och aldrig mer köpt Nvidia efter detta...

Rapportera Redigera

Citera flera Citera (3)

2020-09-05 00:39

Permalänk

medbor

Medlem ★

Like-magnet

Registrerad: Okt 2011

●

Skrivet av obadja:

Stämmer det här verkligen? Trodde att RTX IO enbart är software och borde därför inte vara någon skillnad mellan arkitekturerna.

Gå till inlägget

Det handlar ju om dataöverföring på PCIe alltså kan det påverka till viss del, men största vinsten är ju att GPU kan packa upp rådatan och cpu inte behöver packa upp och skicka vidare vilket sparar mycket cpu-kraft. Min känsla är därför att PCIe gen knappt borde göra skillnad

Rapportera Redigera

Citera flera Citera

2020-09-05 01:19

Permalänk

GuuFi

Medlem ★

Registrerad: Aug 2003

●

Skrivet av medbor:

Trevlig genomgång av vissa delar såklart, men känns inte som man förstår helheten ändå. Känns som att antalet cuda-kärnor knappt skalar alls med spelprestanda, så många andra flaskhalsar är nog i vägen. Men vilka är dom och varför gör man denna dubblering ändå när den knappt hjälper för spel?

Allting de pratade om med latens handlade ju bara om att de nu kan köra RT parallellt med shaders, vilket såklart förbättrar både latens och bildfrekvens, men att jämföra med SoftwareRT på Pascal kändes så krystat att jag knappt finner ord... det är alltså ingen förbättring värd att nämna här om man inte kör RT, vilket väldigt få gör som det är redan eftersom det helt dödar all framerate.

Märks nu mer än någonsin hur mycket av en Beta-produkt 2000-serien var och hur rätt alla hade som skrattade åt priserna och prestandan...

Hade jag ägt 2000-serien nu hade jag varit sjukt arg och aldrig mer köpt Nvidia efter detta...

Gå till inlägget

Mjo det är ju lite av en smäll i käften för någon som betalat skitmycket för t.ex. 2080Ti nyligen, ingen verkar bry sig.

De konkurrerar med sina egna produkter och skiter i vad konsumenten tycker så länge man är bättre än konkurrenten.

Alltid bra med förbättrade produkter men nu är det konsumenterna som betalar, RTX var från början en nisch som lovade 100+ titlar, måste ha slutat med 10 vettiga, ingen bryr sig.

Rapportera Redigera

Citera flera Citera (3)

2020-09-05 01:23

Permalänk

lundagrabb

Medlem

Plats: Lund
Registrerad: Mar 2011

●

"CUDA-kärnorna i ett SM-kluster har utökats till att nu kunna hantera antingen två flyttalsberäkningar (FP32) eller en FP32- och en integerberäkning (INT32) per klockcykel. En SM-enhet bestyckas med fyra kluster av 32 CUDA-kärnor, och dessa kan nu alltså utföra totalt 128 aritmetiska adderingsberäkningar (FMA), upp från 64 för SM-enheterna i Turing. "

Är det inte lite fel formulerat? Vad är för övrigt "aritmetiska adderingsberäkningar"? De kan väl göra mer än att bara "plussa"?
Totala antalet operationer i varje SM är väl fortfarande totalt 128 som tidigare men att numera kan de utgöras av upp till 100% flyttalsberäkningar mot tidigare max 50%. Andelen helttalsberäkningar är fortfarande max 50%.

Generellt när det gäller artiklar av denna typ där arkitekturer skal analyseras så upplever jag de som dåliga där skribenten uppenbarligen inte behärskar terminologin helt och formuleringarna är luddiga.
Talesättet "det dunkelt sagda är det dunkelt tänkta" poppar upp i mitt huvud?
Kan ni inte be Yoshman korrekturläsa vad ni skriver? Eller bättre anställa honom att skriva denna typ av artiklar. Jag scrollar oftast ner till hans inlägg i kommentarsfältet för att få en tydlig,lättläst och insiktsfull förklaring på vad denna typ av artikel egentligen försöker förmedla.

Rapportera Redigera

Citera flera Citera (11)

2020-09-05 01:37

Permalänk

Shiprat

Medlem ★

Registrerad: Jun 2017

●

Skrivet av GuuFi:

Mjo det är ju lite av en smäll i käften för någon som betalat skitmycket för t.ex. 2080Ti nyligen, ingen verkar bry sig.

De konkurrerar med sina egna produkter och skiter i vad konsumenten tycker så länge man är bättre än konkurrenten.

Alltid bra med förbättrade produkter men nu är det konsumenterna som betalar, RTX var från början en nisch som lovade 100+ titlar, måste ha slutat med 10 vettiga, ingen bryr sig.

Gå till inlägget

Well, sa vid lanseringen att Turing kändes som att betala för att bli beta-testare, men köpte till slut då min gamla gpu dog och jag ville inte ta ett kliv neråt i prestanda medan jag väntade. Men det pris jag nu kan tänka mig att jag skulle få för mitt 2080S lär vara så dåligt att jag sannolikt inte kommer sälja det alls om jag uppdaterar, när haman på hyllan som reserv eller för andra projekt eller något. Rätt fånigt.

Visa signatur

Gamingrigg: MEG x570 ACE, 5950X, Ripjaws V 32GB 4000MT/S CL16, 6800XT Red Devil LE, HX1200i.
Laptop: XPS 9570 x GTX 1050 x 8300h + 16GB Vengeance 2666Mhz + Intel AX200
Valheim server: i7-8559 + Iris Plus 655 + 32GB + 256GB
Printers? Yes. Ender 5, Creality LD-002R, Velleman VM8600, Velleman K8200

Rapportera Redigera

Citera flera Citera

2020-09-05 01:42

Permalänk

IKEA Billy Bokhylla

Medlem ★

Registrerad: Okt 2015

●

Vet redaktionen möjligtvis om referenskylaren kommer vara semipassiv?

Visa signatur

:^)

Rapportera Redigera

Citera flera Citera

2020-09-05 02:17

Permalänk

medbor

Medlem ★

Like-magnet

Registrerad: Okt 2011

●

Skrivet av GuuFi:

Mjo det är ju lite av en smäll i käften för någon som betalat skitmycket för t.ex. 2080Ti nyligen, ingen verkar bry sig.

De konkurrerar med sina egna produkter och skiter i vad konsumenten tycker så länge man är bättre än konkurrenten.

Alltid bra med förbättrade produkter men nu är det konsumenterna som betalar, RTX var från början en nisch som lovade 100+ titlar, måste ha slutat med 10 vettiga, ingen bryr sig.

Gå till inlägget

Men hur kan folk inte vara sura över att detta? Jaja... som alltid är det väl med fanboys? Lite som med MAGA-gänget men mindre extremt såklart

Rapportera Redigera

Citera flera Citera (3)

2020-09-05 02:47

Permalänk

JackeShan

Medlem ★

Plats: Vintergatan
Registrerad: Jul 2006

●

Den här artikeln och en god stark kopp kaffe på en lördagsmorgon sitter fint.

Rapportera Redigera

Citera flera Citera (2)

2020-09-05 02:48

Permalänk

oceanic

Medlem

Plats: Kalmar
Registrerad: Dec 2005

●

Skrivet av medbor:

Men hur kan folk inte vara sura över att detta? Jaja... som alltid är det väl med fanboys? Lite som med MAGA-gänget men mindre extremt såklart

Gå till inlägget

Priserna på Turing pumpades upp med coin-brytningen därtill var korten bäst på marknaden vid lanseringen och är fortfarande riktigt bra. Sen om folk uppgraderade från Pascal med rätt liten prestandaökning kan man fundera om det var klokt beslut, nu ger dock uppgradering från de äldre korten rejält prestandalyft värt de tusentals kronor man får lägga ut tycker åtminstone jag.

Visa signatur

CPU: Intel i9-12900K Cooler: Asus TUF Gaming LC 240 ARGB MB: Asus TUF Gaming Z690 Plus Wifi D4 GPU: Asus TUF GeForce RTX 3080 Ti 12GB Case: In Win D-Frame HD: Intel Optane 900P 280GB, WD Black SN850 1TB Mem: Kingston Fury Beast RGB 3600MHz CL17 32GB PSU: Corsair AX760 OS: Win11 Pro

Rapportera Redigera

Citera flera Citera (6)

2020-09-05 04:38

Permalänk

GuuFi

Medlem ★

Registrerad: Aug 2003

●

Skrivet av medbor:

Men hur kan folk inte vara sura över att detta? Jaja... som alltid är det väl med fanboys? Lite som med MAGA-gänget men mindre extremt såklart

Gå till inlägget

Jag är inte sur, jag har inget Nvidia-kort.

Men förstår absolut de som är bittra över hur Nvidia hanterat övergången till nästa generation.

Som sagt, just nu konkurrerar de mot sig själva aka sin befintliga kunder, inget att vara sur över men visst får man vara bitter om man bitit i det sura äpplet som är Nvidias förra generation som hade sjukt överpris för något som knappt existerar i spel, RTX.

Rapportera Redigera

Citera flera Citera

2020-09-05 05:10

Permalänk

Azodan

Medlem ★

Registrerad: Nov 2004

●

Ja, jag är då peppad. Uppgraderar jag till ett RTX 3080 från mitt GTX 1060 6GB så kommer jag, enligt mina beräkningar, att få ungefär 5 gånger prestandan för ungefär 5 gånger högre pris...

Rapportera Redigera

Citera flera Citera (5)

2020-09-05 08:39

Permalänk

Callister

Medlem

Registrerad: Jul 2004

●

Skulle någonsin kunna förklara lite mer hur RTX IO hänger ihop med vad jag har för SSD disk? Jag trodde det var en fristående sak och inte hängde ihop med lagringsdisken.

Visa signatur

Fractal Design Define R5 - SuperNOVA 750 G2 750w - KFA2 GeForce RTX 3080 SG - G.Skill Flare X Black DDR4 3400mhz CL14 - Ryzen 3600 - MSI B450 Tomahawk Max - Samsung 850 Series EVO 500gb - Samsung 970 Evo Plus 1TB - Acer 27" Predator XB271HU

Rapportera Redigera

Citera flera Citera

2020-09-05 08:54

Permalänk

lhugo

Medlem ★

Plats: Göteborg
Registrerad: Dec 2017

●

Skrivet av meanh:

Ett förtydligande som kan vara värt att göra är att RTX IO även kommer att fungera på Turing och inte endast på Ampere. Dock mer begränsat då Turing "endast" har pcie3.

Gå till inlägget

Är det verkligen PCIe3 aom begränsar. 16 banor PCIe3 borde kunna leverera 16 GB/s. Så snabba sekundärlagringsenheter har vi ju inte än.

Rapportera Redigera

Citera flera Citera (3)

2020-09-05 08:54

Permalänk

Azodan

Medlem ★

Registrerad: Nov 2004

●

Skrivet av Callister:

Skulle någonsin kunna förklara lite mer hur RTX IO hänger ihop med vad jag har för SSD disk? Jag trodde det var en fristående sak och inte hängde ihop med lagringsdisken.

Gå till inlägget

Vet inte riktigt vad du menar men det måste vara en NVMe SSD så grafikkortet kan, om operativsystemet tillåter, gå direkt till SSDn och fråga om datat den behöver.

Rapportera Redigera

Citera flera Citera

2020-09-05 08:59

Permalänk

lhugo

Medlem ★

Plats: Göteborg
Registrerad: Dec 2017

●

Skrivet av medbor:

Det handlar ju om dataöverföring på PCIe alltså kan det påverka till viss del, men största vinsten är ju att GPU kan packa upp rådatan och cpu inte behöver packa upp och skicka vidare vilket sparar mycket cpu-kraft. Min känsla är därför att PCIe gen knappt borde göra skillnad

Gå till inlägget

Håller med att PCIe-generation borde dpela mindre roll. Men är det verkligen CPU-kraft man vill spara med detta. Det är väl inte för att befria CPUn från beräkningar så att den kan arbeta med annat. Det är väl snarare att ta över en uppgift som CPUn är mindre lämpad för? Sen får vi se hur väl detta funkar praktiken.

Rapportera Redigera

Citera flera Citera

2020-09-05 08:59

Permalänk

hakd

Medlem ★

Plats: Isla de Muerta
Registrerad: Okt 2009

●

Jag har fortfarande en magkänsla att något inte stämmer, det känns lite väl bra.

Visa signatur

CPU: 5600x
GPU: 3080
RAM: 32GB

Sluta gömma din identitet, skaffa en till istället

Rapportera Redigera

Citera flera Citera (5)

2020-09-05 09:01

Permalänk

meanh

Medlem ★

Plats: Horndal
Registrerad: Mar 2005

●

Skrivet av lhugo:

Är det verkligen PCIe3 aom begränsar. 16 banor PCIe3 borde kunna leverera 16 GB/s. Så snabba sekundärlagringsenheter har vi ju inte än.

Gå till inlägget

Fast din pcie3 ssd har max tillgång till 4 banor (max 3,5GB/s) medans en pcie4 ssd på sina 4 banor har dubbla bandbredden (max 7GB/s)

Edit: Sedan tror jag inte detta blir någon jätteskillnad i praktiken, men en begränsning gentemot Ampere är det likväl.

Rapportera Redigera

Citera flera Citera (8)

2020-09-05 09:16

Permalänk

Reiker

Medlem ★

Plats: Kalmar
Registrerad: Sep 2010

●

Skrivet av lhugo:

Håller med att PCIe-generation borde dpela mindre roll. Men är det verkligen CPU-kraft man vill spara med detta. Det är väl inte för att befria CPUn från beräkningar så att den kan arbeta med annat. Det är väl snarare att ta över en uppgift som CPUn är mindre lämpad för? Sen får vi se hur väl detta funkar praktiken.

Gå till inlägget

Även moderkortet kommer ha en påverkan då M.2-portarna antingen är begränsade vid 3500MB/sec (PCIE-gen3) eller 7000MB/sec (PCIE-gen4), sen är ju SSD:n i sig en begränsning då låååångt från alla SSD:s maxar PCIE-gen3.

Oavsett så kommer det bli stor skillnad från idag oavsett om man har Turing eller Ampere och en hyfsad SSD!

Senast redigerat 2020-09-05 09:24

Visa signatur

Ryzen 7 5800X3D || Powercolor AMD Radeon RX 6800 16Gb || G.Skill Flare X 16GB 3200MHz CL14 || Gigabyte B550I Aorus Pro AX || LG 27GL850 QHD IPS 144 Hz || Samsung SSD 970 EVO Plus 1TB || Samsung SSD 960 EVO 250GB || Corsair SF600 || Louqe Ghost S1 Limestone || 2xMedium Tophat med 2xNF-F12 + 2xNF-A12x25 || Noctua NH-L12

Rapportera Redigera

Citera flera Citera

2020-09-05 09:30

Permalänk

Tea42BBS

Medlem ★

Plats: Stockholm / Vendelsö
Registrerad: Mar 2010

●

Fattar inte riktigt

1000ms/60 önskade fps = 16,6ms processtid per frame. Med siffrorna i artikeln så får jag det till att dagens RTX kort pre 3 serien, max kan prestera knappa 30 fps eller lägre för raytracade frames?

// LZ

Rapportera Redigera

Citera flera Citera

2020-09-05 09:47

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av Tea42BBS:

Fattar inte riktigt

1000ms/60 önskade fps = 16,6ms processtid per frame. Med siffrorna i artikeln så får jag det till att dagens RTX kort pre 3 serien, max kan prestera knappa 30 fps eller lägre för raytracade frames?

// LZ

Gå till inlägget

Beror väl dels på om den väntar till en frame är helt klar innan den börjar på nästa, det vet jag ingenting om hur det fungerar. Men sedan så finns det väl såklart simplare mer lågupplösta frames att räkna på än den de har i exemplet.

Rapportera Redigera

Citera flera Citera

2020-09-05 09:59

Permalänk

loevet

Lyxfällan 🎮 ★

Andreas Eklöv

Plats: Stockholm
Registrerad: Dec 2015

●

@meanh: helt rätt, kan vara bra att förtydliga så att det inte verkar vara förbehållet Ampere, lade till ett stycke om det. Bra fångat! 👍

Visa signatur

"We're with the press, hired geeks!"
Raoul Duke, Fear n' Loathing in Las Vegas

Rapportera Redigera

Citera flera Citera

2020-09-05 10:03

Permalänk

medbor

Medlem ★

Like-magnet

Registrerad: Okt 2011

●

Skrivet av meanh:

Fast din pcie3 ssd har max tillgång till 4 banor (max 3,5GB/s) medans en pcie4 ssd på sina 4 banor har dubbla bandbredden (max 7GB/s)

Edit: Sedan tror jag inte detta blir någon jätteskillnad i praktiken, men en begränsning gentemot Ampere är det likväl.

Gå till inlägget

Det är väl ganska få SSD idag för vettiga pengar (som folk alltså köper till speldatorer) som är PCIe4 eller presterar märkbart över 3000MB/s.

Det som kommer begränsa prestandan är SSDn helt klart, men PCIe generationen är nästan irrelevant med tanke på att de flesta diskar ligger på 2000-2500MB/s max

Rapportera Redigera

Citera flera Citera (1)

2020-09-05 10:21

Permalänk

DasIch

Medlem ★

Plats: Stockholm
Registrerad: Aug 2001

●

Skrivet av medbor:

Men hur kan folk inte vara sura över att detta? Jaja... som alltid är det väl med fanboys? Lite som med MAGA-gänget men mindre extremt såklart

Gå till inlägget

Jag undrar snarare hur folk kan vara sura över detta. Turing var första generationen av ny teknik, där vanlig rastrering och RT fick konkurrera om utrymme på en gigantisk krets, och ett pris som var mycket högre än tidigare. Det har varit givet redan från början att nästa generation kommer ge stora förbättringar - även vad gäller pris/prestanda.

Det här är saker som alla bör ha förstått och det är inte Nvidia fel om man inte gjort det.

Skrivet av Callister:

Skulle någonsin kunna förklara lite mer hur RTX IO hänger ihop med vad jag har för SSD disk? Jag trodde det var en fristående sak och inte hängde ihop med lagringsdisken.

Gå till inlägget

RTX IO gör det möjligt att streama resurser komprimerat från SSD;n direkt till GPU;n där Tensor-kärnorna packar upp dem. Fördelarna är att det frigör resurser hos CPU;n och att VRAM kan fyllas väldigt snabbt, vilket gör det möjligt att använda mycket större resurser då man inte behöver hålla lika mycket i VRAM och att man kan reducera laddningstider.

Rapportera Redigera

Citera flera Citera (16)

2020-09-05 10:25

Permalänk

FreddyK

Medlem ★

Plats: Uppsala
Registrerad: Okt 2003

●

Skrivet av medbor:

Men hur kan folk inte vara sura över att detta? Jaja... som alltid är det väl med fanboys? Lite som med MAGA-gänget men mindre extremt såklart

Gå till inlägget

Vad är det att vara sur över? Jag visste att risken var stor att nästa serie med RTX skulle vara mycket billigare när jag köpte mitt 2080ti, att sätta ett högt pris på något med en ny häftig teknik som dom kan hypa är inget ovanligt, plus att som någon annan sa, bitcoin-mining hade drivit upp priserna redan innan.

Man kan inte vara arg över att nästa generation av delar till en PC är mycket bättre än den förra eftersom företagen envisas med att släppa förbättrade versioner av allt hela tiden, en månad eller två efter att man köpt det "värsta" så finns det något bättre igen.

Lovar att 3080ti kommer avtäckas i slutet av det här året eller i början på nästa. Ska alla som köpt 3080 vara arga då?

Visa signatur

R7 7800X3D | 4070Ti | 32GB DDR5 6000mhz | 1TB SSD | 1TB M.2

Rapportera Redigera

Citera flera Citera (13)

2020-09-05 10:32

Permalänk

lhugo

Medlem ★

Plats: Göteborg
Registrerad: Dec 2017

●

Skrivet av meanh:

Fast din pcie3 ssd har max tillgång till 4 banor (max 3,5GB/s) medans en pcie4 ssd på sina 4 banor har dubbla bandbredden (max 7GB/s)

Edit: Sedan tror jag inte detta blir någon jätteskillnad i praktiken, men en begränsning gentemot Ampere är det likväl.

Gå till inlägget

Men kan man inte tänka sig att folk sitter på PCIe gen 4 SSD med Turing-GPU? Det gäller ju alla de som kör ryzen 3000 serien på 500-chippen. Då borde väl full bandbredd PCie 4, 4 banor kunna utnyttjas? Eller funkar inte bussen på det viset?

Rapportera Redigera

Citera flera Citera (1)

2020-09-05 10:40

Permalänk

IceKey

Medlem

Registrerad: Jan 2002

●

Folk är bara bra dumma att tro att deras 2080 Ti helt plötsligt är dåliga nu när 3000 serien är presenterad..

Köpte mitt 2080 Ti Strix för 9000 förra hösten på tradera (desperat utav pengar troligtvis därav summan), tvekar lite nu när man kan få ett likadant för nästan halva priset och köra SLI istället för 3080.

Själv är man nöjd med 120 fps i BF V (som man lirar till 99.9 % trots att det är slut), men även Doom Eternal och lite RTS.

Visa signatur

Intel i5 12600K | 128 GB DDR4 3600 Mhz
ASUS TUF Z690-PLUS D4 | ASUS TUF VG32VQ 32" 1440p
XFX 6900 XT Merc 319 Black Limited
HP ProLiant DL380p Gen8 | HP MicroServer Gen 8 |
Mikrotik 10 GbE Networking

Rapportera Redigera

Citera flera Citera (4)

Nvidia Ampere – en teknisk djupdykning

Nvidia Ampere – en teknisk djupdykning

Externa nyheter

Spelnyheter från FZ