Nvidias Ampere-arkitektur gör premiär i datacenterkortet A100

2020-05-14 15:46

Melding Plague

Registrerad: Dec 1999

●

Nvidias Ampere-arkitektur gör premiär i datacenterkortet A100

Med Ampere introducerar Nvidia ett nytt format för flyttalsberäkningar och möjligheten att dela upp kortet i flera oberoende enheter.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Rapportera Redigera

Citera flera Citera (1)

2020-05-14 15:59

Permalänk

Daz

Medlem ★

Plats: Södra norrland
Registrerad: Jul 2003

●

Ska vi slå vad om att LinusTechTips kommer tjata till sig en och tvinga någon av sina medarbetare att få in crysis på den?

Visa signatur

Rapportera Redigera

Citera flera Citera (24)

2020-05-14 16:01

Permalänk

Vargas

Medlem ★

Registrerad: Jul 2001

●

Multi-Instance GPU även på konsumentkorten skulle vara intressant för virtualisering utan traditionell PCI passthrough?

Visa signatur

Var snälla mot varandra och snåla inte på nätaggregatet.

Rapportera Redigera

Citera flera Citera (2)

2020-05-14 16:06

Permalänk

THB

Snusfri ★

Plats: Inglewood
Registrerad: Aug 2005

●

Drägglar..
Skulle inte tacka nej till A100 för rendering

Visa signatur

WS: i9 13900K - 128GB RAM - 6.5TB SSD - RTX 3090 24GB - LG C2 42" - W11 Pro
LAPTOP 1: Lenovo Gaming 3 - 8GB RAM - 512GB SSD - GTX 1650
LAPTOP 2: Acer Swift 3 - 8GB RAM - 512GB SSD
SERVER: i5 10400F - 64GB RAM - 44TB HDD
NALLE: Pixel 7 Pro

Rapportera Redigera

Citera flera Citera (1)

2020-05-14 16:16

Permalänk

Fulci

Medlem ★

Registrerad: Jun 2003

●

Spec här:
https://videocardz.com/press-release/nvidia-announces-ampere-...

GA100
6912 cores
108 SM
432 tensor cores
826 mm2

Osv...

Rapportera Redigera

Citera flera Citera (1)

2020-05-14 16:28

Permalänk

xyllian

Medlem ★

Plats: Solna
Registrerad: Nov 2008

●

Hittar någon teknisk information av vad "Tensor Float 32" är för något?

Om det är "float16 precision and float32 range", vilket kan tolkas som 10 bitar signifikand, 8 bitar exponent och en teckenbit, är det egentligen bara 19 bitar i talet? Skulle ju vara jävligt ruttet att kalla det för ett 32-bitars format i sådant fall (och att jämföra float32 prestanda mot "TF32")

Rapportera Redigera

Citera flera Citera (1)

2020-05-14 16:30

Permalänk

Novdid

Medlem ★

Plats: Malmö
Registrerad: Okt 2014

●

826 mm2!

Det var en rejäl jäkla krets!

Rapportera Redigera

Citera flera Citera (1)

2020-05-14 16:36

Permalänk

firstofmay

Medlem ★

Plats: Whiterun
Registrerad: Dec 2011

●

Skrivet av Vargas:

Multi-Instance GPU även på konsumentkorten skulle vara intressant för virtualisering utan traditionell PCI passthrough?

Gå till inlägget

Nvidia gillar pengar, det får vi nog glömma tills AMD börjar flåsa dem i nacken.

Visa signatur

7800X3D//4090
MINT XFCE // W11 🤮

Rapportera Redigera

Citera flera Citera (1)

2020-05-14 16:40

Permalänk

darrenj

Medlem

Plats: Stockholm
Registrerad: Jan 2006

●

Yeah såå
what's it gonna cost me?

Visa signatur

My Rig https://classic.prisjakt.nu/list.php?ftg_check=on&exclude_ftg...
Fel av mig! Men sjutton vad snabba ni är på att kommentera vad andra gör och inte gör rätt och fel... :/

Rapportera Redigera

Citera flera Citera

2020-05-14 16:42

Permalänk

loevet

Lyxfällan 🎮 ★

Andreas Eklöv

Plats: Stockholm
Registrerad: Dec 2015

●

@darrenj: om du vill köpa på dig ett DGX A100-system kostar det blott 2,5 miljoner kronor ink moms, som hittat!

Visa signatur

"We're with the press, hired geeks!"
Raoul Duke, Fear n' Loathing in Las Vegas

Rapportera Redigera

Citera flera Citera (6)

2020-05-14 16:45

Permalänk

Tea42BBS

Medlem ★

Plats: Stockholm / Vendelsö
Registrerad: Mar 2010

●

så helt ointressant. Förstår att de inte ens orkade köra live. De hade väl fullt upp med att Joakim Von Anka bada i pengar sen tidigare

// LZ

Rapportera Redigera

Citera flera Citera (3)

2020-05-14 16:54

Permalänk

UndaC

Konsolpleb 🕹 ★

Registrerad: Jan 2003

●

Skrivet av Tea42BBS:

så helt ointressant. Förstår att de inte ens orkade köra live. De hade väl fullt upp med att Joakim Von Anka bada i pengar sen tidigare

// LZ

Gå till inlägget

Det är ju inte tilltänkt vanliga dödliga som tittare

Håller med om att det är lite sömnigt att titta på som "vanlig" datorentusiast, men för dem som jobbar i olika fält där det här är av vikt så är det ju desto mer intressant.
Men alla är ju så taggade på ny info om GeForce så det brukar alltid bli lite av den här effekten: "vanliga" användare tycker det är underwhelming. Är själv skyldig, hade hoppas på lite fler nuggets kring nästa generation konsumentkort där i.

Själv kastade jag mig in i denna video som de också la ut i förhoppning om att hitta något guldkorn, men höll bokstavligt talat på att somna: https://developer.nvidia.com/gtc/2020/video/s21770

Visa signatur

240p är livet

Rapportera Redigera

Citera flera Citera (6)

2020-05-14 16:57

Permalänk

Fulci

Medlem ★

Registrerad: Jun 2003

●

Nvidia har nu lagt upp en mer detaljerad genomgång av Ampere-kretsen som används i DGX-A100.
https://devblogs.nvidia.com/nvidia-ampere-architecture-in-dep...

Rapportera Redigera

Citera flera Citera

2020-05-14 16:57

Permalänk

Ekorrism

Medlem ★

Plats: Örnsköldsvik
Registrerad: Aug 2012

●

Underbart med detta för AI! Dock som folk verkar tro är att detta är pengar för dessa företag.. 1miljoner dollarzzz är typ småpengar.. tänk vad dem betalar i Mjukvara...

Härligt att denna typ av marknad växer! Speciellt i AI forskning för virus ETC etc.

Rapportera Redigera

Citera flera Citera (3)

2020-05-14 16:58

Permalänk

Fulci

Medlem ★

Registrerad: Jun 2003

●

Skrivet av Tea42BBS:

så helt ointressant. Förstår att de inte ens orkade köra live. De hade väl fullt upp med att Joakim Von Anka bada i pengar sen tidigare

// LZ

Gå till inlägget

Jag uppfattade det som förinspelade videos de la upp på en gång och inte live. Eller det kanske var en video som var live och resten var förinspelade?

Rapportera Redigera

Citera flera Citera

2020-05-14 17:03

Permalänk

johanandersson

Medlem ★

Plats: Göteborg
Registrerad: Dec 2010

●

Skrivet av loevet:

@darrenj: om du vill köpa på dig ett DGX A100-system kostar det blott 2,5 miljoner kronor ink moms, som hittat!

Gå till inlägget

Efter lite snabbt googlande så är en 2080 Ti dubbelt så snabb som en ASCI Q var 2003 räknat i flops. Jag hittar förvisso inte vad den kostade, men om det var världens näst snabbaste dator så var den nog inte gratis. Så jag ser fram emot att något dubbelt så snabbt som den här leksaken når övre konsumentsegmentet inom 16 år, om det går lika snabbt som tidigare? Bara att vänta.

Visa signatur

i5-7600k . GTX 1080 . 16 GB

Rapportera Redigera

Citera flera Citera (3)

2020-05-14 17:03

Permalänk

DasIch

Medlem ★

Plats: Stockholm
Registrerad: Aug 2001

●

Jag gillar Jens fram tills han säger "the more you buy". Därefter vill jag vädra gamle hallick-handen i hans nylle.

Rapportera Redigera

Citera flera Citera (5)

2020-05-14 17:10

Permalänk

loevet

Lyxfällan 🎮 ★

Andreas Eklöv

Plats: Stockholm
Registrerad: Dec 2015

●

@johanandersson: ja utvecklingen går otroligt snabbt inom såväl komponenter som systemens totala kapacitet, och sedan grafikkorten började användas som acceleratorenheter har utvecklingen tagit fart som en raket (i enlighet med Jensens liknelse). Ska bli väldigt intressant att se hur de bäst presterande konsumentsystemen presterar om bara säg fem år, med vanliga konsumentkort och kort för arbetsstationer. Om funktioner som Amperes MIG görs tillgängliga även i konsumentsystem kan man potentiellt sätta upp partitionerade beräkningsresurser i ett virtualiserat system i hemmet eller hos små företag. Möjligheterna är många, kul att spekulera runt

Visa signatur

"We're with the press, hired geeks!"
Raoul Duke, Fear n' Loathing in Las Vegas

Rapportera Redigera

Citera flera Citera (3)

2020-05-14 17:11

Permalänk

trickeh2k

Medlem ★

Plats: Sthlm
Registrerad: Apr 2002

●

Jag antar att det inte blev något om RTX idag?

Skrivet av DasIch:

Jag gillar Jens fram tills han säger "the more you buy". Därefter vill jag vädra gamle hallick-handen i hans nylle.

Gå till inlägget

The more you buy, the more it just works! ;>

Visa signatur

..:: trickeh2k ::..
Windows 11 Pro - Ryzen 7 7800X3D - ASUS TUF B650-PLUS - Kingston FURY Beast DDR5 64GB CL36 - MSI MAG A850GL - MSI RTX 4080 VENTUS 3X OC - Acer Predator XB271HU - ASUS VG248QE - QPAD MK-85 (MX-Brown)/Logitech G PRO Wireless - Samsung 960 EVO 250GB, Samsung EVO 860 500GB, SanDisk Ultra II 480GB, Crucial MX500 1TB, Kingston KC3000 2TB - Steelseries Arctic 5 - Cooler Master Masterbox TD500 Mesh V2

Rapportera Redigera

Citera flera Citera

2020-05-14 17:13

Permalänk

loevet

Lyxfällan 🎮 ★

Andreas Eklöv

Plats: Stockholm
Registrerad: Dec 2015

●

Har lagt in en specifikationstabell som jämför Ampere vs Volta vs Pascal (dvs A100 vs V100 vs P100). Vi ska kika på deras arkitekturgenomgång @fulci , kanske blir det en genomgång av de intressanta delarna där och hur de potentiellt kan appliceras även på konsumentkort för spelande.

Visa signatur

"We're with the press, hired geeks!"
Raoul Duke, Fear n' Loathing in Las Vegas

Rapportera Redigera

Citera flera Citera

2020-05-14 17:15

Permalänk

loevet

Lyxfällan 🎮 ★

Andreas Eklöv

Plats: Stockholm
Registrerad: Dec 2015

●

Intressant också att Nvidia överger Intel för AMD med Epyc Rome, deras datacenter- och AI-fokuserade system har ju varit Intel-baserade hittills.

Visa signatur

"We're with the press, hired geeks!"
Raoul Duke, Fear n' Loathing in Las Vegas

Rapportera Redigera

Citera flera Citera (17)

2020-05-14 17:21

Permalänk

Swivl

Medlem

Registrerad: Mar 2008

●

Jag är ingen expert på folk i läderjackor men det verkar som att Jensen är mycket behagligare att lyssna på här än när man sett honom tala inför publik på mässor. Han är inte lika ivrig att få fram en reaktion hos lyssnarna här.

Rapportera Redigera

Citera flera Citera (1)

2020-05-14 17:23

Permalänk

ipac

Medlem ★

Plats: Sverige
Registrerad: Jun 2006

●

Ser det här som ingångsdata för spekulation av vad GA102/3080Ti kommer bli.

Rapportera Redigera

Citera flera Citera

2020-05-14 17:53

Permalänk

unzane

Medlem ★

Plats: Stockholm
Registrerad: Jul 2007

●

Hyfsat ointressant eftersom alla konsumentprodukter uteblev.

Rapportera Redigera

Citera flera Citera (3)

2020-05-14 17:58

Permalänk

Sienar

Medlem ★

Registrerad: Sep 2013

●

Men klarar den Crysis?

Rapportera Redigera

Citera flera Citera (1)

2020-05-14 17:58

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av xyllian:

Hittar någon teknisk information av vad "Tensor Float 32" är för något?

Om det är "float16 precision and float32 range", vilket kan tolkas som 10 bitar signifikand, 8 bitar exponent och en teckenbit, är det egentligen bara 19 bitar i talet? Skulle ju vara jävligt ruttet att kalla det för ett 32-bitars format i sådant fall (och att jämföra float32 prestanda mot "TF32")

Gå till inlägget

Precis som du skriver: TF32 består av 8 bitars exponent (samma som IEEE 754 FP32) samt 10 bitars mantissa (vilket är samma som IEEE 754 FP16). Poängen här är att i vissa områden (framförallt AI) kommer man summera massor med tal och TF32 gör denna summering med IEEE 754 FP32.

Om man aggregerar massor med tal kommer ändå de låga bitarna i mantissan vara irrelevanta för slutresultat, men fördelen med att göra aggregering med högre precision än indata är att man då undviker vissa fel orsakade av återkommande avrundning.

FMA (fused-multiply add) har förut att det går att implementera effektivt i HW samma fördel.

A = B * C + D

Där är indata och utdata i samma format (FP32 eller FP64), men själva beräkningen av högerledet utförs med högre precision vilket gör fler bitar i svaret signifikanta i vissa lägen.

Så TF32 är inte samma sak som FP32, Nvidia försöker inte hävda det heller för om de gjorde de skulle de säga att FP32 kapaciteten nu är 156 TFLOPS, men den är listad som 19,5 TFLOPS. För vissa fall kan man använda TF32 lika väl som FP32 och det med en rejäl prestandaboost!

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (13)

2020-05-14 18:30

Permalänk

knkg

Medlem

Plats: Västerås
Registrerad: Aug 2012

●

Skrivet av Ekorrism:

Underbart med detta för AI! Dock som folk verkar tro är att detta är pengar för dessa företag.. 1miljoner dollarzzz är typ småpengar.. tänk vad dem betalar i Mjukvara...

Härligt att denna typ av marknad växer! Speciellt i AI forskning för virus ETC etc.

Gå till inlägget

Visst 1 miljoner dollar är ju småpengar men du glömmer hur mycket mindre ström de drar och vet inte om de då räknade in hur mycket mindre AC de behöver för samma beräkningskraft.

Rapportera Redigera

Citera flera Citera

2020-05-14 19:07

Permalänk

Dinoman

Moderator

Testpilot ★

f.d. Dinoman 🦖

Plats: Älmhult
Registrerad: Jan 2002

●

Skrivet av Swivl:

Jag är ingen expert på folk i läderjackor men det verkar som att Jensen är mycket behagligare att lyssna på här än när man sett honom tala inför publik på mässor. Han är inte lika ivrig att få fram en reaktion hos lyssnarna här.

Gå till inlägget

Den observationen gjorde jag också. Det lustiga är att jag väntade mig en konstpaus och sen dundrade applåder men istället blev det bara ett torrt konstaterande även om användandet av kraftuttryck var många. World's first, biggest, most advanced med mera.

Uppfriskande dock

Visa signatur

ASrock x470 Taichi Ultimate - AMD Ryzen R9 3900x - G.Skill Ripjaws@3.6GHz 16GB RAM - RTX 3080 Ti - Super Flower Leadex Gold 1000W - Phanteks Enthoo Pro - AOC AG35UCG 34" 3440x1440p@100Hz - kalaset vattenkylt

Rapportera Redigera

Citera flera Citera

2020-05-14 19:28

Permalänk

xyllian

Medlem ★

Plats: Solna
Registrerad: Nov 2008

●

Skrivet av Yoshman:

Precis som du skriver: TF32 består av 8 bitars exponent (samma som IEEE 754 FP32) samt 10 bitars mantissa (vilket är samma som IEEE 754 FP16). Poängen här är att i vissa områden (framförallt AI) kommer man summera massor med tal och TF32 gör denna summering med IEEE 754 FP32.

Om man aggregerar massor med tal kommer ändå de låga bitarna i mantissan vara irrelevanta för slutresultat, men fördelen med att göra aggregering med högre precision än indata är att man då undviker vissa fel orsakade av återkommande avrundning.

FMA (fused-multiply add) har förut att det går att implementera effektivt i HW samma fördel.

A = B * C + D

Där är indata och utdata i samma format (FP32 eller FP64), men själva beräkningen av högerledet utförs med högre precision vilket gör fler bitar i svaret signifikanta i vissa lägen.

Så TF32 är inte samma sak som FP32, Nvidia försöker inte hävda det heller för om de gjorde de skulle de säga att FP32 kapaciteten nu är 156 TFLOPS, men den är listad som 19,5 TFLOPS. För vissa fall kan man använda TF32 lika väl som FP32 och det med en rejäl prestandaboost!

Gå till inlägget

Tack för inlägget och informationen. Jag gör ingen AI så vet inte vad som är viktigt, men om det som du säger är mycket addition kan det vara ok att byta till kortare mantissa, däremot vid multiplikation blir det uselt.

Sedan tycker jag helt klart att Nvidia vilseleder med TF32 och sannolikt är det med mening. Hade de kallat det för TF19 så hade det varit okej tex. Dessutom i figur 4 i artikeln där de gör prestandajämförelsen ställer de Volta FP32 mot Ampere TF32, klart missledande då Ampere FP32 inte är med i jämförelsen alls vilket får Amperes prestanda att se ut att vara 10x Volta, när det egentligen är Ampere 2x Volta och TF32 5x FP32.

Rapportera Redigera

Citera flera Citera (1)

2020-05-14 19:32

Permalänk

kelthar

Medlem ★