Jag har svårt att bevisa det påståendet, se nedan.
Och ditt bevis för att Nvidia inte haft ett eller ett par exemplar som klarat högre frekvenser?
Testerna kanske kördes på mindre kretsar som klockades upp, men när man såg effektförbrukning och yield valdes i stället den större kretsen med fler kärnor och lägre frekvens för att få hög prestanda med hanterbar effektförbrukning.
Står ju faktiskt "~1TB/s possible" och RTX 3090 har officiellt 936 GB/s. Det kallar jag att ha rätt.
Betänk att många i industrin verkar anse att IPC inte handlar om "per clock" och att förutsättningen är högre klockfrekvenser så skulle det stämt, givet att frekvenserna hamnat nära 2 GHz.
Skulle inte förvåna mig om Sweclockers testexemplar går att skrämma upp dit, men förvänta dig inte att partnerkorten av icke-premiummodell klarar det.
Finns även senare rapporter/läckor om kort som klarar >2GHz, exempel:
https://www.sweclockers.com/nyhet/30208-geforce-rtx-3080-ampe...
Det "fel" Tom gör här är att han utgår från de rapporterade höga frekvenserna hos testexemplaret.
Japp, där blev det rejält fel. Undrar var uppgiften o fler tensorkärnor kom ifrån.
Kombinera denna dubblerade effektivitet per TC med den förväntade dubbleringan av antalet TC (enligt ovan) och du kommer når "upp till x4 bättre".
Dubbleringen av prestanda per TC stämde alltså!
RTX 3090 är inte top tier, det är A100. Nvidias Keynote 14/5: "GA100 tillverkas på TSMC:s 7-nanometersteknik..."
Detta hade alltså varit offentlig information ett par veckor när Tom gav presentationen, och han missade inte det.
Dvs en anpassning för bättre HPC/Multipurpose.
Som jag förstått det ska DLSS 3.0 på något sätt kunna nyttja TAA för att få de data som behövs för de egna beräkningarna. Kanske även posera som TAA, dvs om man har drivrutiner/API(?) för DLSS 3.0 installerade och kör ett spel som inte skrivits för DLSS men har TAA, så kommer en aktivering av TAA innebära att man får DLSS i stället.
Min sammanfattning:
(Gällande Toms tre månader gamla förutsägelser från Yoshmans inlägg ovan och helt utan hänsyn tagen till Toms verbalt kommunicerade egen sannolikhetsbedömning för respektive punkt.)
Påstående: Diverse påståenden gällande ett specifikt engineering sample.
Utfall: Kan inte alls verifieras som sanna eller falska. Bortses från.
Påstående: De läckta bilderna på FE-kylaren ser riktiga ut.
Utfall: Sant! Det är bilder av den riktiga kylaren.
Påstående: Kort på upp till 2,5 GHz sannolika.
Utfall: Fel. I alla fall i de presenterade prisklasserna.
Påstående: Använder GDDR6X eller GDDR6, nära 1TB/s möjligt.
Utfall: Sant. RTX 3090 har GDDR6X med 936 GB/s, övriga kort har GDDR6 med lite lägre prestanda.
Påstående: Ingen NVCache eller Tensor Memory Compression för konsumentkorten.
Utfall: Falskt ???
Korten ska ha stöd för RTX IO som innebär snabbare kommunikation med systemminnet (lika med "NVCache"?) tack vare komprimering av datan (Tensor Memory Compression?).
Påstående: 10-20% IPC-ökning gentemot Turing.
Utfall: Återstår att se.
Påstående: Klockfrekvenser över 1,9 GHz borde bli standard.
Utfall: Fel. (~1,7 GHz boost, men överklockning möjlig för de bästa chipen)
Påstående: Dubblerat antal TC per SM.
Utfall: Fel, det är ungefär samma? (Hittar inga hårda data om antalet TC, men definitivt ingen dubblering per SM.)
Påstående:Dubblerad prestanda per TC (resulterande i RT-prestanda upp till fyra gånger bättre än Turing).
Utfall: Rätt. Prestandan per TC är (enligt Nvidia) upp till dubblerad.
Påstående: RT ingen större negativ inverkan på prestandan.
Utfall: Återstår att se i praktiken, men verkar osannolikt.
Påstående: Ampere är en evolution av Turin, inte bara en krympning.
Utfall: Sant!
Påstående: Ampere ska fungera både till HPC och spel. En arkitektur som ska fungera till flera användningsområden.
Utfall: Sant.
Påstående: GA100 tillverkas på TSMCs 7nm nod (officiellt från Nvidia), men GPU för gaming tillverkas på Samsung 8nm, oklart vid vilken prestandanivå gränsen går.
Utfall: Mer 8nm än han vågade tro. Sant.
Påstående: DLSS 3.0 mycket bättre än 2.0, så nu blir det ett realistiskt försäljningsargument (till skillnad från när Turing släpptes).
Utfall: DLSS 3.0 kommer inte (ännu) till Ampere. Återstår att se om
- DLSS 2.1 blir ett försäljningsargument.
- 3.0 hinner komma till Ampere.
- 3.0 kan jobba med TAA.
Påstående: NVCache kommer, och är Nvidias svar på HBCC.
Utfall: Här är jag inte kompetent att avgöra, men jag tror också att det är för tidigt. I alla fall är "NVCache" inte ett namn som används.
Resultat, så här långt:
6 rätt
3 fel
5 oklara, baserat på min okunnighet och/eller att det ännu saknas officiella data. En del av dessa bör kunna avgöras om ett par timmar.
Definitivt inte "majoriteten rätt ordentligt fel".