Jensen sa vad nog många gissade igår:
"Nvidia-Branded ARM CPUs Are a Possibility"
Föga oväntat verkar huvudmålet med att köpa Arm vara att kunna driva Arms serversatsning, Neoverse, i en riktning som är perfekt match för Nvidia. Nvidia har nu alla de kritiska komponenterna för en modern server: CPU, GPU, "NPU" samt världsledande I/O (Mellanox).
Nvidia plockar fram de riktigt stora kanonerna när de tar sikte på framförallt Intel i datacenter. Microsoft tog ju in Stones för Win95 lanseringen, kanske dags för Nvidia att ta in AC/DC
Skrivet av Petterk:
Hur ska Nvidia driva utvecklingen av Mali som till stor del görs i Europa inkl i Norge? Och samtidigt hålla ARM som ett eget och separat bolag?
Nvidia har tidigare gått ut med att de är redo att licensiera sina GPUer, det är bara att ingen hoppade på det. Nvidia anpassade Ampere för SoCs innan det kom några desktop-kort, så nog finns det teknik att licensiera och nog kan de ge kunder en custom GPU även i det området. Nu skulle de kunna överföra rättigheter till det framtida dotterbolaget och licensiera det genom ARMs försäljningsnätverk.
I övrigt riskerar företagen att vända sig till AMD och resterna av Imagination (deras GPUer ser i princip fortfarande ut som Apples), i mindre mån Vivante om de upplever att Mali inte får prioritet. Det i sig är inte dåligt, men det riskerar att skapa fragmentering hos SoC-leverantörerna där olika segments kretsar har olika GPUer/leverantörer och därav en annan bas för drivrutiner/BSP. Alternativen till Mali är sällan bäst från typ segmentet smarta klockor till high-end telefoner och surfplattor, TV/STB SoCs o.s.v. utan leverantörerna riskerar att gå tillbaka till ett mer uppbrutet utbud.
Samsung Electronics kanske klarar av att hantera Qualcomm-kretsar med Adreno-grafik blandat med modeller/varianter med Samsung-kretsar med Mali-grafik, men ska också kretsar med grafik från Imagination, Vivante och AMD blandas in i den mixen kommer inte drivrutinerna och programvaran vara lika bra som idag. Den fragmenteringen är ju tvärt om mot vad Apple gör, där allt ska ha samma features och i grunden kommer köra samma drivrutiner från smartklocka upp till arbetsstation.
Du har helt rätt i att Nvidia inte alls verkar bekymrade över att licensiera ut Geforce. Hittar inget konkret runt just Ampere, menade du kanske Kepler då bl.a. AnandTech rapporterar om att Nvidia 2013 pushade sin IP som möjlig att licensiera av 3:e part?
Enda jag hittar om just Ampere är att datacenter var prio #1.
Finns ju massor med saker Nvidia kan tillföra Mali ändå. En sak Geforce inte kan matcha Mali är perf/W i lägen där absolut effekt är väldigt låg. Tegra har ändå hittat sina användningsområden, men det är primärt inte som GPU utan som GPGPU. Och att man vill använda Tegra för GPGPU har egentligen inget med Geforce HW att göra, det är helt en effekt av att man vill ha tillgång till CUDA.
CUDA är "free as in beer", kollar lite på licensen ser man att Nvidia verkligen sett till att ingen bara kan ta ramverket och porta det till någon annan GPU-arkitektur. AMD har dragit det så långt man nog vågar med sitt HIP, man har till och med utvecklat en s.k. transpiler för att "kompilera CUDA till motsvarande HIP". Problemet med en sådan lösning är att man alltid kommer ligga ett par steg efter och är hela tiden Nvidia som sätter agendan då de kontrollerar CUDA, vissa saker i HIP är redan gammal skåpmat sedan Volta. Det HIP använder har potentiella race med Volta och senare p.g.a. tillägget independent thread scheduling (krävs bl.a. för vissa ISO C++ funktioner på GPU).
CUDA lär komma till Mali väldigt snabbt, för rent tekniskt lär det inte vara så komplicerat att stödja CUDA på andra GPUer. Det lyfter värdet väldigt mycket för Mali över andra konkurrenter. Precis som Geforce bland forward renderer kretsarna blir då Mali ensam bland TBDR kretsarna med stöd för världens överlägset mest använda ramverk för GPGPU.
Ser inte hur övriga skulle kunna vända sig till så många andra än Imagination, ett företag som i det här läget knappt verkar ha någon GPU-verksamhet kvar. Vet att Samsung har ett avtal med AMD, gissar att det handlar om framtida konkurrenter till Qualcomm/Microsoft SQ1: d.v.s. ARM64 baserade kretsar för Windows on ARM64. TLDR-kretsar må fungera under Windows, men det är långt ifrån optimalt givet att DX11/DX12 saknar funktioner för att explicit dra nytta av egenskaperna hos TLDR. Svårt att se Samsung använda något som RDNA i mobiler, det lär knappast kunna konkurrera med Adreno, Mali och Apples TLDR baserade GPUer i det kontextet. Precis som Geforce inte var vettig i det kontextet.
Ser inte riktigt heller problemet med drivrutiner. Rimligen är det AMD som tillverkar drivarna åt Samsung om man kör RDNA, det är i alla fall Arm som tillhandahåller drivarna till Mali, Qualcomm som tillhandahåller drivarna för Adreno (där kommer allt från Qualcomm då de är ensamma om använda Adreno) samt Nvidia som tillhandahåller drivarna för Geforce.
Sist har Nvidia väsentligt mer kunskap och patent runt GPUer än vad Arm har, så finns rimligen massor med saker de kan tillföra Mali-teamet här. Det även om Mali-teamet fortsätter som en separat enhet.
Skrivet av Dizzö:
Förlåt mig men har du kollat i spåkulan och vet exakt vad Nvidia har för planer och vad de kommer att göra?
Framgick det inte att min spåkula hade rätt stora slängar av myrornas krig?
Beskrev tre huvudfall, 2/3 tycker i alla fall jag verkar rätt positiva så oddsen ser ju fina ut
Enda gör Nvidia vad de säger: win!
Eller så gör Nvidia vad många tror de kommer göra och många tror det ger RISC-V jackpott: win!
Eller så havererar affären, vi blir fast ännu ett par decennier med en CPU-arkitektur som passerat bäst-före: ...
Sista är i.o.f.s. inte garanterat att det måste bli dåligt, så 2/3 bra är kanske till och med pessimistiskt!
För att ge den sista lite kontext. Innan Cortex A76 viftade även jag bort ARM64 med motiveringen: visst ökar prestanda 20-30 % per år, men hur imponerande är det när man ändå ligger klart efter AMDs/Intels CPUer?
Med Cortex A76 nådde man ungefär samma mängd utfört arbete som AMD/Intel per cykel. Nu tänkte de flesta: nu kommer Arm få se hur svårt det är, här slår man rimligen i en vägg.
12 månader senare släpptes Cortex A77 designen som var 25-35 % snabbare än Cortex A76. 12 månader efter det släpptes Cortex A78 och Cortex X1. Cortex X78 är "bara" ~7 % snabbare än Cortex A77, fast den lyckas med det på 4 % färre transistorer än Cortex A77. Så en normal x86 uppgradering, fast man lyckades minska kretsen storlek! Cortex X1 smällde på med >30 % högre heltalsprestanda och upp till 100 % högre flyttalsprestanda (rent specifikt ökades SIMD kapacitet med 100 %).
Ställ det med hur fantastiskt vi tycker det är när Sunny/Willow Cove ökar IPC 20-25 % över Skylake (så 20-25 % på 5 år) och det är rejäl entusiasm runt Zen3 för den kan säker blir 15-20 % snabbare än Zen2 (vilket tyvärr placerar Zen3 efter Coves då del av lyftet förväntas komma från frekvens, 20-25 % för Coves är enbart IPC ökningen)! Fast det är inte precis 12 månaders kadens där och man är nu inte bara omkörd av Apple, man är även omkörd av Arm där gemensam nämnare än ARM64!