ARM: "Övergången till 64 bitar accelererar"

Permalänk
Melding Plague

ARM: "Övergången till 64 bitar accelererar"

Brittiska ARM berättar att övergången till 64-bitars processorer för mobila enheter går i ett allt snabbare tempo och de kommande systemkretsarna har fördelar även med dagens mjukvara.

Läs artikeln

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Bra, 64-bitars borde vara standard i varje segment

Visa signatur

Stuff: Asus P9X79 Deluxe | 3930K @ 4375 Mhz | 16 GB DDR3 @ 2000 Mhz | 2x R9 290X CrossFireX | SSD |
Windows 10
-=Water-cooled with custom loop=-
MG279Q triple screen
6700K, 32 GB DDR4, Fury X, Samsung PRO M.2 SSD 256 GB, Samsung SSD 1 TB, Windows 10 pro

Permalänk
Medlem

Apple's 64-bit SoC A7(kodnamn: 'Cyclone') var faktiskt desktop-klass, åtminstone om man får tro Anandtech.
Mycket mer kraftigt än vad som faktiskt krävdes för de enheter som de användes/används i.

Tycka vad man vill om Apple, men de tvingar utvecklingen framåt, vilket denna artikel bevisar. Om inte Apple hade kommit med sin 64-bit SoC, hade då alla
Aandroid OEM's rushat till 64-bit? ARMs egna förvåning ger en fingervisning om att det inte hade blivit så.

Permalänk
Medlem
Skrivet av Umbrellas:

Apple's 64-bit SoC A7(kodnamn: 'Cyclone') var faktiskt desktop-klass, åtminstone om man får tro Anandtech.
Mycket mer kraftigt än vad som faktiskt krävdes för de enheter som de användes/används i.

Tycka vad man vill om Apple, men de tvingar utvecklingen framåt, vilket denna artikel bevisar. Om inte Apple hade kommit med sin 64-bit SoC, hade då alla
Aandroid OEM's rushat till 64-bit? ARMs egna förvåning ger en fingervisning om att det inte hade blivit så.

Konkurrens driver på utvecklingen framåt? Kan inte vara sant!

Permalänk
Datavetare
Skrivet av Umbrellas:

Apple's 64-bit SoC A7(kodnamn: 'Cyclone') var faktiskt desktop-klass, åtminstone om man får tro Anandtech.
Mycket mer kraftigt än vad som faktiskt krävdes för de enheter som de användes/används i.

Tycka vad man vill om Apple, men de tvingar utvecklingen framåt, vilket denna artikel bevisar. Om inte Apple hade kommit med sin 64-bit SoC, hade då alla
Aandroid OEM's rushat till 64-bit? ARMs egna förvåning ger en fingervisning om att det inte hade blivit så.

Det som också nämns i AnandTechs artikel är att inte bara prestanda var "desktop class", priset och strömförbrukningen vid last var också det!

Vad Apple gjort är definitivt imponerande, men Cyclone är ingen CPU-design som skulle vara lämpligt att användas att 3:e part (icke problem då Apple inte tillåter det) då den helt enkelt är för dyr och komplicerad.

Sedan är "deskop class" lite en sanning med modifikation. Visst är IPC på Cyclone i nivå med Haswell, men det gäller bara på väldigt "snäll" kod då Cyclone är en extremt "bred" design, 50% bredare än Haswell (6-decode mot 4-decode), detta betyder att hopp-intensiv kod blir mindre effektiv på Cyclone än på Haswell då man bara kan hantera ett hopp per cykel (detta är orsaken till att bredd över två snabbt leder till "dimishing returns").

Haswell kan också hantera lång många fler samtida "in-flight" minnestransaktioner, så i applikationer som har stora dataset är Cyclone betydligt mer lik Silvermont än Haswell i kapacitet.

Sist men absolut inte minst så kan Intels/AMDs "big-core" CPUer köras i klockfrekvenser runt 3-4GHz, Cyclone skulle man inte få upp över 2GHz även om den fick dra 100W. Den är från grunden designad till att ha hög IPC men en relativt låg frekvens, vilket är helt rätt beslut för något som ska sitta i telefoner/mobiler.

Det som är lite intressant med rushen till 64-bit är just att så många pratar om Cortex A53, det är 64-bitars varianten av Cortex A7 som är betydligt långsammare än de Krait400 och Cortex A15 baserade systemkretsar som används idag. "lösningen" verkar vara 8 kärnors telefoner/pekplattor, Apple lär skratta av lycka när de hör detta då deras design med 2 starka kärnor kommer ge dem ännu större fördelar vad det gäller upplevd prestanda.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Allt handlar idag om pris/prestanda, inte enbart prestanda. Mediatek börjar också komma ikapp och erbjuda bra presterande SoC:ar för lite pengar.

Det är väl det som är den stora och ultimata utmaningen för företag idag, att skapa en så bra produkt som möjligt för minsta möjliga kostnad. Man gör avvägningar och försöker hitta genvägar...

Permalänk
Medlem
Skrivet av Yoshman:

Det som är lite intressant med rushen till 64-bit är just att så många pratar om Cortex A53, det är 64-bitars varianten av Cortex A7 som är betydligt långsammare än de Krait400 och Cortex A15 baserade systemkretsar som används idag. "lösningen" verkar vara 8 kärnors telefoner/pekplattor, Apple lär skratta av lycka när de hör detta då deras design med 2 starka kärnor kommer ge dem ännu större fördelar vad det gäller upplevd prestanda.

Jo tyvärr kommer nog "spec-hetsen" leda till att vi i början får se en del telefoner med sämre prestanda än föregångarna. Cortex A53 kommer ju vara rätt slö.

Permalänk
Medlem

Desktop-klass betyder inte desktop-prestanda rakt igenom, inte ens hypotetiskt då det är ett 1.3-1.4GHz chip. Det är ingen arkitektur som skalar till ~4GHz som desktop/server-processorer gör. Finns också flera andra svagheter om man ska jämföra med Haswell/Ivy. Processorns mikroarkitektur är däremot väldigt bra och PA-Semi och Intrinsitygänget i Austin har gjort bra ifrån sig. Det räcker däremot inte för att tävla mot Intel, AMD och IBM på större system där krävs också ledarskap inom tillverkning och process, något de gick ifrån att behöva tävla om (via partner/leverantörsval) när de gick till Intel och ARM, inom ARM-segmentet använder alla standardprocesser från fabs, anledningen att Qualcomm lyckats dominera är inte ledarskap inom process eller tillverkning utan för att de är bra på att integrera alla nödvändiga funktioner och är väldigt bra på modemsidan, där de har ett ledarskap och själva äger/utvecklar IP (starka på LTE, GNSS) samt att de erbjuder väldigt bra mjukvarustöd (BSP). På processorsidan är de efter numera, de har ingen egen 64-bit arkitektur att annonsera än, men de har också en viktig tillgång på GPU-sidan med deras egna IP.

När det gäller Apple på tablets/surfplattor så tappar de i försäljning redan idag. Sen har du såklart lösningar från större leverantörer som Qualcomms 810 med fyra A-57 och fyra A-53, eller 808 med två A-57 och fyra A-53 som kommer runt tidpunkten det talas om. A-53 känns mer som det hör hemma i nätverkstillämpningar som deras WiFi-routrar och NAS-inriktade segment upp till lite mer professionella grejer. Där tävlar de mot typ in-order MIPS64-design med rötter från mitten av 90-talet. När det gäller mikroservers så är det egendesignade 64-bit ARMv8-A eller ARMs A-57 som gäller där, AMDs egna variant är ju A-57 t.ex. och de äger en mikroserverleverantör. Just Qualcomm är dock väldigt sent ute med det hela och måste sätta ihop nya lösningar snabbt så visst därifrån ser vi A-53 först. Apple visade vägen för snabb övergång här, men både ARM och Intel jobbar t.ex. med Android för 64-bit. I Intels lösningar finns redan stödet där, Atom har ju aldrig varit mindre än x86-64 och SSSE3, hårdvaran som skeppats stödjer det redan det handlar om att lite mer än kerneln ska rulla och dra nytta av det bara.

Även Android är en god miljö för att ha flera olika mål (arkitekturer) samtidigt. Idag har vi ju ARMv6, ARMv7, olika NEON-funktioner/VFP/float, x86, MIPS32 som standard som distribueras i samma APK, som NDK stödjer, att sånt som Dalvik/ART porteras påverkar ju inte programmen heller (de behövs inte skrivas eller byggas om) utan de körs vidare som vanligt oavsett om runtime är 64-bit eller 32-bit. Om VM körs i 64-bit, men denna runtime drar nytt av det och ger mer prestanda, så får du fortfarande en prestandaskjuts om biblioteken som programmet även använder är kompilerade för ARMv7-A, men stor del av programmet körs i Dalvik/ART som kan dra nytt av förändringarna, rena program utan att skrivas i Java så visst då krävs att programmet porteras för att det ska ge någon större vinst. Så det handlar bara om att lägga ner lite utveckling. De har tid på sig med tanke på när ARM64 blir mainstream inom mobiler, när leverantörerna får ut det på mainstream. Även ARM Cortex-A7 levererar tillräckligt prestanda för att nyare Androidversioner inte ska kännas slöa. Även Intel levererar nya lösningar här för Android som sagt. Så att en 64-bit Android-enhet skulle storspöas i browser/JS-benchmarks av Apple oroas jag mig inte riktigt för. Silvermont har nog lite mer att ge där än det visats sig än så länge.

Permalänk
Datavetare
Skrivet av teejee:

Jo tyvärr kommer nog "spec-hetsen" leda till att vi i början får se en del telefoner med sämre prestanda än föregångarna. Cortex A53 kommer ju vara rätt slö.

Ska man vara snäll så är det ändå på en in-order-design, som både A7 och A53 är, där förbättringarna från Aarch32 till Aarch64 kommer relativt sätt betyda mest. Samma sak gällde för x86, "gamla" Atom får betydligt större boost av att gå från IA32 till AMD64/Intel64 än vad "big core" CPUerna fick. Men det kommer inte att räcka för att göra A53 prestandamässigt konkurrenskraftig med Krait400, A53 kan inte heller kompensera med högre frekvens då den verkar sikta på <=2GHz medan Krait400 numera är <=2.5GHz.

Anledningen att "big core" designerna vinner mindre på en "bra" ISA är att dessa har tillräckligt med logik för att gömma majoritet av alla tillkortakommanden i instruktionsuppsättningen, så att både 64-bitars ARM och 64-bitars rättar till två ganska risiga 32-bitars ISA betyder inte så mycket på en avancerade CPU-design.

Att Cyclone ändå ser ut att vara betydligt snabbare i 64-bit än i 32-bit beror mest på att folk använder GeekBench som måttstock och den benchmarken gör väldigt lite som är relevant för "riktiga" program. 64-bitars ARM har t.ex. HW instruktioner som 10 dubblar resultaten i minst två GeekBench deltester, deltester som är helt irrelevanta för nära nog alla "appar".

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Apple lär skratta av lycka när de hör detta då deras design med 2 starka kärnor kommer ge dem ännu större fördelar vad det gäller upplevd prestanda.

Du som har koll, vad kan vi förvänta oss av Apple A8? Fler kärnor är med Cyclone-arkitekturen är inte troligt? Är det 20nm o högre frekvenser att vänta?

Hur borde A-57 prestera jämfört med Cyclone?

Skickades från m.sweclockers.com

Permalänk
Datavetare
Skrivet av NiQ3:

Du som har koll, vad kan vi förvänta oss av Apple A8? Fler kärnor är med Cyclone-arkitekturen är inte troligt? Är det 20nm o högre frekvenser att vänta?

Hur borde A-57 prestera jämfört med Cyclone?

Skickades från m.sweclockers.com

Vad Apple jobbar på är de väldigt bra att gömma, så har faktiskt ingen aning. Tittar man på vad de gjorde med Cyclone så finns det faktiskt inte jättemycket kvar, A7 är t.ex. ensam bland systemkretsar att använda den teknik med GPU-cache som används i Xbox360, XBO och Iris Pro.

A8 lär knappast bli "bredare", är väl bara Itanium som varit ännu bredare men det visade sig bara fungera bra på HPC (High Performance Computing, beräkningskluster) och är ju inte riktigt dit Apple siktar.

Finns lite putsning på L2/L3-cache designen, den är ju inte i nivå med Intels ännu vad det gäller latens. Tittar man bara på den logiska designen av beräkningsenheter så borde Silvermont vara chanslös mot Cyclone, A15, Krait och Jaguar, men tack vare att den har en bättre cache-design än alla konkurrenterna så står den sig riktigt bra i "riktiga" program.

Har ingen aning om hur effektiv Cyclone är att hantera "synkrona instruktioner" (behövs för multicore programming), mycket av de förbättringar som faktiskt gjorts mellan Core2->Haswell har legat här (många sådan saker är 100% snabbare i Haswell än Core2). Just "synkrona instruktioner" är något som 32-bitars ARM har rejäla problem med (är väldigt dyrt), i teorin ska problemet vara fixat i 64-bitars ARM men krävs ju att microarkitekturen är bra också.

A57 kommer bli snabbare än Cyclone p.g.a. att A57 är designad för att nå betydligt högre klockfrekvenser. Gissar däremot att Cyclone kommer vara den snabbaste när formfaktorn är telefon/pekplatta, A57 för microservers (där det pratas om 2.5 och ända upp mot 3GHz) kommer ju dra >=30W.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Avstängd

Pinsamt att det tar så lång tid för andra tillverkare och leverantörer att gå över till ARMv8 64-bit.

Hoppas vi snart får se ARMv8 64-bit mobiler och single-board computers och billiga microservrar.