Ett sådan fusk påverkar överhuvudtaget inte "IPC" värdet, men det är en indikation på att Cortex A76 drar lite väl mycket ström vid 2,6 GHz (vilket är vad Kirin 960 kör de snabbaste kärnorna på) för en mobil.
Att ARM64 designerna börjar kliva förbi x86 är rätt väntat. Finns flera designval i ARM64 som gör det betydligt lättare att skriva upp IPC jämfört med en x86 av motsvarande komplexitet (d.v.s. med motsvarande teoretiska kapacitet för avkodning och körning av instruktioner).
Cortex A76 är i nivå med Skylake/Zen när det kommer till många mikroarkitektur-parameters, men finns ställen det skiljer och då är det i princip konsekvent så att Skylake/Zen har högre teoretisk kapacitet.
IPC: genomsnittlig antal instruktioner som körs per cykel. När man jämför olika CPU-arkitekturer blir "instruktioner" lite abstrakt då man egentligt jämför hur snabbt de utför en specifik uppgift vid samma CPU-frekvens.
Har faktiskt kvar min G4-baserade MacMini än + kört en hel del PowerPC e500 baserade plattformar på jobbet och de är rätt likvärdiga G4 (eller PowerPC 7400 som den egentligen heter) sett till mikroarkitektur.
Det Apple visade upp där är både helt sant och extremt mycket rök och speglar... PowerPC 7400 är i praktiken en högre klockad PowerPC 750 med AltiVec stöd och snabbare flyttals, d.v.s vi pratar Pentium MMX / PPro eran...
AltiVec och flyttalsstödet är röken och speglarna! PIII hade rätt medioker SSE kapacitet och klart efter G4 i flyttalskapacitet (PIII låg även efter Athlon i just flyttalskapacietet). Men det var helt omvända förhållande för heltal och heltalkapacitet är det som är primär flaskhals för en klar majoritet av alla program (något som är sant än idag). Till och med vid 1,0 GHz var PIII snabbare på t.ex. kompilering, textsökning, databashantering jämfört med 1,25 GHz G4 (vilket är vad min MacMini kör på).
ISA må spela roll när man jämför snarlika mikroarkitekturer, men det spelar klart mindre roll än mikroarkitekturer. PIII kunde köra upp till tre instruktioner per cykel och hade mycket större buffertar för spekulation (out-of-order execution). Att kunna spekulera är nästan alltid mindre viktigt för flyttalstunga program då de normalt gör matematik (där finns sällan villkor) medan "vanliga" program tendera innehålla massor med logik och villkorad körning.
Också därför har inte ARM kunna passera Skylake/Zen i IPC tidigare. Ja ARM64 (som formellt heter Aarch64) är långt bättre designad men det kanske kan ge max 25-30 % IPC boost vilket inte alls är tillräckligt för att kompensera att t.ex. Cortex A75 endast kan köra två instruktioner per cykel medan Skylake/Zen kan köra upp till fyra (Skylake kan köra fem i speciella fall). Cortex A76 kan också köra fyra instruktioner, då blir ISA tungan på vågen (överförenklat då det finns långt fler aspekter, men även där är A76 i nivå med Skylake/Zen, något som inte var fallet tidigare).
Är fortfarande en bit upp till Apple, deras CPU kan köra upp till 6(!) instruktioner per cykel. Men gissar att det börjar bli rätt mycket "diminishing returns" där. Att Apple överhuvudtaget kan göra detta är ju en effekt av ISA, den CPUn spenderar garanterat bara en fraktion av transistorbudget på avkodning jämfört med vad Skylake/Zen gör för att kunna nå 4 x86 instruktioner per cykel trots 50 % högre teoretisk kapacitet (x86 är en total cluster-fsck när det kommer till instruktionskodning).
Apple passerade Skylake i IPC (om GB4 används som referens) ett par generationer tillbaka, även om man då kunde man ju bara klocka de CPUer strax över 1 GHz något man har fått upp till strax över 2 GHz (2,3 GHz verkar gränsen vara för CPU i Iphone 8/X).
Edit: vad Apple i princip alltid visade i sina G4 vs Pentium jämförelse var Photoshop och liknande program med fall som kunde optimeras väldigt väl m.h.a. AltiVec. Så man ljög absolute inte, men det vara bara en väldigt selektiv del av sanningen som visades upp.