Fast är verkligen IPC på Haswell/Broadwell nivå?
Med tanke på hur en modern high-end x86 är konstruerad får man nog dela in IPC i tre klasser
skalära heltal
skalära flyttal
vektoriserade heltal/flyttal
Av dessa är det endast 2. där IPC matchar Haswell/Broadwell. Rent teoretiskt har också Zen klart högre kapacitet här, så rätt väntat att detta skulle vara den starkaste punkten. Zen kan köra upp till två skalära flyttalsadditioner OCH två flyttalsmultiplikationer per cykel.
Haswell/Brodwell kan maximalt köra två skalära flyttalsoperationer per cykel, varav max en kan vara en addition. Skylake förbättrar detta till två skalära flyttalsoperationer per cykel och det kan vara vilken kombination av addition/multiplikation som helst.
Att Zen skulle ligga efter i 3. har varit självklart sedan i höstas, teoretiskt har Haswell och senare dubbla kapacitet per cykel (32 SP / 16 DP per cykel mot 16 SP / 8 DP för Zen). Skylake kan nå över 90 % av detta teoretiska max i verkliga applikationer.
Det stora frågetecknet just nu är exakt hur bra/dåligt 1. är då det är den överlägset viktigaste parametern i praktiken. Det både för desktop och framförallt för servers. T.ex. så är all kod som kör i OS-kärnor uteslutande 1., är inte tillåtet att köra flyttal eller SSE/AVX-kod i Window, Linux eller OSX kärnorna.