För att bara hålla sig till huvudpoängen: den stora vinst man ser på AMD kort mellan OpenGL och Vulkan har på det stora hela nästan ingenting att göra med "async compute" utan är en effekt av att Vulkan, precis som DX12 och Metal, har betydligt lägre "overhead".
Såg något om att 1080 ser en boost men inte 1070. Den närmaste förklaringen där är nog att 1080 kan hamna på FPS-nivåer där enkeltrådprestanda faktiskt blir en flaskhals när man kör OpenGL. När man då går över till Vulkan försvinner den flaskhalsen och FPS ökar något. 1070 når kanske inte tillräckligt höga FPS-nivåer i OpenGL för att CPU-delen överhuvudtaget ska utgöra en flaskhals.
Om då AMDs OpenGL drivare är tyngre för CPU att driva runt kommer CPU-delen bli flaskhals i fler lägen. Ett litet litmus-test på den teorin skulle vara om någon har sett hur 280X, 380 och 380X skalar i förhållande till de snabbare korten. Om flaskhalsen ligger i CPU-delen borde de svagare korten relativt sett få en mindre boost än de starkare korten.
Är övertygad om att även 960 kommer se en rejäl boost i Doom när man går från OpenGL till Vulkan bara man testar på ett system med Atom eller Jaguar CPU.
Sedan semantik: 970 kortet är inte överklockat då det kör på sin specificerade klockfrekvens. Däremot har alla Maxwell-kort med eftermarknadskylare en högre klockfrekvens jämfört med referensmodellen. Sedan är skillnaden mellan 970 och 480 ~30 % i OpenGL, vilket är allt för mycket för att förklaras med att det handlar om ett 970-kort med eftermarknadskylare då dessa kort är ~10 % snabbare än referens.
TL;DR
Prestandaboosten är en effekt av "low-overhead", inte av "async compute".