AMD Zen får 40 procent högre prestanda än Excavator vid samma klockfrekvens

Permalänk
Datavetare
Skrivet av skruvis:

Ok så det du säger är att FX serien inte är en dålig arkitektur utan det är programen som inte är optimerade för 8 kärnor etc.!

Nu är jag övertygat att du driver med mig, men svarar mot bättre vetande

Det som påpekats många gånger i dessa diskussioner, ett par gånger bara i kommenterar till denna artikel, är att en förkrossande majoritet av de program vi kör på skrivbordet kan inte skala till många kärnor. Handlar inte om slöa/inkompetenta programmerare utan om att vissa problem har ingen inneboende parallellism alt. har så finkornig parallellism att det kostar mer att kommunicera mellan CPU-kärnor är själva beräkningar (att använda fler kärnor i det fallet minskar prestanda).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Nu är jag övertygat att du driver med mig, men svarar mot bättre vetande

Det som påpekats många gånger i dessa diskussioner, ett par gånger bara i kommenterar till denna artikel, är att en förkrossande majoritet av de program vi kör på skrivbordet kan inte skala till många kärnor. Handlar inte om slöa/inkompetenta programmerare utan om att vissa problem har ingen inneboende parallellism alt. har så finkornig parallellism att det kostar mer att kommunicera mellan CPU-kärnor är själva beräkningar (att använda fler kärnor i det fallet minskar prestanda).

Håller med dig i bägge fallen.

Sitter med 2st system nu bägge med Z97-A ena med G3258 & andra med en Celeron G1830 .. flyter på bra i windows miljö, enda jag lirat är pre-alpha av nya Unreal Tournament & bägge 2 propparna har inga problem med det! Körde på ett R9 280 i bägge fallen.

Visa signatur

XFX Radeon RX 7700 XT Speedster QICK 319 Black Edition | AMD Ryzen R7 5700X | Noctua NH-D15 | Asus TUF Gaming B550-Plus | Kingston Fury Beast DDR4 3600MHz 4x8GB | Samsung 990 Pro 1TB | Corsair HX1000i | Fractal Design Define S | LG 27GL83A | Corsair K95 Platinum | Corsair Sabre RGB PRO Wireless | Corsair Void Elite Wireless

Permalänk
Medlem

@Yoshman

Problemet är ju att BD inte hade hög total prestanda. Talar vi teoretisk prestanda så har ju en Piledriver FX-8350 256 GFLOPS SP, 128 GFLOPS DP. En Sandy/Ivy Bridge hade ungefär redan motsvarande, och samtidigt fanns 6-kärnor Sandy-E med högre teoretisk prestanda. Talar vi typ DMIPS/MHz så var Sandy mer än dubbelt så snabb per kärna. Då talar vi ändå bara Entusiastplattform.

Idag så har ju Haswell närmare bestämt hela 512 GFLOPS SP och 256 GFLOPS DP på 4 kärnors 4790k. AMD hade ju kunnat dubblera flyttalsprestandan om de fortsatt satsa, men problemet är ju att Intel i entusiastversion numera har 8 kärnor Haswell-E samtidigt skalar ju inte scenariot entusiastprocessorer borda vara bra på mer än till mellan 2-6 kärnor, och en quad-core mainstream(K)-processor presterar ofta bättre i spel än Ivy/Haswell-E bland annat pga högre klockfrekvenser än 6 och 8 kärnordelarna. Andra problem är inte heller massivt parallella. T.ex. går det inte nödvändigtvis snabbare att koda film (med handbrake exempelvis) på en 5960X än en 4790K.

Så hur en del förväntar sig att AMD skulle komma ikapp eller ta igen lite av nederlaget bara mjukvaran utvecklas vet jag inte. Samtidigt kommer ju Intels 6 och 8 kärnors förbi deras 4-kärnors processorer i fler fall om fler mjukvaror skalar bättre och de får bara en ursäkt att sälja dyrare grejer. Hade det varit så lätt hade de tvingat fram en sådan utveckling.

Permalänk
Medlem
Skrivet av Dallebull:

Tänk om AMDS pr avdelning kunde bita sig i tungan nån gång ibland....
Gillar AMD som företag men sånna här siffror stämmer sällan, och det ger bara bakslag för företaget då dom lovar saker de inte kan hålla.

Hoppas dock att det stämmer, då kommer de upp i Intels prestanda, more or less.

Sidfråga/Edit: Hur står sig AMD på Linuxsidan prestandamässigt? Vill minnas att det tog ett tag innan Microsoft la till Bulldozerstöd och om Windows och dess applikationer mer anpassade för Intels arkitektur är det inte konstigt om AMD halkar efter prestandamässigt även om hårdvaran hade varit bättre än Intels med rätt optimering.
Dock bör man ju optimera för gällande programvara och inte tvinga världen att anpassa sig efter sina egna grejjer, om man inte har lika många marknadsandelar som Apple, egen mjukvara och kan kontrollera det 100%.

Microsoft "fixade" inte bulldozerstöd utan förbättrade deras scheduler (schemaläggare) för att ta hänsyn till dess design så att trådar skall försöka hålla sig till moduldesignen och inte hoppa mellan. Vad jag kan minnas har Microsoft inte varit allt så bra på detta planet gentimot Linux. Samt att du som användare kan själv välja en annan schemaläggare. Själv kör jag Brain Fuck Scheduler (BFS) Han har Archlinux kernel med schedulern, kompilerad för olika processorer via Repo-ck

Vad dock AMD laggar efter i Linux är med deras powerstates och drivrutinen som skall hantera det effektivt. Kör man med Ondemand (Varierande klockfrekvens) default värde får man ofta ganska märkbar prestandaförlust mot att köra Performance läge d.v.s. 100% av klockfrekvensen igång även när den idlar. Men man kan lösa det genom att sätta aggresivare Ondemand läge, eller låsa trådar till kärnor som körs på 100% eller sätta hela processorn på Performance läge. Intel med pstate är helt klart bättre.

Visa signatur

Arch - Makepkg, not war -||- Gigabyte X570 Aorus Master -||- GSkill 64GiB DDR4 14-14-15-35-1T 3600Mhz -||- AMD 5900x-||- Gigabyte RX6900XT -||- 2x Adata XPG sx8200 Pro 1TB -||- EVGA G2 750W -||- Corsair 570x -||- O2+ODAC-||- Sennheiser HD-650 -|| Boycott EA,2K,Activision,Ubisoft,WB,EGS
Arch Linux, one hell of a distribution.

Permalänk
Datavetare
Skrivet av Petterk:

@Yoshman

Problemet är ju att BD inte hade hög total prestanda. Talar vi teoretisk prestanda så har ju en Piledriver FX-8350 256 GFLOPS SP, 128 GFLOPS DP. En Sandy/Ivy Bridge hade ungefär redan motsvarande, och samtidigt fanns 6-kärnor Sandy-E med högre teoretisk prestanda. Talar vi typ DMIPS/MHz så var Sandy mer än dubbelt så snabb per kärna. Då talar vi ändå bara Entusiastplattform.

Idag så har ju Haswell närmare bestämt hela 512 GFLOPS SP och 256 GFLOPS DP på 4 kärnors 4790k. AMD hade ju kunnat dubblera flyttalsprestandan om de fortsatt satsa, men problemet är ju att Intel i entusiastversion numera har 8 kärnor Haswell-E samtidigt skalar ju inte scenariot entusiastprocessorer borda vara bra på mer än till mellan 2-6 kärnor, och en quad-core mainstream(K)-processor presterar ofta bättre i spel än Ivy/Haswell-E bland annat pga högre klockfrekvenser än 6 och 8 kärnordelarna. Andra problem är inte heller massivt parallella. T.ex. går det inte nödvändigtvis snabbare att koda film (med handbrake exempelvis) på en 5960X än en 4790K.

Så hur en del förväntar sig att AMD skulle komma ikapp eller ta igen lite av nederlaget bara mjukvaran utvecklas vet jag inte. Samtidigt kommer ju Intels 6 och 8 kärnors förbi deras 4-kärnors processorer i fler fall om fler mjukvaror skalar bättre och de får bara en ursäkt att sälja dyrare grejer. Hade det varit så lätt hade de tvingat fram en sådan utveckling.

Visst stämmer siffrorna du listar, men flyttalsprestanda är långt mindre viktigt än heltalsprestanda. Att en Bulldozer-modul delar en flyttalsdel mellan två heltalskärnor är en av få vettiga delarna med denna design.

Det som kan bli ett problem med en delad flyttalsenhet är att den också sköter SSE/AVX. Intel är medveten om att man inte kommer speciellt mycket längre med att höja IPC eller klockfrekvens, de lägger därför väldigt mycket resurser på att få kompilatorer att lura ut hur loopar och andra saker kan skrivas så de kan köra flera "varv" parallellt genom att använda SSE/AVX. Att man lagt till heltalsinstruktioner till senare versioner av SSE och även i AVX2 är just för man hoppas att det ska gå att använda i lite mer "vanliga" program.

Det stora problemet med Bulldozer-designen var att den presterade så dåligt på heltal och då främst heltal när man bara kör en tråd. Detta påverkar så enormt många program på ett negativt sätt.

Edit: förresten, FX-8350 har ju 2 st 128-bitars FMA enheter per modul. Det betyder att maximal DP/SP borde vara

2 (antal FMA) * 4 (antal moduler) * 4.0 (GHz) * 4 (antal SP tal på 128-bitar) = 128 GFLOPS SP 2 (antal FMA) * 4 (antal moduler) * 4.0 (GHz) * 2 (antal DP tal på 128-bitar) = 64 GFLOPS DP

kör man AVX tar varje instruktion dubbelt så lång tid då den måste köras två varv för att få 256 bitar.

Edit2: Glöm det, FMA = 2 FLOPS per instruktion. Dina siffror är rätt, Haswell har dubbla prestanda då det är totalt sett lika många FMA enheter fast de är 256-bitar breda.

Edit3: fast har kanske rätt om FX-8350 ändå
Uppmätt "reciprocal throughput" är 1 för FMA instruktionerna på FX-8350, det betyder att det maximalt går att påbörjar 1 sådan instruktion per cykel i praktiken. Haswell har "reciprocal throughput" på 0.5 för FMA vilket betyder att det i praktiken går att påbörja 2 instruktioner per cykel.
Kör man enbart addition så är det möjligt att påbörja 2 instruktioner per cykel även i 8350, betyder att det finns någon begränsning som är specifik till FMA som hindrar att man kan snitta på 2 sådan per cykel och modul. Lite google verkar peka på att folk verkar i praktiken ser runt 100GFLOP för SP på 8350.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Kolla figure 4, page 450, skulle säga att det finns ett rätt uppenbart samband mellan kretsarean och sannolikheten att den innehåller en "katastrofal" defekt (d.v.s att kretsen inte fungerar korrekt).

Sedan är "wafer" runda och kretsar typiskt kvadratiska, ren geometri (aliasingeffekter) säger att man får mindre spill runt kanterna med mindre kretsar.

Är helt sant att antal transistorer inte alls är en bra indikator på kretsstorlek, båda fallen är det ca 1.2 miljarder transistorer på 32nm

  • i7-2600: ~216 mm²

  • FX-8350: ~315mm²

Ja, jag håller med dig i det dock inget jag tänkt räkna ut för just detta, men det är generellt. I början av en process är yields mycket lägre än senare, att GPUer ökar i storlek på 28nm är inte jag särskilt oroad för. Mellan Tahiti (7970) och Hawaii (290) bör du få plats 25% fler kretsar på wafern med Tahiti, men yields 2011 när Tahiti började produceras var förmodligen inte särskilt bra och har förmodligen gått upp med mer än motsvarande 25% extra kretsar under den tiden. Du kan nog i det exemplet faktiskt få fler fungerande Hawaii per wafer än du fick Tahiti i början. Samtidigt kan priset per wafer gått ner. I det här fallet rörde det sig ju om att "krympa K10" vs rulla ut Bulldozer i 32nm. I det fallet hade de ju säkert ökat till 8 kärnor och legat på liknande densitet och transistorantal. Alltså inte producerat mindre kretsar. Cellbibliotek och liknande är inte lika täta hos AMD/GF som hos Intel. Så designförutsättningarna för tätare krets och mindre krets hade inte funnits. Carrizo krymps t.ex. med 23% genom att byta från high perfomance cell-bibliotek till high-density. Sånt som cache krymper du däremot inte, men logiken kan du krympa en hel del och som du själv säger densitet och därav storlek kan vara helt olika på samma nod.

Permalänk
Medlem
Skrivet av skruvis:

Den verkliga prestandan är vad hela processorn verkligen kan prestera när den får visa vad den kan, singeltråd prestandan är bara en del av sanningen.

Men visst är det märkligt att en del Intel proppar presterar ruggigt bra i singel prestanda jämfört med en FX propp för att sedan dala brutalt i prestanda jämfört med en FX propp i multithread prestanda.

Kan vara för att en fyrmodulig AMD har åtta beräkningskärnor som kan köra sitt eget race om omständigheterna är rätt. Singeltrådat ligger fortfarande Intel 2600K 20-%15% högre än FX-8350 men multitrådat ligger den strax ovanför. Det är en av anledningarna till att jag anser CMT är i grunden en mycket bra design; den är smalare och får mer gjort om instruktionerna som den ges är smala. Jämför man CMT-moduler med SMT-kärnor så är det mer prestanda att hämta i CMT-moduler. Nu skulle det behövas en nanometerkrympning för att singeltrådsprestandan skulle ligga likvärdigt med Intel. I det scenariot ger CMT mer än SMT.

Nu har dock AMD hamnat i en dålig sits och måste vara innovativa (ehm. rätta sig i ledet) för att överleva, därmed kommer Zen att göra sig av med CMT och satsa på SMT. Något som gör mig smått nyfiken är att om jag förstått Yoshman korrekt så har Zen vissa drag av CMT-kärnorna kvar i designen. Förmodligen är det resultatet av en optimering där man tagit det bästa från två världar. Är det så behöver jag inte känna mig alltför besviken över valet att avveckla CMT.

Visa signatur

Kör Linux - Yes! We are the 2 percent! And growing... Föreslå inte ens något Windows-exklusivt om jag inte specifikt frågar efter något till Win.
2600K - 18GB RAM - 1TB HDD - 64GB SSD - GTX 650 Ti Boost
Minnesvärda trådar: 1, 2

Permalänk
Datavetare
Skrivet av Erwya:

Kan vara för att en fyrmodulig AMD har åtta beräkningskärnor som kan köra sitt eget race om omständigheterna är rätt. Singeltrådat ligger fortfarande Intel 2600K 20-%15% högre än FX-8350 men multitrådat ligger den strax ovanför. Det är en av anledningarna till att jag anser CMT är i grunden en mycket bra design; den är smalare och får mer gjort om instruktionerna som den ges är smala. Jämför man CMT-moduler med SMT-kärnor så är det mer prestanda att hämta i CMT-moduler. Nu skulle det behövas en nanometerkrympning för att singeltrådsprestandan skulle ligga likvärdigt med Intel. I det scenariot ger CMT mer än SMT.

Nu har dock AMD hamnat i en dålig sits och måste vara innovativa (ehm. rätta sig i ledet) för att överleva, därmed kommer Zen att göra sig av med CMT och satsa på SMT. Något som gör mig smått nyfiken är att om jag förstått Yoshman korrekt så har Zen vissa drag av CMT-kärnorna kvar i designen. Förmodligen är det resultatet av en optimering där man tagit det bästa från två världar. Är det så behöver jag inte känna mig alltför besviken över valet att avveckla CMT.

Dold text

Vi vet inget om Zen än kring mikroarkitektur, så det har jag inte sagt något om. "Alla" tror (och hoppas) att Zen går till s.k. inklusiv-cache-policy och att det blir en relativt "bred" design.

Vad jag sagt om CMT är att det kan göras bra, FreeScale PowerPC e6500 är ett sådant exempel (som är ganska långt från Bulldozer designen sett till mikroarkitektur).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Hjälpsam
Skrivet av lord_vasagos:

För att koden i t.e.x spelen är omodern och nyare spel kan nytja prestandan som finns som battlefield gta osv men vid multi gpu lösnigar kan dom vara lite för trött men det är även i5/i3 och skulle själv satsa i7 där esn mantle och DX12 hjälper AMD och är inget snack om den saken men du får mer fps pga ipc i dom flesta spel men där presterar FX bra och FX känns ganska mycket rappare än k10 phenom II när man sitter och använder dom t.o.m 81xx serien känns rappare än phenom II trots om hade bättre IPC än FX

sen bärbar med quad duger lika bra som intels dito om vi pratar integrerade där intel har snabb cpu svag gpu amd svag cpu snabb gpu

och vist är det så att prestanda skalar sämre över flera cores och säger inte det är ultimata cpu´n men dom funkar till allt utom guildwars och större battles där är enda det märks att dom är core svaga och skippar man flera gpu är dom ett bra val ....Har du använt och testat en FX ??

Ja det är märkligt, jag har själv en FX-8350 och en Phenom 2 X6 1090T, konfigurationerna är ganska snarlika, Asus Sabertooth Rev2 vs Rev 1, 32 GiB vs 16 i samma hastighet och min FX känns onekligen rappare, vet inte riktigt varför, placebo?

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Medlem

Tycker inte vi ska vara allt för hårda mot Bulldozer/Pildriver i dess nuvarande skrud ändå. Precis efter lanseringen klev ju den nya VD:n in och mer eller mindre stoppade all utveckling. Många saker på bulldozers roadmap försvann då. t.ex. krympningen till 28nm, 10-kärnors varianten, 1090FX chippet och diverse annat. Allt vi fick var en urvattnad FX-8350 som vi fått leva med allt för länge. Förmodligen rätt beslut men det blir lite fel då att säga att deras nuvarande produkter är "det bästa de kan"

Skulle därför inte förvåna mig om de tar ett ganska stort kliv framåt nu med zen.

Permalänk
Skrivet av tvelander:

Ja GPU test ^^ så lite fail XD

de flesta köper ju nyare/bättre processorer här på SweC med motiveringen: spelprestanda
så varför inte kika på just spel i den mest vanligaste upplösningen 1080p ?
enligt min högst egna personliga åsikt så är 8350/i5K (från sandy och nyare) fullt kapabla till spel. det är först när man använder workstation/produktiva apps som det är lönt att uppgradera. men det är vad jag tycker

sen att det är kul att uppgradera är en helt annan sak, då jag ser pc byggandet som en hobby

Visa signatur

ROG Strix SCAR 17 | 12th gen i9H | 3070Ti 8GB (såld)
Ryzen 7600 | RTX 4080S FE | 32GB ram 6800 Mhz
Ljudprylar: M-Audio Studiophile Q40, Blue Yeti mick, JBL Quantum 810, V-moda Crossfade 2

Permalänk
Master of Overkill
Skrivet av truedesire:

de flesta köper ju nyare/bättre processorer här på SweC med motiveringen: spelprestanda
så varför inte kika på just spel i den mest vanligaste upplösningen 1080p ?
enligt min högst egna personliga åsikt så är 8350/i5K (från sandy och nyare) fullt kapabla till spel. det är först när man använder workstation/produktiva apps som det är lönt att uppgradera. men det är vad jag tycker

sen att det är kul att uppgradera är en helt annan sak, då jag ser pc byggandet som en hobby

http://i.imgur.com/D4UWZvX.png

Jo fast, vill gärna ha bra prestanda i spel som kräver CPU.
Lägger jag 3k+ på GPU så vill jag ha balans mot CPU, men det är jag det.

Visa signatur

CASE Caselabs SMA8-A + TH10+PED + Louqe Ghost S1 CPU 9900k @5.3GHz (No AVX) 9800X @4.8GHz GPUs RTX 3090 FE RAM 4x16GB Corsair Dominator Platinum 3533MHz CL13 + 2x16GB Corsair Dominator Platinum RGB 3000MHz PSU EVGA T2 1600W + Corsair SFF 750W SSD 905p 480GB, 4x Samsung 970 Pro M.2 Headphones Audeze Maxwell + FOSTEX TR-X00 + Audeze LCD-2 + Moon Cable DAC/AMP Chord Mojo, Schiit Magni&Modi Screen LG 48CX 4K 120Hz HDR + ASUS ROG SWIFT PG258Q 240Hz
Motherboard X299 EVGA DARK + ASUS ROG Strix Z390-I Watercooling 560+480+480+280+360. 240+240

Permalänk
Medlem
Skrivet av tvelander:

http://i.imgur.com/D4UWZvX.png

Jo fast, vill gärna ha bra prestanda i spel som kräver CPU.
Lägger jag 3k+ på GPU så vill jag ha balans mot CPU, men det är jag det.

Klart att Swec:are önskar mer CPU. Jag skulle t.o.m. accepetera en lite lägre singeltrådprestanda än nuvarande för att få en CPU med 8+ kärnor och mer totalprestanda. Man gör ju inte bara en sak med datorn och har man tur är även programmen man använder i hög grad parallella vilket är ++ med fler kärnor!

Skrivet av Yoshman:

Vi vet inget om Zen än kring mikroarkitektur, så det har jag inte sagt något om. "Alla" tror (och hoppas) att Zen går till s.k. inklusiv-cache-policy och att det blir en relativt "bred" design.

Vad jag sagt om CMT är att det kan göras bra, FreeScale PowerPC e6500 är ett sådant exempel (som är ganska långt från Bulldozer designen sett till mikroarkitektur).

Bra att du säger till om jag missförstått dig. När det gäller Zen så är allt än så länge alltså spekulationer. Det ska bli spännande att hur processorn fungerar, inte bara i designen utan också i realiteten.

e6500 ser ut som något AMD skulle kunnat göra CMT till. Blir nyfiken att läsa på mer om processorn.
* Hur den skiljer sig prestandamässigt från x86_64
* Skillnader i arkitektur/instruktioner
* Kostnad/tillgänglighet
* Om det finns Linux som kör på denna arkitektur (borde göra)

Självklart skulle det vara trevligt att se fortsatt utveckling av CMT på x86_64. Med tanke på hur opinionen svänger lär det dock dröja länge, om ens någonsin, vi åter kommer se CMT i arkitekturen...

Visa signatur

Kör Linux - Yes! We are the 2 percent! And growing... Föreslå inte ens något Windows-exklusivt om jag inte specifikt frågar efter något till Win.
2600K - 18GB RAM - 1TB HDD - 64GB SSD - GTX 650 Ti Boost
Minnesvärda trådar: 1, 2

Permalänk
Medlem

Bredare kärnor är vad som behövs. Det fungerade inte att göra något smalare än K8/K7 även om den var bredare enligt hur AMD presentera det hela per heltalspipeline (4 instruktioner per klock) i teorin än tidigare generation (3 instruktioner) så var det inget som kunde sättas i praktiken eftersom varje ALU/AGU inte kunde göra allt, resurserna hade inte breddas praktiskt även om de ville framstå som de hade det och modulen inte kunde mata kärnorna där man snarare kunde beskriva det som att de gick från 3 instruktioner per klock till 2 och även i bästa fall inte bredare än tidigare.

Freescale e6500 är en annan design, har postat lite om den i forumet tidigare – där är designen med CMT mer än dubbelt så snabb som föregångaren (CoreMark DMIPS/MHz) den är baserad på per kärna, en tråd är alltså snabbare än en tidigare kärna som bygger kring samma arkitektur. Den har dock inte flyttals/SIMD-resurser att tala om så går inte att jämföra med skrivbord, och x86-server eller SPARC och Power-maskiner. Den sitter i t.ex. fordon och basstationer (telekom) eller andra nätverkstillämpningar.

ARM Cortex-A72 är i princip mer intressant än att vidareutveckla BD, att AMD fortsätter satsa på K12 (ARM) samtidigt som de lägger ner mikroservers är för övrigt intressant. A72 är en hyfsad förbättring över A57 också. Men nu blir det ingen sockel-kompatibilitet. Det bör bli delar som ska konkurrera i lite högre frekvenser med ARMs designer, där kör de knappast supersmalt heller men det dröjer ett bra tag innan vi får se vad det blir av det.

Permalänk
Entusiast
Skrivet av Petterk:

Bredare kärnor är vad som behövs. Det fungerade inte att göra något smalare än K8/K7 även om den var bredare enligt hur AMD presentera det hela per heltalspipeline (4 instruktioner per klock) i teorin än tidigare generation (3 instruktioner) så var det inget som kunde sättas i praktiken eftersom varje ALU/AGU inte kunde göra allt, resurserna hade inte breddas praktiskt även om de ville framstå som de hade det och modulen inte kunde mata kärnorna där man snarare kunde beskriva det som att de gick från 3 instruktioner per klock till 2 och även i bästa fall inte bredare än tidigare.

Freescale e6500 är en annan design, har postat lite om den i forumet tidigare – där är designen med CMT mer än dubbelt så snabb som föregångaren (CoreMark DMIPS/MHz) den är baserad på per kärna, en tråd är alltså snabbare än en tidigare kärna som bygger kring samma arkitektur. Den har dock inte flyttals/SIMD-resurser att tala om så går inte att jämföra med skrivbord, och x86-server eller SPARC och Power-maskiner. Den sitter i t.ex. fordon och basstationer (telekom) eller andra nätverkstillämpningar.

ARM Cortex-A72 är i princip mer intressant än att vidareutveckla BD, att AMD fortsätter satsa på K12 (ARM) samtidigt som de lägger ner mikroservers är för övrigt intressant. A72 är en hyfsad förbättring över A57 också. Men nu blir det ingen sockel-kompatibilitet. Det bör bli delar som ska konkurrera i lite högre frekvenser med ARMs designer, där kör de knappast supersmalt heller men det dröjer ett bra tag innan vi får se vad det blir av det.

Ja jag funderade lite på vad AMD har för plan där egentligen. K12 verkade ju vara en vettig satsning när de tänkte köra mikroservrar men nu när SeaMicro är skrotat så är frågan vad de ska ha processorerna till. Tidigare har de sagt att de inte är intresserade av surfplattor och den typen av enheter men de kanske har ändrat sig? Ryktet säger ju att K12 är lik Zen så de kör som Nvidia och Apple med en relativt stor kärna som översätter ARM till en intern ISA. Det verkar ju fungera bra för Apple och gick väl sådär för Nvidia. Tror du vi kommer se AMD-processorer i surfplattor och telefoner framöver eller är det ett projekt som gått så långt att det inte var värt att skrota tillsammans med SeaMicro? Eller de kanske siktar in sig på enheter som Chromebook? De kanske satsar på att ARM kommer krypa uppåt i segmenten en bit till.

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Medlem
Skrivet av Zotamedu:

Ja jag funderade lite på vad AMD har för plan där egentligen. K12 verkade ju vara en vettig satsning när de tänkte köra mikroservrar men nu när SeaMicro är skrotat så är frågan vad de ska ha processorerna till. Tidigare har de sagt att de inte är intresserade av surfplattor och den typen av enheter men de kanske har ändrat sig? Ryktet säger ju att K12 är lik Zen så de kör som Nvidia och Apple med en relativt stor kärna som översätter ARM till en intern ISA. Det verkar ju fungera bra för Apple och gick väl sådär för Nvidia. Tror du vi kommer se AMD-processorer i surfplattor och telefoner framöver eller är det ett projekt som gått så långt att det inte var värt att skrota tillsammans med SeaMicro? Eller de kanske siktar in sig på enheter som Chromebook? De kanske satsar på att ARM kommer krypa uppåt i segmenten en bit till.

Nej, telefoner och surfplattor ska de inte satsa på alls enligt presentationen 6e maj. Därav lite intressant vad de tänkt.

Zen ska dessutom skala ner till fläktlösa Windowsplattor är det ju tänkt. Intel kör samtidigt Android på samma plattform/chip de kör Windows på. AMD har dock inte vettiga drivrutiner för Android så att använda ett GCN-derivat vore inte nödvändigtvis det bästa. Att köra Android på x86 är däremot en bra lösning. En surfplatta skulle kanske kunna klara sig med lite mindre utvecklade drivrutiner. AMD siktar nog på mer en HPC-lösning (server) med gpgpu när det gäller ARM än mobila plattformar.

Apple kör inte med binäröversättning (mjukvara) på VLIW så som Nvidia. Vad det finns för arv mellan K12 och Zen återstår att se, men det skulle ju kunna spekuleras i att det är mycket likt i back-end men har helt annan front-end/avkodare för ARM vet inte om det skulle vara vettigt däremot. Nvidia skulle i princip kunna uppdatera mjukvara och köra x86 på sin processor, Transmeta lade t.ex. in stöd för nya instruktioner som en firmware/bios-uppdatering på sin tid. Många ändringar behöver efterspeglas i kiseln däremot så att växla mellan ISA eller lägga till nya extensions skulle inte nödvändigtvis vara så lätt.

Permalänk
Medlem

Mycket intressant som händer hos AMD just nu.

Permalänk
Entusiast
Skrivet av Petterk:

Nej, telefoner och surfplattor ska de inte satsa på alls enligt presentationen 6e maj. Därav lite intressant vad de tänkt.

Zen ska dessutom skala ner till fläktlösa Windowsplattor är det ju tänkt. Intel kör samtidigt Android på samma plattform/chip de kör Windows på. AMD har dock inte vettiga drivrutiner för Android så att använda ett GCN-derivat vore inte nödvändigtvis det bästa. Att köra Android på x86 är däremot en bra lösning. En surfplatta skulle kanske kunna klara sig med lite mindre utvecklade drivrutiner. AMD siktar nog på mer en HPC-lösning (server) med gpgpu när det gäller ARM än mobila plattformar.

Apple kör inte med binäröversättning (mjukvara) på VLIW så som Nvidia. Vad det finns för arv mellan K12 och Zen återstår att se, men det skulle ju kunna spekuleras i att det är mycket likt i back-end men har helt annan front-end/avkodare för ARM vet inte om det skulle vara vettigt däremot. Nvidia skulle i princip kunna uppdatera mjukvara och köra x86 på sin processor, Transmeta lade t.ex. in stöd för nya instruktioner som en firmware/bios-uppdatering på sin tid. Många ändringar behöver efterspeglas i kiseln däremot så att växla mellan ISA eller lägga till nya extensions skulle inte nödvändigtvis vara så lätt.

Just det, Zen skulle ju skala ner till 5 W så en direkt konkurrent mot Core M och övre segmentet Atom. Var passar då ARM in? Om den har mycket gemensamt med Zen lär den ju inte vara direkt billigare att tillverka heller och den lär väl inte skala alltför långt nedåt som enklare ARM-kärnor. Vad finns det då kvar? Är det ett projekt som startades när de fortfarande tänkte satsa hår på mikroservrar men som nu är så långt gånget att de lika gärna kan köra klart det istället för att skrota det?

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Medlem
Skrivet av Zotamedu:

Just det, Zen skulle ju skala ner till 5 W så en direkt konkurrent mot Core M och övre segmentet Atom. Var passar då ARM in? Om den har mycket gemensamt med Zen lär den ju inte vara direkt billigare att tillverka heller och den lär väl inte skala alltför långt nedåt som enklare ARM-kärnor. Vad finns det då kvar? Är det ett projekt som startades när de fortfarande tänkte satsa hår på mikroservrar men som nu är så långt gånget att de lika gärna kan köra klart det istället för att skrota det?

Någon lär väl vilja ha den, men det finns en hel del konkurrens inom serverområdet, det finns flertalet andra med egna Custom ARMv8. Low-end embedded/inbyggnad skulle de också stanna borta ifrån typ enklare IoT-grejer, men då blir det ju server och nätverk kvar. Det är möjligt att en hel del mjukvara hellre är ARM än går över till x86 och är möjligt att det är en del av deras semi-customstrategi där kunder kan beställa egna varianter av den. Deras presentation tyder på detta. Svårt att säga när vi inte vet hur SoC:en kommer se ut, var den används beror ju på vilka funktioner som byggs in och liknande utöver att bara ha en "highest performance ARM" eller vad de som kör semi-custom bygger ihop med den. Kolla slidesen från FAD (sweclockers nyhetssida lär ha de flesta) så ser du lite hur de tänkt. Områden de tänkt köra nu är "Computing & Graphics" med PC/processorer, GPU, och professionell grafik samt "Enterprise, embedded and semi-custom" som alltså är server, inbyggnad och semi-custom.

De de sagt om K12 är egentligen "Highly levered with x86 Core Development" vilket bör betyda att det är samma team och ingenjörer som jobbat på båda i någon mån. Tror nog arkitekterna tycker det är kul att designa något som inte är x86. Med ARMv8 har väldigt många gått custom som sagt. Trotts att ARMs designer bör lämpa sig för väldigt många tillämpningar. Frågan vad som händer där rör inte bara AMD, men de andra som bygger har traditionella marknader där de stoppat in dessa och är i den mån inte beroende av att det växer fram nya.

Permalänk
Medlem
Skrivet av Erwya:

Kan vara för att en fyrmodulig AMD har åtta beräkningskärnor som kan köra sitt eget race om omständigheterna är rätt. Singeltrådat ligger fortfarande Intel 2600K 20-%15% högre än FX-8350 men multitrådat ligger den strax ovanför. Det är en av anledningarna till att jag anser CMT är i grunden en mycket bra design; den är smalare och får mer gjort om instruktionerna som den ges är smala. Jämför man CMT-moduler med SMT-kärnor så är det mer prestanda att hämta i CMT-moduler. Nu skulle det behövas en nanometerkrympning för att singeltrådsprestandan skulle ligga likvärdigt med Intel. I det scenariot ger CMT mer än SMT.

Nu har dock AMD hamnat i en dålig sits och måste vara innovativa (ehm. rätta sig i ledet) för att överleva, därmed kommer Zen att göra sig av med CMT och satsa på SMT. Något som gör mig smått nyfiken är att om jag förstått Yoshman korrekt så har Zen vissa drag av CMT-kärnorna kvar i designen. Förmodligen är det resultatet av en optimering där man tagit det bästa från två världar. Är det så behöver jag inte känna mig alltför besviken över valet att avveckla CMT.

CMT må vara intressant i teorin, men implementeringen i Bulldozer är tyvärr ett rent misslyckande för AMD.

Permalänk
Medlem
Skrivet av lorgix:

CMT må vara intressant i teorin, men implementeringen i Bulldozer är tyvärr ett rent misslyckande för AMD.

Sant, eller det är sant att det är känt som ett misslyckande för helhetsintrycket för processorn. Bulldozer skulle behövt flera ordentliga revideringar för att ha blivit en bra CMT. Nu valde man tyvärr att lägga ned redan innan det hunnit etablera sig och innan flaskhalsar åtgärdats.

Visa signatur

Kör Linux - Yes! We are the 2 percent! And growing... Föreslå inte ens något Windows-exklusivt om jag inte specifikt frågar efter något till Win.
2600K - 18GB RAM - 1TB HDD - 64GB SSD - GTX 650 Ti Boost
Minnesvärda trådar: 1, 2

Permalänk
Medlem
Skrivet av Erwya:

Sant, eller det är sant att det är känt som ett misslyckande för helhetsintrycket för processorn. Bulldozer skulle behövt flera ordentliga revideringar för att ha blivit en bra CMT. Nu valde man tyvärr att lägga ned redan innan det hunnit etablera sig och innan flaskhalsar åtgärdats.

Fast frågan är om dom fått till det. SMT vet vi ju att det fungerar bra. Kanske bättre att dom satsade på ett säkert (eller ja, säkrare) kort som det ser ut just nu.
Ser väldigt mycket fram emot Zen!

Permalänk
Medlem
Skrivet av lorgix:

Fast frågan är om dom fått till det. SMT vet vi ju att det fungerar bra. Kanske bättre att dom satsade på ett säkert (eller ja, säkrare) kort som det ser ut just nu.
Ser väldigt mycket fram emot Zen!

De behöver spela säkra kort just nu för att inte riskera att bli utpetade från marknaden. Vi behöver deras konkurrens för att få de andra tillverkarna att investera i bättre produkter. Ser också fram emot Zen. 16 kärnor får det att vattnas i munnen...

Visa signatur

Kör Linux - Yes! We are the 2 percent! And growing... Föreslå inte ens något Windows-exklusivt om jag inte specifikt frågar efter något till Win.
2600K - 18GB RAM - 1TB HDD - 64GB SSD - GTX 650 Ti Boost
Minnesvärda trådar: 1, 2

Permalänk
Medlem
Skrivet av Erwya:

De behöver spela säkra kort just nu för att inte riskera att bli utpetade från marknaden. Vi behöver deras konkurrens för att få de andra tillverkarna att investera i bättre produkter. Ser också fram emot Zen. 16 kärnor får det att vattnas i munnen...

De lade till fler decoders (x86 avkodare) i Steamroller, ytterligare förbättringar hade varit att dubblera FPUn. Fast det är ju dock fortfarande heltalsenheterna som är problemet och att byta ut dem hade ju i praktiken betytt att dumpa BD.

Att fortsätta roadmap med 10-kärnor (20 i MCM) Opteron, nya chipset, socklar och så vidare och släppt 8 kärnor Steamroller och XV för icke-APU hade inte hjälpt särskilt mycket. Prestandan hade ändå inte blivit markant bättre än Kaveri och Carrizo. När det gäller "K10" så byggdes Stars-baserade Llano (228mm² 4C med 1.45 miljarder transistorer, men detta är en APU och Carrizo som är 28nm är själv 250mm² med 3.1 miljarder) på 32 nm. Det hade inte varit tillräckligt att öka prestandan som mest 5-10% mellan varje generation BD hur som helst. Den förbättringen fick du i princip på mobila varianterna ändå.

16 trådar, eller ska jag köpa Power8 och gå runt och säga att jag har 96 kärnor i min 12-kärnors processor?

3.1
Permalänk
Medlem

Jag väntar på spänning .Kan ju hoppas den blir riktigt bra .(kommer köpa 1 av varje lag ändå för att gynna konkurrensen.Om inte vore helt själva på marknaden vilka priser hade vi inte sett då ?

Visa signatur

Dator 1 5800x 32 GB ram B550 plus TUF Kingston 3000 2048 GB EVO 870 QVO 4TB ASUS 370 ti TUF RM 750 X Corsair 4000D Airflow Noctua NH-D15S WIN 10 ASUS PG279Q skärm

Permalänk
Inaktiv
Skrivet av Petterk:

De lade till fler decoders (x86 avkodare) i Steamroller, ytterligare förbättringar hade varit att dubblera FPUn. Fast det är ju dock fortfarande heltalsenheterna som är problemet och att byta ut dem hade ju i praktiken betytt att dumpa BD.

Att fortsätta roadmap med 10-kärnor (20 i MCM) Opteron, nya chipset, socklar och så vidare och släppt 8 kärnor Steamroller och XV för icke-APU hade inte hjälpt särskilt mycket. Prestandan hade ändå inte blivit markant bättre än Kaveri och Carrizo. När det gäller "K10" så byggdes Stars-baserade Llano (228mm² 4C med 1.45 miljarder transistorer, men detta är en APU och Carrizo är själv 250mm² med 2.3 miljarder) på 32 nm. Det hade inte varit tillräckligt att öka prestandan som mest 5-10% mellan varje generation BD hur som helst. Den förbättringen fick du i princip på mobila varianterna ändå.

16 trådar, eller ska jag köpa Power8 och gå runt och säga att jag har 96 kärnor i min 12-kärnors processor?

Du och Yoshman verkar väldigt kunniga i allt som rör processorer. Var kan man mer läsa om det någonstans så man själv blir lika självlärd?

Permalänk
Medlem
Skrivet av anon114264:

Du och Yoshman verkar väldigt kunniga i allt som rör processorer. Var kan man mer läsa om det någonstans så man själv blir lika självlärd?

Nu jobbar ju inte jag som utvecklare som Yoshman, gör man det är det enklare att få insikt i hur de fungerar. Det är ganska omfattande information (dokumentation) som ges ut till utvecklare för att man ska kunna använda produkten på bästa sätt. Det finns också många kunniga som går igenom och på så vis avslöjar detaljer om hur sakerna fungerar. Det finns ju t.o.m. firmor som gör egna die shots av produkter på marknaden och en del information kan alltså avslöjas den vägen. Agners genomgångar brukar vara intressanta. Hos många ges en hel del detaljer ut i materialet som är tänkt att sälja grejerna.

Det som finns utan att jobba på företagen som utvecklar mikroarkitekturerna är ju den information som offentliggörs. Teorin lärs ju ut på universitet osv, men när det gäller detaljer så får man nöja sig med sånt som anställda på dessa firmor offentliggör på t.ex. konferenser för andra inom branschen. Samt det som de offentliggör vid deras egna pressträffar och för deras investerare (sån information är offentlig för alla börsnoterade bolag eftersom alla måste ha tillgång till samma information annars åker du dit för insider trading om du handlar med information som inte är känd) eller helt enkelt det material de skickar till pressen. Helt slutet är det inte, och teknikområden brukar vara ganska öppna och är ofta knutna till den akademiska världen också, som i grunden bygger på öppenhet. Bland annat pga av att det är börsnoterade firmor så kan du inte bara fråga en ingenjör på firman däremot, det behöver inte vara av rena sekretesskäl. Det är ju för deras egna bästa som högteknologiska firmor samarbetar med universitet och liknande samt därav delar med sig en hel del, och runt alla tillverknings eller designcenters i världen finns det skolor som utbildar inom detta.

Har man intresse är det bara att följa, det första man gör behöver ju inte vara att läsa 500 sidor teori. Är man lagd åt det hållet inom litteraturen så finns det ju böcker om det hela däremot. Facklitteratur är ett stort område inom många discipliner, men det är få som klarar att hoppa på de tyngsta böckerna inom ett ämne de inte redan besitter omfattande kunskaper i skulle jag tro. Det finns däremot många självlärda ingenjörer och specialister, och många av de plöjer en hel del sådan litteratur även utanför deras egna område. När det gäller produkters utveckling finns det inget annat än att följa de över en tid. Detaljer i dessa ändras ju mycket oftare än själva koncepten.

Permalänk
Medlem
Skrivet av anon114264:

Du och Yoshman verkar väldigt kunniga i allt som rör processorer. Var kan man mer läsa om det någonstans så man själv blir lika självlärd?

AnandTech har många artiklar som går på djupet, ofta ges de ut när det lanseras nya arkitekturer.

Visa signatur

i5 4790K, 8 GB XMS3 1600 Mhz, RX 5700XT, Gigabyte G1.Sniper M5

Permalänk
Medlem

Ge mig en tvåkärnig processor med hyperthreading eller liknande som inte är nedbantad. Då kommer jag bli kund.

Visa signatur
Permalänk
Inaktiv
Skrivet av Petterk:

Nu jobbar ju inte jag som utvecklare som Yoshman, gör man det är det enklare att få insikt i hur de fungerar. Det är ganska omfattande information (dokumentation) som ges ut till utvecklare för att man ska kunna använda produkten på bästa sätt. Det finns också många kunniga som går igenom och på så vis avslöjar detaljer om hur sakerna fungerar. Det finns ju t.o.m. firmor som gör egna die shots av produkter på marknaden och en del information kan alltså avslöjas den vägen. Agners genomgångar brukar vara intressanta. Hos många ges en hel del detaljer ut i materialet som är tänkt att sälja grejerna.

Det som finns utan att jobba på företagen som utvecklar mikroarkitekturerna är ju den information som offentliggörs. Teorin lärs ju ut på universitet osv, men när det gäller detaljer så får man nöja sig med sånt som anställda på dessa firmor offentliggör på t.ex. konferenser för andra inom branschen. Samt det som de offentliggör vid deras egna pressträffar och för deras investerare (sån information är offentlig för alla börsnoterade bolag eftersom alla måste ha tillgång till samma information annars åker du dit för insider trading om du handlar med information som inte är känd) eller helt enkelt det material de skickar till pressen. Helt slutet är det inte, och teknikområden brukar vara ganska öppna och är ofta knutna till den akademiska världen också, som i grunden bygger på öppenhet. Bland annat pga av att det är börsnoterade firmor så kan du inte bara fråga en ingenjör på firman däremot, det behöver inte vara av rena sekretesskäl. Det är ju för deras egna bästa som högteknologiska firmor samarbetar med universitet och liknande samt därav delar med sig en hel del, och runt alla tillverknings eller designcenters i världen finns det skolor som utbildar inom detta.

Har man intresse är det bara att följa, det första man gör behöver ju inte vara att läsa 500 sidor teori. Är man lagd åt det hållet inom litteraturen så finns det ju böcker om det hela däremot. Facklitteratur är ett stort område inom många discipliner, men det är få som klarar att hoppa på de tyngsta böckerna inom ett ämne de inte redan besitter omfattande kunskaper i skulle jag tro. Det finns däremot många självlärda ingenjörer och specialister, och många av de plöjer en hel del sådan litteratur även utanför deras egna område. När det gäller produkters utveckling finns det inget annat än att följa de över en tid. Detaljer i dessa ändras ju mycket oftare än själva koncepten.

Tack så mycket för det välinformerade svaret! Det är ni som gör Sweclockers!