AMD: "Bulldozer har åtta kärnor"

Permalänk
Medlem
Skrivet av Defeat^:

Jag skulle säga att det är fel att kalla bulldozer för 8-kärnig, men det är ännu mer fel att kalla den 4-kärnig. 8-kärnig ligger helt enkelt närmast sanningen. HT låter väl bara två trådar turas om med resurserna på en kärna, medan bulldozer kör 8 stycken slaktade kärnor. Skulle säga att bulldozer är betydligt närmare 8-kärnor än vad en 4-kärnig I7 är.

Jag håller helt med. Jag tycker AMD borde givit sina kärnor ett nytt namn. Tex mha ett prefix.
Som sagt en 4kärnig med HT har endast 4kärnor. Inget att diskutera där och jag har aldrig påstått något annat. Just därför så håller inte argumentet i artikeln om att antal parallella instruktioner skulle avgöra antalet kärnor.

Observera att jag aldrig påstått att bulldozer inte har 8st kärnor(i någon mån), men då de inte påpekar att dessa kärnor inte är samma som tidigare AMD och nuvarande Intel kärnor så är det vad jag kallade för "ful-PR". Kanske inte en ren lögn, men inte speciellt uppriktigt och rakryggat gjort.

Permalänk
Medlem
Skrivet av adzer:

Jag håller helt med. Jag tycker AMD borde givit sina kärnor ett nytt namn. Tex mha ett prefix.
Som sagt en 4kärnig med HT har endast 4kärnor. Inget att diskutera där och jag har aldrig påstått något annat. Just därför så håller inte argumentet i artikeln om att antal parallella instruktioner skulle avgöra antalet kärnor.

Observera att jag aldrig påstått att bulldozer inte har 8st kärnor(i någon mån), men då de inte påpekar att dessa kärnor inte är samma som tidigare AMD och nuvarande Intel kärnor så är det vad jag kallade för "ful-PR". Kanske inte en ren lögn, men inte speciellt uppriktigt och rakryggat gjort.

om man ska berätta vad ens produkt inte är så går ju informationsmängden mot oändligheten eller?

Visa signatur

vad gör man inte för massorna med en
"riktigt stor digital penis"

Permalänk
Medlem
Skrivet av moreempty:

om man ska berätta vad ens produkt inte är så går ju informationsmängden mot oändligheten eller?

Självklart och det har jag inte sett att någon frågat efter heller?

Om man dock berättar vad ens produkt är så bör man vara tydlig tycker jag. Det är AMD som slagit på stora trumman med "8 core" utskrivet i fokus på varenda reklamblad och referens. Att man då inte nämner att dessa kärnor inte är samma som ens tidigare generationer tycker iaf jag är lite fult. Du behöver så klart inte hålla med mig.

Skickades från m.sweclockers.com

Permalänk
Medlem
Skrivet av adzer:

Självklart och det har jag inte sett att någon frågat efter heller?

Om man dock berättar vad ens produkt är så bör man vara tydlig tycker jag. Det är AMD som slagit på stora trumman med "8 core" utskrivet i fokus på varenda reklamblad och referens. Att man då inte nämner att dessa kärnor inte är samma som ens tidigare generationer tycker iaf jag är lite fult. Du behöver så klart inte hålla med mig.

Skickades från m.sweclockers.com

AMD talade om kluster och "Bulldozer cores" långt innan några konsumenter köpte grejerna.

Permalänk
Medlem
Skrivet av Petterk:

AMD talade om kluster och "Bulldozer cores" långt innan några konsumenter köpte grejerna.

Internt ja. Deras ingenjörer har garanterat koll på detta, men precis som med nvidias 3.5+0.5GB fadäs så är det PR-avdelningen som skapar problem. Det är hur reklamen framställer produkten som stämningen handlar om.

Permalänk
Avstängd

Kanske inte relaterat till huruvida Bulldozer har 8 "riktiga" kärnor eller ej, men definitivt relaterat till prestandan.

Läste testpanelens prestandatest av Fallout 4 och såg att de inte kom upp ens i 100 FPS med vare sig GTX 970 eller R9 390 på lägsta inställningar och att detta berodde på att processorn (i7 6600K) inte riktigt dög till.

Sitter själv på en FX-9590 och R9 390X och kommer utan problem upp i 144 FPS på merparten inställningar på low och några enstaka på medium. Har då en 1920x1080-monitor.
Har inte kikat närmare på exakta belastningar, utan vet bara att radiatorn pumpar värme som ett bastuaggregat under spelandet (blir ungefär 30 grader varmt vid skrivbordet). Det beror dock på att moderkortet matar 1.4875V till processorn by default av någon anledning och jag glömmer ställa ner det.
Väl nere på 1.4000V så bibehålls klockningen på 4,7GHz, prestandan i spelet bibehålls och processorn blir inte varmare än 50 grader.

Värt att nämna är då även att jag har ett nätaggregat på endast 600W vilket verkligen inte bör orka driva AMD:s dieselpannor vid maxbelastning.

Kan det verkligen vara så att Bethesda har lyckats med konsten att programmera sitt spel till AMD:s fördel eller vad i hela friden beror det på?
I regel brukar ju annars FX-serien inte utnyttjas så väl till spelande jämfört med Intels grejer.

Permalänk
Medlem
Skrivet av DavidtheDoom:

Suffixen gör det mycket lätt att hålla reda på. Lär man sig 4st bokstäver för laptops så är man hemma.

Ja det är okej att alla i U-serien har samma antal kärnor och man bara diferensierar med frekvenserna. Detta gör man överallt i industrin. Det är ingen fysisk skillnad mellan din i5:a och din i7:a på desktop heller. Det sitter samma typ av chip som har blivit binnat, vissa har dubbla uppsättningar register och blir i7:or och andra blir i5:or med en uppsättning register per kärna. Samma sak mellan 1600MHz och 2800MHz DDR3 Ram-minnen. Kan vara identiska chip men av olika binningsnivåer.

Och i3:or med 8st trådar? Vart har du hittat denna trycksfelsnissen? Det existerar nämligen inte.
Nja, definera kärnor...

Windows och vissa andra operativsystem ser inte beräkningsenheterna som finns på chippet utan de register som finns. Så Windows visar t ex logiska kärnor i aktivitetshanteraren.
Dock är detta samma sak som trådar och inte samma sak som fysiska kärnor.

ojdå, skulle självklart stå 2kärnor o 4 trådar
Men tycker dock fortfarande att det är otroligt fult av nvidia att göra så då nästan alla tänker att i7a är 4C 8T och i5 4C 4T etc etc
och det att du jämför RAM är ändå ddr3 1600/2400 o det kanske är samma, men då borde processorerna heta i3 2,0/2,3/2,6ghz och inte slänga in något helt annat namn innan som bara förvirrar och använder det som ett halvfult försäljningsknep.

Visa signatur

Citera för svar!

Detta må inte längre vara min primära dator men står kvar vid TV:n så den får ligga kvar ändå!

MB: Asus Maximus III Gene CPU: I7 860 4ghz HT Kylning: Antec 920 GPU: EVGA 770 2GB RAM: Corsair 12GB 1600mhz XMS3 2x2GB + Vengence HP 2x4GB SSD: Samsung EVO 840 120GB HDD: Samsung 1Tb 7200rpm, Seagate 2TB 7200rpm Chassi: Fractal Design Define Mini

Permalänk
Medlem

@Ricerunner:
Har sett något prestanda test på något annat nytt spel där bulldozer arkitekturen visade framfötterna.

Undrar om det var witcher 3.

Visa signatur

Hårdvaru och mjukvaru intresserad

Permalänk
Medlem
Skrivet av Tempel:

När man körde Amiga så fanns ingen fpu alls förens man stoppade i turbokort men inte ens då var det en del av cpum utan det var ett eget chip. Var då verkligen en 68020 en riktig cpu? Eller för den delen 68000. Jepp. Så att det bara finns en ALU säger inte så mycket, det är inte en vital del av kärnan. A4000 hade dessutom en ec cpu dvs en utan mmu. Men en A500 med en 68020 och en 68881 var en best... ja så länge man hade minne på turbokortet för annars hände inte mycket men den extra kraften.

Exact. För oss gamla amiganer så var det inget problem men AMDs sätt att se saker

Man kanske ska stämma alla som någonsin gjort CPUer utan FPUer ända tillbaka till 70-talet? Det är ju falsk marknadsföring helt klart.

Permalänk
Datavetare
Skrivet av Petterk:

AMD talade om kluster och "Bulldozer cores" långt innan några konsumenter köpte grejerna.

Går ändå inte att komma ifrån att om du ställer frågan:
Hey, Mr CPU what is your core count?
så svarar en FX-8350
It's 4 cores, sir!

Har ingen aning om vilka chanser denna person har att vinna stämningen, men skulle ändå säga att hans största chans måste vara att peka just på att AMD själva valt att låta CPUn identifiera sig mot OS som att den har 4 kärnor och 8 trådar.

Rent tekniskt finns ju bara en enda skillnad mellan "Core" CPUer med HT och Bulldozer designen:
I "Core" så finns 3-4 (4 från Haswell och framåt) ALUs för heltal per kärna och i Bulldozer designen finns 4 ALU för heltal per modul.

Skillnaden är att "Core" låter en ensam tråd använda alla ALU-enheter och när båda trådarna används får de dela på ALU-enehterna och det blir då 1,5-2,0 st i snitt per tråd.

I Bulldozer-designen valde man att göra en statisk separation, trådarna kan använda två ALUs var oavsett om en eller två CPU-trådar är aktiva.

I övrigt är en Bulldozer-modul och en "Core"-kärna med HT väldigt lika från hög nivå, båda trådarna delar "front-end" och båda trådarna delar FPU.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Är inte Amd:s reklam om apu:er! AMD APU technology with up to 12 Compute Cores lika missvisande ?

Visa signatur

Vedeldad 486:dx. Jag klockar o jag klockar... allt laggar ändå.

Permalänk
Medlem

men hur svårt ska det vara, sluta att prata och dra igång bevis live i rätten där ni kör 8 instanser samtidigt på alla kärnor så är det ju klart... om det inte är så att de av någon anledning inte vill göra så för att det kanske inte går

Permalänk
Medlem
Skrivet av Yoshman:

Går ändå inte att komma ifrån att om du ställer frågan:
Hey, Mr CPU what is your core count?
så svarar en FX-8350
It's 4 cores, sir!

Har ingen aning om vilka chanser denna person har att vinna stämningen, men skulle ändå säga att hans största chans måste vara att peka just på att AMD själva valt att låta CPUn identifiera sig mot OS som att den har 4 kärnor och 8 trådar.

Rent tekniskt finns ju bara en enda skillnad mellan "Core" CPUer med HT och Bulldozer designen:
I "Core" så finns 3-4 (4 från Haswell och framåt) ALUs för heltal per kärna och i Bulldozer designen finns 4 ALU för heltal per modul.

Skillnaden är att "Core" låter en ensam tråd använda alla ALU-enheter och när båda trådarna används får de dela på ALU-enehterna och det blir då 1,5-2,0 st i snitt per tråd.

I Bulldozer-designen valde man att göra en statisk separation, trådarna kan använda två ALUs var oavsett om en eller två CPU-trådar är aktiva.

I övrigt är en Bulldozer-modul och en "Core"-kärna med HT väldigt lika från hög nivå, båda trådarna delar "front-end" och båda trådarna delar FPU.

Fast de kan lätt hänvisa till deras moduler och "Bulldozer-arkitektur", eller på att han påstår att den inte kan köra åtta instruktioner. AMD har två "förenade"schedulers och registerfiler för heltal och en registerfil och pipeline för flyttalenheten där bara ena av dessa kan köra instruktioner från olika trådar samma cykel per modul. Intel har en scheduler med en registerfil och pipeline för heltalsenheten och en för flyttal per kärna. AMDs design är smalare än tidigare K10/Stars/K8 och det var de ganska tydliga med. Det finns massor att peka på, är man besviken på prestandan så är man och det är inte grund att stämma någon. Formuleringar är viktiga i stämningar och AMD kan ju t.o.m. hänvisa till att BD kan köra två SSE-instruktioner per cykel per modul vilket är dubbelt så mycket som en kärna kunde i deras tidigare arkitektur. Motorola marknadsförde ju t.o.m. Moto X som en åttakärnig telefon trotts att de var tvungna att räkna in mikrokontrollers för att få den siffran samt "gpu-kärnor", mikrokontrollern har ju inte ens MMU, en av kärnorna är en ren DSP.

Det är ju inte som AMDs arkitektur och produkt inte klarar det som dokumentationen säger. Åtta stycken heltalspipelines där de delar på front-end i grupper av 2 finns som utlovat.

Permalänk
Medlem
Skrivet av zxhosting:

Skulle inte säga att den har 8 kärnor.

Den har.

4 kärnor

8 trådar
----------------------------------------------------
Men om den hade 8 kärnor så skulle den ha.

8 kärnor

16 trådar

Därför köper jag bara Intel för dom kan man lita på. Intel <3

Det du beskriver är hur det ser ut för en Intel processor med HT & inte för en AMD processorer med moduler, men plocka gärna fram den internationella standarden som beskriver hur en cpu med kärnor skall vara uppbyggd för att få kallas cpu samt hur kärnor skall vara uppbyggda samt fungera för att kallas kärnor.. skippa allt subjektivt & plocka fram standarden tack! Gissar på att du inte kan göra det?

Visa signatur

XFX Radeon RX 7700 XT Speedster QICK 319 Black Edition | AMD Ryzen R7 5700X | Noctua NH-D15 | Asus TUF Gaming B550-Plus | Kingston Fury Beast DDR4 3600MHz 4x8GB | Samsung 990 Pro 1TB | Corsair HX1000i | Fractal Design Define S | LG 27GL83A | Corsair K95 Platinum | Corsair Sabre RGB PRO Wireless | Corsair Void Elite Wireless

Permalänk
Datavetare

@Petterk: jag säger inte att min åsikt är att han har rätt i sin stämning (tvärt om hoppas jag han förlorar), jag säger bara att det finns en del ammunition som helt klart befinner sig i Tony Dickey hörn.

Rätten ska inte heller göra en teknisk definition av vad en "CPU-kärna" är, de ska bara bedöma om det kan anse vilseledande att AMD kallar t.ex. FX-8350 för 8-kärnig.

Just definitionen av SMT är ett annat vapen som är till Tony Dickey fördel och gissar att det är grundstenen i hans "case". Det finns överhuvudtaget inga tvivel om att Bulldozer designen är en form av SMT, råder heller inga tvivel om att CPUer med oberoende kärnor (Stars, Silvermnt, Jaguar, även de 8-kärniga ARM-kretsarna i telefoner) inte implementerar SMT då kravet för att det ska vara SMT är att minst en av fetch-decode-execute ska delas mellan minst två CPU-trådar.

Om jag skulle kört denna stämning skulle just dessa två saker vara mina hörnstenar

  • FX-8350 identifierar sig som fyrkärnig med åtta trådar via CPUID

  • "riktiga" CPU-kärnor kan inte klassas som att implementera SMT, en AMD modul är helt uppenbart en SMT implementation. SMT är till skillnad från "CPU-kärna" väldefinierat på teknisk nivå

SMT kräver också att minst två trådar kan köra instruktioner samtidig (d.v.s. under samma cykel), om de inte kan detta (vilket är fallet för t.ex. SPARC T1/T2 som ändå har fyra trådar per CPU-kärna) kallas det temporal multithreading. Både HT och AMD moduler uppfyller detta krav, så båda är SMT.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Oavsett om det är 4 eller 8 kärnor så är prestandan för dålig. Har inte kört AMD sedan A64 tiden för att de helt enkelt blir överkörda av intel i spel. Hoppas de kommer ifatt någon gång så vi får riktig konkurrens. Intels prestanda har inte utvecklats nämnvärt senaste åren. Jämför Sandy bridge med första Core CPUn och det är enorm skillnad. Jämför skylake med Sandy Bridge och det är skillnad men inte 4 år av skillnad tycker jag. Det är bara lite bättre. I spel så är tex min Ivy Bridge lila bra som de senare modellerna.

Skickades från m.sweclockers.com

Visa signatur

Asus B650 TUF, Ryzen 7600X, 32GB 6000mhz DDR5, Corsair RM1000X, Powercolor 6900XT Red Devil Ultimate, 360mm Corsair AIO, MSI Velox 100P Airflow. Kingston KC3000 M.2.

Permalänk
Medlem
Skrivet av Yoshman:

@Petterk: jag säger inte att min åsikt är att han har rätt i sin stämning (tvärt om hoppas jag han förlorar), jag säger bara att det finns en del ammunition som helt klart befinner sig i Tony Dickey hörn.

Rätten ska inte heller göra en teknisk definition av vad en "CPU-kärna" är, de ska bara bedöma om det kan anse vilseledande att AMD kallar t.ex. FX-8350 för 8-kärnig.

Just definitionen av SMT är ett annat vapen som är till Tony Dickey fördel och gissar att det är grundstenen i hans "case". Det finns överhuvudtaget inga tvivel om att Bulldozer designen är en form av SMT, råder heller inga tvivel om att CPUer med oberoende kärnor (Stars, Silvermnt, Jaguar, även de 8-kärniga ARM-kretsarna i telefoner) inte implementerar SMT då kravet för att det ska vara SMT är att minst en av fetch-decode-execute ska delas mellan minst två CPU-trådar.

Om jag skulle kört denna stämning skulle just dessa två saker vara mina hörnstenar

  • FX-8350 identifierar sig som fyrkärnig med åtta trådar via CPUID

  • "riktiga" CPU-kärnor kan inte klassas som att implementera SMT, en AMD modul är helt uppenbart en SMT implementation. SMT är till skillnad från "CPU-kärna" väldefinierat på teknisk nivå

SMT kräver också att minst två trådar kan köra instruktioner samtidig (d.v.s. under samma cykel), om de inte kan detta (vilket är fallet för t.ex. SPARC T1/T2 som ändå har fyra trådar per CPU-kärna) kallas det temporal multithreading. Både HT och AMD moduler uppfyller detta krav, så båda är SMT.

Fast heltalsenheterna har inte SMT utan snarare FGMT som är en typ av temporal multithreading. Det är bara FPUn som är SMT.

Vi vet att stämningen handlar om saker som "eight instructions simultaneously" och processorn klarar ju faktiskt en hel del mer än så, du kan ju även snitta mer än så. Manualer och dokumentation har ju inte ljugit hur det hela fungerar. Har då svårt att se vad de skulle missleda om, de byggde och levererade en "hybriddesign" precis som de lovade och att de levererade den designen är ju problemet inte marknadsföringen. Att de har en delad FPU och en bulldozer-arkitektur framgår ju t.o.m. i informationen menad till konsumenter. De jämförde t.o.m. deras "eight core" processor med 4 kärnor Sandy-Bridge i marknadsföringen. Det borde säga en hel del när det gäller prestandan och förväntningarna en konsument kan ha.

Permalänk
Datavetare
Skrivet av Petterk:

Fast heltalsenheterna har inte SMT utan snarare FGMT som är en typ av temporal multithreading. Det är bara FPUn som är SMT.

Vi vet att stämningen handlar om saker som "eight instructions simultaneously" och processorn klarar ju faktiskt en hel del mer än så, du kan ju även snitta mer än så. Manualer och dokumentation har ju inte ljugit hur det hela fungerar. Har då svårt att se vad de skulle missleda om, de byggde och levererade en "hybriddesign" precis som de lovade och att de levererade den designen är ju problemet inte marknadsföringen. Att de har en delad FPU och en bulldozer-arkitektur framgår ju t.o.m. i informationen menad till konsumenter. De jämförde t.o.m. deras "eight core" processor med 4 kärnor Sandy-Bridge i marknadsföringen. Det borde säga en hel del när det gäller prestandan och förväntningarna en konsument kan ha.

Även heltalsdelen är SMT, front-end är delad och SMT kräver att minst en av fetch-decode-execute delas för att det ska vara SMT. Core med HT delar alla tre, Bulldozer/Piledriver delar de två första för heltal och alla tre för flyttal och Steamroller/Excavator delar den första för heltal (och är därmed fortfarande en SMT-design även i heltalsdelen).

Vi har ju tidigare diskuterat Freescale e6500, den har separat fetch-decode men delar execute och är därmed också en SMT-implementation (vilket också är vad Freescale säger i sitt marknadsmaterial, d.v.s. man räknar inte trådar som delar execute som separata kärnor).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Även heltalsdelen är SMT, front-end är delad och SMT kräver att minst en av fetch-decode-execute delas för att det ska vara SMT. Core med HT delar alla tre, Bulldozer/Piledriver delar de två första och Steamroller/Excavator delar den första (och är därmed fortfarande en SMT-design).

Vi har ju tidigare diskuterat Freescale e6500, den har separat fetch-decode men delar execute och är därmed också en SMT-implementation (vilket också är vad Freescale säger i sitt marknadsmaterial, d.v.s. man räknar inte trådar som delar execute som separata kärnor).

Fast din definition skulle omöjliggöra temporal multithreading på en superscaler eller multi-issue CPU, även om de inte kör instruktioner från fler än en tråd samtidigt, och det vet jag inte om litteraturen håller med om. Även UltraSPARC T1 delar fetch/decode och då med fyra trådar. BD/PD växlar ju varje cykel mellan olika trådar. Det är något e6500 inte gör. e6500 delar L1, MMU och FPU, men har separata heltalspipelines (execute) de också. Båda delar FPU. Meningen med SMT är att köra instruktioner från olika trådar samma cykel och det gör ju inte BDs heltalskluster även om FPUn ska klara det.

Permalänk
Datavetare
Skrivet av Petterk:

Fast din definition skulle omöjliggöra temporal multithreading på en superscaler eller multi-issue CPU, även om de inte kör instruktioner från fler än en tråd samtidigt, och det vet jag inte om litteraturen håller med om. Även UltraSPARC T1 delar fetch/decode och då med fyra trådar. BD/PD växlar ju varje cykel mellan olika trådar. Det är något e6500 inte gör. e6500 delar L1, MMU och FPU, men har separata heltalspipelines (execute) de också. Båda delar FPU. Meningen med SMT är att köra instruktioner från olika trådar samma cykel och det gör ju inte BDs heltalskluster även om FPUn ska klara det.

Ser inte vad problemet är. Ja, SMT kräver en superskalär design. SPARC T1/T2 är en single-issue, d.v.s. inte superskalär och implementerar därför inte SMT utan temporal multithreading.

Just dessa saker är väl definierade, råder därför inga tvivel om att en AMD-modul är SMT. Den är inte temporal multithreading. Råder heller inga tvivel om att t.ex. Jaguar inte är SMT då den inte delar någon av fetch-decode-execute mellan olika CPU-trådar.

SMT säger också specifikt att den inte tar hänsyn till minneshierarkin, så hur cachen är organiserad är irrelevant ur det perspektivet.

BD/PD växlar inte tråd varje cykel, den kör båda trådarna samtidigt precis som Intels CPUer med HT (vilket är ett krav för SMT). SPARC T1/T2 växlar däremot tråd varje cykel och implementerar därmed en variant av temporal multithreading som kallas barrel processor.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Orkhan:

Jo men frågan är nog mer om vi anser att man fortfarande kan kalla det för 8 kärnor efter som att vissa komponenter av kärnorna är bortskalade. Vad är definitionen av en kärna? Vad måste man ta bort från kärnan för att det inte längre kan anses som en hel kärna? Är mitt rött samma som ditt rött? Vissa kanske anser att alla kärnor måste kunna operera helt oberoende av varandra för att det skall vara en "äkta" oktacore.

Förstod det efter att ha läst om artikeln i efterhand, tror jag va lite trött för att koppla ihop poängen haha..

Visa signatur

Lycksalig Compaqsamlare, från LTE 4/50 till Evo N610c | Vardag: 3930K elmätarnitro@stock | Hyfsat astillräcklig, farväl Win10 snarast 🥳 🎉

Världen: never talk about yourself
Swec: Jag jag jag

Permalänk
Medlem
Skrivet av Yoshman:

Ser inte vad problemet är. Ja, SMT kräver en superskalär design. SPARC T1/T2 är en single-issue, d.v.s. inte superskalär och implementerar därför inte SMT utan temporal multithreading.

Just dessa saker är väl definierade, råder därför inga tvivel om att en AMD-modul är SMT. Den är inte temporal multithreading. Råder heller inga tvivel om att t.ex. Jaguar inte är SMT då den inte delar någon av fetch-decode-execute mellan olika CPU-trådar.

SMT säger också specifikt att den inte tar hänsyn till minneshierarkin, så hur cachen är organiserad är irrelevant ur det perspektivet.

BD/PD växlar inte tråd varje cykel, den kör båda trådarna samtidigt precis som Intels CPUer med HT (vilket är ett krav för SMT). SPARC T1/T2 växlar däremot tråd varje cykel och implementerar därmed en variant av temporal multithreading som kallas barrel processor.

BD/PD avkodar väl en tråd per cykel? Den kan inte köra olika trådar på samma heltalspipeline. Förstnämnda är ju åtgärdat först i Steamroller.

Så vitt jag vet går det att köra FGMT med superscaler-design. Det är åtminstone vad akademiska källor verkar visa.

Permalänk
Medlem
Skrivet av Yoshman:

Ser inte vad problemet är. Ja, SMT kräver en superskalär design. SPARC T1/T2 är en single-issue, d.v.s. inte superskalär och implementerar därför inte SMT utan temporal multithreading.

Just dessa saker är väl definierade, råder därför inga tvivel om att en AMD-modul är SMT. Den är inte temporal multithreading. Råder heller inga tvivel om att t.ex. Jaguar inte är SMT då den inte delar någon av fetch-decode-execute mellan olika CPU-trådar.

SMT säger också specifikt att den inte tar hänsyn till minneshierarkin, så hur cachen är organiserad är irrelevant ur det perspektivet.

BD/PD växlar inte tråd varje cykel, den kör båda trådarna samtidigt precis som Intels CPUer med HT (vilket är ett krav för SMT). SPARC T1/T2 växlar däremot tråd varje cykel och implementerar därmed en variant av temporal multithreading som kallas barrel processor.

Inte enligt wikipedia så använder inte BD/PD SMT tekniken utan det är bara delvis en SMT implementation, märkligt jag har läst där flera ggr men missat det inte för att jag kan det tekniska runt det!

AMD Bulldozer microarchitecture FlexFPU and Shared L2 cache are multithreaded but integer cores in module are single threaded, so it is only a partial SMT implementation.
https://en.wikipedia.org/wiki/Simultaneous_multithreading

Detta kan diskuteras till evigheten sen kan man ha delade åsikter om lämpligheten i att låta en domstol berätta för en tillverkare vilken teknik deras produkt innehåller? Men alla verkar vara överens om att en processor behöver inte innehålla en FPU eller ens L2 cache, eller hur var det med det nu?

Visa signatur

XFX Radeon RX 7700 XT Speedster QICK 319 Black Edition | AMD Ryzen R7 5700X | Noctua NH-D15 | Asus TUF Gaming B550-Plus | Kingston Fury Beast DDR4 3600MHz 4x8GB | Samsung 990 Pro 1TB | Corsair HX1000i | Fractal Design Define S | LG 27GL83A | Corsair K95 Platinum | Corsair Sabre RGB PRO Wireless | Corsair Void Elite Wireless

Permalänk
Datavetare
Skrivet av Petterk:

BD/PD avkodar väl en tråd per cykel? Den kan inte köra olika trådar på samma heltalspipeline. Förstnämnda är ju åtgärdat först i Steamroller.

Så vitt jag vet går det att köra FGMT med superscaler-design. Det är åtminstone vad akademiska källor verkar visa.

Det är fullt möjligt att ha en implementation där man växlar mellan trådar varje cykel i front-end men där man ändå kör avkodadeinstruktioner parallellt i delade eller separata (kvittar) back-end(s). Nyckelordet här är att det som kallas "issue", d.v.s att en avkodad instruktion påbörjar sin körning i back-end, måste potentiellt kunna ske från flera CPU-trådar parallellt för att det ska vara SMT, om det bara kan ske från en tråd är det inte SMT utan "temporal multithreading" (av någon form).

Mellan front-end och back-end ligger ju en kö med väntande instruktioner, så även om front-end är implementerad så att den alternerar (rätt säker på att varken AMDs moduler eller Intels HT fungerar så, rätt säker att de kan i alla fall avkoda från två trådar samma cykel) kan det ändå vara SMT bara man kan "issue" mer än en instruktion och det potentiellt kan vara instruktioner från mer än en CPU-tråd.

Hittar en del presentationer från föreläsningar och liknande, t.ex. denna, och de verkar vara överens med det som står på Wikipedia

There are many ways to support more than one thread within a chip, namely:

  • Interleaved multithreading: Interleaved issue of multiple instructions from different threads, also referred to as temporal multithreading. It can be further divided into fine-grain multithreading or coarse-grain multithreading depending on the frequency of interleaved issues. Fine-grain multithreading—such as in a barrel processor—issues instructions for different threads after every cycle, while coarse-grain multithreading only switches to issue instructions from another thread when the current executing thread causes some long latency events (like page fault etc.). Coarse-grain multithreading is more common for less context switch between threads. For example, Intel's Montecito processor uses coarse-grain multithreading, while Sun's UltraSPARC T1 uses fine-grain multithreading. For those processors that have only one pipeline per core, interleaved multithreading is the only possible way, because it can issue at most one instruction per cycle.

  • Simultaneous multithreading (SMT): Issue multiple instructions from multiple threads in one cycle. The processor must be superscalar to do so.

  • Chip-level multiprocessing (CMP or multicore): integrates two or more processors into one chip, each executing threads independently.

  • Any combination of multithreaded/SMT/CMP.

FGMT är inte SMT, utan vad som här kallas "Interleaved multithreading". Här står faktiskt också att CMP/multicore "each executing threads independently", vilket alltså inte gäller för AMDs moduldesign. Är exakt den definitionen jag skulle välja för en formell definition av "CPU-kärna". Undrar hur pass förankrad texten på Wikipedia är med de definitioner universitet och industrin använder? Kan som sagt inte påminna mig att jag någonsin sett en formell definition av CPU-kärna, men Wikipedia har uppenbarligen en sådan. En fixad "citation needed" skulle vara guld värd på detta!

Skrivet av skruvis:

Inte enligt wikipedia så använder inte BD/PD SMT tekniken utan det är bara delvis en SMT implementation, märkligt jag har läst där flera ggr men missat det inte för att jag kan det tekniska runt det!

AMD Bulldozer microarchitecture FlexFPU and Shared L2 cache are multithreaded but integer cores in module are single threaded, so it is only a partial SMT implementation.
https://en.wikipedia.org/wiki/Simultaneous_multithreading

Detta kan diskuteras till evigheten sen kan man ha delade åsikter om lämpligheten i att låta en domstol berätta för en tillverkare vilken teknik deras produkt innehåller? Men alla verkar vara överens om att en processor behöver inte innehålla en FPU eller ens L2 cache, eller hur var det med det nu?

För SMT är det irrelevant om det finns FPU, L2 eller ens L1$. Men AMD BD är inte "partial SMT", endera är det SMT eller så är det inte SMT och kravet är att minst en av fetch-decode-execute ska delas och så är fallet både för flyttal och heltal i alla BD-designer så de implementerar alla SMT (och alltså inte CMP enligt den definition någon lagt på Wikipedia).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

För SMT är det irrelevant om det finns FPU, L2 eller ens L1$. Men AMD BD är inte "partial SMT", endera är det SMT eller så är det inte SMT och kravet är att minst en av fetch-decode-execute ska delas och så är fallet både för flyttal och heltal i alla BD-designer så de implementerar alla SMT (och alltså inte CMP enligt den definition någon lagt på Wikipedia).

Ok så vi bortser totalt från wikipedia i alla fall.

Men kravet för att få kalla det för SMT är det du listar, men man måste skilja på vad man måste uppfylla för att få kalla det för någonting till vad det verkligen är & eftersom AMD uppenbarligen håller fast vid att det är 8-kärnor samt det faktum att det inte finns någon standard till att SMT är en teknik & ingen standard, så hamnar man där att det är upptill tillverkaren att avgöra.

SEN kommer diskussionen fick AMD ut budskapet, förstod Dicken vad det var han införskaffade sig? etc. etc. osv.

Visa signatur

XFX Radeon RX 7700 XT Speedster QICK 319 Black Edition | AMD Ryzen R7 5700X | Noctua NH-D15 | Asus TUF Gaming B550-Plus | Kingston Fury Beast DDR4 3600MHz 4x8GB | Samsung 990 Pro 1TB | Corsair HX1000i | Fractal Design Define S | LG 27GL83A | Corsair K95 Platinum | Corsair Sabre RGB PRO Wireless | Corsair Void Elite Wireless

Permalänk
Medlem

Står 4 "Kärnor" 8 logiska processorer i windows 10 på min 9590

Permalänk
Medlem
Skrivet av RaZman:

När fanboys resonerar handlar det minsann om hur mycket man skall komma undan med genom falsk marknadsföring, varenda litet kryphål skall utnyttjas för att få produkterna att verka bättre än vad de faktiskt är. Stämningar som dessa handlar inte om att göra någonting "idiotsäkert", det handlar om att företag inte skall kunna sälja sin fyrkärniga processor som åttakärnig genom luddiga definitioner. Man skall inte behöva läsa det finstilta för att se om man köpt vad som står på kartongen..

Sade killen med Intel-logga som profilbild

Det handlar inte om att försvara AMD för att AMD är AMD. Utan det kan ju faktiskt vara så att Bulldozer ligger närmare att ha åtta kärnor än att ha fyra.

Du har köpt en AMD XXX byggd på Bulldozer och har åtta kärnor - var får du idén om att dessa kärnor måste vara samma kärnor och fungera lika dant som de kärnor som sitter i en Intel XXX i7 byggd på Ivy Bridge med 4 kärnor? Varför är Intels definition på en kärna normen?

Permalänk
Medlem
Skrivet av Yoshman:

Det är fullt möjligt att ha en implementation där man växlar mellan trådar varje cykel i front-end men där man ändå kör avkodadeinstruktioner parallellt i delade eller separata (kvittar) back-end(s). Nyckelordet här är att det som kallas "issue", d.v.s att en avkodad instruktion påbörjar sin körning i back-end, måste potentiellt kunna ske från flera CPU-trådar parallellt för att det ska vara SMT, om det bara kan ske från en tråd är det inte SMT utan "temporal multithreading" (av någon form).

Mellan front-end och back-end ligger ju en kö med väntande instruktioner, så även om front-end är implementerad så att den alternerar (rätt säker på att varken AMDs moduler eller Intels HT fungerar så, rätt säker att de kan i alla fall avkoda från två trådar samma cykel) kan det ändå vara SMT bara man kan "issue" mer än en instruktion och det potentiellt kan vara instruktioner från mer än en CPU-tråd.

Hittar en del presentationer från föreläsningar och liknande, t.ex. denna, och de verkar vara överens med det som står på Wikipedia

There are many ways to support more than one thread within a chip, namely:

  • Interleaved multithreading: Interleaved issue of multiple instructions from different threads, also referred to as temporal multithreading. It can be further divided into fine-grain multithreading or coarse-grain multithreading depending on the frequency of interleaved issues. Fine-grain multithreading—such as in a barrel processor—issues instructions for different threads after every cycle, while coarse-grain multithreading only switches to issue instructions from another thread when the current executing thread causes some long latency events (like page fault etc.). Coarse-grain multithreading is more common for less context switch between threads. For example, Intel's Montecito processor uses coarse-grain multithreading, while Sun's UltraSPARC T1 uses fine-grain multithreading. For those processors that have only one pipeline per core, interleaved multithreading is the only possible way, because it can issue at most one instruction per cycle.

  • Simultaneous multithreading (SMT): Issue multiple instructions from multiple threads in one cycle. The processor must be superscalar to do so.

  • Chip-level multiprocessing (CMP or multicore): integrates two or more processors into one chip, each executing threads independently.

  • Any combination of multithreaded/SMT/CMP.

FGMT är inte SMT, utan vad som här kallas "Interleaved multithreading". Här står faktiskt också att CMP/multicore "each executing threads independently", vilket alltså inte gäller för AMDs moduldesign. Är exakt den definitionen jag skulle välja för en formell definition av "CPU-kärna". Undrar hur pass förankrad texten på Wikipedia är med de definitioner universitet och industrin använder? Kan som sagt inte påminna mig att jag någonsin sett en formell definition av CPU-kärna, men Wikipedia har uppenbarligen en sådan. En fixad "citation needed" skulle vara guld värd på detta!

För SMT är det irrelevant om det finns FPU, L2 eller ens L1$. Men AMD BD är inte "partial SMT", endera är det SMT eller så är det inte SMT och kravet är att minst en av fetch-decode-execute ska delas och så är fallet både för flyttal och heltal i alla BD-designer så de implementerar alla SMT (och alltså inte CMP enligt den definition någon lagt på Wikipedia).

Kön ligger väl ändå i heltalsklustren i BD beroende på vad du syftar på. Agner har väl gått igenom hur decode fungerar på BD för övrigt. Massor andra har också gjort det och publicerat dokument och hållit föreläsningar om det. När du kör två trådar på en modul så kör bara avkodaren varannan cykel per tråd, då avkodaren är ihopkopplad så vis att den bara kan köras tillsammans med ett kluster i taget. Klustren är inte flertrådade. Det är därför de fått egna avkodare i Steamroller/XV. Inte för att det hjälper så våldsamt då det fortfarande är en smal arkitektur. Klustren kan fortfarande inte köra instruktioner från flera trådar samtidigt. Utnyttjandet av pipeline bör därför fortfarande se ut mer som FGMT än SMT.

Det finns arkitekturer som blandar FGMT och SMT i kretsar, Intels EU-arkitektur (IGP) är en sådan.

Permalänk
Medlem
Skrivet av JonatanR:

ojdå, skulle självklart stå 2kärnor o 4 trådar
Men tycker dock fortfarande att det är otroligt fult av nvidia att göra så då nästan alla tänker att i7a är 4C 8T och i5 4C 4T etc etc
och det att du jämför RAM är ändå ddr3 1600/2400 o det kanske är samma, men då borde processorerna heta i3 2,0/2,3/2,6ghz och inte slänga in något helt annat namn innan som bara förvirrar och använder det som ett halvfult försäljningsknep.

Börjar nästan tycka synd om nVidia när dom t.o.m. får skit för Intels namnschema...

Visa signatur

Hata postsorteringen i Ånge.

Permalänk
Medlem
Skrivet av Ratatosk:

Sett tester som visat att en FX8350 är svagare än en 2600K per kärna, men starkare i de fall den kan använda alla sina åtta kärnor.

Om man klockar går 2600k förbi.
FX-8xxx är väldigt prisvärda om du bara gör saker som skalar bra, men Intel är bättre på allt annat. Är man seriös med det man gör så har man ju ändå LGA 2011(-3).

Skrivet av dblade:

Intressant! Kollade upp introduktionspriserna på motsvarande cpu's i dollar:

2700K / $317
3770K / $313
4770K / $339
6700K / $339

Dollarn har dock gått upp med omkring 38% sedan Jan 2011 och priset på CPU har stigit med 7%, vilket borde ge en prisökning på 47%.

2300 * 1.47 = 3381. Det kan också vara så att det ligger en del extra marginaler i mellanhänder?

4790K är faktiskt lite billigare än 3381 kr, bara 6700k som har ett hutlöst pris. Kanske det beror på bristen.

Visa signatur

De köper en bil. Säljaren säljer bilen till dem. Var är du? Vart ska du? Varifrån kom du?