Intel Broadwell-K för stationära datorer utrustas med Iris Pro och 128 MB minne

Permalänk
Medlem
Skrivet av rektor:

E-serien, Xeon är för dyra.

I och med Xbox One och PlayStation 4 så satsar alla spelföretag på flerkärnigt.
Dom kommer vilja pressa Xbox One och PlayStation 4 så mycket som går och försöka sträva efter att få det snabbare och snyggare än konkurrenterna och den enkeltrådade prestandan kommer inte räcka till, så då måste dom satsa på flera kärnor.

Så när alla spelstudios går över till spelmotorer med bibliotek optimerade för flerkärniga processorer då vill man inte sitta med en PC på 4 kärnor längre när alla andra plattformar har 8 kärnor.

Men sen får man ju inte glömma att en enkelkärnig processor inte är oförmögen att hantera flera trådar, det var lite det som virtual void försökte resonera kring i inlägget ovan.

Om du har en enkelkärning processor med 100 i kraft så kommer den fyrkärniga med 4x25 aldrig att prestera bättre, även om det körs en applikation som är fyrtrådad. (så länge det inte uppstår flaskhalsar i minnen och schemaläggning m.m.) Däremot så är den fyrkärninga mycket sämre i lägen då en applikation inte kan utnyttja flera kärnor på ett effektivt sätt, och tyvärr så är detta ett relativt vanligt scenario som är svårt att komma ifrån.

Visa signatur

| AMD Phenom II x6 1100T @ 4 GHz || Thermalright ultra 120 eXtreme || Asus Crosshair IV Formula 890FX |
| 8GB Corsair Vengeance LP @ 7-8-8-19 1500 MHz || Asus GTX 560 ti directCUII @ 1000/2300 MHz |
| Adata XPG SX900 512 GB SSD || Corsair HX Series 520W || Antec p182 |

Permalänk
Avstängd

[QUOTE=Yoshman;14111200]Hur ska man på något rimligt sätt skriva en programvara som kräver ett minimalt antal CPU-kärnor???

Om du har två CPUer,

  • en med 2 kärnor där varje kärna kan utföra 2N arbete per tidsenhet

  • en med 4 kärnor där varje kärna kan utföra N arbete per tidsenhet

så finns det överhuvudtaget inget rimligt sätt att strukturera sitt program så att det presterar bättre på maskinen med 4 kärnor. Du kan skriva program som i bästa fall är lika snabbt i båda fallen, men i många fall kommer den första CPUn vara snabbare. Att flytta arbete mellan kärnor är relativt dyrt (undantaget är att flytta mellan två HT som delar L1-cache och är därför nära nog gratis).[/QUOTE]

Man kan läsa in och dekomprimera data som texturer, modeller, ljud, musik, och kartor simultant över flera trådar.

Vet inte om man kan göra rendering, audio processing, AI, fysik, och nätverskommunikation på olika trådar eller om man behöver inter-process communication (IPC) och där kanske latensen blir för hög?

Vet inte om bibliotek som OpenMP, OpenACC, C++ AMP, Cilk Plus, etc lämpar sig för spel.
Spel är ju lite annorlunda då det kräver interaktion och låga latenser, och då funkar inte bakgrundsjobb som kan ta lång tid att få svar från.

Permalänk
Avstängd
Skrivet av Arion:

Men sen får man ju inte glömma att en enkelkärnig processor inte är oförmögen att hantera flera trådar, det var lite det som virtual void försökte resonera kring i inlägget ovan.

Om du har en enkelkärning processor med 100 i kraft så kommer den fyrkärniga med 4x25 aldrig att prestera bättre, även om det körs en applikation som är fyrtrådad. (så länge det inte uppstår flaskhalsar i minnen och schemaläggning m.m.) Däremot så är den fyrkärninga mycket sämre i lägen då en applikation inte kan utnyttja flera kärnor på ett effektivt sätt, och tyvärr så är detta ett relativt vanligt scenario som är svårt att komma ifrån.

Jo men en 8 kärnig processor på 8x25 kan vara snabbare än en enkelkärnig processor med 100 i kraft.

Permalänk
Medlem
Skrivet av rektor:

Jo men en 8 kärnig processor på 8x25 kan vara snabbare än en enkelkärnig processor med 100 i kraft.

Ja absolut, i vissa applikationer som skalar bra med många kärnor. Men det som diskuterades nu var väl "Så när alla spelstudios går över till spelmotorer med bibliotek optimerade för flerkärniga processorer då vill man inte sitta med en PC på 4 kärnor längre när alla andra plattformar har 8 kärnor. " vilket virtual void hävdade att man kanske visst vill. Om de fyra kärnorna har högre total prestanda än de åtta så kommer den åttakärninga aldrig att prestera bättre trots att koden är optimerad för åtta kärnor.

Men visst, en av intels senaste CPU:er med åtta istället för fyra kärnor och lika hög frekvens kommer garanterat fungera lika bra och ibland vara upp emot dubbelt så snabb som den fyrkärninga.

Visa signatur

| AMD Phenom II x6 1100T @ 4 GHz || Thermalright ultra 120 eXtreme || Asus Crosshair IV Formula 890FX |
| 8GB Corsair Vengeance LP @ 7-8-8-19 1500 MHz || Asus GTX 560 ti directCUII @ 1000/2300 MHz |
| Adata XPG SX900 512 GB SSD || Corsair HX Series 520W || Antec p182 |

Permalänk
Datavetare

Exakt, är helt övertygad om att spelstudios kommer utveckla spelmotorer som kan utnyttja alla 6 CPU-kärnor som PS4/XBone har tillgängliga för spel. Men då den teoretiska kapaciteten av 6 Jaguar-kärnor @ 1.6-1.75GHz är lägre än den teoretiska kapaciteten av 2 Core i3-kärnor så kommer det inte betyda att 2/4-kärniga CPUer är passé för spel.

Du nämner OpenMP, Cilk++. Framförallt Cilk+ är extremt effektivt på vad det gör, men det är ramverk som dels lämpar sig mest för beräkningsintensiva program, svårt att se hur spel skulle kunna använda dessa ramverk dock. Men även med dessa verktyg så har man en "overhead" som ökar ju flera CPU-kärnor man har, så i fallet 6 Jaguar-kärnor mot 2 i3-kärnor så skulle den senare alltid vara snabbare då den har mindre "overhead" men i detta fall har den även mer total kapacitet.

@Arion: du har helt rätt i att trådar kan användas även på enkelkärninga CPUer, kan i vissa fall minska genomsnittlig latens (om det är ett mål). Men normalt sett använder man inte trådar direkt när man gör ramverk som ska automatiskt skala med CPU-kärnor, man använder sig av någon form av "work-stealing" vilket är den teknik som t.ex. OpenMP/Cilk+ använder sig av (vilket också är anledningen till varför dessa ramverk passar illa i spel då de två "work-stealing schedulers" man då får skulle vara i vägen för varandra).

Grundtanken med "work-stealing" är att undvika att flytta arbete mellan CPU-kärnor så länge som alla kärnor har något att göra. Anledning är naturligtvis att migrering av data mellan kärnor är dyrt så det gör man så lite som möjligt. När en CPU-kärna får slut på jobb så "stjäl" den jobb från någon annan kärna, i detta läge stjäl man typiskt hälften av köade jobb från den CPU-kärna som för tillfället har mest att göra. Man vill stjäla flera jobb då stor del av kostnaden är en engångskostnad som inte beror på antalet jobb man flyttar.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

En annan inressant grej att läsa om när man snackar om prestanda med flera kärnor är ju Amdahls lag. Då väldigt få laster är 100 % parallella så når man en gräns då ytterliggare processorkärnor inte tillför något, vilket lätt kan förstås genom att läsa ingressen, bildtexten samt att titta på bilden i denna wikipediartikel:

http://en.wikipedia.org/wiki/Amdahl%27s_law

Visa signatur

| AMD Phenom II x6 1100T @ 4 GHz || Thermalright ultra 120 eXtreme || Asus Crosshair IV Formula 890FX |
| 8GB Corsair Vengeance LP @ 7-8-8-19 1500 MHz || Asus GTX 560 ti directCUII @ 1000/2300 MHz |
| Adata XPG SX900 512 GB SSD || Corsair HX Series 520W || Antec p182 |

Permalänk
Medlem
Skrivet av Arion:

Men sen får man ju inte glömma att en enkelkärnig processor inte är oförmögen att hantera flera trådar, det var lite det som virtual void försökte resonera kring i inlägget ovan.

Om du har en enkelkärning processor med 100 i kraft så kommer den fyrkärniga med 4x25 aldrig att prestera bättre, även om det körs en applikation som är fyrtrådad. (så länge det inte uppstår flaskhalsar i minnen och schemaläggning m.m.) Däremot så är den fyrkärninga mycket sämre i lägen då en applikation inte kan utnyttja flera kärnor på ett effektivt sätt, och tyvärr så är detta ett relativt vanligt scenario som är svårt att komma ifrån.

Allt det där är helt riktigt, men om man nu antar att varje enkild kärna i en 8 core cpu är lika sark som en stark single, dual, quad core cpu, så kommer det under optimala förhållanden innebär en mindre eller större förbättring.

I vissa nya spel och program kan man enkelt se det med AMD FX 8 core jämte dito med 4 core cpu, AMD nackdel är lite att dessa cpu är svagare än Intels cpu, per kärna.

Om man nu antar att varje kärna är lika stark i en Intel 8 core cpu som i en dito 4 core cpu så blir det en förbättring bara spel och program kan stödja multicore och det stödet finns i fler och fler spel och program, och kommer troligen bli mer vanligt under 2014/2015, det är ett faktum att dagens moderna spelmotorer utvecklas med sikte på bra multicore stöd.

Tror också att det är den vägen man får gå för att få ut mer prestanda ur CPUer, märks ganska väl att prestandalyftet från generation till generation blir allt mindre idag, dvs taket med nuvarande teknik kan inte höjas mer än få % med nya generationer.

Visst kommer det innebära en markant höjning av TDP, men dom som är intresserade av lite kraftfullare gamingsystem bryr sig knappast över det i en stationär dator, dessa bryr sig heller inte över hur bra eller dålig dess grafikdel är.

Klar man kan gå på ett 2011 system, men priserna på dessa sätter effektivt stop för detta, för dom flesta.

Visa signatur

Acer Predator Helios 300

Permalänk
Datavetare
Skrivet av ggustavsson:

Om man nu antar att varje kärna är lika stark i en Intel 8 core cpu som i en dito 4 core cpu så blir det en förbättring bara spel och program kan stödja multicore och det stödet finns i fler och fler spel och program, och kommer troligen bli mer vanligt under 2014/2015, det är ett faktum att dagens moderna spelmotorer utvecklas med sikte på bra multicore stöd.

Fast det är inte fallet (varje kärna lika stark) ens om man bara jämför Intel CPUer på samma µarch. Man måste skala tillbaka frekvensen så fort man vill ha flera CPU-kärnor eller höja TDP. När man kommer upp till 8 CPU-kärnor så räcker inte ens en TDP på 150W för att matcha frekvensen av t.ex. i7-4770.

Om man inte vill gå över den TDP som i7-4770 har så kan man öka den totala mängden arbete som kan utföras sett över alla CPU-kärnor (då strömförbrukningen i praktiken ökar snabbare än linjärt med ökad frekvens), men man får göra det på bekostnad av enkeltrådprestanda. I genomsnitt kommer man i de flesta fall då får en minskning av prestanda givet hur de flesta program är utvecklade och givet att vissa problem helt enkelt inte kan utnyttja många kärnor på ett effektivt sätt.

För rätt typ av problem är naturligtvis en 8-kärnors CPU att fördra över en högre klockat CPU med färre kärnor, men i praktiken finner man nästan alltid dessa problem i servers eller HPC, inte på skrivbordet. Och visst kan man tycka att E-serien/Xeons är dyra, men om man tillhör gruppen som verkligen har nytta av mer än 4 CPU-kärnor idag så måste man inse att man är en extrem minoritet.

Att gå från 1 till 2 kärnor gick väldigt fort för det är en vinst direkt då det man har i förgrunden kan få en "egen" kärna och erbjuda maximal enkeltrådprestanda medan övriga uppgifter kör i bakgrunden på den andra kärnan. Man gick sedan ganska snabbt från 2 till 4 och planerade initialt att ungefär dubbla antal kärnor som man tidigare dubblade frekvens. Men tror de flesta märkte att övergången från 2->4 kärnor inte alls gav samma effekt som 1->2, vilket är anledningen till varför trycket på än mer kärnor är extremt litet.

På laptop-sidan (som är den största delen av PC-marknaden idag) är ju normen fortfarande en 2-kärnig CPU, de 4-kärniga är nästa uteslutande i "proffssegmentet" med prislapp därefter.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Trixtr:

Bättre att låta datorn switcha mellan inbyggt och extern gpu. Behöver ju inte kraften av extern gpu när man surfar eller annat simpelt.

Skickades från m.sweclockers.com

Kan en stationär göra det utan att man måste flytta kablar? :S

Skrivet av sesam2k:

Kan inte Intel göra precis som AMD och kalla en APU för en APU och inte en CPU. Grrr...
Integrerad grafik är väl trevligt, men om man inte är intresserad av den då vill jag heller inte betala för den. När ska Intel släppa prollar utan integrerad grafik (förutom Xeon då)?

Det gör de väl, de brukar märkas Sandy Bridge-E, Ivy Bridge-E osv. Däremot skulle jag också vilja ha fler "mainstream" modeller som i5 och i7 utan IGP.

Visa signatur

No man is free who is not master of himself

Permalänk
Medlem
Skrivet av Luminous:

Det gör de väl, de brukar märkas Sandy Bridge-E, Ivy Bridge-E osv. Däremot skulle jag också vilja ha fler "mainstream" modeller som i5 och i7 utan IGP.

Grejen är ju att det är dyrare att tillverka en ny rad likadana cpu's utan IGP än att helt enkelt sälja de med IGP till folk som inte behöver dom. Med andra ord så skulle man få betala mer för en likadan cpu utan IGP än för en med. Därför väljer dom att inte ha en separat line utan IGP. Däremot finns det ju exemplar där IGP inte funkar och då säljer man dom med ändelsen P, men det verkar dom bara ha gjort med ivy och sandy, inte haswell.

Visa signatur

| Fractal Design XL R2| 2x Gigabyte 680 Gtx@1254/7300mhz | Asrock Z77 OC Formula | 3570k@4.5ghz(1.36v) & Phanteks PH-TC14PE | 16gig hyperx beast series@2133mhz | Fractal Design Newton R2, 1000W 80+ | Samsung SSD Basic 840-Series 512GB | 2TB Toshiba 7200rpm SATA6 | 9x Scythe Glide Stream 2000rpm | 2x Bitfenix Recon Fan Controller | BenQ 27'' XL2720T 120Hz + Dell UltraSharp 27" U2713HM IPS 2560x1440 | Sennheiser HD595

Permalänk
Medlem
Skrivet av elklazor:

Coolt, trodde dock att det var 128 mb i L3 först

Haha jag med! Tappade hakan

Visa signatur

| 4770K @stock | Corsair 2x8GB @1600MHz | Gigabyte 680 OC | Corsair 850W TX | Gigabyte GA-Z87X-UD3H | Samsung 830 120GB | WD 1TB 5200RPM | WD 500GB 7200RPM |

Permalänk
Medlem

Trevligt att fler av deras processorer får kommer med 128MB eDRAM, för er som gnäller över att det är för grafikdelen, även CPUn ska kunna använda detta minnet.