Inlägg

Inlägg som Jones377 har skrivit i forumet
Av Jones377

SSE4 består av 54 nya instruktioner. Penryn implementerar 47 stycken av dessa i vilket Intel kallar SSE4.1. De sista 7 kommer med Nehalem. AMD implementerar 4 stycken nya instruktioner som dom kallar SSE4a.

Jag tror DivX 6.6 använder fler än AMDs 4 instruktioner för att boosta Penryn.

http://download.intel.com/technology/architecture/new-instruc...
http://www.xbitlabs.com/articles/cpu/display/amd-k10_10.html

Av Jones377

Det finns egentligen ingen anledning att köpa P965 längre då P35 är dess ersättare i mellansegmentet. P35 presterar lite bättre (<5%) än P965 samt som du säger har officiellt stöd för 1333MHz FSB. Alla P35 moderkort kommer också att stödja Wolfdale/Yorkfield (45nm processorer).

Av Jones377
Citat:

Ursprungligen inskrivet av ilg@dd
Jo, och AMD går ut och blåljuger i pressreleasen antar jag..
Mycker spekulationer här, men jag litar nog lite mer på AMD's pressreleaser än en för mej okänd debattör på Swec..

Ingenting i AMDs pressrelease utesluter att det i själva verket är en quadcore med en kärna avstängd. Sen om det är pga att en kärna är skadad eller ej är en annan sak.

Av Jones377
Citat:

Ursprungligen inskrivet av ilg@dd
Som till exempel?

Hur svårt skulle det vara att placera kärnorna t.ex så här:
http://www.gunnarsson.biz/news/ren_spekulation.JPG

Inte svårt alls, det tar bara ca 2-3 år och massor av $$ att utveckla.

Av Jones377

Ack! Jag har dock fortfarande sidan uppe. Här är numren:

Cloverton X5365 3GHz

3Dmark06 CPU - 5873
Sandra64 CPU - 87348
Sandra64 FPU - 73098
Sandra64 MMint - 645550
Sandra64 MMfp - 463483
Sandra64 memInt - 4291
Sandra64 memFP - 4298
Sandra64 memlat - 118 ns
Povray 3.7 1CPU - 586
Povray 3.7 8CPU - 4448

Harpertown X5472 3GHz

3Dmark06 CPU - 6890
Sandra64 CPU - 100398
Sandra64 FPU - 81289
Sandra64 MMint - 653866
Sandra64 MMfp - 508850
Sandra64 memInt - 9092
Sandra64 memFP - 9087
Sandra64 memlat - 109 ns

Povray 3.7 1CPU - 623
Povray 3.7 8CPU - 4667

Av Jones377

Harpertown (45nm Xeon) testad

http://www.theinquirer.net/?article=42423

Ganska dåligt urval av tester men en står ut jämfört med dom andra. Minnesbandbredden har förbättrats rejält, över 100%, tack vare det nya Seaburg chipsetet. Det är inte riktigt i klass med vad en dual Barcelona klarar av men bra mycket närmare än det var varit tidigare.

Av Jones377
Citat:

Ursprungligen inskrivet av ilg@dd
Och källa som bekräftar detta??

Det finns rapporterat på massor av sajter.

Av Jones377
Citat:

Ursprungligen inskrivet av Scheimpflug
Skulle det inte kunna vara 4-kärniga processorer där en kärna är trasig och därför inaktiverad?

Det är precis så det är.

Av Jones377

Hur skulle en Penryn prestera med en integrerad minneskontroller? Svaret får vi när Nehalem kommer ut om ett år ungefär...

Av Jones377
Citat:

Ursprungligen inskrivet av Aircut64
Därför att AMD satsar mkt på budget numera.

Det är inget medvetet val som AMD tagit. Dom har blivit tvingade att sänka priserna för att deras produkter presterar sämre än Intel's för närvarande.

Av Jones377

raderat

Av Jones377
Citat:

Ursprungligen inskrivet av zwelegacy
men är det inte så att desto högre upplösning desto mindre roll spelar processorn i testerna?

Precis, vilket gör det troligt att Penryn presterar mer än 0.4% bättre än Conroe i den lägre upplösningen.

Av Jones377
Citat:

Ursprungligen inskrivet av 2good4you
Det skall eventuellt komma en ännu uppdaterad variant som sagt då det fortfarande stryper processorn. Minneskontrollern och L3 cachen på K10 processorer går i samma frekvens och denna går att ställa separat och behöver ökas i hastighet. Detta är ju något som automatiskt blir bättre när processorn kommer upp i frekvens också.

Självklart kommer L3/minneskontrollern att köras snabbare varje gång AMD släpper en *snabbare* processor. K8 har ingen L3 cache men minneskontrollern på den körs i processorhastigheten, vilket betyder att K8 får en boost när frekvensen går upp. Om inte K10 kommer att få det så kommer den att skala sämre än K8. Att öka frekvensen på L3/minneskontrollern i takt med (eller nära nog) CPU frekvensen är ett måste!

Annars blir det som den gamla K7 med extern L2 cache. När den kom ut kördes L2 i halva CPU frekvensen men i takt med att CPU frekvensen ökade så saktades L2 frekvensen ner relativt sett (men inte absolut sett) till 2/5 och till sist 1/3 av CPU frekvensen vid 1GHz. Det fick en negativ effekt på prestandan. Som tur var var den ändå snabb nog att slå P3 på den tiden.

Förvänta dig inte något mirakel när Phenom kommer ut i högre frekvenser....

Av Jones377
Citat:

Ursprungligen inskrivet av kabanan
Jag är mer imponerad av Barcelona än Penryn, se bara på Anandtech´s tester... 16% bättre på oblivion än K8 vid samma klockfrekvens.
Penryn klarade väl bara ca 0.4% bättre än Conroe vid samma klockfrekvens.
Det tycker åtminstone jag är bra gjort av AMD.

Grejen är att Conroe redan är mycket snabbare än K8 i Oblivion. Sen får man akta sig för att jämföra tester som körs i olika upplösningar. Anandtech testade spelen i 1600*1200 i sin Penryn artikel men körde i 1024*768 med Barca.

Av Jones377
Citat:

Ursprungligen inskrivet av 2good4you
Skulle tro att Shanghai kommer att fungera på nuvarande SocketAM2 också vilket är riktigt trevligt.

Sen ser man ju hälften av tråden som sitter med Core2 processorer. Core2 var absolut inte lika bra när den kom som nu. Det är en ny arkitektur, den kör DDR2-667, lägre L3 cache hastigheter, lägre hastighet på minneskontrollern, Hypertranport 2.0 istället för 3.0 och sist men inte minst riktigt låg frekvens. Också sagt är att programutvecklare har nog säkert möjlighet att optimera program bättre i en senare version till K10.

Vänta och se ett litet tag innan ni kastar er ur en massa nonsens. Processorn är lanserad och kommer sälja stort på servermarknaden och som jag skrev i tidigare inlägg så verkar det komma en rev rätt fort där man fixat flaskhalsen på L3 cache/minneskontrollern.

Den revisionen som fixar minneskontrollern är den som släpps *nu*. De tidigare läckta prestandatesterna från Maj och i somras kördes med den gamla revisionen. Anledningen att Barcelona har högre latenser till minnet är pga L3 cachen. En läsning från RAM minnet föregås av en L1 cachemiss, L2 cachemiss och nu ytterligare en L3 cachemiss. Barcelona får ut markant mycket högre bandbredd ur samma DDR2 667 REG/ECC moduler än den gamla Opteron. Den tidigare revisionen från i somras hade en bugg som strypte minneskontrollern rätt rejält.

Kom ihåg den första P4 Extreme Edition CPUn som hade 512KB L2 + 2MB L3 cache. Jag tror kärnan hette Gallatin och användes tidigare i XeonMP modellerna på 0.13 noden. Den hade också något högre minneslatenser pga L3-cachen.

Av Jones377

Alltså, minneshastigheten är låst till FSB hastigheten med en multipel som du kan ändra. P35 stöder FSB i hastigheterna 800, 1066 och 1333 samt DDR2 533, 667 och 800 i alla tänkbara kombinationer emellan.

Det du kan göra är att klocka ner minnet till 533MHz innan du överklockar FSBn över 1333MHz. Så länge du inte ökar FSB med mer än 25% (till 1666MHz) så kommer minnet att köras inom specifierad hastighet.

Tyvärr kan man inte ändra minneshastigheten i 1MHz steg oberoende från FSB hastigheten.

Av Jones377
Citat:

Ursprungligen inskrivet av Palme_570
inget att lita på då amd har kommit med dessa siffror

Man kan jämföra AMDs prestandasiffror med redan publicerade siffror i SPECFP_rate2006. Här är en Intel Xeon processor E5345, 2.33 GHz som enligt Dell presterar 55.0. Det finns flera andra resultat för E5345 publicerade från olika företag, inklusive Intel själva. Alla runt eller strax under 60. Jag tror inte AMD ljuger i det här fallet.

http://www.spec.org/cpu2006/results/res2007q2/cpu2006-2007040...

---

Mer Barcelona siffror, från IBM.

ftp://ftp.software.ibm.com/eserver/benchmarks/news/newsblurb_...

1.9GHz Barcelona i en IBM server.
SPECint2006 ungefär som en E4300 1.8GHz
SPECfp2006 ungefär som en E6300 1.86GHz

SPEC_rate betydligt bättre, speciellt fp.

Av Jones377

fudzilla....

Av Jones377
Citat:

Ursprungligen inskrivet av m0rk
risc

VLIW, faktiskt.

edit: Det verkar vara någon slags hybrid mellan RISC och VLIW. Mer info här: http://www.itjungle.com/tlb/tlb082107-story02.html

Av Jones377

Jag tror poängen är att man köper en billig (mindre dyr) Phenom X4 och klockar den till 3GHz istället för att köpa en Phenom FX 3GHz och försöka klocka den ytterligare.

Inlägg redigerat av GAPa. Innehåll som inte hade med trådens innehåll att göra borttaget.