Inlägg

Inlägg som Jones377 har skrivit i forumet
Av Jones377
Citat:

Ursprungligen inskrivet av gosh
Ok, men för att du skall bli trovärdig så vad är din förklaring till att intel själva byter arkitektur till något som nästan är en kopia av AMD (självklart försöker man trimma delarna så mycket som går). För om jag förstår dig rätt så är den typen av arkitektur inte bättre.

Du känner kanske till att nehalem är mycket lik phenom

Du säger även att FSB'n inte är något problem men läser man teknik på andra sajter så beskriver de ofta att den just är det.
Här kan du se hur en sajt förklarar varför det är meningslöst och köpa snabba minnen
The need for an IMC and why the FSB is dead

Nej jag har aldrig sagt att en FSB är bättre än en integrerad minneskontroller. Jag har hela tiden sagt att C2Q presterar bättre än Phenom trots att den inte har en integrerad minneskontroller. Det är ju många andra skillnader mellan de två processorerna som tillsammans gör att C2Q presterar bättre.

När Intel kommer med en integrerad minneskontroller så ökar dom prestandan ytterligare. Vad kan AMD göra för att kontra det? Integrera en till minneskontroller? Tyvärr, det kan man bara göra en gång. AMD får försöka hitta andra lösningar för att öka prestandan, dvs det som Intel redan har gjort i C2Q.

Av Jones377
Citat:

Ursprungligen inskrivet av gosh
En integrerad minneskontroller så som de är gjorda idag fungerar ihop med L3 cachen. Så en C2Q med integrerad minneskontroller hade fått lika "långsamt" cache som en phenom. Det är två stycken olika typer av cache.

Det verkar som du bara tror det är och pussla ihop

ta en titt på denna film för den är mycket bra och handlar dessutom om intel så jag tror stoltheten inte sätter käppar i hjulet på dig där

http://www.intel.com/technology/quickpath/demo/demo.htm

Den handlar om nehalem, en processor som de även skall använda som desktopprocessor och till och med mobilprocessor. Man kan ju fråga sig varför de skall göra det när du säger att dagens processor är så bra.

Jag har ju förrsökt förklara för dig men du argumenterar i cirklar. C2Q presterar bättre än Phenom trots att den inte har en integrerad minneskontroller. Resten kan du läsa ovan igen.

Av Jones377
Citat:

Ursprungligen inskrivet av gosh
?
Tror du det enda som är bättre på AMD är att de har snabbare kommunikation med andra socklar?
Vet du hur snabb intels FSB är? Kolla samtidigt av hur snabbt minne som är meningsfullt och använda, köper man dyra minne så spelar det ingen roll för den klarar ändå inte och dra nytta av dem. Utöver det så kanske man har två snabba grafikkort.

Jämför med vad PCI Express 2.0 x16 klarar och hantera med FSB, även om det är teoretiska prestanda och sällan nyttjas så innebär det ändå en extra belastning som skall samsas med minnestrafiken.

över 250 klockcykler för en HOP vid cachesynklrinisering är rätt seegt det med. är det dessutom kö för att annan trafik skall imellan så kan det säkert bli en hel del tid. I alla fall om man jämför med drygt 40 klockcyler på phenom.

Idag är skillnaden knappt märkbar eftersom få program har behov, men en quad tror jag inte man köper för idag. Är ingen expert på spel, har ändå testat och spela grid en del och den verkar skala mycket bra och fördela arbetet på 4 kärnor.

På tal om PCI-E 2.0 som du harpar om. Jämför 32x PCI-E 2.0 bandbredden med bandbredden du får ut från HT3 Inte för att det har någon betydelse men all kommunikation mellan en Phenom och två stycken SLI/CF kort måste gå via HT3/minneskontrollern vare sig det är DMA texturer från minnet/hårddisken eller data från processorn.

Det är en massa faktorer som påverkar prestandan i slutändan. Integrerad minneskontroller är bara en av dessa. Och bevisligen (se min länk ovan eller läs valfri Phenom review) så räcker inte minneskontrollern för att Phenom ska prestera bättre än C2Q. Om AMD hade designat en bättre kärna (högre IPC och eller högre klockfrekvens) och använt samma minneskontroller så hade kanske situationen sett annorlunda ut.

Vi kan dansa runt teorier hela natten men det är klart att kommunikationen mellan kärnorna över FSBn inte hämmar C2Q särskilt mycket. Se till exempel Cinebench eller 3dsmax där alla 4 kärnorna jobbar med samma rendering vilket betyder att det är mycket kommunikation mellan dem. Just Cinebench är extra intressant eftersom det kan testas med 1 tråd vs flera trådar. Phenom tjänar lite mer på att gå från 1 tråd till 4 trådar men det hjälper inte för totalt sett hamnar ändå Phenom fortfarande efter prestandamässigt. (Q6600 är ju inte Intel's snabbaste quad)

Åter igen, det är en massa faktorer som spelar in på prestandan. C2Q presterar bättre än Phenom trots att den använder en FSB. C2Q med en integrerad minneskontroller skulle prestera ännu bättre än nu och totalt utklassa dagens Phenom, om den inte gör det redan.

Av Jones377
Citat:

Ursprungligen inskrivet av gosh
Repris:
ja när det gäller program som använder lite minne och kan använda intels L2 cache så kommer den fungera bättre. L2 cache är snabbare än L3 cache, det är en enklare typ av cache.

Så fort ett program måste ta hänsyn till situationen så blir det en helt annan sak. en beräkning är en beräkning, man vet om omständigheterna innan. att designa den typen av operation där trådar förändrar minne och läser av minne hos varandra är klantigt, för det tar extra tid även om processorn är gjord för att hantera det.

Den typ av operation är dessutom ovanlig för en användare. vanligare är det med de nya browsrarna, firefox och IE använder sig av trådar och läser mycket minne.
Eller varför inte sätta på flera andra program när man kör en intel quad med beräkningsintesivt program, det gillar den inte.

Jo men desktop program beter sig inte på det viset. Och bara för att ett eller flera program tar upp mycket RAM minne betyder ju inte att det slukar upp en massa minnes bandbredd när det utför beräkningar. Det är två helt skilda saker.

Av Jones377
Citat:

Ursprungligen inskrivet av gosh
det är intressant för det är en typ av programvara som just försöker dra nytta av flera kärnor. det är en typ av programvara som förmodligen kommer dyka upp mer och mer på desktop. att det änsålänge inte finns någon speciell nytta alls med en quad beror på att det inte funnits en marknad och behovet är litet. köper man en quad så gör man det inte för de program som finns idag.

I spel tror jag absolut det kommer komma, säkerligen redan till hösten. Vad jag känner till så är XBOX trekärnig och PS3 är också en variant av flera kärnor, tror även speltillverkare har en del framförhållning och vet om att det kommer än mer kärnor så förmodligen håller man inte igen lika mycket på trådar längre.

Konsollerna styr en hel del vad som dyker upp, tror ingen designar en spelmotor idag som endast går på PC och måste ha en mycket kraftfull dator.

Programvara som drar nytta av flera kärnor på desktopen finns redan och som jag visade i länken ovan så presterar Phenom fortfarande sämre än C2Q trots det. Alla server tester jag har sett har varit med 2 eller 4 socklar. Dessa går inte att härleda till 1 socket desktop datorer eftersom arkitekturen är så olika. En Intel server med 4 socklar har en minneskontroller, en AMD med 4 socklar har 4 minneskontroller.

Med endast en minneskontroller för både Intel och AMD på desktop datorer är AMD's fördel som allra minst och då spelar alla de andra skillnaderna mellan processorerna in mer på prestandan. Tror du att en hypotetisk 486 med integrerad minneskontroller skulle prestera bättre i server tester än en modern Xeon?? Knappast va..

Av Jones377
Citat:

Ursprungligen inskrivet av gosh
Det finns en typ av flertrådiga program som intel quad presterar bättre och det är beräkningsintensiva program som inte skyfflar speciellt mycket minne. varje tråd kan där jobba individuellt eftersom det är en kontrollerad operation, det är lite minne som behöver överföras till och från arbetsminne och intel kan där dra nytta av sin snabba L2 cache.

Sedan att en hel del likställer detta med att intel är mycket snabbare visar bara hur lite man vet om programvara, för man kan ju räkna upp all serverprogramvara och kolla hur prestanda blir då. serverprogramvara brukar just vara en typ av programvara som drar nytta av så många kärnor som möjligt.

tror man fortfarande att intels quad är snabbare så kanske man kan ta sig en funderare på varför de designat om processorn så till nehalem.

Och hur är Phenom och C2Q relevant när det gäller server program? Det är ju knappast intressant för någon här annat än i akademiskt intresse. Det är ju för övrigt ingen som säger att Barcelona är en kass server processor, det är något du målat upp helt på egen hand.

Jag kom ihåg när de första server testerna av Barcelona kom ut förra året och den presterade riktigt bra, typ 20% bättre per klock än Xeon. Genast började vissa tro att denna prestandan skulle hålla i sig även för workstation, spelprogram och så vidare. Så blev det ju inte och dom flesta har accepterat det nu. Så när någon frågar om hur en Phenom står sig mot Q6600 till exempel är det ju inte relevant att dra upp en massa Barcelona server tester!

Av Jones377
Citat:

Ursprungligen inskrivet av gosh
För att Intels Quad är en fyrkärnig processor som fungerar bäst för program som inte använder 4 kärnor Helst skall programmet bara snurra på en kärna.

Frågan är väll med hur mycket de klarar angående trafik med andra delar.

Klarar Intels FSB och leverera till två snabba grafikkort som kör PCI Express 2.0 x16 utan att de får vänta ?

Skall processorn även tugga minne så gör den det inte

http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=3272&p=9

När C2Q presterar bättre än Phenom i flertrådiga program trots sin FSB, vad säger det då om Phenom?

Av Jones377
Citat:

Ursprungligen inskrivet av Thallid
Alltså, vad står det i alla dessa 150 miljoner sidor? Hade jag fått 150 miljoner sidor på mig så skulle jag kunna beskriva universums historia på atomnivå.

Nä men allvarligt, hur kan det finnas så mycket information om detta att man behöver 150 miljoner sidor?

Det är nog en medveten taktik från Intels sida. Typ Chewbacca defence

Av Jones377

Och om ni kommer undra varför hunden ylar hela tiden när datorn är igång...

Av Jones377
Citat:

Ursprungligen inskrivet av Typhonos
Preview av Nehalem på anandtech:
http://www.anandtech.com/cpuchipsets/intel/showdoc.aspx?i=332...

IMPRESSIVE

Av Jones377

Minnerna är alltså 512Megabit eftersom dom säljer minneschip, inte moduler. 16Mx32 betyder att chippen i det här fallet har en databuss 32-bitar bred (8x och 16x är vanligt på DIMM, dvs 8 stycken 8x chip parallellt).

16M*32 = 512Mbit.

De flesta grafikkort har en 256-bit minnesbuss nu för tiden. 8st 32x GDDR5 chip blir 512MB (Byte i det här fallet!) totalt

32bit*8 = 256bit

Av Jones377

Det är lagom nu när "review-hypen" av 9xxx serien har kommit och gått... Det är ganska smart, gör de nya drivrutinerna tillgängliga bara till de nya korten så att de ser ut att vara snabbare än de verkligen är jämfört med förra generationen, trots att de bygger på samma krets G92.

Av Jones377

Re: Re: AMD Bulldozer

Citat:

Ursprungligen inskrivet av Smartidiot89
Så Thread-fusing skulle betyda att 1-trådade program/applikationer/mjukvara (ja vad ni nu vill ) kan använda 4 - 8 trådar på en gång fast dom arbetar som 1? Skulle ju verkligen vara super

Det låter som det tidigare "reverse hyperthreading" ryktet vilket visade sig vara helt påhittat.

Av Jones377
Citat:

Ursprungligen inskrivet av Rovah
Återstår väl att se

http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=3293

Av Jones377

Bulldozer har försvunnit från AMD's senaste roadmap, vilken sträcker sig över hela 2009. Så räkna inte med den förrän tidigast 2010.

Bevis? prova här...

Från Dec 2007
http://download.amd.com/Corporate/MarioRivasDec2007AMDAnalyst...

Jämför med deras tidigare roadmap från Juli 2007
http://www.amd.com/us-en/assets/content_type/DownloadableAsse...

I Juli pratade AMD om "Falcon" som den första Fusion processorn som innehåller Bulldozer och kommer ut 2009. I December så dyker "Swift" upp istället som den första Fusion processorn innehållande "Stars" (Shanghai 45nm variant).

Det finns mer. Det är bara att jämföra de två dokumenten.

Av Jones377
Citat:

Ursprungligen inskrivet av zwelegacy
aha u ersatt med i*r

p=i*r*i

statisk och dynamisk effekt? heh så långt har jag inte kommit i elläran vad innebär det?

Ja man kan kombinera formler sådär.

Statisk och dynamisk effekt har mer med elektronik att göra. En processor drar mer effekt ju högre klockfrekvensen är vilket är allmänt känt.. Det är den dynamiska effekten. Men dessa transistorer som processorn är uppbyggd av "läcker" också ström oberoende av frekvensen, det är den statiska effekten. Väldigt förenklat.

Av Jones377

P = I^2*R
|
|
v
R=P/(I^2)

Edit: ska tilläggas att den riktiga formeln för effekten(P) i en processor är betydligt mer komplicerad. Den innehåller både statisk och dynamisk effekt och är summan av dessa två.

Av Jones377

Här är en review...

http://www.techreport.com/articles.x/13790

Inte så rosande. Det verkar som det gamla rådet gäller. Köp bara ett nvidia moderkort om du ska använda SLI.

Av Jones377

160 megaflops motsvarar väl ungefär en gammal Pentium Pro 166MHz. Jag tror dom kom ut runt 1995.

Av Jones377

Och här är resultaten efter buggfixen...

http://techreport.com/articles.x/13741

edit: såg inte att det redan länkats ovan