Hjälp mig förstå MHz på GPUs. Betydelse?

Permalänk
Medlem

Hjälp mig förstå MHz på GPUs. Betydelse?

Hej!

Har möjligheten att köpa en dator med 2080 ti i och blev såklart sugen på att kolla upp komponenterna. Jag märkte en sak som jag inte fattar.
Hur kommer det sig att ett 2080 super kan boosta till 1800+ men sen när jag ser på ett 2080 ti, så ligger den modellen på 1665 MHz. Varför? Borde inte varje nyare modell ge mer? vad är det utöver MHz som gör att ett 2080 ti är snabbare än ett super utan att RTX läget är på?

Jag ser själv såklart att 2080 ti har betydligt med CUDA kärnor men vad innebär det? Har inte också 2080 super 15000 i minneshastighet vs 14000?

Helt enkelt. Vad är det som gör ett nyare grafikkort bättre än det äldre?

Tack för att ni hjälper mig förstå

Visa signatur

Dator: i7 9700k @ 5.0 Ghz - Asus Rog Strix OC 2080 Super
3600mhz 32gb - Gigabyte UD Z390 - Dark Rock Pro 4 - M.2 SSD MP510

Kringutrustning: Xiaomi 34" 3440x1440 - Xtrfy K4 - Glorious 0 Mus
Ljud: DT770 80ohm Headset - E10K DAC/AMP

Permalänk
Medlem

Det finns flera saker som påverkar ett grafikkorts prestanda, som du nämner så är klockfrekvenser för både GPU och minnet en viktig del av ekvationen och även antalet CUDA kärnor där fler CUDA kärnor ger mer beräkningskraft. Sen kommer förstås tillverkningsprocessen fram i ekvationen, en nyare och mindre tillverkningsnod ger oftast mer prestanda vid en given kretsyta då transistorerna är mindre. Allt eftersom tillverkningsprocessen minskar så kan tillverkarna tillverka välja att utnyttja minskningen antingen genom att sänka strömförbrukningen på ett grafikkort eller helt enkelt skala upp antalet kärnor. Jag kan rekommenderas att du tittar på hur Moores lag fungerar för att se ungefär hur antalet transistorer på en given kretsyta ökar under tid, även fast Moores lag i dagens fall inte stämmer lika bra som den gjort tidigare pga. fysikens lagar.

Du är på rätt väg när du talar om CUDA kärnorna och det är där som 2080 Ti vinner i detta fallet, 2080 Ti har flera CUDA kärnor, alltså flera kärnor som kan utföra beräkningar. Så den högre klockfrekvensen hos 2080 kan inte mäta sig med 2080 Ti:s flera CUDA kärnor.

Visa signatur

Processor: R5 2600 Moderkort: X470-F Gaming Grafikkort: Nvidia 3080 FE Ram: Trident Z Neo 16gb Nätaggregat: CM 850V Chassi: FD Meshify C Lagring: Corsair MP510 1TB, Crucial MX300 750gb

Permalänk
Medlem

Stirra dig inte blind på frekvensen. I praktiken klockar alla Turing-kort (i alla fall de A-binnade) automatiskt upp till samma maxfrekvenser om de har samma kylning och strömförsörjning. Siffran i produktinformationen betyder alltså i princip inget alls. Jag förstår inte varför de envisas med att skriva ut sånt, när det är så missvisande.

2080 Ti har sånt övertag i CUDA-kärnor och minne att ett 2080 Super är ganska långt bakom, oavsett modell av grafikkort. Det sämsta, icke-OC-2080 Ti är markant bättre än det bästa 2080 Super som finns på marknaden.

Visa signatur

Moderkort: Gigabyte X570 Aorus Master | CPU: AMD Ryzen R9 5900X | CPU-kylare: Noctua NH-D15 chromax.black | RAM: Corsair Vengeance LPX 64 GB (4x16) DDR4-3600 CL18 | GPU: Gigabyte RTX 4080 Eagle OC | SSD: 2 x Samsung 970 EVO Plus 1 TB NVMe + Kingston A400 480 GB + Samsung QVO860 1 TB | PSU: EVGA SuperNOVA G2 1000 W Gold | Chassi: Lian Li O11 Dynamic XL | Skärm: BenQ PD3200U @ 3840x2160 + ASUS ROG Strix XG32VQ @ 2560x1440 | Tangentbord: Corsair K68 RGB Cherry MX Red | Mus: Logitech MX Master 2S

Permalänk
Festpilot 2020, Antiallo
Skrivet av KlyfftPotatis:

Hej!

Har möjligheten att köpa en dator med 2080 ti i och blev såklart sugen på att kolla upp komponenterna. Jag märkte en sak som jag inte fattar.
Hur kommer det sig att ett 2080 super kan boosta till 1800+ men sen när jag ser på ett 2080 ti, så ligger den modellen på 1665 MHz. Varför? Borde inte varje nyare modell ge mer? vad är det utöver MHz som gör att ett 2080 ti är snabbare än ett super utan att RTX läget är på?

Jag ser själv såklart att 2080 ti har betydligt med CUDA kärnor men vad innebär det? Har inte också 2080 super 15000 i minneshastighet vs 14000?

Helt enkelt. Vad är det som gör ett nyare grafikkort bättre än det äldre?

Tack för att ni hjälper mig förstå

Frekvensen är egentligen bara en frekvens. Den säger ingenting utan övrig information.

Ponera att varje kärna (Cuda core) kan genomföra en uppgift per klockcykel. Då är det bara att multiplicera antalet kärnor med klockcykler för att få fram ett värde på teoretisk beräkningskraft. Detta är högst teoretiskt då det inte tar hänsyn till problem med schemaläggning av arbetsuppgifter, begränsningar i minnesbandbredd, latenser, att många operationer tar fler än en klockcykel att genomföra etc etc.

Detta är dessutom bara genomförbart mellan två kretsar med samma arkitektur. Du kan inte jämföra en Cuda-kärna mot en AMD Stream-processor. Inte ens två Nvidiakort går att jämföra på rak arm om de är från olika arkitekturer.

Där kommer prestanda per klockcykel in i bilden (IPC). Högre IPC innebär högre beräkningsförmåga per klockcykel och kärna. Detta värde går lättare att jämföra men det finns fallgropar, t ex kan en arkitektur vinna i heltalsberäkningar men vara mycket långsammare i flyttal.

När det kommer till maximal hastighet på Super vs 2080 Ti.
2080 Ti är en större krets och troligen är det svårare att leverera ström internt i kretsen, även säkerställa kvalité och det man kallar "process corner", i vissa fall rapporteras detta delvis som "Asic Quality" vilket motsvarar vilket strömläckage kretsen har. Kort och gott, större krets är svårare att få upp i höga frekvenser.

2080 Super är dessutom en mer raffinerad serie, där Nvidia har fått chansen att finslipa lite på tillverkningsprocessen och bena ut lite av de problem som tidigare fanns. Således pressas frekvensen upp ytterligare något.

Minnesfrekvens, bandbredd, hastighet mm säger inte så mycket om det inte är minnesbegränsad prestanda. I detta fallet lär nog 2080 ti såklart må bra av snabbare minne, men inget som kommer göra att 2080 Super vinner med sitt snabbare minne. Det är många andra faktorer som spelar roll.

Bästa tipset jag har är nog att faktiskt kolla på recensioner och tester på just det du vill göra med korten och jämföra den relativa prestandan. Att sitta och räkna på teoretisk hastighet ger sälla några tillförlitliga resultat.

Skrivet av Trizones:

Det finns flera saker som påverkar ett grafikkorts prestanda, som du nämner så är klockfrekvenser för både GPU och minnet en viktig del av ekvationen och även antalet CUDA kärnor där fler CUDA kärnor ger mer beräkningskraft. Sen kommer förstås tillverkningsprocessen fram i ekvationen, en nyare och mindre tillverkningsnod ger oftast mer prestanda vid en given kretsyta då transistorerna är mindre.

Förtydligar detta något. En transistor ger inte högre beräkningskraft för att den har en mindre tillverkningsnod utan för att den antingen:
Går att köra med en högre frekvens.
Fler transistorer går att packa i kretsen och köras samtidigt (kopplat både till area och energiåtgång)

Att bygga två kretsar med samma arkitektur på olika tillverkningsnoder kommer ge samma prestanda vid samma frekvens.

Visa signatur

 | PM:a Moderatorerna | Kontaktformuläret | Geeks Discord |
Testpilot, Skribent, Moderator & Geeks Gaming Huvudadmin

Permalänk
Medlem

För att utveckla svaren ovan så har 2080 Super 3072 st. kärnor medan 2080 Ti har 4352 st. Ti har alltså 42% fler kärnor jämfört med Super, medan Super har 17% högre boostfrekvens (i stock, d.v.s. 1815 vs 1545 MHz).

Permalänk
Medlem

För att förtydliga lite. Mitt 2080 Ti är Palit GamingPro OC. På Palits sida står det följande:
Graphics Clock 1350 MHz
Boost Clock 1650 MHz

Men i praktiken ser jag aldrig under 1800 under några som helst omständigheter när grafikkortet jobbar, och i benchmarks är det som regel en inledande topp på uppåt 2100, för att sen sjunka till lite drygt 1900. Det säger en del om hur meningslösa specifikationerna är när det gäller frekvens.

Visa signatur

Moderkort: Gigabyte X570 Aorus Master | CPU: AMD Ryzen R9 5900X | CPU-kylare: Noctua NH-D15 chromax.black | RAM: Corsair Vengeance LPX 64 GB (4x16) DDR4-3600 CL18 | GPU: Gigabyte RTX 4080 Eagle OC | SSD: 2 x Samsung 970 EVO Plus 1 TB NVMe + Kingston A400 480 GB + Samsung QVO860 1 TB | PSU: EVGA SuperNOVA G2 1000 W Gold | Chassi: Lian Li O11 Dynamic XL | Skärm: BenQ PD3200U @ 3840x2160 + ASUS ROG Strix XG32VQ @ 2560x1440 | Tangentbord: Corsair K68 RGB Cherry MX Red | Mus: Logitech MX Master 2S

Permalänk
Medlem

Otroligt tack för så väl uförda svar ❤

Skickades från m.sweclockers.com

Visa signatur

Dator: i7 9700k @ 5.0 Ghz - Asus Rog Strix OC 2080 Super
3600mhz 32gb - Gigabyte UD Z390 - Dark Rock Pro 4 - M.2 SSD MP510

Kringutrustning: Xiaomi 34" 3440x1440 - Xtrfy K4 - Glorious 0 Mus
Ljud: DT770 80ohm Headset - E10K DAC/AMP

Permalänk

Detta med frekvenser är egentligen lite luddigt numera. där finns ofta en basfrekvens som är den minsta frekvens ett kort kan hålla och somk tillverkaren garanterar.

Sen finns där en "boost" det är en frekvens som också är utlovad men gäller inte för alla förhållanden.

allt över den specade boosten är en bonus, det är inget som garanteras och inget man heller ska förvänta sig.

Vill minnas att boost frekvensen är en target som kan överskridas ifall man inte slår i några tak(spänning, ström och temperatur)

Vi tar ett random nvidia kort, som har ett power tak på 250W, en boost frekvens på 1600mhz och en max volt på 1.2

Har det kortet en hyfsad eftermarknads kylare och kortet ligger på 50 grader under spel och med en effekt åtgång på 180W på 1.0 volt så tillåts kortet att fortsätta klocka upp sig.

Så det kanske går upp till 1900Mhz på 1.15v och 250W och kortet håller 75 grader.

Då har man nått taket för ström åtgång t.ex. men i och med kortet inte drar mer än det får, och tempsen är under kontroll och spänningen inte ligger på en skadlig nivå så är det extra prestanda.

Med AMD kort är lite annorlunda. där finns en bas frekvens, en uppskattad boost(ungefär där kortet bör ligga i.e "Game Boost") och en teoretisk max.

dvs står alla planeter på led och kylpastan är välsignad av gud etc så kan man nå dom frekvenserna.

lite som nvidias frekvenser men nvidia specar inte dom. Spelar egentligen ingen roll för vanliga konsumenter då alla kort klockar olika och alla kort kommer boosta olika, så det kan skilja sig i beteende.

Det är antagligen varför nvidia inte heller specificerar "max".

Sen så kan mindre transistorer ge mer prestanda, inte för att dom ger mer prestanda per transistor, men för att ström åtgången sjunker, dvs tar vi mitt exempel igen:

samma kort i 1900Mhz på 1.15v och 250W vid 75 grader.

Effektivare nod hade gjort att det kortet gått ner till 225W. så man slänger på lite volt så den hoppar upp till 1.17v och man slår i 250W taket igen, denna gången ligger kortet på 80 grader, då vi kör mer spänning genom det.

I och med transistorerna är mer effektiva så slår vi inte i effekt taket lika tidigt som innan.

----

Minnes frekvenser är lite luddigt att gå igenom, minnet har en frekvens, sen har du en minnes buss.

Se det lite som en motor väg. Minnes hastigheten är hur fort man får köra och minnets bussbredd är hur många filer där finns på vägen.

ett kort med en frekvens på 1000Mhz och 256bitar har lika mycket total bandbredd som ett kort med 512 bitars buss och 500Mhz.

ena är en motor väg med två filer och man kan köra 100KM/h och den andra är en 4 med fyra filer och man kan bara köra 50KM/h

du får fram lika många lastbilar med gods efter en timme då man kan köra dubbelt så många lastbilar typ
(jag vet att denna analogin är lite dålig men jag vet inte hur man skall beskriva den bättre)

med två snabba filer blir det ju lättare köer ifall man gör mycket, men är den inte sjukt trafikerad går det ju fortare.

Men där finns lösningar på den trafikerade biten, nvidia och amd respektive har hittat på en manick som gör att man kan lasta mer på lastbilarna utan att dom blir för tunga och man får böter.

Vilket kallas minnes komprimering, man använder sig av algoritmer och andra små trick för att få plats med mer grejer i minnet pretty much.

Så att stirra sig blind på minnes frekvenser mellan generationer samt hur många bitar bussen är på, är inte helt solklart då både nvidia och amd jobbar på sina minnes komprimerings tekniker hela tiden.

Ett kort med 256 bitar minnes buss och 1000MHz kan vara lika snabbt som deras nya kort som också har 1000MHz minne men istället har en 192 bitars buss. Men oftast brukar det bli att dom har kvar 256 bitars buss och 1000Mhz och då får extra prestanda fast det kanske inte riktigt syns i produkt bladet.
(ifall där inte kommer ut något nytt som t.ex GDDR6 som det gjort nu)

Nu är detta inte helt exakt, jag tog bara lite siffror för att förklara på ett ungefär.

----

När det sen kommer till beräknings enheter så är det också lite luddigt, man kan inte jämföra AMD och Nvidias "kärnor"(Cuda cores, streampipes, shader cores etc, kärt barn har många namn)

Och oftast kan man inte ens jämföra mellan generationer. Enklaste sättet är att jämföra dom som processorns kärnor.

Det stämmer inte heller helt men ger en indikation till hur bra kortet är om man jämför t.ex mellan 2070 och 2080ti. Det första man kollar efter är hur många shaders kortet har, sen hur bred minnes buss.

Minnes frekvenserna brukar oftast ligga så långt som det går på alla korten. Likaså brukar nvidias kort boosta så mycket dom kan innan man går utanför vad tillverkarna garanterar så korten kommer rulla ungefär lika ifall man köper ett bra kort. Det brukar inte variera sjukt mycket.

Det är som jag pratade om längre upp vilka temperaturer man har osv. har man en dator låda som är ganska instängd för att få ner ljudnivån så har man gjort en trade-off, lägre ljudnivå mot lägre klockfrekvens.

ett kluster med AMDs GCN till exempel är i par om 64 Shaders, och vill minnas att dom har 4xGeometri enheter 4xTMU enheter och 1xRaster enhet per cluster.

ett RX 570 har 32 stycken så vi gör matten: 32x64 shaders: 2048, 32x4 Textur enheter är 128 textur enheter samt 32 raster enheter.

(nu vet jag inte ifall det är 4 geometri enheter totalt, eller det är per cluster/"Grafikkärna", som det finns 32 av)

Men nu snöar vi in på områden som vi egentligen på behöver gå in på(och som jag inte heller är särskilt bra på )

Men ungefär samma gäller för nvidia, men som en regel mellan tummen och pekfingret så är mer bättre ifall man jämför mellan samma generation.

finns såklart undantag men då är vi inne på flaskhalsar inom arkitekturen(vega 64 är ett prakt exemplar där fler inte är bättre)

Ju fler beräknings cluster man har ju mer ström går där åt för driva runt allt, och då slår man i taket fortare förutsatt att man har en likadan kylare.

Men generellt sätt är fler bättre, bredare minnesbuss är bättre och högre frekvenser är bättre. Men man kan bara jämföra mellan samma generation och tillverkare.

Luddigt värre ;)
Permalänk
Medlem

Väcker lite liv i detta igen. Ser att det skiljer sig ca 200 mhz mellan den billigaste 2080 ti, ex ventus icke OC och den dyraste. Det är typ 12.000 vs 15000kr. Vad pratar vi om för skillnad i ren fps / % om vi säger att båda är stock direkt ur lådan? Finns ju 2080 ti som fortfarande går för 16.000 liksom. Varför skulle man lägga 3000-5000 mer? Kan inte tänka mig att det skiljer sig mer än 10 fps, om ens det?

Visa signatur

Dator: i7 9700k @ 5.0 Ghz - Asus Rog Strix OC 2080 Super
3600mhz 32gb - Gigabyte UD Z390 - Dark Rock Pro 4 - M.2 SSD MP510

Kringutrustning: Xiaomi 34" 3440x1440 - Xtrfy K4 - Glorious 0 Mus
Ljud: DT770 80ohm Headset - E10K DAC/AMP

Permalänk
Medlem
Skrivet av KlyfftPotatis:

Väcker lite liv i detta igen. Ser att det skiljer sig ca 200 mhz mellan den billigaste 2080 ti, ex ventus icke OC och den dyraste. Det är typ 12.000 vs 15000kr. Vad pratar vi om för skillnad i ren fps / % om vi säger att båda är stock direkt ur lådan? Finns ju 2080 ti som fortfarande går för 16.000 liksom. Varför skulle man lägga 3000-5000 mer? Kan inte tänka mig att det skiljer sig mer än 10 fps, om ens det?

Dyrare kort har sannolikt mer påkostade kyllösningar, som kan ge lägre temperaturer (bibehållen boost längre) och/eller lägre ljudnivåer från fläktarna.

Det enda man bör skilja på i övrigt är icke-OC och OC, där det faktiskt signalerar en skillnad i vilken krets som använts. Nvidia har dels låsta kretsar (utan överklockningsmöjlighet) och dels upplåsta (som går att överklocka, och som nog även kommer från en bättre binning). OC-märkta modeller har alltså en bättre krets.

I ren prestanda i t ex spel skiljer det kanske väldigt lite mellan en dyr och en billig variant, men det dyra kortet kanske är tystare och går att överklocka till högre nivåer.

Visa signatur

Moderkort: Gigabyte X570 Aorus Master | CPU: AMD Ryzen R9 5900X | CPU-kylare: Noctua NH-D15 chromax.black | RAM: Corsair Vengeance LPX 64 GB (4x16) DDR4-3600 CL18 | GPU: Gigabyte RTX 4080 Eagle OC | SSD: 2 x Samsung 970 EVO Plus 1 TB NVMe + Kingston A400 480 GB + Samsung QVO860 1 TB | PSU: EVGA SuperNOVA G2 1000 W Gold | Chassi: Lian Li O11 Dynamic XL | Skärm: BenQ PD3200U @ 3840x2160 + ASUS ROG Strix XG32VQ @ 2560x1440 | Tangentbord: Corsair K68 RGB Cherry MX Red | Mus: Logitech MX Master 2S

Permalänk
Medlem
Skrivet av cyklonen:

Dyrare kort har sannolikt mer påkostade kyllösningar, som kan ge lägre temperaturer (bibehållen boost längre) och/eller lägre ljudnivåer från fläktarna.

Det enda man bör skilja på i övrigt är icke-OC och OC, där det faktiskt signalerar en skillnad i vilken krets som använts. Nvidia har dels låsta kretsar (utan överklockningsmöjlighet) och dels upplåsta (som går att överklocka, och som nog även kommer från en bättre binning). OC-märkta modeller har alltså en bättre krets.

I ren prestanda i t ex spel skiljer det kanske väldigt lite mellan en dyr och en billig variant, men det dyra kortet kanske är tystare och går att överklocka till högre nivåer.

Okej men då ska jag hålla utkik efter det billigaste 2080 ti OC då kanske? Vet att asus har en OC version som kostar 12.400. 400kr mer än ventus icke OC

Visa signatur

Dator: i7 9700k @ 5.0 Ghz - Asus Rog Strix OC 2080 Super
3600mhz 32gb - Gigabyte UD Z390 - Dark Rock Pro 4 - M.2 SSD MP510

Kringutrustning: Xiaomi 34" 3440x1440 - Xtrfy K4 - Glorious 0 Mus
Ljud: DT770 80ohm Headset - E10K DAC/AMP

Permalänk
Medlem
Skrivet av cyklonen:

Dyrare kort har sannolikt mer påkostade kyllösningar, som kan ge lägre temperaturer (bibehållen boost längre) och/eller lägre ljudnivåer från fläktarna.

Det enda man bör skilja på i övrigt är icke-OC och OC, där det faktiskt signalerar en skillnad i vilken krets som använts. Nvidia har dels låsta kretsar (utan överklockningsmöjlighet) och dels upplåsta (som går att överklocka, och som nog även kommer från en bättre binning). OC-märkta modeller har alltså en bättre krets.

I ren prestanda i t ex spel skiljer det kanske väldigt lite mellan en dyr och en billig variant, men det dyra kortet kanske är tystare och går att överklocka till högre nivåer.

Aldrig hört om dessa kretsarna från Nvidia som inte kan överklockas. Vilka skulle det vara? Dom som inte har OC i namnet?

Visa signatur

sweclockers prestandaindex

Efter 10 kommer 11.
Efter 99 kommer 100.

Permalänk
Medlem
Skrivet av ClintBeastwood:

Aldrig hört om dessa kretsarna från Nvidia som inte kan överklockas. Vilka skulle det vara? Dom som inte har OC i namnet?

Mer specifikt är det de kretsar som saknar "A" i modellnamnet. Hur tredjepartstillverkarna väljer att namnge korten som har de olika kretsarna varierar, men "OC" är vanligt för de överklockningsbara.

För 2080 Ti heter den högre binnade, och överklockningsbara "TU102-300A", medan den sämre och nedlåsta heter "TU102-300", dvs utan "-A" på slutet.

Möjligen går det att överklocka "icke-A"-kretsar lite som användare, men de är betydligt mer begränsade både i hårdvara och i mjukvarualternativ.

Visa signatur

Moderkort: Gigabyte X570 Aorus Master | CPU: AMD Ryzen R9 5900X | CPU-kylare: Noctua NH-D15 chromax.black | RAM: Corsair Vengeance LPX 64 GB (4x16) DDR4-3600 CL18 | GPU: Gigabyte RTX 4080 Eagle OC | SSD: 2 x Samsung 970 EVO Plus 1 TB NVMe + Kingston A400 480 GB + Samsung QVO860 1 TB | PSU: EVGA SuperNOVA G2 1000 W Gold | Chassi: Lian Li O11 Dynamic XL | Skärm: BenQ PD3200U @ 3840x2160 + ASUS ROG Strix XG32VQ @ 2560x1440 | Tangentbord: Corsair K68 RGB Cherry MX Red | Mus: Logitech MX Master 2S