Kort efter lanseringen av Geforce RTX 3000-serien publicerade SweClockers en guide för hur du kan öka energieffektiviteten på ditt grafikkort genom att sänka spänningen till grafikkretsen. Med Geforce RTX 3000-serien är det en tacksam metod att uppnå klart märkbart resultat med en relativt liten handpåläggning. Geforce RTX 4000-serien har dock hittills visat sig vara betydligt mer energieffektiv direkt ur kartong än sin föregångare men finns det ändå något att hämta hos Ada Lovelace med undervoltning?

Likt överklockning är sänkt spänning, eller "undervoltning", ingen exakt vetenskap. Variationen mellan grafikkretsar kan ibland vara enorm, vilket innebär att vissa exemplar klarar av att bibehålla en hög frekvens vid låg spänning medan andra är hopplöst instabila. Det gäller därför att pröva sig fram och inte ge upp direkt om värdena i den här guiden inte fungerar rakt av.

Grafikkortet som har fått stå till grund för artikeln är redaktionens Geforce RTX 4090 Founders Edition. Testmiljön är i redaktionens testrigg för grafikkort på en öppen testbädd, detta medför att resultaten i till exempel temperatur inte är direkt representativa för för resultaten i ett stängt chassi. Däremot går det att utläsa eventuellt delta mellan de olika körningarna för att få ett hum om resultatet.

Innan du börjar skruva på klockfrekvenser och spänningsnivåer kommer du att behöva mjukvara för ändamålet. Redaktionen använder sig av MSI Afterburner för att göra de faktiska justeringarna på spänningskurvan samt Techpowerups GPU-Z för att logga parametrar hos grafikkortet under belastning.

guide.jpg

Ovanpå detta behövs någon form av mjukvara för att belasta grafikkortet och mäta prestandan före och efter spänningssänkningen, samt långtgående stabilitet över tid. Här kan du exempelvis använda dig av det inbyggda prestandatestet i ett specifikt spel eller någon form av syntetisk testsvit. Vi har i denna guide valt att använda oss av stresstesten Port Royal och Speed Way i mjukvaran 3DMark.

Mät klockfrekvens, spänning samt prestanda i grundutförande

Låt oss börja med att belasta grafikkortet i sitt grundutförande för att se vilken prestanda, klockfrekvens och spänning som uppnås under en längre belastning. Här kan du med fördel använda loggningsfunktionen som finns inbyggd i GPU-Z för att få ut en fil med intressant data som kan granskas närmare vid ett senare tillfälle.

Som tidigare nämnts använder jag här stresstestet Speed Way som finns inbyggt i 3DMark. Detta har visat sig vara väldigt representativt för hur grafikkortet belastas av tyngre speltitlar, samtidigt som ray tracing används vilket är en viktig komponent vid de senare stabilitetstesterna.

Efter ungefär en halvtimmes körning har kortets temperaturer och klockfrekvens stabiliserat sig och vi kan därför nu kika närmare på siffrorna som loggats. I Speed Way ligger den genomsnittliga klockfrekvensen för kortets grafikkrets på 2 700 MHz medan den genomsnittliga spänningen som används ligger på 1 050 mV.

Justera kortets klockfrekvenskurva med MSI Afterburner

Med siffrorna i hand från vårt belastningstest med kortet i grundutförande har vi nu det underlag som behövs för att justera spänningen till grafikkretsen. Låt oss därför dra igång MSI Afterburner och justera grafikkortets klockfrekvenskurva.

För att komma till menyn där klockfrekvenskurvan redigeras använder vi kortkommandot "CTRL+F" i Afterburner. Detta öppnar upp ett nytt fönster som visar kortets grundinställda frekvenskurva, med spänningsnivåerna på den horisontella axeln och respektive klockfrekvensnivå på den vertikala axeln.

voltstock.jpg

Det vi nu vill göra är att välja ut en lägre spänningsnivå än den vi uppmätte vid stresstestet för att på så sätt sänka grafikkortets effektuttag. Enligt våra tidigare mätningar låg vi kring 1 050 mV under långa belastningsperioder medan frekvensen landade på 2 700 MHz. Exakt hur lågt det är möjligt att gå på spänningsstegen kommer att variera mellan olika exemplar samt vilken klockfrekvens du vill uppnå.

volt+l.jpg

Vi tar sikte på spänningsnivån 950 mV, vilken ur kartong har klockfrekvensen 2 505 MHz tilldelad till sig på frekvenskurvan. Det vi nu ska göra är att höja klockfrekvensen för just denna spänningsnivå för att matcha den vi fick ut under det tidigare stresstestet. För att göra detta tar vi tag i pricken ovanför spänningen vi vill ändra och drar denna uppåt tills vi uppnått den önskade frekvensen. Innan vi är klara behöver vi nu låsa grafikkortet till att använda denna spänning och klockfrekvens, vilket görs genom att trycka på "L"-tangenten. Om allt har gått rätt till ska det se ut som bilden ovan med en gulstreckad linje som går genom punkten för vår spänning och frekvens.

Den som har ett öga för detaljer noterar dock att vi i spänningskurvan ovan har låst kortet 15 MHz högre än 2 700 MHz, detta grundar sig i att med Geforxe RTX 4090 arbetar kortet i praktiken 15 MHz lägre än vad vi ställer in i kurvan. Så vid värdet 2 700 MHz låst i kurvan blir arbetsfrekvensen i praktiken 2 685 MHz.

volt+l+apply.jpg

Då ändringar i frekvenskurvan inte sparas automatiskt behöver vi nu återgå till huvudfönstret för MSI Afterburner och trycka på "Apply". När detta är gjort bör frekvenskurvan se ut ungefär som den på bilden ovan och därmed är spänningen låst till 950 mV vid klockfrekvensen 2 715 MHz.

Stabilitetstesta och mät prestandan

Då kommer vi till den kanske mest tidsödande biten av denna guide, nämligen att testa om vår sänkta spänningsnivå är stabil under långtida belastning. Här rekommenderar jag starkt att använda en arbetslast med ray tracing som även belastar grafikkretsens RT-kärnor, då dessa är mer känsliga för sänkt spänning än övriga delar av kretsen.

Här fungerar stresstestet 3DMark Port Royal alldeles ypperligt, då det både är grafiktungt och använder sig av ray tracing. För den som inte vill lägga pengar på den mjukvaran kan jag även rekommendera den kostnadsfria demoversionen av Quake II RTX som finns tillgängligt via Steam, då detta spel kommer att framkalla krascher ganska snabbt om spänningen är för låg i förhållande till klockfrekvensen.

3dmark-time-spy-extreme-screenshot.jpg

Om programmet/spelet kraschar är troligtvis spänningen för låg för den givna klockfrekvensen och därför behöver den höjas innan du försöker igen. Om detta sker är det bara att återvända till frekvenskurvan i MSI Afterburner, trycka på "L" för att låsa upp spänningen/frekvensen, välja nästa punkt till höger i frekvenskurvan och sedan höja denna till samma klockfrekvens som tidigare. Avsluta sedan med att trycka på "L" för att låsa spänningen och tryck "Apply".

Upprepa proceduren ovan tills en stabil nivå har uppnåtts under långtida belastning. Likaså kan du göra det omvända om kortet är stabilt redan vid den första spänningsjusteringen, vilket innebär att man kanske kan sänka spänningen ytterligare för att vinna ännu mer effektmässigt. Detta är dock inget krav om du redan är nöjd med nivån du ligger på.

När du har hittat en spänningsnivå som är helt stabil under långtida belastning kan det avslutningsvis vara bra att köra ett par prestandatester och jämföra dem mot resultaten som uppnåddes med kortet i sitt grundutförande. Är det likvärdiga eller till och med bättre är det bara att gå vidare till det sista steget i guiden. Är de istället märkbart sämre kan det vara värt att kika närmare på loggarna från GPU-Z och se att klockfrekvensen verkligen ligger rätt.

Skapa en slutgiltig frekvenskurva för permanent bruk

Nu skulle en kunna tro att allt är klart, men det återstår dock en sista grej. Som grafikkortet är konfigurerat just nu är nämligen både spänningen och klockfrekvensen låst till ett fast värde, oavsett om det belastas eller inte. Detta är smidigt när du fipplar med olika spänningar, men en klar nackdel vid vanligt bruk då kortet aldrig går ner i frekvens och därmed drar onödigt mycket vid vila.

Därför ska vi nu skapa en slutgiltig frekvenskurva som låter kortet klocka ner sig själv när det inte belastas men samtidigt inte kliver över den lägre spänningsnivån som vi lyckats spika efter stabilitetstesterna vid spelande.

MSIAB-250.jpg

För att göra detta återvänder vi till MSI Afterburner och trycker på "Reset" för att återställa frekvenskurvan till fabriksinställningarna. Därefter tar vi tag i reglaget för "Core Clock" och sänker detta till -250 MHz. Varför vi gör detta kommer kommer att bli tydligt i nästa steg.

volt-250.jpg

Nu är det dags att öppna frekvenskurvan igen (CTRL+F) och som vi kan se har vi nu en kurva som ligger 250 MHz lägre vid varje spänningspunkt ställt mot fabriksinställningarna.

volt-250+950.jpg

Det vi nu ska göra är att återigen ta tag i spänningspunkten vid 950 mV och dra upp denna till 2 715 MHz. När detta är gjort trycker vi på "Apply" i huvudfönstret inuti MSI Afterburner.

volt-250+950+apply.jpg

Efter att vi applicerat ändringarna kommer resten av spänningspunkterna till höger om vår satta spänning (950 mV) att plattas ut och lägga sig på samma klockfrekvens (2 715 MHz). Det vi har gjort nu i praktiken är att sätta den sedvanliga turbofunktionen ur spel och tvinga grafikkretsen att inte överskrida 950 mV på frekvenskurvan.

Återvänd nu till huvudfönstret för Afterburner och spara ner den modifierade frekvenskurvan till en profil (tryck på "Save" och sedan någon av siffrorna till vänster). Sist men inte minst rekommenderar vi att bocka i "Apply overclocking at system startup", då detta laddar vår modifierade klockkurva varje gång systemet startar.

Prestandatester med sänkt spänning

Hur fungerar det då i praktiken med den mängd handpåläggningar vi har genomfört? För att visa detta har jag plockat ut tre stycken spel ur testsviten som har körts i upplösningen 3 840 × 2 160 pixlar i sina högsta fördefinierade grafiklägen med ray tracing aktiverat. Därtill har vi testat stresstesterna Port Royale samt Time Spy Extreme från 3DMark.

Därefter följer mätningar av temperatur efter 30 rundor i Port Royales stresstest samt ett genomsnittligt effektuttag i de tre speltesterna vi har använt. Effektuttaget är plockat från Frameview-datan tillsammans med Nvidias PCAT-verktyg.

De fyra stycken scenarion för grafikkortet som ställs mot varandra är Geforce RTX 4090 Founders Edition i stockinställningar, med strömbudget uppskruvad till 133%, strömbudget nedskruvad till 80% samt det manuellt undervoltade kortet på 2 715 MHz vid 950 mV.

Sammanfattande tankar

Med Geforce RTX 4090 går det kortfattat att säga att undervoltning inte är lika mycket av en "måste"-grej som det var med till exempel Geforce RTX 3090. Mycket av detta kan tillskrivas det faktum att RTX 4090 har så pass mycket av sin strömbudget tillgodo direkt ur kartong och går relativt tyst och svalt. För den som enbart är ute efter extra prestanda är kortet dock väldigt tacksamt att skrämma upp i ännu högre prestanda med överklockning.

För den som däremot är ute efter att sänka effektuttag och ljudnivå utan att tumma allt för mycket på prestandan är dock fortfarande undervoltning en metod som lämpar sig väl för detta. Däremot så vill jag också göra er uppmärksamma på att det med RTX 4000-serien går alldeles utmärkt att sänka strömbudgeten för att få liknande resultat, hur mycket prestanda du tappar kommer dock givetvis bero på övriga systemet och scenariot det används i.

I de fall där processorn är den stora flaskhalsen bör prestandatappet vara minimalt, men kan bli mer kännbart i mer grafikintensiva scenarion. Därför rekommenderar jag att manuellt justera spänning och frekvens och för all del kombinera detta med överklockning av grafikkretsen samt grafikminne. Det är det alltid välkommet att få ut samma prestanda till ett lägre effektuttag. Är du dessutom funtade på samma sätt som undertecknad är det dessutom väldigt roligt att justera och leka med de olika värdena tills du kommer fram till vad som fungerar bäst i erat specifika fall.

Det bör noteras att liknande metod går att tillämpa på andra kort ur Nvidias Geforce RTX 4000-serie, resultat och värden kommer dock givetvis variera beronde på vilken modell du använder.

Fick du upp suget att själv experimentera med din profil efter detta? Om du redan gjort det får du väldigt gärna dela med dig av dina egna erfarenheter och inställningar i den tillhörande diskussionstråden!

Bör vi även se över AMD:s Radeon RX 7000-serie?