Samplingsfrekvens och bitdjup (sammanfattning)

Ljudkortets huvudsakliga uppgift är att omvandla mellan digital data och analogt ljud. Musiken från Spotify som strömmas till datorn i digitala datapaket måste på något sätt omvandlas till ljud som kan spelas upp av hörlurar eller högtalare. Ljudet som fångas upp av datorns mikrofon när vi spelar spel eller videochattar måste också på ett eller annat vis digitaliseras så att det kan strömmas över nätet.

För att omvandla digital data till analogt ljud används ljudkortets DAC (Digital to Analog Converter). Den kompletteras av en ADC (Analog to Digital Converter) som gör exakt samma sak i motsatt riktning. Hur väl dessa två omvandlingar görs beror framförallt på två faktorer: samplingsfrekvensen och bitdjupet.

Samplingsfrekvens

En dator kan omöjligtvis spara en analog ljudsignal. Den sparar i stället data som representerar den analoga ljudsignalen. Det görs genom en process som kallas sampling där datorn tar mätvärden från den analoga signalen i ett tätt intervall. På en CD-skiva representeras det digitala ljudet med 44100 mätvärden per sekund. I ljudsammanhang uttrycks det som att samplingsfrekvensen är 44100 Hz (44,1 kHz).

Analogt ljud digitaliseras genom en samplingsprocess som tar mätvärden i ett tätt intervall.

Analogt ljud digitaliseras genom en samplingsprocess som tar mätvärden i ett tätt intervall.

Analogt ljud digitaliseras genom en samplingsprocess som tar mätvärden i ett tätt intervall.

Analogt ljud digitaliseras genom en samplingsprocess som tar mätvärden i ett tätt intervall.

Ett par oförstörda människoöron hör ljud mellan cirka 20 Hz (dova basljud) och 20 kHz (pipiga diskantljud). När vi samplar ljud måste vi få med alla dessa frekvenser. Ju högre ljudets frekvens är (ju pipigare det är) desto högre måste även samplingsfrekvensen vara.

Ingenjörerna Harry Nyquist och Claude Shannon konstaterade att samplingsfrekvensen måste vara minst dubbelt så hög som ljudets frekvens (detta konstaterande kallas Nyquists samplingsteorem eller Nyquist-Shannons samplingsteorem).

I och med att en CD-skivas ljud är samplat i 44,1 kHz kan den återge ljud på upp till 22,05 kHz i teorin. Anledningen till att ljudet inte samplas i exakt 40 kHz (något som hade sparat data i en tid då datakapaciteten var begränsad) är att inga filter kan skära av ljudets frekvenser vid exakt 20 kHz. I hifi-sammanhang samplas ofta ljudet i ännu högre frekvens för att ytterligare kompensera för digitaliserings- och analogiseringskomponenternas brister.

Bitdjup

Samplingsfrekvensen säger enbart något om hur ofta mätvärdena tas. Bitdjupet, som beskriver hur noga ljudet vid varje sampling sparas, är precis lika viktigt. På en CD-skiva lagras ljudet med 16 bitars bitdjup. Vid varje mätvärde avrundas således ljudvågens amplitud till det närmsta värdet av 65536 tänkbara värden (216).

När CD-standarden sattes blev 16 bitars bitdjup en godtagbar kompromiss mellan ljudkvalitet och lagringsutrymme. Idag, när lagringsutrymme inte längre är ett problem, efterfrågas högre bitdjup av hifi-entusiaster. Streamingtjänsten Tidal erbjuder exempelvis delar av sitt musikutbud med 24 bitars bitdjup och 96 kHz samplingsfrekvens.

Anledningen till att ljudkvaliteten blir bättre med högre bitdjup är att avrundningsfelen minimeras. Skillnaden mellan ljudets faktiska amplitud och närmsta digitala värde blir mindre ju högre bitdjupet är. För varje bit som läggs till fördubblas antalet tänkbara värden. Med 24 bitars bitdjup finns 224 olika värden, det vill säga över 16 miljoner.

Bitdjupet anger hur noga ljudets amplitud kan sparas.

Bitdjupet anger hur noga ljudets amplitud kan sparas.

Om bitdjupet är för lågt blir avrundningsfelen stora.

Om bitdjupet är för lågt blir avrundningsfelen stora.

Det problemet löses genom att öka bitdjupet.

Det problemet löses genom att öka bitdjupet.