Alleen deze week begon Spotify "verliesvrije" audiobestanden te testen. Maar wat is "verliesloze" audio precies en hoe werkt de compressie van digitale audio?

Hoe werkt audiocompressie?

Het doel van audiocompressie is om het aantal bits dat nodig is om een ​​analoog geluid nauwkeurig te reproduceren, te verminderen. Het eerste proces dat we zullen bekijken, wordt "lossy" genoemd. Lossy-compressie is een techniek waarbij niet-kritieke gegevens worden weggegooid om ruimte te besparen. Deze technieken zijn de meest gebruikte methoden om audiobestanden te comprimeren en verschijnen zowel in MP3- als AAC- en WMA-bestanden. Er zijn twee plaatsen waar lossy codecs eruitzien om bits te besparen: bitrate en psychoakoestiek.

Bitrate

Bitrate meet het aantal bits dat wordt gebruikt om een ​​enkele seconde audio te coderen. Als we bijvoorbeeld codering van lage kwaliteit, 8 kilobit per seconde (kbps) gebruiken, is ons algoritme beperkt tot het gebruik van slechts 8 kilobits aan gegevens om elke seconde audio te beschrijven. Dat is hetzelfde als proberen een kleurenfoto te beschrijven met slechts een paar honderd pixels. Misschien krijg je de brede lijnen goed, maar over het algemeen zul je een ernstig aangetast beeld zien. Als we een bitrate van een hogere kwaliteit gebruiken, zoals 192 kbps, hebben we voldoende ruimte om genuanceerde details te bespreken. Om terug te keren naar ons fotografische voorbeeld, hebben we nu genoeg pixels om de verschillende lichten, donkere kleuren en kleuren in een afbeelding te beschrijven. Een hoge bitsnelheid bepaalt niet de kwaliteit van een opname als zodanig, maar een lage bitsnelheid kan de uitvoerkwaliteit ernstig beperken.

psychoakoestiek

Psychoakoestiek is de wetenschap van hoe de hersenen geluiden begrijpen. Door bekende grillen te manipuleren in de manier waarop mensen geluid waarnemen, kunnen compressiealgoritmen slim details verwijderen die de meeste menselijke oren niet zullen missen. Het doel is om informatie "af te ronden" die de waargenomen audiokwaliteit van een nummer niet zal veranderen, waarbij oordeelkundig alleen onbelangrijke informatie wordt verwijderd.

U weet bijvoorbeeld dat het typische bereik van het menselijk gehoor tussen 20Hz en 20kHz ligt. Het is duidelijk dat geluiden buiten dat bereik kunnen worden verwijderd. Bovendien ligt het meest gedetailleerde bereik van het menselijk gehoor tussen 100Hz en 4kHz, en het verwijderen van stille geluiden buiten die frequentiebereiken veroorzaakt minimale schade aan de kwaliteit van een opname. We kunnen een vergelijkbare truc doen met sterk contrasterende geluiden. Als er tegelijkertijd een zeer hard geluid en een zeer stille sound wordt gespeeld, is het stille geluid veel moeilijker waar te nemen dan op zichzelf. Encoders maken gebruik van deze "geluidsmaskering" om het stille geluid te verwijderen, waardoor bits worden bespaard.

Frequentie kan ook van invloed zijn op hoe goed we geluiden waarnemen. Een aanhoudende, laagfrequente drumbeat neigt bijvoorbeeld naar de meer delicate, hogerfrequente harmonischen van melodische instrumenten. En geluidsmassage is vooral effectief boven 15 kHz, waar het gehoor van mensen doorgaans minder gevoelig is om mee te beginnen.

Veelgebruikte audiocompressieschema's zoals MP3 profiteren van het volledige scala aan compressiemogelijkheden en proberen zo trouw mogelijk te blijven aan de originele opname. Natuurlijk, sommige mensen hebben het gevoel dat het verwijderen van deze frequenties ernstige schade aan de opname veroorzaakt. Dat is waarom lossless compressiestandaarden bestaan.

Wat is "Lossless" -audio?

Het doel van Lossless-audiocompressie is om de bestandsgrootte te verkleinen terwijl de oorspronkelijke audio onaangeroerd blijft. Deze codecs gebruiken geen van de bovenstaande permanente compressietechnieken, maar richten zich in plaats daarvan op volledig omkeerbare methoden voor gegevenscompressie. Ze gebruiken lossless compressietechnieken die zijn geleend van algoritmen voor bestandscompressie zoals ZIP om overtollige gegevens te verwijderen en tegelijkertijd de integriteit van de onderliggende informatie te behouden. Twee populaire verliesloze audiocodecs - FLAC en Apple Lossless (ALAC) - beide gebruiken schema's op basis van ZIP-compressie.

Focussen op datacompressie betekent alleen dat veel van de details die MP3 en andere lossy-standaarden zouden vernietigen zouden worden bewaard. Als u scherpe oren en een hoogwaardige luisteropstelling hebt, kan het verschil voelbaar zijn.

Lossless-compressie is niet alleen goed voor luisteren, het is ook een geweldige opslagtool. Net zoals je niet wilt dat een JPG van 72 dpi de enige digitale kopie is van de foto's van Ansel Adam, willen we niet alleen 128 kbps MP3's van "Kind of Blue". Lossless-standaarden zoals FLAC stellen ons in staat om audio efficiënt op te slaan zonder potentieel weg te gooien waardevolle gegevens. Ze maken ook remastering en herdistribueren dat geluid gemakkelijker, omdat het beginnen met compromisloze meesters een eindproduct van hogere kwaliteit betekent.

Conclusie: kunt u het verschil zien?

Lossless audioformaten zorgen voor beter klinkende opnames. Maar soms zijn de verschillen tussen een MP3 van hoge kwaliteit en een verliesloos bestand bijna onmerkbaar, vooral voor het ongetrainde oor. Als u wilt zien of uw hoofdtelefoon (en oren) voldoende scherp zijn om het verschil te kunnen zien, heeft NPR een leuke test; Houd er wel rekening mee dat goedkope koptelefoons en laptopluidsprekers de subtiele verschillen tussen verliesvrije audio en MP3's niet kunnen reproduceren. Voor een serieuzere analyse van codecs, bekijk de Encoder-beoordelingen van SoundExpert.