Digitalni audio
DIGITALNI AUDIO
1. AUDIO KOMPRESIJA
Digitalna audio kompresija omogućava efikasno skladištenje i prenos audio sadržaja.
Audio kompresija se može podeliti u dve grupe:
• kompresija bez gubitaka (lossless compression)
• kompresija sa gubitkom (lossy compression)
1.1
Kompresija bez gubitaka
Kompresija bez gubitaka kompresuje audio sadržaj na takav način da se prilikom
njegove dekompresije dobija signal koji je potpuno identičan početnom signalu. Iako
ima svojih prednosti, ova vrsta kompresije nije postigla veću popularnost u digitalnoj
audio kompresiji, prvenstveno zbog malog stepena kompresije koji se za zvuk CD
kvaliteta (16 bita, 44.1 KHz) kreće između 30% i 50%. Tehnike kompresije bez
gubitaka se uglavnom razlikuju po brzini audio kompresije i dekompresije dok
kvalitet kompresovanog sadržaja nema nikakvu
1.2
Kompresija sa gubicima
Zvuk koji se smatra „manje važnim“ je kodiran sa smanjenom preciznošču ili nije u
opšte kodiran, zbog toga kompresija sa gubitkom smanjuje taj shvatljivi višak. Da bi
se odredilo koje informacije u audio signalu su „manje važne“, većina algoritama
kompresije sa gubitkom koriste transformacije kao što je modifikovana diskretna
kosinusna transformacija (MDCT) da konvertuje vremenski domen semplovanog
zvuka u domen frekvencije. Komponentama frekvencija mogu se alocirati bitovi na
osnovu njihove zvučnosti. Zvučnost frekvencijske komponente se definiše tako što se
prvo izračunava prag maskiranja ispod koje se pretpostavlja da je zvuk izvan limita
ljudske percepcije (psiho-akustični model). Takođe neki algoritmi kompresije sa
gubitkom koriste LPC (Linear Perceptive Coding) da konvertuju vremenski domen
semplovanog zvuka.
Pošto kod kompresije sa gubitkom dolazi do opadanja kvaliteta audio zvuka, ova
kompresija se smatra neodgovarajućom kod profesionalnih audio inžinjerskih
aplikacija kao što je editiranje zvuka i multitrack snimanja zvuka. Međutim, ova
kompresija je veoma pogodna za prenos i skladištenje audio podataka.
2.
Moderne metode audio kompresije
Postoji nekoliko algoritama moderne kompresije i metoda za skladištenje audio
sadržaja u kompjuterskoj tehnologiji:
1
DIGITALNI AUDIO
2.1 • MP3 (MPEG-1 Layer-3)
Sastoji se od psihoakustičnog modela, FFT analiza, hibridnih filtera,
nelinearne kvantizacije, Huffman-ovog kodovanja, 2 kanala sa konstantnim
ili promjenjivim brzinama bita od 32 do 256 kb/s i koji je uspješno
implementiran u moderne CD/DVD i portabl plejere, mobilne telefone,...
2.2 • MP3 Pro
Kreiran od strane Coding Technologies Laboratory, zasniva se na
principima formiranja MP3 formata, sastoji se od SBR (Spectral Band
Replication) tehnologije koja koduje visoko frekventni opseg (od 10 do 15
kHz) sa veoma malom brzinom bita.
2.3 •
AAC (MPEG-2 Advanced Audio Coding)
Kreiran od strane AT&T, Dolbija, Fraunhofer IIS i Sonija, je ISO standard
MPEG-2 koji se sastoji od osnovnih principa MP3 formata uključujući
psihoakustični model, hibridne filtere, skalabilne brzine odmeravanja, 2
kanala sa brzinama bita od 48 do 576 kbps.
2.4 • AAC Plus
Potiče od AAC formata, sastoji se od SBR-a sa brzinom bita do 100 kbps.
2.5 • WMA (Windows Media Audio)
Kreiran od strane Mikrosofta, sastoji se od DRM (Digital Rights Management),
CBR i VBR, WMA kodovanja digitalnog audia bez gubitaka (brzine bita 2:1
do 3:1), WMA profesionalno kodovanje višekanalnog audia (128 do 768 kbps)
i WMA za kodovanje glasa (od 4 do 20 kbps).
2.6 • VQF (Vector Quantization File)
Kreiran od strane NNT Human Interface Laboratories i Yamaha, nastao je
na osnovu MP3 principa, kompleksnijeg kodovanja, 25-35% bolja kompresija
u odnosu na MP3 kompresiju.
3. MPEG audio kompresija / MPEG-1 Layer-3 (MP3)
The Motion Picture Experts Group (MPEG) radna grupa je osnovana 1988. godine i
definisala je standarde za video i audio kompresiju. Objavljen 1993. godine od strane
International Standards Organization / International Electrotechnical Commission
(ISO/IEC), MPEG-1, ISO/IEC 11172 standard uključuje specifikacije za 1-2 Mbps video
kompresiju i tri sloja za audio kompresiju.
Termin MP3 je obično korišten kao referenca za MPEG-1 Layer-3 specifikaciju za
2

DIGITALNI AUDIO
3.1 LAYER I
Layer I algoritam koristi osnovni filter bank koji se može naći u svim ostalim
slojevima. Ovaj filter bank deli audio signal na 32 jednaka frekvencijska opsega. Prva,
32 frekvencijska opsega ne reflektuju tačno kritične opsege kod ljudskog uha. Opseg
je suviše širok za niske frekvencije tako da broj kvantifikovanih bitova ne može biti
posebno namešten na osetljivost na šum u svakom kritičnom opsegu. Filter bank
proizvodi 32 frekvencijska sempla, jedan sempl po opsegu, za svaki od 32 audio
sempl ulaza. Layer I algoritam zajedno grupiše 12 semplova za svaki od 32 opsega.
Svakoj grupi od 12 semplova se dodeljuje jedan bit i (ako bit nije nula) faktor
skaliranja. Dodeljivanje bita određuje broj bitova koji predstavljaju svaki sempl.
Faktor skaliranja je umnožak koji određuje veličinu sempla da bi maksimizovao
rezoluciju kvantifikatora. Layer I koder formira 32 grupe po 12 semplova (ukupno
384 semplova) u jedan frejm. Pored audio podatka, svaki frejm sadrži header i CRC
(eng. cyclic redundancy code) proveru i moguće dodatne podatke.
3.2 LAYER II
4
DIGITALNI AUDIO
Layer II algoritam je jednostavno proširenje Layer I. Poboljšava perfomanse
kompresije kodirajući podatke u veće grupe. Layer I kodira podatke u pojedinačne
grupe po 12 sempla za svaki podopseg, a Layer II kodira podatke u 3 grupe od 12
seplova za svaki podopseg. Koder vrši kodiranje sa jedinstvenim faktorom skaliranja
za svaku grupu od 12 seplova jedino ako je neophodno da se izbegne audio distorzija.
Koder deli vrednost faktora skaliranja između dve ili tri grupe samo u dva slučaja: (1)
kada su vrednosti faktor skaliranja dovoljno blizu (2) kada koder očekuje da će
privremeno maskiranje šuma ljuskog uveta sakriti konsekventu diztorziju.Layer II
algoritam takođe poboljšava perfomanse Layer I reprezentacijom alokacije bita,
vrednostima faktora skaliranja i kodiranjem kvantifikacije semplova efikasnijim
kodom.
3.3 LAYER III
Layer III algoritam je mnogo finiji pristup. Iako je zasnovan na istom filter bank-u
kao i Layer I i Layer II, Layer III vrši kompenzaciju nekih nedostataka u filter bank-u
tako što procesuira izlaze iz filter bank-a sa modifikovanom diskretnom kosinusnom
transformacijom ( MDCT ).
MDCT dalje deli izlaze filter bank-a na frekvencije da bi obezbedio bolju spektralnu
rezoluciju. Zbog neizbježnog “trgovanja“ između vremenske i frekvetne rezolucije,
Layer III specifira dve različite veličine MDCT bloka. Dugački blok od 36 sempla i
kraći blok od 12 sempla. Kratak blok poboljšava vremensku rezoluciju da bi se bolje
suočio sa tranzientima. Blok kratke dužine cini jednu trećinu dugog bloka.
5
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti