DIGITALNI AUDIO

 

1. AUDIO KOMPRESIJA

 

Digitalna audio kompresija omogućava efikasno skladištenje i prenos audio sadržaja. 

Audio kompresija se može podeliti u dve grupe:

• kompresija bez gubitaka (lossless compression)

• kompresija sa gubitkom (lossy compression)

                                                                    

1.1  

Kompresija bez gubitaka

Kompresija bez gubitaka kompresuje audio sadržaj na takav način da se prilikom 

njegove dekompresije dobija signal koji je potpuno identičan početnom signalu. Iako 

ima svojih prednosti, ova vrsta kompresije nije postigla veću popularnost u digitalnoj 

audio kompresiji, prvenstveno zbog malog stepena kompresije koji se za zvuk CD 

kvaliteta (16 bita, 44.1 KHz) kreće između 30% i 50%. Tehnike kompresije bez 

gubitaka se uglavnom razlikuju po brzini audio kompresije i dekompresije dok 

kvalitet kompresovanog sadržaja nema nikakvu                                                                     

1.2 

Kompresija sa gubicima

Zvuk koji se smatra „manje važnim“ je kodiran sa smanjenom preciznošču ili nije u 

opšte kodiran, zbog toga kompresija sa gubitkom smanjuje taj shvatljivi višak. Da bi 

se odredilo koje informacije u audio signalu su „manje važne“, većina algoritama 

kompresije sa gubitkom koriste transformacije kao što je modifikovana diskretna 

kosinusna transformacija (MDCT) da konvertuje vremenski domen semplovanog 

zvuka u domen frekvencije. Komponentama frekvencija mogu se alocirati bitovi na 

osnovu njihove zvučnosti. Zvučnost frekvencijske komponente se definiše tako što se 

prvo izračunava prag maskiranja ispod koje se pretpostavlja da je zvuk izvan limita 

ljudske percepcije (psiho-akustični model). Takođe neki algoritmi kompresije sa 

gubitkom koriste LPC (Linear Perceptive Coding) da konvertuju vremenski domen 

semplovanog zvuka.

Pošto kod kompresije sa gubitkom dolazi do opadanja kvaliteta audio zvuka, ova 

kompresija se smatra neodgovarajućom kod profesionalnih audio inžinjerskih 

aplikacija kao što je editiranje zvuka i multitrack snimanja zvuka. Međutim, ova 

kompresija je veoma pogodna za prenos i skladištenje audio podataka.

2. 

Moderne metode audio kompresije 

Postoji nekoliko algoritama moderne kompresije i metoda za skladištenje audio 

sadržaja u kompjuterskoj tehnologiji:

1

                                                                                                              

DIGITALNI AUDIO

2.1 • MP3 (MPEG-1 Layer-3)

Sastoji se od psihoakustičnog modela, FFT analiza, hibridnih filtera, 

nelinearne kvantizacije, Huffman-ovog kodovanja, 2 kanala sa konstantnim 

ili promjenjivim brzinama bita od 32 do 256 kb/s i koji je uspješno

implementiran u moderne CD/DVD i portabl plejere, mobilne telefone,...

2.2 • MP3 Pro

Kreiran od strane Coding Technologies Laboratory, zasniva se na

principima formiranja MP3 formata, sastoji se od SBR (Spectral Band 

Replication) tehnologije koja koduje visoko frekventni opseg (od 10 do 15

kHz) sa veoma malom brzinom bita. 

2.3 •

 AAC (MPEG-2 Advanced Audio Coding)

Kreiran od strane AT&T, Dolbija, Fraunhofer IIS i Sonija, je ISO standard

MPEG-2 koji se sastoji od osnovnih principa MP3 formata uključujući 

psihoakustični model, hibridne filtere, skalabilne brzine odmeravanja, 2

kanala sa brzinama bita od 48 do 576 kbps.

2.4 • AAC Plus

Potiče od AAC formata, sastoji se od SBR-a sa brzinom bita do 100 kbps.

2.5 • WMA (Windows Media Audio)

 

Kreiran od strane Mikrosofta, sastoji se od DRM (Digital Rights Management), 

CBR i VBR, WMA kodovanja digitalnog audia bez gubitaka (brzine bita 2:1 

do 3:1), WMA profesionalno kodovanje višekanalnog audia (128 do 768 kbps) 

i WMA za kodovanje glasa (od 4 do 20 kbps).

2.6 • VQF (Vector Quantization File)

Kreiran od strane NNT Human Interface Laboratories i Yamaha, nastao je

na osnovu MP3 principa, kompleksnijeg kodovanja, 25-35% bolja kompresija 

u odnosu na MP3 kompresiju.                                                                                                       

3. MPEG audio kompresija / MPEG-1 Layer-3 (MP3)

The Motion Picture Experts Group (MPEG) radna grupa je osnovana 1988. godine i 

definisala je standarde za video i audio kompresiju. Objavljen 1993. godine od strane 

International Standards Organization / International Electrotechnical Commission 

(ISO/IEC), MPEG-1, ISO/IEC 11172 standard uključuje specifikacije za 1-2 Mbps video 

kompresiju i tri sloja za audio kompresiju. 

Termin MP3 je obično korišten kao referenca za MPEG-1 Layer-3 specifikaciju za 

2

background image

                                                                                                              

DIGITALNI AUDIO

 

3.1 LAYER I

Layer I algoritam koristi osnovni filter bank koji se može naći u svim ostalim 

slojevima. Ovaj filter bank deli audio signal na 32 jednaka frekvencijska opsega. Prva, 

32 frekvencijska opsega ne reflektuju tačno kritične opsege kod ljudskog uha. Opseg 

je suviše širok za niske frekvencije tako da broj kvantifikovanih bitova ne može biti 

posebno namešten na osetljivost na šum u svakom kritičnom opsegu. Filter bank 

proizvodi 32 frekvencijska sempla, jedan sempl po opsegu, za svaki od 32 audio 

sempl ulaza. Layer I algoritam zajedno grupiše 12 semplova za svaki od 32 opsega. 

Svakoj grupi od 12 semplova se dodeljuje jedan bit i (ako bit nije nula) faktor 

skaliranja. Dodeljivanje bita određuje broj bitova koji predstavljaju svaki sempl. 

Faktor skaliranja je umnožak koji određuje veličinu sempla da bi maksimizovao 

rezoluciju kvantifikatora. Layer I koder formira 32 grupe po 12 semplova (ukupno 

384 semplova) u jedan frejm. Pored audio podatka, svaki frejm sadrži header i CRC 

(eng. cyclic redundancy code) proveru i moguće dodatne podatke.

3.2 LAYER II

4

                                                                                                              

DIGITALNI AUDIO

Layer II algoritam je jednostavno proširenje Layer I. Poboljšava perfomanse 

kompresije kodirajući podatke u veće grupe. Layer I kodira podatke u pojedinačne 

grupe po 12 sempla za svaki podopseg, a Layer II kodira podatke u 3 grupe od 12 

seplova za svaki podopseg. Koder vrši kodiranje sa jedinstvenim faktorom skaliranja 

za svaku grupu od 12 seplova jedino ako je neophodno da se izbegne audio distorzija. 

Koder deli vrednost faktora skaliranja između dve ili tri grupe samo u dva slučaja: (1) 

kada su vrednosti faktor skaliranja dovoljno blizu (2) kada koder očekuje da će 

privremeno maskiranje šuma ljuskog uveta sakriti konsekventu diztorziju.Layer II 

algoritam takođe poboljšava perfomanse Layer I reprezentacijom alokacije bita, 

vrednostima faktora skaliranja i kodiranjem kvantifikacije semplova efikasnijim 

kodom.

3.3 LAYER III

Layer III algoritam je mnogo finiji pristup. Iako je zasnovan na istom filter bank-u 

kao i Layer I i Layer II, Layer III vrši kompenzaciju nekih nedostataka u filter bank-u 

tako što procesuira izlaze iz filter bank-a sa modifikovanom diskretnom kosinusnom 

transformacijom ( MDCT ).

MDCT dalje deli izlaze filter bank-a na frekvencije da bi obezbedio bolju spektralnu 

rezoluciju. Zbog neizbježnog “trgovanja“ između vremenske i frekvetne rezolucije, 

Layer III specifira dve različite veličine MDCT bloka. Dugački blok od 36 sempla i 

kraći blok od 12 sempla. Kratak blok poboljšava vremensku rezoluciju da bi se bolje 

suočio sa tranzientima. Blok kratke dužine cini jednu trećinu dugog bloka. 

5

Želiš da pročitaš svih 15 strana?

Prijavi se i preuzmi ceo dokument.

Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.

Slični dokumenti