Odlomak

AUDIO KOMPRESIJA
Digitalna audio kompresija omogućava efikasno skladištenje i prenos audio sadržaja. Audio kompresija se može podeliti u dve grupe:

  • kompresija bez gubitaka (lossless compression)
  • kompresija sa gubitkom (lossy compression)

 

 

 

Kompresija bez gubitaka
Kompresija bez gubitaka kompresuje audio sadržaj na takav način da se prilikom njegove dekompresije dobija signal koji je potpuno identičan početnom signalu. Iako ima svojih prednosti, ova vrsta kompresije nije postigla veću popularnost u digitalnoj audio kompresiji, prvenstveno zbog malog stepena kompresije koji se za zvuk CD kvaliteta (16 bita, 44.1 KHz) kreće između 30% i 50%. Tehnike kompresije bez gubitaka se uglavnom razlikuju po brzini audio kompresije i dekompresije dok kvalitet kompresovanog sadržaja nema nikakvu

 

 

 

Kompresija sa gubicima
Zvuk koji se smatra „manje važnim“ je kodiran sa smanjenom preciznošču ili nije u opšte kodiran, zbog toga kompresija sa gubitkom smanjuje taj shvatljivi višak. Da bi se odredilo koje informacije u audio signalu su „manje važne“, većina algoritama kompresije sa gubitkom koriste transformacije kao što je modifikovana diskretna kosinusna transformacija (MDCT) da konvertuje vremenski domen semplovanog zvuka u domen frekvencije. Komponentama frekvencija mogu se alocirati bitovi na osnovu njihove zvučnosti. Zvučnost frekvencijske komponente se definiše tako što se prvo izračunava prag maskiranja ispod koje se pretpostavlja da je zvuk izvan limita ljudske percepcije (psiho-akustični model). Takođe neki algoritmi kompresije sa gubitkom koriste LPC (Linear Perceptive Coding) da konvertuju vremenski domen semplovanog zvuka.
Pošto kod kompresije sa gubitkom dolazi do opadanja kvaliteta audio zvuka, ova kompresija se smatra neodgovarajućom kod profesionalnih audio inžinjerskih aplikacija kao što je editiranje zvuka i multitrack snimanja zvuka. Međutim, ova kompresija je veoma pogodna za prenos i skladištenje audio podataka.

 

 

 

Moderne metode audio kompresije
Postoji nekoliko algoritama moderne kompresije i metoda za skladištenje audio sadržaja u kompjuterskoj tehnologiji:

 

 

 

• MP3 (MPEG-1 Layer-3)
Sastoji se od psihoakustičnog modela, FFT analiza, hibridnih filtera, nelinearne kvantizacije, Huffman-ovog kodovanja, 2 kanala sa konstantnim ili promjenjivim brzinama bita od 32 do 256 kb/s i koji je uspješnoimplementiran u moderne CD/DVD i portabl plejere, mobilne telefone,…

 

 

MP3 Pro
Kreiran od strane Coding Technologies Laboratory, zasniva se na principima formiranja MP3 formata, sastoji se od SBR (Spectral Band Replication) tehnologije koja koduje visoko frekventni opseg (od 10 do 15kHz) sa veoma malom brzinom bita.

 

 

AAC (MPEG-2 Advanced Audio Coding)
Kreiran od strane AT&T, Dolbija, Fraunhofer IIS i Sonija, je ISO standard MPEG-2 koji se sastoji od osnovnih principa MP3 formata uključujući psihoakustični model, hibridne filtere, skalabilne brzine odmeravanja, 2 kanala sa brzinama bita od 48 do 576 kbps.

 

 

AAC Plus
Potiče od AAC formata, sastoji se od SBR-a sa brzinom bita do 100 kbps.

 

 

WMA (Windows Media Audio)
Kreiran od strane Mikrosofta, sastoji se od DRM (Digital Rights Management), CBR i VBR, WMA kodovanja digitalnog audia bez gubitaka (brzine bita 2:1 do 3:1), WMA profesionalno kodovanje višekanalnog audia (128 do 768 kbps) i WMA za kodovanje glasa (od 4 do 20 kbps).

 

 

VQF (Vector Quantization File)
Kreiran od strane NNT Human Interface Laboratories i Yamaha, nastao je na osnovu MP3 principa, kompleksnijeg kodovanja, 25-35% bolja kompresija u odnosu na MP3 kompresiju.

 

 

 

MPEG audio kompresija / MPEG-1 Layer-3 (MP3)
The Motion Picture Experts Group (MPEG) radna grupa je osnovana 1988. godine i definisala je standarde za video i audio kompresiju. Objavljen 1993. godine od strane International Standards Organization / International Electrotechnical Commission (ISO/IEC), MPEG-1, ISO/IEC 11172 standard uključuje specifikacije za 1-2 Mbps video kompresiju i tri sloja za audio kompresiju.
Termin MP3 je obično korišten kao referenca za MPEG-1 Layer-3 specifikaciju za audio kodovanje. MP3 standard definiše procese dekodovanja, format niza bita i strategiju kodovanja audio sadržaja. Samo jezgro algoritama i teoriju su prvobitno razvili na Fraunhofer Institutu, koji ima nekoliko patenata vezanih za ovaj metod kodovanja. MPEG audio istraživači su izvršili obiman subjektivan slušalački test kroz razvoj ovog standarda. Test je pokazao da čak pri kompresiji 6:1 i pri optimalnim uslovima za slušanje, slušalački experti nisu bili u stanju da razlikuju kodirani i originalni audio klip.
Empirijski rezultati su takođe pokazali da ljudsko uho ima ograničenu frekvencijsku selektivnost koja varira u oštrini od nešto manje od 100Hz za najniže čujne frekvencije do nešto više od 4kHz za najviše. Prema tome čujni spektrum može biti podeljen na kritične opsege koji predstavljaju moć razlučivanja ljudskog uha kao funkcija zavisna od frekvencije. Zbog toga što ljudsko uho ima ograničenu moć da razlikuje frekvencije, ta kritična tačka za maskiranje šuma bilo koje frekvencije jedino zavisi od aktivnosti signala u kritičnom opsegu te frekvencije. Za audio kompresiju, ova osobina odnosno to pravilo se može koristiti u transformisanju audio signala u domen frekvencija, zatim podeliti rezultajući spektrum u podopsege koji približno odgovaraju kritičnim opsezima i na kraju kvantifikovati svaki podopseg na osnovu čujnostikvantifikovanog šuma koji se nalazi unutartog opsega. Za optimalnu kompresiju, svaki opseg bi trebao biti kvantifikovan sa ne većim brojem nivoa od potrebnog, da bi kvantifikovan šum bio nečujan. Ulazni audio signal prolazi kroz filter bank ( deo za filtriranje signala ) koji deli ulazni signal na više različitih podopsega. Ulazni audio signal simultativno prolazi kroz psihoakustični model koji određuje signal-maska odnos za svaki podopseg.
Bit ili šum blok za dodeljivanje, koristi odnos signal-maska kako bi pravilno odmjerio i dodelio broj kodiranih bitova potrebnih za kvantifikaciju svih podopsega signala kako bi umanjio čujnost kvantifikovanog šuma. Na kraju, poslednji blok uzima tu reprezentaciju kvantifikovanog audio sempla i formira bitove koje je moguće dekodirati.
Dekoder jednostavno vrši obrnuto formiranje, zatim rekonstruiše kvantifikovane vrednosti svih podopsega u vremenski domen audio signala. MPEG audio standard ima tri sloja (layers) za kompresiju. Layer I formira najednostavniji algoritam, a Layer II i Layer III su nastavci koji koriste neke elemente iz Layer I. Svaki od ovih slojeva pobojšava perfomanse kompresije na uštrb veće kompleksnosti kodera i dekodera.

No votes yet.
Please wait…

Prijavi se

Detalji dokumenta

Više u Skripte

Komentari