Audio kompresija
Smer: Informacione tehnologije
Predmet: Multimedijalni sistemi
SEMINARSKI RAD
AUDIO KOMPRESIJA
Profesor:
Studenti:
Vladimir Mladenović
Asistent:
Maja Radović
Nenad Miloradovic 540/2014
Aleksandra Milenković 553/2014
Čačak
Decembar, 2014.
UNIVERSITY OF KRAGUJEVAC
FACULTY OF TEHNICAL SCIENCE
УНИВЕРЗИТЕТ У КРАГУЈЕВЦУ
ФАКУЛТЕТ ТЕХНИЧКИХ НАУКА
Sadrzaj
Sadrzaj.............................................................................................................................................2
1. Audio kompresija.........................................................................................................................3
2. Moderne metode audio kompresije.............................................................................................4
3. MPEG audio kompresija / MPEG-1 Layer-3 (MP3)...................................................................5
3.1 MPEG audio kodovanje i dekodovanje.................................................................................5
3.2 LAYER I................................................................................................................................6
3.3 LAYER II..............................................................................................................................7
3.4 LAYER III............................................................................................................................. 7

2. Moderne metode audio kompresije
Postoji nekoliko algoritama moderne kompresije i metoda za skladištenje audio sadržaja
u kompjuterskoj tehnologiji:
•
MP3 (MPEG-1 Layer-3)
Sastoji se od psihoakustičnog modela, FFT analiza, hibridnih filtera, nelinearnekvantizacije,
Huffman-ovog kodovanja, 2 kanala sa konstantnimilipromenjivim brzinama bita od 32 do 256
kb/s i koji je uspešno implementiran u moderne CD/DVD i portabl plejere, mobilne telefone,...
•
MP3 Pro
Kreiran od strane Coding Technologies Laboratory, zasniva se naprincipima formiranja MP3
formata, sastoji se od SBR (Spectral BandReplication) tehnologije koja koduje visoko frekventni
opseg (od 10 do 15 kHz) sa veoma malom brzinom bita.
•
AAC (MPEG-2 Advanced Audio Coding)
Kreiran od strane AT&T, Dolbija, Fraunhofer IIS i Sonija, je ISO standardMPEG-2 koji se
sastoji od osnovnih principa MP3 formata uključujućipsihoakustični model, hibridne filtere,
skalabilne brzine odmeravanja, 2 kanala sa brzinama bita od 48 do 576 kbps.
•
AAC Plus
Potiče od AAC formata, sastoji se od SBR-a sa brzinom bita do 100 kbps.
•
WMA (Windows Media Audio)
Kreiran od strane Mikrosofta, sastoji se od DRM (Digital Rights Management), CBR i VBR,
WMA kodovanja digitalnog audia bez gubitaka (brzine bita 2:1do 3:1), WMA profesionalno
kodovanje višekanalnog audia (128 do 768 kbps) i WMA za kodovanje glasa (od 4 do 20 kbps).
•
VQF (Vector Quantization File)
Kreiran od strane NNT Human Interface Laboratories i Yamaha, nastao jena osnovu MP3
principa, kompleksnijeg kodovanja, 25-35% bolja kompresija u odnosu na MP3 kompresiju.
3. MPEG audio kompresija / MPEG-1 Layer-3 (MP3)
The Motion Picture Experts Group (MPEG) radna grupa je osnovana 1988. godine i
definisala je standarde za video i audio kompresiju. Objavljen 1993. godine od strane
International Standards Organization / International Electrotechnical Commission (ISO/IEC),
MPEG-1, ISO/IEC 11172 standard uključuje specifikacije za 1-2 Mbps video kompresiju i tri
sloja za audio kompresiju.
Termin MP3 je obično korišćen kao referenca za MPEG-1 Layer-3 specifikaciju za audio
kodovanje. MP3 standard definiše procese dekodovanja, format niza bita i strategiju kodovanja
audio sadržaja. Samo jezgro algoritama i teoriju su prvobitno razvili na Fraunhofer Institutu, koji
ima nekoliko patenata vezanih za ovaj metod kodovanja.
MPEG audio istraživači su izvršili obiman subjektivan slušalački test kroz razvoj ovog
standarda. Test je pokazao da čak pri kompresiji 6:1 i pri optimalnim uslovima za slušanje,
slušalački experti nisu bili u stanju da razlikuju kodirani i originalni audio klip.
Empirijski rezultati su takođe pokazali da ljudsko uho ima ograničenu frekvencijsku selektivnost
koja varira u oštrini od nešto manje od 100Hz za najniže čujne frekvencije do nešto više od 4kHz
za najviše. Prema tome čujni spektrum može biti podeljen na kritične opsege koji predstavljaju
moć razlučivanja ljudskog uha kao funkcija zavisna od frekvencije.
Zbog toga što ljudsko uho ima ograničenu moć da razlikuje frekvencije, ta kritična tačka
za maskiranje šuma bilo koje frekvencije jedino zavisi od aktivnosti signala u kritičnom opsegu
te frekvencije. Za audio kompresiju, ova osobina odnosno to pravilo se može koristiti u
transformisanju audio signala u domen frekvencija, zatim podeliti rezultajući spektrum u
podopsege koji približno odgovaraju
kritičnim opsezima i na kraju kvantifikovati
svaki podopseg na osnovu čujnosti
kvantifikovanog šuma koji se nalazi unutar
tog opsega. Za optimalnu kompresiju, svaki
opseg bi trebao biti kvantifikovan sa ne
većim brojem nivoa od potrebnog, da bi
kvantifikovan šum bio nečujan.
3.1 MPEG audio kodovanje i dekodovanje
Ulazni audio signal prolazi kroz filter bank (deo za filtriranje signala) koji deli ulazni
signal na više različitih podopsega. Ulazni audio signal simultativno prolazi kroz psihoakustični
model koji određuje signal-maska odnos za svaki podopseg.
Bit ili šum blok za dodeljivanje, koristi odnos signal-maska kako bi pravilno odmerio i dodelio
broj kodiranih bitova potrebnih za kvantifikaciju svih podopsega signala kako bi umanjio čujnost
kvantifikovanog šuma. Na kraju, poslednji blok uzima tu reprezentaciju kvantifikovanog audio
sempla i formira bitove koje je moguće dekodirati.
Dekoder jednostavno vrši obrnuto formiranje, zatim rekonstruiše kvantifikovane vrednosti
svih podopsega u vremenski domen audio signala.
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti