Audio kompresija Pregled

Smer: Informacione tehnologije
Predmet: Multimedijalni sistemi

SEMINARSKI RAD

AUDIO KOMPRESIJA

Profesor:

Studenti:

Vladimir Mladenović
Asistent:
Maja Radović

Nenad Miloradovic 540/2014

Aleksandra Milenković 553/2014

Čačak

Decembar, 2014.

UNIVERSITY OF KRAGUJEVAC

FACULTY OF TEHNICAL SCIENCE

УНИВЕРЗИТЕТ У КРАГУЈЕВЦУ

ФАКУЛТЕТ ТЕХНИЧКИХ НАУКА

Sadrzaj

Sadrzaj.............................................................................................................................................2
1. Audio kompresija.........................................................................................................................3

1.1 Kompresija bez gubitaka....................................................................................................... 3
1.2 Kompresija sa gubicima........................................................................................................ 3

2. Moderne metode audio kompresije.............................................................................................4
3. MPEG audio kompresija / MPEG-1 Layer-3 (MP3)...................................................................5

4. Karakteristike MP3 kompresije...................................................................................................8

4.1 FILE Format..........................................................................................................................8
4.2 MPEG-1/2 Layer-3 format zaglavlja.....................................................................................8

5. Vizuelni prikaz zglavlja MP3 formata.........................................................................................9
6. Zašto MP3 kompresija ?............................................................................................................ 10

6.1 Ukratko o MP3 kompresiji.................................................................................................. 10

2. Moderne metode audio kompresije

Postoji nekoliko algoritama moderne kompresije i metoda za skladištenje audio sadržaja

u kompjuterskoj tehnologiji:

•

MP3 (MPEG-1 Layer-3)

Sastoji se od psihoakustičnog modela, FFT analiza, hibridnih filtera, nelinearnekvantizacije,
Huffman-ovog kodovanja, 2 kanala sa konstantnimilipromenjivim brzinama bita od 32 do 256
kb/s i koji je uspešno implementiran u moderne CD/DVD i portabl plejere, mobilne telefone,...

•

MP3 Pro

Kreiran od strane Coding Technologies Laboratory, zasniva se naprincipima formiranja MP3
formata, sastoji se od SBR (Spectral BandReplication) tehnologije koja koduje visoko frekventni
opseg (od 10 do 15 kHz) sa veoma malom brzinom bita.

•

AAC (MPEG-2 Advanced Audio Coding)

Kreiran od strane AT&T, Dolbija, Fraunhofer IIS i Sonija, je ISO standardMPEG-2 koji se
sastoji od osnovnih principa MP3 formata uključujućipsihoakustični model, hibridne filtere,
skalabilne brzine odmeravanja, 2 kanala sa brzinama bita od 48 do 576 kbps.

•

AAC Plus

Potiče od AAC formata, sastoji se od SBR-a sa brzinom bita do 100 kbps.

•

WMA (Windows Media Audio)

Kreiran od strane Mikrosofta, sastoji se od DRM (Digital Rights Management), CBR i VBR,
WMA kodovanja digitalnog audia bez gubitaka (brzine bita 2:1do 3:1), WMA profesionalno
kodovanje višekanalnog audia (128 do 768 kbps) i WMA za kodovanje glasa (od 4 do 20 kbps).

•

VQF (Vector Quantization File)

Kreiran od strane NNT Human Interface Laboratories i Yamaha, nastao jena osnovu MP3
principa, kompleksnijeg kodovanja, 25-35% bolja kompresija u odnosu na MP3 kompresiju.

3. MPEG audio kompresija / MPEG-1 Layer-3 (MP3)

The Motion Picture Experts Group (MPEG) radna grupa je osnovana 1988. godine i

definisala   je   standarde   za   video   i   audio   kompresiju.   Objavljen   1993.   godine   od   strane
International   Standards   Organization   /   International   Electrotechnical   Commission   (ISO/IEC),
MPEG-1, ISO/IEC 11172 standard uključuje specifikacije za 1-2 Mbps video kompresiju i tri
sloja za audio kompresiju.
Termin   MP3   je   obično   korišćen   kao   referenca   za   MPEG-1   Layer-3   specifikaciju   za   audio
kodovanje. MP3 standard definiše procese dekodovanja, format niza bita i strategiju kodovanja
audio sadržaja. Samo jezgro algoritama i teoriju su prvobitno razvili na Fraunhofer Institutu, koji
ima nekoliko patenata vezanih za ovaj metod kodovanja.
MPEG   audio   istraživači   su   izvršili   obiman   subjektivan   slušalački   test   kroz   razvoj   ovog
standarda. Test je pokazao da čak pri kompresiji 6:1 i pri optimalnim uslovima za slušanje,
slušalački experti nisu bili u stanju da razlikuju kodirani i originalni audio klip.

Empirijski rezultati su takođe pokazali da ljudsko uho ima ograničenu frekvencijsku selektivnost
koja varira u oštrini od nešto manje od 100Hz za najniže čujne frekvencije do nešto više od 4kHz
za najviše. Prema tome čujni spektrum može biti podeljen na kritične opsege koji predstavljaju
moć razlučivanja ljudskog uha kao funkcija zavisna od frekvencije.

Zbog toga što ljudsko uho ima ograničenu moć da razlikuje frekvencije, ta kritična tačka

za maskiranje šuma bilo koje frekvencije jedino zavisi od aktivnosti signala u kritičnom opsegu
te frekvencije. Za audio kompresiju, ova osobina odnosno to pravilo se može koristiti u
transformisanju audio signala u domen frekvencija, zatim podeliti rezultajući spektrum u
podopsege koji približno odgovaraju
kritičnim opsezima i na kraju kvantifikovati
svaki podopseg na osnovu čujnosti
kvantifikovanog šuma koji se nalazi unutar
tog opsega. Za optimalnu kompresiju, svaki
opseg bi trebao biti kvantifikovan sa ne
većim brojem nivoa od potrebnog, da bi
kvantifikovan šum bio nečujan.

3.1 MPEG audio kodovanje i dekodovanje

Ulazni audio signal prolazi kroz filter bank (deo za filtriranje signala) koji deli ulazni

signal na više različitih podopsega. Ulazni audio signal simultativno prolazi kroz psihoakustični
model koji određuje signal-maska odnos za svaki podopseg.
Bit ili šum blok za dodeljivanje, koristi odnos signal-maska kako bi pravilno odmerio i dodelio
broj kodiranih bitova potrebnih za kvantifikaciju svih podopsega signala kako bi umanjio čujnost
kvantifikovanog šuma. Na kraju, poslednji blok uzima tu reprezentaciju kvantifikovanog audio
sempla i formira bitove koje je moguće dekodirati.
Dekoder jednostavno vrši obrnuto formiranje, zatim rekonstruiše kvantifikovane vrednosti
svih podopsega u vremenski domen audio signala.