Paketizacija govornog signala
INTERNACIONALNI UNIVERZITET U TRAVNIKU
POLITEHNIČKI FAKULTET
TRAVNIK
TEMA: PAKETIZACIJA GOVORNOG
SIGNALA
SEMINARSKI RAD
PREDMET: KOMUTACIONI SISTEMI
Predmetni nastavnik: Student:
Prof.dr. sc Goran Popović Suad Rodić
Asistent : Almedina Hatarić PT-21/14
Travnik, novembar 2016.
2

4
1. KODERI GOVORNOG SIGNALA
Govorni signal tipično zauzima frekvencijski opseg do 10kHz, ali se najveći dio snage
govornog signala nalazi u opsegu 300-3400Hz. Otuda se govorni signal tipično propušta kroz NF
filtar čija je gornja granica 3400Hz. Druga osobina govornog signala je da vokali (samoglasnici)
nose snagu govornog signala, a suglasnici razumljivost govornog signala, pri čemu su suglasnici
manje snage. Pošto digitalizacija inherentno unosi šum kvantizacije, poželjno je da ovaj šum
bude mali kada se digitalizuju suglasnici da bi se dobila veoma dobra razumljivost govornog
signala, dok kod vokala šum može biti i veći jer oni nose snagu govornog signala, a imaju manji
uticaj na razumljivost signala. Postoje i druge osobenosti govornog signala. Sve osobenosti
govornog signala se u većoj ili manjoj mjeri uzimaju prilikom digitalnog kodiranja govornog
signala. Kao rezultat koderi mogu da proizvedu kompaktniju digitalnu predstavu govornog
signala koja ima manji protok, ali i manji kvalitet reprodukcije, i obrnuto. Koji koder će se
koristiti zavisi od definisanog nivoa kvaliteta govornog signala, odnosno komunikacije, broja
istovremenih komunikacija koji se želi ostvariti, dozvoljenog protoka za jednu govornu
komunikaciju (razgovor) i sl. Koderi se često nazivaju i kompresorima jer tipično kompresuju
govorni signal da bi ostvarili niži protok, ali nauštrb
kvaliteta govornog signala. G.711 koder
daje najbolji kvalitet govornog signala i jedino se za njega govori da daje nekomprimovani
digitalizovani govorni signal. Kodere (kompresore) možemo podijeliti u dvije grupe:
Talasni koderi
Parametarski koderi
Talasni koderi se zasnivaju na ideji da se govorni signal kodira tako da se na prijemu
može rekonstruisati originalni talasni oblik govornog signala. Pošto se rekonstruiše originalni
talasni oblik signala, ovi koderi se u principu mogu primjeniti i na druge tipove signala, a ne
samo na govorne signale. Ovi koderi tipično omogućavaju veći kvalitet, ali zahtjevaju i veće
protoke. Rekonstrukcija talasnog oblika može biti rekonstrukcija talasnog oblika vremenskog
domena ili frekvencijskog domena. U slučaju vremenskog domena rekonstruiše se originalan
Prilog
nauštrb
koji znači na štetu, na račun nečega, piše se spojeno.
5
vremenski oblik signala u skladu sa principima zakona o odabiranju, pri čemu su najpoznatiji
takvi koderi G.711 i G.726 koderi. S druge strane, ideja rekonstrukcije talasnog oblika u
frekvencijskom domenu se zasniva na ideji da se frekvencijski spektar signala podjeli na
podopsege koji se zasebno kodiraju, pri čemu se važniji podopsezi kodiraju preciznije sa više
bita, a manje važni podopsezi se kodiraju sa manje bita tj. manje precizno. Drugi metod za
talasno kodiranje u frekvencijskom domenu je primjena brzih transformacija poput diskretne
kosinusne transformacije za predstavljanje odsječka govornog signala u vidu velikog broja
frekvencijskih opsega, pri čemu se vrši adaptivno kodiranje koeficijenata koji opisuju spektralne
karakteristike odsječka govornog signala. Koeficijenti se kodiraju adaptivno
tako da se
preciznije (sa više bita) kodiraju važniji koeficijenti, a manje precizno (sa manje bita) manje
važni koeficijenti. Napomenimo još da su talasni koderi jednostavni za implementaciju i brzo
vrše kodiranje (procesiranje govornog signala nije kompleksno kod talasnih kodera), pri čemu se
za kodiranje govornog signala češće koriste talasni koderi koji rekonstruišu talasni oblik
vremenskog domena.
Parametarski koderi se zasnivaju na ideji da se kodira govorni signal, odnosno za razliku
od talasnih kodera uzimaju se u obzir sve osobenosti govornog signala, pa parametarski koderi
nisu upotrebljivi za ostale tipove signala. Stoga, parametarski koderi vrše modelovanje govornog
trakta korisnika i prenose vrijednosti karakterističnih parametara govornog signala koji se
dobijaju analizom govornog signala. Na prijemu se na osnovu tih prenjetih parametara vrši
sinteza govornog signala. Međutim, cilj sinteze nije rekonstruisanje originalnog talasnog oblika
govornog signala, već dobijanje razumljivog govornog signala koji slušalac može da razumije.
Otuda se ovi sistemi još nazivaju sistemi analize i sinteze, jer se na predaji vrši analiza govornog
signala radi određivanja karakterističnih parametara govornog signala koji se potom prenose, a
onda se na prijemu na osnovu tih parametara sintetiše govorni signal. Ovi koderi omogućavaju
bolju kompresiju (zahtjevaju manji protok), ali imaju i niži kvalitet. Niži kvalitet potiče iz
činjenice da se govorni signal na prijemu sintetiše pa slušaocu takav govorni signal djeluje
vještački tj. neprirodan i bez emocija čime slušalac ima subjektivan osećaj nižeg kvaliteta
govornog signala i pored činjenice da je govorni signal u potpunosti razumljiv. Govorni signal je
potpuno razumljiv jer je glavni cilj parametarskih kodera da precizno prenesu parametre koji se
odnose na razumljivost govora. Takođe, parametarski koderi su procesorski zahtjevni pa je
implementacija ovih kodera kompleksnija nego u slučaju talasnih kodera. Parametarski koderi se
još nazivaju i vokoderi (
vocoder
). U najvećem broju parametarskih kodera se vrši simulacija
dekodera u okviru kodera radi što bolje procjene parametara govornog signala jer se odmah u
predajniku zna kako će izgledati sintetizovan govor čime je omogućeno preciznije određivanje
parametara govornog signala. Napomenimo da postoji i tzv. grupa hibridnih kodera koji
kombinuju pristupe talasnih i parametarskih kodera tako da ostvare niži protok i viši kvalitet
Adaptacija prilagodba

7
teksta podrazumjevati ovu vrednost). Naime, definiše se maksimalan apsolutni nivo govornog
signala (nivo može imati i pozitivnu i negativnu vrijednost) i potom se u slučaju uniformne PCM
modulacije čitav opseg nivoa govornog signala izdjeli na regione iste veličine kao na slici 1.1.1.
Svaki region se kodira sa 12 bita, dok 13. bit definiše znak regiona (pozitivan ili negativan).
Govorni signal se kodira tako što se odredi u koji region upada i potom se uzima dvanestobitni
kod regiona ispred kojega se stavlja znak regiona (koji u stvari odgovara znaku nivoa govornog
signala). Uniforman pristup isto tretira sve regione, odnosno šum kvantizacije je u prosjeku
uvijek isti nezavisno od nivoa signala, ali ovaj pristup nije optimalan jer, kao što je već
navedeno, niske nivoe govornog signala treba finije kvantizovati (tj. praviti manji šum
kvantizacije), nego visoke nivoe govornog signala. Iz tog razloga se koristi A zakon kompresije
koji uviđa logaritamsku prirodu govornog signala.
A zakon kompresije
F
(
x
) govornog odmjerka se definiše sljedećim izrazom:
F
(
x
)
=
¿
{
sgn
(
x
)
⋅
A
|
x
|
1
+
ln
A
,
|
x
|<
1
A
¿¿¿¿
(1.1.1)
gde je
x
normalizovana vrijednost odmjerka govornog signala,
A
parametar kompresije koji u
Evropi iznosi 87.7 (moguće je koristiti i vrijednost 87.6). Na prijemu se mora izvršiti
dekompresija koja je definisana sa:
F
−
1
(
y
)
=
¿
{
sgn
(
y
)
⋅
|
y
|
(
1
+
ln
A
)
A
,
|
y
|<
1
1
+
ln
A
¿¿¿¿
(1.1.2)
Naravno, implementirati rad sa ovim logaritamskim krivama nije efikasno rješenje, pa se
navedena kriva kompresije predstavlja u vidu osam linearnih segmenata za oba znaka kao što je
prikazano na slici 1.1.2.
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti