Teorija informacija i kodova
Prvi čas

1.1. Osnovni elementi teorije vjerovatnoće

Na samom početku, ukratko ćemo predstaviti osnovne elemente teorije vjerovatnoće, koji će biti 
korišćeni u kursu. Napomenimo da ćemo ovdje već pomenuti neke pojmove kao što su  

signal

  i 

informacija

 i koji će biti definisani u narednoj lekciji. Pretpostavimo da u električnom kolu jedino 

stanje koje se može pojaviti u nekom čvoru je 5V. To stanje onda nije neodređeno i ako apriori 
znamo da je u toj tački napon 5V mjerenje ne moramo ni obaviti. U rječniku teorije informacija  
kaže se da ovo stanje ne nosi informaciju.

Ako postoji mogućnost da u pomenutoj tački postoji vrijednost 0V i 5V postoji potreba da se izvrši 
mjerenje i da se "ukine neodređenost" o vrijednosti stanja. Sada vrijednosti 0V možemo pridružiti 
vrijednost 0 i vrijednost 5V pridružiti vrijednost 1 u binarnoj aritmetici. Za ovu operaciju se kaže da 
smo kodirali stanje (poruku). 

Dalje, posmatrajmo mogućnost da imamo trideset mogućih naponskih stanja 0V, 1V, 2V, ... 29V 
kojima   možemo   pridružiti   slova   naše   abecede   A,   B,   C,   ...   Ž.   Sada   zamislimo   da   nam   neko 
mijenjajući stanje u tački kola prenosi poruku. Mi tu poruku možemo tumačiti mjerenjem napona u 
pojedinim trenucima. Ova operacija se uslovno može zvati dekodiranje.

Da bi se način "prenosa" optimizovao (poboljšao) neophodno je odrediti prirodu poruke koja se 
prenosi. Znači, mi očekujemo neku poruku nepoznate sadržine iz skupa svih poruka koje se na 
našem jeziku mogu izgovoriti. Da bi tačno kvantifikovali mogućnost pojavljivanja nekog slova 
koristimo   pojam   vjerovatnoće.   Tako   možemo   reći   da   je   vjerovatnoća   pojavljivanja   slova   A   u 
ukupnom   skupu   slova   u   našem   jeziku   neka   vrijednost.  Očigledno   je   ta   vrijednost   veća   nego 
pojavljivanje slova Š. Da bi način mjerenja (odnosno prenosa informacija) podesili pravilno, trebalo 
bi da nam mjerna skala oko vrijednosti napona koja daje slovo A, bude preciznija nego ona oko 
slova Š. Isto se dešava kod prenosa informacija. Dakle, poznavanje vjerovatnoće pojavljivanja 
nekog slova u poruci opredjeljuje performanse sistema. Sistem koji govori o porukama koje su 
unaprijed nepoznate sadržine je "stohastički" ili slučajan. Suprotno od ovoga su deterministički 
sistemi. Deterministički sistemi ne nose poruke i informacije, ali su lakši za analizu pa se stoga i u 
mnogim oblastima koje se bave porukama koriste kao model. Teorija informacija i kodova međutim 
polazi od slučajnih poruka sa određenom vjerovatnoćom pojavljivanja određenog simbola.

Drugi veoma značajan razlog za uvođenje pojmova teorije vjerovatnoće u teoriju informacija je 
postojanje određenih vrsta smetnji koje se pri slanju, prenosu, prijemu i razumjevanju poruke mogu 
dogoditi. Sve ove smetnje se na nekom nivou mogu opisati determinističkim zakonima. Međutim, 
za dovoljno preciznu analizu dovoljne su procjene procesa koji dovode do smetnji. Takve procjene 
ćemo nazivati šumovima. Važno je napomenuti da neke vrste šumova potiču od termičkog kretanja 
elektrona, druge su izazvane atmosferskim procesima ili ljudskim aktivnostima. Međutim, mi u 
ovom kursu nećemo razmatrati šum na fizičkom nivou već samo kao model.

Posmatrajmo sada sljedeći slučajni događaj: izbor jednog elementa iz konačnog skupa  

X

  koji se 

sastoji od elemenata 

x

i

X

i

=1,2,...,

N

. Ponavlja se veliki broj "izbora" iz skupa 

X

. Neka je svaki 

x

element "izvučen"  

k

i

  puta. Tada se može reći da je procjena vjerovatnoće pojavljivanja nekog 

elementa iz skupa 

X

 jednaka:

1

gdje je: 

k

1

+

k

2

+...+

k

N

=

K

. Ako je 

K

 veoma veliki broj (praktično beskonačan) nije više riječ o procjeni 

vjerovatnoće pojavljivanja nekog elementa već o vjerovatnoći. Uvijek je sporno koliko je dobra 
procjena vjerovatnoće događaja. Naime, za skup slova našeg jezika bi potpuno valjana procjena 
obuhvatila sve što je ikada rečeno i napisano na našem jeziku. Čak ni takva procjena ne može nam 
govoriti o kvalitetu mjerenja (određivanja neke poruke) jer npr. u poruci može biti izostavljen neki 
često ponavljani karakter. U daljem tekstu mi ćemo podrazumjevati da su nam vjerovatnoće (a ne 
procjene)   apriori   poznate.   U   nekim   slučajevima   ćemo   se   vratiti   na   problem   procjenjivanja 
vjerovatnoća. Srednja ili očekivana vrijednost koja opisuje događaj se određuje kao:

gdje je 

f

(

x

i

) neka funkcionalna zavisnost od elemenata skupa 

X

. Ako su elementi skupa 

X

 zapravo 

numerički kvantifikovani (brojevi) tada se srednja vrijednost definiše kao:

Druga važna karakteristika koja se koristi zapisivanje slučajnih procesa je varijansa:

gdje je 

 srednja kvadratna vrijednost. Srednja vrijednost predstavlja mjeru najvjerovatnijeg 

događaja dok varijansa predstavlja mjeru odstupanja od tog događaja.

Zapamtite. Suma vjerovatnoća svih događaja je 1. Vjerovatnoća nemogućeg događaja je 0.

Vjerovatnoća da slučajna promjenljiva uzme neke vrijednosti u skupu 

Y

 koji je podskup skupa 

X

 je 

jednaka:

Mi ćemo informacije posmatrati skoro isključivo kao diskretne slučajne procese (slučajne procese 
koji mogu uzeti vrijednost iz konačnog skupa vrijednosti). Pored ovakvih postoje i kontinualne 
slučajne   promjenljive,   koje   sa   određenom   vjerovatnoćom   mogu   uzeti   neku   vrijednost   iz 
kontinualnog   intervala.   U   tom   slučaju   nema   smisla   govoriti   o   vjerovatnoći   da   događaj   uzme 
vrijednost   2,   jer   događaj   može   uzeti   i   vrijednost   2.01,   2.0000001,   itd,   odnosno   vjerovatnoća 
"uzimanja"  jedne  diskretne  vrijednosti  iz posmatranog  skupa  može  se  smatrati  jednakom  nula. 
Stoga se uvodi pojam funkcije raspodjele. Ako je 

 slučajna promjenjiva, koja može uzeti bilo koju 

vrijednost na intervalu od -

 do 

, tada se funkcija raspodjele definiše kao vjerovatnoća da događaj 

uzme neku vrijednosti koja je manja od vrijednosti 

x

:

Očigledno važe slijedeće relacije 

  i 

  kao i činjenica da je funkcija raspodjele 

neopadajuća   funkcija   (kako   vrijednost   argumenta  

x

  raste,   tako   ova   funkcija   raste   ili   uzima 

prethodnu  vrijednost). Ova činjenica se može matematički zapisati kao  

Druga   izuzetno   značajna   funkcija   koja   se   definiše   kod   kontinualnih   slučajnih   promjenljivih   je 
funkcija gustine vjerovatnoće:

2

background image

Ako   su  

A

  i  

B

  nezavisni   tada   važi  

  odnosno  

Događaj “dogodili se i 

A

 i 

B

” se često obilježava kao 

AB.

 Uočimo dalje da važi:

odnosno

Ako se u nekom trenutku može prenositi set simbola 

B

i

i

=1,...,

N

, tada je vjerovatnoća događaja 

jednaka:

Pa se Bayesovo pravilo može svesti na:

i opisuje aposteriori vjerovatnoću (vjerovatnoću ako već znamo da se dogodio događaj 

A

 kolika je 

vjerovatnoća da ga je uzrokovao događaj 

B

j

).

1.2. Višedimenzione slučajne promjenljive

Funkcija združene gustine raspodjele (združena raspodjele) slučajnih promjenljivih 

 i 

 se definiše 

kao   vjerovatnoća   događaja   {



x



y

}   i   označava   se   kao

 

P



(

x

;

y

. Marginalne funkcije se definišu kao  

  i 

. Funkcija gustine raspodjele se definiše kao:

Za diskretnu dvodimenzionu slučajnu promjenljivu funkcija gustine raspodjele se definiše kao: 

. Marginalne funkcije gustine raspodjele se dobijaju kao:

 

1.3. Slučajni procesi

Slučajni proces 

(

t

,

s

) je funkcija koja preslikava prostor događaja u familiju vremenskih funkcija. 

Ovo je proširenje pojma slučajne promjenljive, jer svakom od mogućih događaja (stanja ili ishoda) 
umjesto   broja   pridružuje   odgovarajuća   vremenska   funkcija.   Skup   svih   mogućih   vremenskih 
funkcija se naziva 

ansambl

, a pojedine funkcije su realizacije ili članovi ansambla. 

Funkcija   raspodjele   slučajnog   procesa  

s

(

t

1

)=

s

1

  se   označava   sa  

Slučajan proces je stacionaran ako njegova raspodjela ne zavisi od pomjeraja duž vremenske ose:

Slučajni proces je stacionaran u širem smislu ako srednja vrijednost i varijansa procesa ne zavise od 
vremenskog trenutka:

4

gdje je 

 autokorelaciona funkcija.

Očekivana   vrijednost   procesa   predstavlja   vremensku   funkciju   koja   pokazuje   koliko   pojedine 
realizacije   iz   ansambla   imaju   srednju   vrijednost   u   ovom   trenutku.   Autokorelaciona   funkcija 
predstavlja srednju vrijednost proizvoda signala u dva različita vremenska trenutka.

Pored ovih veličina može se uvesti i srednja vrijednost slučajnog procesa unutar njegovog trajanja 
za datu realizaciju:

Vremenska autokorelaciona funkcija 

 se definiše kao:

Srednja vrijednost po vremenu za generalizovanu autokorelaciju se označava kao:

Ako   su   sve   srednje   vrijednosti   računate   po   ansamblu   jednake   svim   srednjim   vrijednostima 
računatim po vremenu, proces se naziva ergodičnim. Svaki ergodični proces je stacionaran. Naime, 
srednja   vrijednost   po   vremenu   ne   zavisi   od   posmatranog   vremenskog   trenutka.   Ako   je   proces 
ergodičan to znači da ni srednja vrijednost po ansamblu (koja je jednaka srednjoj vrijednosti po 
vremenu)   ne   zavisi   od   vremena.   Ovo   je   osobina   koja   važi   za   stacionarne   procese.   Međutim, 
stacionarnost ne implicira ergodičnost. 

1.4. Spektralne karakteristike slučajnih procesa

Spektralna gustina snage slučajnog procesa 

x

(

t

) se definiše kao:

gdje je:

Snaga slučajnog signala je jednaka:

Kako je spektralna gustina parna realna funkcija važi:

5

Ergodičan

Stacionaran 
u širem 
smislu

Stacionaran u 
užem smislu

Odnosi između pojedinih 
familija slučajnih procesa

background image

1.6. Model sistema za prenos infomracija

Osnovni komunikacioni model za prenos informacija se može opisati sljedećim dijagramom. U 
opštem slučaju izvor poruka može da proizvodi četiri tipa poruka: analogne; diskretne; kontinualne 
sa diskretnim vrijednostima amplitude; digitalne.

Osnovni problem prilikom prenosa informacija je da se na nekoj tački tačno ili približno tačno 
reproducira poruka odabrana u nekoj drugoj tački (C. Shannon 1948.god). 

Mi ćemo posmatrati izvor digitalnih ili diskretnih podataka. Koder izvora teži da eliminiše koliko je 
god moguće, redudanciju između podataka. Redudancija je nepotrebno ponavljanje informacija koja 
je česta i u svakodnevnom životu. Npr. danas, 15.X.2004, srijeda, pada kiša. Ako je ova rečenica 
izgovorena  na dati  datum  onda je  15.X.2004  i  srijeda redudantno  sa  riječju  danas.  Uklanjanje 
redundancije se vrši u cilju kompresije podataka (smanjivanja broja podataka koji je neophodno 
prenijeti kanalom). Koder kanala dodaje malu količinu redudancije u podatke da bi obezbjedio 
mogućnost detekcije i korekcije grešaka iz podataka. Kanal je medijum preko kojeg se prenose 
poruke. To može biti bilo koji put kojim poruke se mogu transportovati uključujući i magnetne 
medije za smještaj poruka, generičke kanale, radio veze, radio relejne linkove, kompjutersku mreži, 
satelitsku komunikacije, itd. Dekoder kanala vrši korekciju i detekciju grešaka, dekoder izvora vrši 
operacije koje su neophodne da se dobija poruka u obliku prihvatljivom za korisnika.

Model sistema za prenos informacija može da uključi i neke druge blokova. Neki sistemi sadrže 
blok koji predstavlja ograničenja koja su nametnuta tom kanalu, blok koji omogućuje kriptografiju i 
dekripciju, blok koji vrši kompresiju sa gubicima. Ove teme se mogu ubrojati u one koje pokriva 
teorija informacija i kodova, ali izlaze iz okvira ovog  predmeta. Neke elemente ovih dodatnih 
sistema ćete učiti iz nekih drugih predmeta. Od naredne lekcije ćemo učiti jedno od najvažnijih 
pitanja teorije informacija, a to je kako mjeriti količinu informacije. Naredno pitanje je koliko i 
kako možemo vršiti kompresiju. Dalje, kako možemo izbjeći greške koje se dešavaju u prenosu? 
Koliko brzo možemo prenositi informacije u kanalu? itd. Ovo su samo neka od pitanja u teoriji 
inforamcija i kodova, kojih ćemo se držati. Naravno, neka od ovih pitanja nijesu do kraja riješena i 
predstavljaju i dalje važan teorijski problem, ali mi ćemo se zadržati na osnovnim rješenjima i dati 
vam neophodno predznanje da vi možete sami da idete dalje kroz ovu ponekad komplikovanu 
oblast. Posebno treba obratiti pažnu na činjenicu da sistemi postaju sve složeniji i ne mogu biti 
razmatrani na intuitivan - empirijski način, već moraju biti posmatrano egzaktno matematički i 
algoritamski.

Teorija   informacija   se   može   posmatrati   kao   fundament   informacione   revolucije   koja   je   počela 
krajem prošlog vijeka. Ako je kraj devetnaestog vijeka obilježila industrijska revolucija zasnovna 
na   zakonima   statističke   mehanike   postojeća   informatička   revolucija   je   zasnovana   na   zakonima 
teorije   informacija.   Fundamenti   ove   teorije   su   postavljeni   od   strane   jednog   čvojeka   -   Clauda 
Shannona, koji je definisao sve fundamentalne zakone u ovoj teoriji počevši od 1948. godine. Neki 
od fundamentalnih principa i teorijskih limita koje je on postavio osnova su ove naučne discipline. 
Teorija je prednjačila za informatičkom revolucijom više desetina godina, što nije bio slučaj sa 
industrijskom revolucijom. Učinak Shannona se stoga može mjeriti samo sa učinkom Anštajna u 
fizici. Drugo važno ime u ovoj oblasti je ruski matematičar Kolmogorov koji je dao značajnu 
matematičku   podlogu.   Na   žalost,   rezultati   Kolmogorova   su   poznati   na   zapadu   tek   početkom 
sedamdesetih godina. Drugi razlog zbog čega ovi rezultati nijesu direktno primjenjeni u teoriji 

7

Želiš da pročitaš svih 118 strana?

Prijavi se i preuzmi ceo dokument.

Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.

Slični dokumenti