ALFA BK UNIVERZITET

FAKULTET ZA MATEMATIKU I RAČUNARSKE NAUKE

STUDIJSKI PROGRAM: RAČUNARSKE NAUKE

DIPLOMSKI RAD

Predmet: Veštačka inteligencija II

SISTEMI I METODI ZA AUTOMATSKO 

PREVOĐENJE PRIRODNIH JEZIKA

Mentor:                                                                                                             Student:

Prof. Dejan Đukić                         

Adnan Muratović

Novi Pazar, 2020.god.

2

SADRŽAJ

UVOD..............................................................................................................................................3

1. RANA ISTORIJA......................................................................................................................5

1.1. Rani sistemi

...........................................................................................................................6

1.2. Kasniji periodi

.......................................................................................................................7

1.3. 21. vek – automatsko prevođenje govora

..............................................................................8

2. ZADACI I OGRANIČENJA....................................................................................................9

2.1. Konkretni problemi

...............................................................................................................9

3. OSTALI PROBLEMI............................................................................................................. 11

3.1. Segmentacija govora

...........................................................................................................11

3.2. Segmentacija teksta

.............................................................................................................11

3.3. Razlučivanje dvosmislenosti značenja reči

.........................................................................11

3.4. Sintaktička dvosmislenost

...................................................................................................11

3.5. Nesavršen ili neregularan ulaz

............................................................................................12

3.6. Ostvarivanje i planovi u govoru

..........................................................................................12

3.7. Statistička obrada prirodnog jezika

.....................................................................................12

3.8. Glavni zadaci u obradi prirodnog jezika

.............................................................................12

3.9. Istorijat procene u obradi prirodnog jezika

.........................................................................13

4. MAŠINE NE SPOZNAJU KULTURU..................................................................................15

4.1. Mašine ne povezuju reči i značenja

....................................................................................15

4.2. Jezik se stalno razvija

..........................................................................................................15

4.3. Mašine ne prepoznaju stil i ton

...........................................................................................16

4.4. Mašine koje prevode - nastanak i istorija

............................................................................16

5. ANALIZA KORPUSA............................................................................................................17

ZAKLJUČAK.............................................................................................................................. 20

BIBLIOGRAFIJA.......................................................................................................................27

background image

4

uopšte ne može biti programiran iz razloga što tehnika napreduje iz dana u dan velikom brzinom, 

tako da ono što danas izgleda nemoguće sutra može biti deo svakodnevnice.)

Najveći problem kod mašinskog prevođenja se javlja kod višestrukih značenja reči i kod 

reda reči u rečenici koji se veoma često ne poklapa u različitim jezicima. Veoma je važno 

naglasiti problem kod prevođenja književnih tekstova, gde se u većini slučajeva dobija bukvalan 

prevod u kojem često ne možemo pronaći čak ni istu poruku i smisao kao u delu na izvornom 

jeziku, o čemu će opširnije biti reči dalje u tekstu i pri analizi korpusa.

U ovom radu bavićemo se analizom mašinskog prevoda pripovedke „Deca“ Ive Andrića. 

U  analizi  smo   koristili  Google   prevodilac-program   za   mašinsko   prevođenje  tekstova  koji   je 

najdostupniji i najčešće se koristi jer je besplatan .Zbog ograničenosti dužinom rada, bavićemo 

se analizom samo jednog segmenta i to onim rečima koje su ostale neprevedene u mašinskom 

prevodu.   Međutim,   uvid   u   sam   prevod   i   njegovo   poređenje   sa   originalom   pokazuje   brojna 

odstupanja i grešaka, koji dovode do toga da su delovi rečenica i čitave rečenice prevoda ne 

samo semantički neprozirne nego i besmislene.

U završnom delu ovog radu bavićemo se analizom mašinskog prevođenja Andrićeve 

pripovetke „Deca“.Koristićemo Gugl prevodilac program za mašinsko prevođenje tekstova koji 

je   najdostupniji   i   najčešće   se   koristi   jer   je   besplatan.   Zbog   ograničenosti   dužine   rada 

analiziraćemo samo jedan od velikog broja nedostataka koji se javljaju kod ovakvog prevođenja, 

a sve to u cilju da pokažemo da ipak neke stvari još uvek ne možemo prepustiti mašinama, da je 

čovek taj koji na kvalitetniji način uspeva da se uhvati u koštac sa ne baš lakim izazovom 

prevođenja jednog književnog dela.

5

1. RANA ISTORIJA

1930-ih godina pojavili su se prvi patenti za mašine prevodioce koji su se bazirali na 

dvojezičnom rečniku i korišćenju papirnih rolni. Nakon toga, 1950.Godine, ruski nastavnik je 

predložio detaljniji plan izgradnje mašine. U tu mašinu su bili uključeni i dvojezični rečnici i 

metod koji se bavio gramatičkim pravilima među jezicima, a bazirao se na esperantu. Sistem je 

obuhvatao   tri   faze;   prvi   segment   je   podrazumevao   da   maternji   govornika   jezika   sa   kog   se 

prevodilo da organizuje reči po njihovim logičkim formama i sintaksičkim funkcijama, zatim u 

drugoj fazi se zahtevalo da mašina prevede te reči na ciljni jezik, a u trećoj fazi je maternji 

govornik imao za zadatak da normalizuje prevod, odnosno da preformuliše rečenicu da bude u 

skladu i duhu sa jezikom na koji se prevodilo.

1

Rana istorija mašinskog prevođenja vezuje se za 1949.godinu kada je Voren Viver iz 

“Rokfeler” fondacije počeo praviti kombinovanu mašinu koja obrađuje kod i prirodni jezik. 

Bazirana je na teoriji informacija koja je bila uspešna u dekodovanju tokom Drugog svetskog 

rata. Predstavlja pionir koncepta računarskog prevoda, a detaljnije o njoj se može pročitati u 

Viverovom   „Memorandumu   o   prevođenju“.   Zapanjujuća   je   činjenica   da   nije   prošlo   mnogo 

vremena od te, prve „prave“ mašine za prevođenje pre nego što su počeli projekti za računarsko 

prevođenje.   Jedan   od   takvih   projekata   je   pokrenuo   istraživački   tim   „Džordžtauna-   IBM 

eksperiment“ koji je 1954. godine demonstrirao mašinu koja je mogla prevesti 250 reči i 49 

specijalno odabranih rečenica sa ruskog na engleski jezik. Polja pokrivena ovom mašinom bila 

su uglavnom o hemiji i nauci.

1.1. Rani sistemi

Rani sistemi su se koristili dvojezičnim rečnicima i ručno kodovanih pravila koja su se 

odnosila na utvrđivanje reda reči u rečenici u završnom prevodu za koji se smatrao za previše 

1

 Škaljić, Abdulah , Turcizmi u srpskohrvatskom jeziku, Svjetlost, Sarajevo, 1989, 6. Izdanje

background image

7

Nisu svi imali viđenje poput ALPAC-a. S druge strane se nalazila kanadski METEO 

sistem koji je prevodio vremensku prognozu i ostale meteorološke izveštaje sa engleskog na 

francuski jezik. To je bio jednostavan program koji je bio u mogućnost da prevede 80 000 reči 

dnevno. Koristio se sve do ranih 2000-ih kada je sistem zahtevao unapređenje.

Od 1980ih su naučnici pokušavali da razviju mašinu koja će prevoditi jezik prevazilazeći 

prepreke u nijansama među jezicima i govornoj komunikaciji. Ali je sistem uvek doživljavao isti 

problem kada je pokušano da se tekst prevede na drugi jezik bez da se izgubi na smislu i 

značenju.

1.3. 21. vek – automatsko prevođenje govora

Obrada prirodnog jezika (OPJ) je oblast veštačke inteligencije i lingvistike koja se bavi 

proučavanjem   problema   automatskog   proizvođenja   i   razumevanja   prirodnih   ljudskih   jezika. 

Sistemi za proizvođenje prirodnog jezika pretvaraju informacije iz računarske baze podataka u 

ljudski jezik koji prirodno zvuči a sistemi za razumevanje prirodnog jezika pretvaraju primere 

ljudskog jezika u više formalne predstave sa kojima računarski programi lakše manipulišu.

3

Bez obzira na velike napretke u svetu tehnologije, shvatanje načina na koji ljudski mozak 

funkcioniše i dalje je veoma teško. Iako je preporučljivije da se za poslovne i sudske prevode 

kontaktiraju prevodilačke agencije, mnogi pribegavaju korišćenju veštačke inteligencije. Mašine 

i onlajn prevodioci su se razvili do te mere, da učenici uglavnom koriste gugltranslejt za svoje 

domaće zadatke iz stranog jezika. U poslednjih par godina, mašine-prevodioci su postale tačnije 

tako što programi „uče“ više o značenju reči i njihovom sadržaju, mada nije evidentno da li će 

mašine moći dazamene ljude kada je reč o prevođenju. Zašto?

U  polju   kompjuterskog   prevođenja  u   poslednjih   nekoliko   godina  došlo   je   do   velikih 

promena.   Trenutno   se   vrši   veliki   broj   istraživanja   o   statističkim   postupcima   kompjuterskog 

prevđenja i prevođenja koje se zasniva na primerima. Što se tiče oblasti koja prevodi govor, 

istraživanja se fokusiraju na prelazak sa sistema ograničenih domena na sistem neograničenih 

3

Sibinović, Novi original: Uvod u prevođenje, Naučna knjiga, Beograd, 1999.

Želiš da pročitaš svih 27 strana?

Prijavi se i preuzmi ceo dokument.

Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.

Slični dokumenti