Sistemi i metodi za automatsko prevođenje prirodnih jezika: analiza mašinskog prevoda
ALFA BK UNIVERZITET
FAKULTET ZA MATEMATIKU I RAČUNARSKE NAUKE
STUDIJSKI PROGRAM: RAČUNARSKE NAUKE
DIPLOMSKI RAD
Predmet: Veštačka inteligencija II
SISTEMI I METODI ZA AUTOMATSKO
PREVOĐENJE PRIRODNIH JEZIKA
Mentor: Student:
Prof. Dejan Đukić
Adnan Muratović
Novi Pazar, 2020.god.
2
SADRŽAJ
1.3. 21. vek – automatsko prevođenje govora
..............................................................................8
3.3. Razlučivanje dvosmislenosti značenja reči
.........................................................................11
3.4. Sintaktička dvosmislenost
3.5. Nesavršen ili neregularan ulaz
............................................................................................12
3.6. Ostvarivanje i planovi u govoru
..........................................................................................12
3.7. Statistička obrada prirodnog jezika
.....................................................................................12
3.8. Glavni zadaci u obradi prirodnog jezika
.............................................................................12
3.9. Istorijat procene u obradi prirodnog jezika
.........................................................................13
4.1. Mašine ne povezuju reči i značenja
....................................................................................15
4.3. Mašine ne prepoznaju stil i ton
...........................................................................................16
4.4. Mašine koje prevode - nastanak i istorija
............................................................................16

4
uopšte ne može biti programiran iz razloga što tehnika napreduje iz dana u dan velikom brzinom,
tako da ono što danas izgleda nemoguće sutra može biti deo svakodnevnice.)
Najveći problem kod mašinskog prevođenja se javlja kod višestrukih značenja reči i kod
reda reči u rečenici koji se veoma često ne poklapa u različitim jezicima. Veoma je važno
naglasiti problem kod prevođenja književnih tekstova, gde se u većini slučajeva dobija bukvalan
prevod u kojem često ne možemo pronaći čak ni istu poruku i smisao kao u delu na izvornom
jeziku, o čemu će opširnije biti reči dalje u tekstu i pri analizi korpusa.
U ovom radu bavićemo se analizom mašinskog prevoda pripovedke „Deca“ Ive Andrića.
U analizi smo koristili Google prevodilac-program za mašinsko prevođenje tekstova koji je
najdostupniji i najčešće se koristi jer je besplatan .Zbog ograničenosti dužinom rada, bavićemo
se analizom samo jednog segmenta i to onim rečima koje su ostale neprevedene u mašinskom
prevodu. Međutim, uvid u sam prevod i njegovo poređenje sa originalom pokazuje brojna
odstupanja i grešaka, koji dovode do toga da su delovi rečenica i čitave rečenice prevoda ne
samo semantički neprozirne nego i besmislene.
U završnom delu ovog radu bavićemo se analizom mašinskog prevođenja Andrićeve
pripovetke „Deca“.Koristićemo Gugl prevodilac program za mašinsko prevođenje tekstova koji
je najdostupniji i najčešće se koristi jer je besplatan. Zbog ograničenosti dužine rada
analiziraćemo samo jedan od velikog broja nedostataka koji se javljaju kod ovakvog prevođenja,
a sve to u cilju da pokažemo da ipak neke stvari još uvek ne možemo prepustiti mašinama, da je
čovek taj koji na kvalitetniji način uspeva da se uhvati u koštac sa ne baš lakim izazovom
prevođenja jednog književnog dela.
5
1. RANA ISTORIJA
1930-ih godina pojavili su se prvi patenti za mašine prevodioce koji su se bazirali na
dvojezičnom rečniku i korišćenju papirnih rolni. Nakon toga, 1950.Godine, ruski nastavnik je
predložio detaljniji plan izgradnje mašine. U tu mašinu su bili uključeni i dvojezični rečnici i
metod koji se bavio gramatičkim pravilima među jezicima, a bazirao se na esperantu. Sistem je
obuhvatao tri faze; prvi segment je podrazumevao da maternji govornika jezika sa kog se
prevodilo da organizuje reči po njihovim logičkim formama i sintaksičkim funkcijama, zatim u
drugoj fazi se zahtevalo da mašina prevede te reči na ciljni jezik, a u trećoj fazi je maternji
govornik imao za zadatak da normalizuje prevod, odnosno da preformuliše rečenicu da bude u
skladu i duhu sa jezikom na koji se prevodilo.
Rana istorija mašinskog prevođenja vezuje se za 1949.godinu kada je Voren Viver iz
“Rokfeler” fondacije počeo praviti kombinovanu mašinu koja obrađuje kod i prirodni jezik.
Bazirana je na teoriji informacija koja je bila uspešna u dekodovanju tokom Drugog svetskog
rata. Predstavlja pionir koncepta računarskog prevoda, a detaljnije o njoj se može pročitati u
Viverovom „Memorandumu o prevođenju“. Zapanjujuća je činjenica da nije prošlo mnogo
vremena od te, prve „prave“ mašine za prevođenje pre nego što su počeli projekti za računarsko
prevođenje. Jedan od takvih projekata je pokrenuo istraživački tim „Džordžtauna- IBM
eksperiment“ koji je 1954. godine demonstrirao mašinu koja je mogla prevesti 250 reči i 49
specijalno odabranih rečenica sa ruskog na engleski jezik. Polja pokrivena ovom mašinom bila
su uglavnom o hemiji i nauci.
1.1. Rani sistemi
Rani sistemi su se koristili dvojezičnim rečnicima i ručno kodovanih pravila koja su se
odnosila na utvrđivanje reda reči u rečenici u završnom prevodu za koji se smatrao za previše
Škaljić, Abdulah , Turcizmi u srpskohrvatskom jeziku, Svjetlost, Sarajevo, 1989, 6. Izdanje

7
Nisu svi imali viđenje poput ALPAC-a. S druge strane se nalazila kanadski METEO
sistem koji je prevodio vremensku prognozu i ostale meteorološke izveštaje sa engleskog na
francuski jezik. To je bio jednostavan program koji je bio u mogućnost da prevede 80 000 reči
dnevno. Koristio se sve do ranih 2000-ih kada je sistem zahtevao unapređenje.
Od 1980ih su naučnici pokušavali da razviju mašinu koja će prevoditi jezik prevazilazeći
prepreke u nijansama među jezicima i govornoj komunikaciji. Ali je sistem uvek doživljavao isti
problem kada je pokušano da se tekst prevede na drugi jezik bez da se izgubi na smislu i
značenju.
1.3. 21. vek – automatsko prevođenje govora
Obrada prirodnog jezika (OPJ) je oblast veštačke inteligencije i lingvistike koja se bavi
proučavanjem problema automatskog proizvođenja i razumevanja prirodnih ljudskih jezika.
Sistemi za proizvođenje prirodnog jezika pretvaraju informacije iz računarske baze podataka u
ljudski jezik koji prirodno zvuči a sistemi za razumevanje prirodnog jezika pretvaraju primere
ljudskog jezika u više formalne predstave sa kojima računarski programi lakše manipulišu.
Bez obzira na velike napretke u svetu tehnologije, shvatanje načina na koji ljudski mozak
funkcioniše i dalje je veoma teško. Iako je preporučljivije da se za poslovne i sudske prevode
kontaktiraju prevodilačke agencije, mnogi pribegavaju korišćenju veštačke inteligencije. Mašine
i onlajn prevodioci su se razvili do te mere, da učenici uglavnom koriste gugltranslejt za svoje
domaće zadatke iz stranog jezika. U poslednjih par godina, mašine-prevodioci su postale tačnije
tako što programi „uče“ više o značenju reči i njihovom sadržaju, mada nije evidentno da li će
mašine moći dazamene ljude kada je reč o prevođenju. Zašto?
U polju kompjuterskog prevođenja u poslednjih nekoliko godina došlo je do velikih
promena. Trenutno se vrši veliki broj istraživanja o statističkim postupcima kompjuterskog
prevđenja i prevođenja koje se zasniva na primerima. Što se tiče oblasti koja prevodi govor,
istraživanja se fokusiraju na prelazak sa sistema ograničenih domena na sistem neograničenih
Sibinović, Novi original: Uvod u prevođenje, Naučna knjiga, Beograd, 1999.
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti