Odlomak

Inteligentna pretraga teksta – Text mining
1.    Uvod

Svako poduzeće ili bilo kakve organizacije prikupljaju velike količine podatakapotrebnih za svoje poslovanje. Međutim, nas zanima, postoje li još nekakve dodatne informacije u tim već prikupljenim i poznatim podatcima koje mogu biti korisne za poslovanje nekog poduzeća. Možemo li iz “iskopanih” podatka “iskopati” još korisnih informacija?
Rudarenje podataka koristi metode koje su poznate u statistici, veštačkoj inteligenciji, matematici i računovodstvu zbog automatskog otkrivanja skrivenih modela i uzoraka podataka u velikim količinama podataka. Svrha ovog procesa jeste predvideti ponašanje u budućim poslovnim događajima, osnovi znanja otkrivenog u podacima.

2.    Šta je inteligentna pretraga teksta (TEXT MINING)?

Text Mining se bavi pronalaženjem zanimljivih informacija u velikim skupovima tekstova, gde se pod ”zanimljivim” podrazumevaju: netrivijalne, skrivene, prethodno nepoznate i potencijalno korisne.

3.    Istorija

Intenzivna manualna upotreba Text Mining-a prvi put se pojavila sredinom 80-ih godina 20. veka, ali tehnološki pronalasci omogućili su da ova oblast izuzetno napreduje 90-ih. Text Mining je interdisciplinarna oblast koja povezuje vraćanje informacija, Data Mining, mašinsko učenje, statistiku i kompjutersku lingvistiku. Kako je veliki deo informacija (preko 80%) trenutno prikazano kao tekst, Text Mining ima veliku potencijalnu vrednost u trgovini.
Povećalo se interesovanje višejezičnim Data Mining-om, da bi se dobilo više informacija za slične pojmove iz više različitih jezičkih izvora u skladu sa istim značenjem.
Iskorišćavanje velikih proporcija „nestruktuiranog“ teksta priznat je decenijama. Priznata je u najranojoj definiciji Business Intelligence (BI) u oktobru 1958.

No votes yet.
Please wait…

Prijavi se

Detalji dokumenta

Više u Informacione tehnologije

Više u Seminarski radovi

Više u Skripte

Komentari