FAKULTET INFORMACIONIH TEHNOLOGIJA

BANJA LUKA

SEMINARSKI RAD

PREDMET

: Menadžment poslovnih informacionih sistema

TEMA: DATA MINING (DM)

STUDENT:

                                                                                 

MENTOR: 

Boris Dramac                                     Prof.dr Gordana Radić

INDEX BROJ

:

188-11 VPI

                          Banja Luka, 2014.-te godine

Boris Dramac                                                                                              Seminarski rad

DATA MINING                                                               1

background image

Boris Dramac                                                                                              Seminarski rad

DATA MINING                                                               3

Primjena, pojam i porijeklo

Data Mining je ugrađeni dio otkrivanja znanja u bazama podataka, odnosno cjelokupni postupak 
pretvaranja ravnih podataka u potrebne informacije.

Data Mining radi algoritamski, gdje svaki algoritam treba da uklopi neki podatak u model. 
Potom se od više modela bira onaj koji je najbliži karakteristikama podataka

Porijeklo Data Mining potiče pojavom prvih stvari koje su nastale pojavom računara. To su:

-

Mašinsko učenje – kao oblast vještačke inteligencije predstavlja skup 
paradigmi algoritama, teoretskih rezultata i primjena iz oblasti vještačke 
inteligencije i evolucijom modela (u smislu pretraživanja) ali i drugih oblasti: 
statistike i vjerovatnoće (

Bajesov klasifikator, raspodele i testovi) i ostalih oblasti 

matematike, teorije izračunljivosti ( mora postojati svijest problema i ograničenjima 
koja proističu iz toga), teorije (adaptivnog) upravljanja, informacione teorije, 
psihologije i neurobiologije

-

Filozofije, kognitivnih i drugih nauka, neuronske mreže.

-

Vještačka inteligencija – predstavlja mješavinu konvencijonalne nauke, fiziologije, i 
psihologije, sve u interesu da se napravi mašina koja bi se, po ljudskim mjerilima, 
mogla smatrati “inteligentnom“. Baze podataka – je skup podataka organizovanih za 
brzo pretraživanje i pristup, koja zajedno sa sistemom za administraciju, 
organizovanje i memorisanje tih podataka čini sistem baze podataka. Sa strane 
korisnika može se reći da su podatci na neki način logički povezani.

-

Prepoznavanje oblika (paterni)

Boris Dramac                                                                                              Seminarski rad

DATA MINING                                                               4

Ciklus Data Mining-a

Istraživanje počinje od podataka u nekom baznom obliku. Nakon toga slijedi  preprocesiranje 
podataka

 

koje za cilj ima da te grube podatke pretvori u nešto što je istražive prirode i da izvuče 

iz njih onaj skup podataka koji može biti relevantan za ciljano istraživanje. Tad se prelazi na 
Data Minig

.  

Postoje razni algoritmi koji se mogu primjeniti nad podacima, i koji daju neke 

rezultate. Izbor algoritma većinom zavisi od prirode podataka nad kojima se primjenjuje, ali i od 
tipa rezultata koji bi on trebao da izbaci- npr. Da li se želi neko predviđanje ili izvlačenje nekih 
pravilnosti   tj.   principa   itd.   Konačno,   kada   izaberemo   algoritam   i   dobijemo   neke   razumne 
rezultate, onda slijedi stepenica: 

postprocesiranje

.  Iako je velik dio posla završen i ova etapa 

ima   svoju   težinu.   Osnovni   zadatak   je   da   se   prouči   tj.   shvate   dobijeni   rezultati,   ili   njihova 
valjanost. 

Potrebno je stvoriti nekakvu vizualizaciju dobijenih rezultata, odnosa ili relacija koje su dobijene 
itd.

Preprocesiranje podataka služi da bi podatci bili transformisani u nešto što više odgovara 
potrebama istraživanja.

background image

Želiš da pročitaš svih 19 strana?

Prijavi se i preuzmi ceo dokument.

Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.

Slični dokumenti