Data Mining
FAKULTET INFORMACIONIH TEHNOLOGIJA
BANJA LUKA
SEMINARSKI RAD
PREDMET
: Menadžment poslovnih informacionih sistema
TEMA: DATA MINING (DM)
STUDENT:
MENTOR:
Boris Dramac Prof.dr Gordana Radić
INDEX BROJ
:
188-11 VPI
Banja Luka, 2014.-te godine
Boris Dramac Seminarski rad
DATA MINING 1

Boris Dramac Seminarski rad
DATA MINING 3
Primjena, pojam i porijeklo
Data Mining je ugrađeni dio otkrivanja znanja u bazama podataka, odnosno cjelokupni postupak
pretvaranja ravnih podataka u potrebne informacije.
Data Mining radi algoritamski, gdje svaki algoritam treba da uklopi neki podatak u model.
Potom se od više modela bira onaj koji je najbliži karakteristikama podataka
Porijeklo Data Mining potiče pojavom prvih stvari koje su nastale pojavom računara. To su:
-
Mašinsko učenje – kao oblast vještačke inteligencije predstavlja skup
paradigmi algoritama, teoretskih rezultata i primjena iz oblasti vještačke
inteligencije i evolucijom modela (u smislu pretraživanja) ali i drugih oblasti:
statistike i vjerovatnoće (
Bajesov klasifikator, raspodele i testovi) i ostalih oblasti
matematike, teorije izračunljivosti ( mora postojati svijest problema i ograničenjima
koja proističu iz toga), teorije (adaptivnog) upravljanja, informacione teorije,
psihologije i neurobiologije
-
Filozofije, kognitivnih i drugih nauka, neuronske mreže.
-
Vještačka inteligencija – predstavlja mješavinu konvencijonalne nauke, fiziologije, i
psihologije, sve u interesu da se napravi mašina koja bi se, po ljudskim mjerilima,
mogla smatrati “inteligentnom“. Baze podataka – je skup podataka organizovanih za
brzo pretraživanje i pristup, koja zajedno sa sistemom za administraciju,
organizovanje i memorisanje tih podataka čini sistem baze podataka. Sa strane
korisnika može se reći da su podatci na neki način logički povezani.
-
Prepoznavanje oblika (paterni)
Boris Dramac Seminarski rad
DATA MINING 4
Ciklus Data Mining-a
Istraživanje počinje od podataka u nekom baznom obliku. Nakon toga slijedi preprocesiranje
podataka
koje za cilj ima da te grube podatke pretvori u nešto što je istražive prirode i da izvuče
iz njih onaj skup podataka koji može biti relevantan za ciljano istraživanje. Tad se prelazi na
Data Minig
.
Postoje razni algoritmi koji se mogu primjeniti nad podacima, i koji daju neke
rezultate. Izbor algoritma većinom zavisi od prirode podataka nad kojima se primjenjuje, ali i od
tipa rezultata koji bi on trebao da izbaci- npr. Da li se želi neko predviđanje ili izvlačenje nekih
pravilnosti tj. principa itd. Konačno, kada izaberemo algoritam i dobijemo neke razumne
rezultate, onda slijedi stepenica:
postprocesiranje
. Iako je velik dio posla završen i ova etapa
ima svoju težinu. Osnovni zadatak je da se prouči tj. shvate dobijeni rezultati, ili njihova
valjanost.
Potrebno je stvoriti nekakvu vizualizaciju dobijenih rezultata, odnosa ili relacija koje su dobijene
itd.
Preprocesiranje podataka služi da bi podatci bili transformisani u nešto što više odgovara
potrebama istraživanja.

Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti