TEMA: BIG DATA ANALITIKA

SEMINARSKI RAD

2

Sadržaj:

Uvod...........................................................................................................................................3

1. Big Data analitika...............................................................................................................4

1.1.

IT infrastruktura za podršku Big Data.........................................................................6

2. Trendovi u analitici velike količine podataka.....................................................................7

2.1.

IBM..............................................................................................................................8

2.2.

IBM alati za analizu velikih podataka.........................................................................9

2.2.1.

IBM PureData Systems........................................................................................ 9

3. Alati za analitiku velike količine podataka.......................................................................12

3.1.

Apache Hive.............................................................................................................. 13

3.2.

Impala........................................................................................................................ 14

3.3.

Presto......................................................................................................................... 15

3.4.

Shark..........................................................................................................................15

3.5.

Apache Drill..............................................................................................................15

3.6.

Hawk..........................................................................................................................16

Zaključak..................................................................................................................................17

Literatura.................................................................................................................................. 18

background image

4

1. Big Data analitika

Big Data je pojam koji označava velike i kompleksne setove podataka, kod kojih tradicionalne 

aplikacije za obradu podataka nisu primjenljive. Te skupove podataka karakterišu raznovrsnost 

formata,   velike   brzine   obrade   i   pristupa,   i   veliki   obim   informacija.   Izazovi   uključuju 

projektovanje i realizaciju infrastrukture i servisa za skladištenje velikih količina podataka, 

njihovu   pretragu,   analizu,   djeljenje   i  vizuelizaciju.  

1

Termin   Big   Data   se   često   odnosi   na 

upotrebu   predikativne   analitike   ili   drugih   naprednih   metoda   za   izdvajanje   vrijednosti   iz 

podataka, a ne samo na određenu veličinu skupa podataka. Big Data analitika je koncept analize 

podataka i izvođenja korisnih informacija iz velikih količina podataka koje se u modernom 

poslovanju   ubrzano   generišu   –   iz   konvencionalnih   sistema   poput   baza   podataka   do 

nestrukturiranih lokacijskih i senzorskih izvora i društvenih mreža. IBM “big data” alati 

pružaju usluge potrebne za uspješnu pripremu, dizajn, razvoj i implementaciju sistema za 

analizu i obradu velikih količina podataka temeljenih na standardnim platformama. Preveliki 

broj informacija može da predstavlja zaista veliki problem. Rješenje je Big Data tehnologija, 

odnosno alati i procedure koji premošćavaju „uska grla“ u infrastrukturi i omogućavaju brzo 

prikupljanje   i   manipulaciju   ogromnom   količinom   podataka.   Ova   nova   tehnologija   se 

primjenjuje   na   informacije   i   podatke   čija   količina,   brzina   generisanja   i   različitost   ne 

dozvoljavaju da se obrade pomoću standardnih, do sada korišćenih metoda i alata. 

Ona postaje sve neophodnija, jer su mnoga preduzeća došla u situaciju da danas imaju pristup 

većoj količini korisnih podataka nego ikad ranije, a da ih istovremeno sve manje kvalitetno 

koriste i time rasipaju novac na skladištenje informacija koje ne upotrebljavaju. IBM alati za 

analizu velikih podataka   imaju   primjenu u svim industrijskim granama, a daju sljedeće 

prednosti: 

a) informacije čine transparentnim i jednostavnim za korišćenje, 

b) dobijaju se informacije o produktivnosti i iste se koriste da bi se izvršilo poboljšanje.

Takođe   se   koristi   za   segmentaciju   korisnika   i   osmišljavanje   boljih   proizvoda   i   usluga. 

Sofisticirane analize mogu značajno da unaprede donošenje odluka. Njihova primjena daje 

kompaniji   puno   prednosti   na   osnovu   kojih   one   efikasno   posluju,   analiziraju   podatke   i 

upotrebljavaju čitavo more podataka kako bi obezbjedile opstanak i konkurentnost na tržištu. 

Često, Big Data karakterišu tri V:

1

 https://sr.wikipedia.org/sr/Big_data

5

a) ekstremni obim (Volume) podataka,

b) širok spektar (Variety) tipova podataka,

c) brzina (Velocity) kojom se podaci moraju obraditi i analizirati.

Podaci koji čine spremišta Big Data mogu da potiču iz izvora koji uključuju veb lokacije, 

društvene medije, stone i mobilne aplikacije, naučne eksperimente i - sve češće - senzore i 

druge uređaje na internetu stvari (IoT).

2

 Koncept Big Data sadrži skup povezanih komponenti 

koje omogućavaju organizacijama da koriste podatke za praktične potrebe i rješavaju niz 

poslovnih problema. Ovo uključuje IT infrastrukturu potrebnu za podršku Big Data, analitiku 

koja se primjenjuje na podatke, tehnologiju potrebnu za projekte Big Data, povezane skupove 

vještina, i stvarne slučajeve za koje je potrebno da se koristi Big Data. Ono što predstavlja 

stvarnu vrijednost svih Big Data koje organizacije prikupljaju je analitika primjenjena na 

podatke. Bez analitike, to bi bila samo gomila podataka sa ograničenom poslovnom upotrebom. 

Analitika   može  da   se   odnosi   na  osnovne  aplikacije  poslovne   inteligencije   ili   naprednije, 

prediktivne   analitike   poput   onih   koje   koriste   naučne   organizacije.   Među   najnaprednijim 

tipovima analitike podataka je prekopavanje podataka (engl. data mining), gdje analitičari 

procenjuju   velike   skupove   podataka   kako   bi   identifikovali   odnose,   obrasce   i   trendove. 

Analitika podataka može uključivati istraživačku analizu podataka (da identifikuje obrasce i 

odnose u podacima) i potvrđujuću (engl. confirmatory) analizu podataka (koja primjenjuje 

statističke tehnike kako bi se utvrdilo da li je pretpostavka o određenom skupu podataka tačna). 

Druga razlika je kvantitativna analiza podataka (ili analiza numeričkih podataka koji imaju 

kvantifikovane promjenljive koje se mogu statistički uporediti) za razliku od kvalitativne 

analize podataka (koja se fokusira na nenumeričke podatke kao što su video, slike i tekst). 

1.1. IT infrastruktura za podršku Big Data

2

 https://raf.edu.rs/citaliste/racunarske-mreze/4756-xa-sta-je-to-big-data-sve-sto-treba-znati-xa

Želiš da pročitaš svih 18 strana?

Prijavi se i preuzmi ceo dokument.

Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.

Slični dokumenti