Statistika i analiza: skripta
Deskriptivna statistika je deo statistike koji se bavi prikupljanjem, obradom i povezivanjem podataka.
Statistička analiza je pribavljanje numeričkih informacija, kvalitativna interpretacija, donošenje
zaključaka i formiranje zakonitosti ponašanja posmatranih pojava. Statistička teorija predstavlja
pronalazak novih statističkih metoda, njihovo objašnjavanje, dokazivanje i usavršavanje. Značaj
statistike je nekad bio metod i sredstvo za prikupljanje
Masovna pojava je svaka pojava koja se u vremenu i prostoru pojavljuje u velikom broju. Statistički
skup ili populacija je skup svih elemenata na kojima se izvesna pojava statistički posmatra. To je skup
pojava koje zadovoljavaju neka svojstva (uslove) bitna za cilj analize, odn. sve pojave koje su predmet
istraživanja.
Reprezentativan uzorak je podskup populacije koji predstavlja karakteristike osnovnog skupa. Nad
uzorkom se sprovodi dalja statistička analiza koja rezultira određenim kvantitativnim zaključcima koji
se prepisuju čitavoj populaciji.
Statistička jedinica je pojedini element populacije ili uzorka (“case”). Statističko obeležje ili varijabla je
svojstvo statističkih jedinica (“variable”). Varijabilitet je promenljivost obeležja od jedinice d
jedinice statističkog skupa (kategorije). Statistički podatak je zapis o elementima statističkog skupa
(broj, reč, simbol, znak,…).
Osnovni koraci statističkog istraživanja Statističko posmatranje je prikupljanje podataka za celu
populaciju ili uzorak. Sređivanje podataka tabelarno i/ili grafički predstavlja razvrstavanje vrednosti
varijabli u grupe (računski ili primenom programskih paketa). Statistička analiza i tumačenje rezultata
je utvrđivanje svojstva populacije, parametara. odnosno, dobijanje statističkih Najbitnije u analizi
podataka je da zaključke treba pregledno i sadržajno obrazložiti.
U zavisnosti da li se obrada podataka vrši na čitavom statističkom skupu (populaciji) ili na uzorku,
razlikujemo sledeće vrste statističke analize: - - Opisnu statističku analizu – područje statistike koje se
bavi prikupljanjem I analizom podataka za populaciju u celini; Reprezentativnu statističku analizu -
područje statistike koje se bavi uopštavanjem, predviđanjem i ocenjivanjem na osnovu nepotpunih
podataka (uzorka)
Za svaku statističku akciju potrebno je izabrati najefikasniji metod posmatranja (prikupljanja
podataka). U zavisnosti od skupa statističkog posmatranja, metode prikupljanja podataka mogu biti
potpuno (na čitavoj populaciji) ili delimično posmatranje (na uzorku). Statistički popis obuhvata sve
jedinice statističkog skupa u određenom “kritičnom” momentu, npr. popis stanovništva na 10 godina,
31. marta. Ovaj metod daje potpuni uvid u stanje i strukturu skupa po raznim obeležjima. Veoma je
skup pa se zato organizuje u dužim vremenskim intervalima. Izveštajni metod prati kontinuirano
događaje čiji je varijabilitet tokom vremena jače izražen. Sprovode ga lica ili institucije radi svojih
poslovnih potreba. Statističkim izveštajem u sukcesivnim vremenskim momentima (npr. stanje novca
u blagajni u mesecu) ili intervalima vremena (npr. prirodno kretanje stanovništva), vrši se posmatranje
promena statističkog skupa. Kvalitet prikupljenih podataka zavisi od: - - - - Specifičnosti istraživanja,
Instrumenata istraživanja, Uslova istraživanja, Stava i ponašanja davalaca podataka. Greške su
neminovni pratilac statističkih istraživanja. Mogu biti: - - Slučajne greške – greške koje nemaju
poseban uticaj na kvalitet podataka; Sistemske greške – greške koje su u samom sistemu statističkog
istraživanja i uvek utiču na podatke
Podaci koji su prikupljeni jednom od metoda, predstavljaju sirov materijal koji treba srediti i obraditi.
Podaci zapisani po redosledu prikupljanja, pre nego što se urede po veličini ili grupišu na neki način,
zovu se neuređeni, negrupisani ili sirovi podaci. Sređivanje podataka predstavlja tehničko-metodološki
postupak u kojem se, prema šemi grupisanja u cilju istaživanja, prikupljeni statistički materijal svrstava
u statističke serije koje predstavljaju statistički način istraživanja. Statističke serije su rezultat
sređivanja, grupisanja statističkih podataka prema određenim kriterijumima unutar utvrđene grupe.
Statističke serije se pregledno prikazuju tabelama i/ili grafikonima. Statistička tabela je osnovna forma
prikazivanja statističkih podataka. Može biti: - - Prosta – sadrži samo jednu varijablu; Složena – sadrži
više varijabli; 11 Statitika i analiza-skripta 2022 - Kombinovana – dobija se ukrštanjem dve ili više
varijabli. Grafikon je osnovna forma grafičkog prikazivanja statističkih podataka. Grafičkim
prikazivanjem statističkih podataka uočavaju se osnovne karakteristike posmatrane pojave. Svaki
grafikon, osim sadržaja (pojave koju prikazuje), mora da ima i sastavne elemente: - - - - - Naslov
(oznaka predmeta); Teritoriju (oznaka mesta); Vreme (oznaka vremena); Legendu (objašnjavanje
simbola); Jedinice mere (u kojima su izraženi rezultati). Prema elementima koje sadrže, razlikujemo: -
Dijagrame (predstavljeni geometrijskim pojmovima); - - Kartograme (grafikoni na geografskim
kartama); Piktograme (slikovito prikazane pojave). U zavisnosti kojim geometrijskim pojmom (2D ili
3D) je predstavljen, dijagram može biti: tačkasti (stigmogram), linijski (poligon), površinski (histogram)
i prostorni (stereogram). Površinskim dijagramima prikazuju se obim, veličina ili struktura jedne ili više
masovnih pojava. Najčešće se koristi u obliku pravougaonika ili krugova. 12
Vrste statističkih varijabli Na osnovu vrste izražavanja vrednosti varijabli razlikujemo: - - Kvantitativne
varijable (numeričke) - kod kojih se vrednosti izražavaju brojevima; Kvalitativne varijable (atributivne,
opisne) – kod kojih se vrednosti opisuju rečima ili simbolima. Kvantitativne varijable mogu biti: 1.
Diskretne (prekidne) – kod kojih obeležje ima konačan broj vrednosti (dozvoljava samo celobrojni
zapis); 2. Kontinuirane (neprekidne) – kod kojih obeležje može 16 Statitika i analiza-skripta 2022 imati
bilo koju vrednost konačnog ili beskonačnog intervala (dozvoljavaju i decimalni zapis). Kvalitativne
varijable možemo dalje podeliti na : 1. Nominalno-atributivne – varijable čije su vrednosti date opisno,
rečima ili simbolima; 2. Nominalno-geografske – varijable vezane za neki geografski pojam; 3.
Redosledne (uređajne) – varijable čije su vrednosti date opisno ali među njima postoji neka gradacija
(zato se mogu simbolično i brojevima izraziti i obrađivati kao numeričke varijable). Sledećom tabelom
sumiran je prikaz vrsta i podvrsta varijabli, kao i odgovarajući primeri: Vrsta varijable Podvrsta Primer
Kvantitativne Diskretne Broj studenata, broj zaposlenih, broj stanovnika,… Kontinuirane Visina, težina,
daljina, visina plate, stopa inflacije,… Kvalitativne Nominalnoatributivne Pol, zanimanje, boja kose,
studijski prog.,… Nominalno- geografske Mesto boravka, zemlja izvoza, mesto rođenja,… Redosledne
(uređajne) Školska sprema, kvalitet usluge,… 17 Statitika i analiza-skripta 2022 METODE OPISIVANJA
KVALITATIVNIH PODATAKA Kvalitativne varijable imaju vrednosti koje se razvrstavaju u kategorije. Pri
proučavanju takvih varijabli pažnju usmeravamo na zastupljenost pojedine kategorije u uzorku na
kojem sprovodimo istraživanje ili na čitavoj populaciji. Osnovna mera kojom opisujemo zastupljenost
jedne kategorije u statističkom skupu jeste frekvencija kategorije.
Frekvencije i relativne frekvencije Frekvencija fi , neke određene kategorije xi , varijable X, je broj
pojavljivanja te vrednosti u posmatranom skupu podataka. Za lakše poređenje i tumačenje rezultata
raznih istraživanja, u opisu zastupljenosti jedne kategorije u uzorku, koristi se i relativna frekvencija.
Relativna frekvencija fri , kategorije xi , je broj izmerenih vrednosti varijable koje pripadaju kategoriji xi
, podeljen ukupnim brojem podataka, odnosno, ako je N broj podataka
u skupu:
=
, Procentualna frekvencija biće jednaka:
×
=
𝒇 𝒇𝒓𝒓𝒓𝒓 𝒇𝒇𝒓𝒓 𝑵𝑵
𝒇 𝒇𝒓𝒓𝒓𝒓 𝟏𝟏𝟏𝟏𝟏𝟏 𝒇𝒇𝒓𝒓 𝑵𝑵
×
.
𝟏𝟏𝟏𝟏𝟏𝟏
Kumulativna frekvencija Pored frekvencije i relativne frekvencije, u ispitivanju i analizi kako
kvalitativnih, tako i kvantitativnih varijabli, veliki značaj ima kumulativna frekvencija. Rastuća
kumulativna frekvencija (“Cumulative frequencies”) predstavlja pridruživanje (sabiranje) frekvencija
prethodnih podataka (intervala) ili samih podataka redom. Koristi se u
ispitivanju frekvencija ili vrednosti zadate gornjom granicom, odnosno, na pitanje: Koliko najviše?
Opadajuća kumulativna frekvencija (“100% minus cumulative percentages”) predstavlja oduzimanje
frekvencija prethodnih podataka (intervala) ili samih podataka redom od zbirne frekvencije (ukuponog
broja podataka). Koristi se u ispitivanju frekvencija ili vrednosti zadate donjom granicom, odnosno, na
pitanje: Koliko najmanje?
Kvantitativni podaci mogu biti prikupljeni posmatranjem (merenjem) numeričkih ili redoslednih
(uređajnih) podataka. Redosledne varijable najčešće imaju samo nekoliko različitih vrednosti. Kod
numeričkih varijabli, posebno kod kontinuiranih, može se desiti da imaju jako veliki broj različitih
vrednosti. Ako su numeričke varijable diskretne sa malo mogućih vrednosti, ili ako su varijable
redosledne (uređajne), za opis podataka možemo koristiti iste metode kao pri opisivanju kvalitativnih
podataka: frekvencije i relativne frekvencije. Ako numeričke varijable imaju veliki broj različitih
vrednosti, tabelarni i grafički prikazi frekvencija mogu biti nedovoljno informativni, a obrada i analiza
podataka takvim postupkom ne služi svrsi, što ilustruje sledeći grafički i tabelarni prikaz primera
numeričke varijable sa velikim brojem različitih vrednosti u varijabli.

Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti