Deskriptivna statistika
SADRŽAJ
2
UVOD
U ovom seminarskom radu, upoznat ćemo se sa pojmom deskriptivna statistika,tačnije mjerama
centralne tendencije ili srednjim vrijednostima.U uvodu ćemo spomenuti osnovne stvari vezane
za statistiku, a nakon toga opširnije ćemo govoriti o temi ovog rada.
Neki primjeri korištenja statistike:
ispitivanja glasača prije/u toku izbora
ispitivanje ljudi uopšteno o bilo kojoj temi
vođenje statistike u proizvodnji procesora, utvrđivanje postotka ispravnih procesora
(yield)
vođenje statistike u proizvodnji, prije i poslije svake kontrole
primijenjena statistika na području biomedicinskih znanosti (biostatistika)
primijenjena statistika u području geoznanosti, odn. prostorna statistika ili geostatistika
biomedicinska statistika (omjeri rizika, omjeri šansi, ROC krive, mjere asocijacije)
Psihološka statistika je matematičko-metodološko ispitivanje i proučavanje individualnih razlika
u: ličnosti, motivaciji, inteligenciji, stavovima, vrijednostima, interesovanjima, emocijama.
Također, provjeravaju se korelacije između različitih varijabli, te doprinos skupa (seta) varijabli
(poznatih pod nazivom prediktori) jednoj kriterijskoj variabli (koja je ishod, posljedica, odnosno
neka mjera ponašanja ili mišljenja koja je bitna npr. u poslu, na fakultetu). Primjeri prediktora
su: generalna inteligencija, motivacija i radne navike, a primjer kriterija je školski ili akademski
uspjeh na kraju godine.
Ono što bi nas moglo malo više zanimati jeste biomedicinska statistiska.Biomedicinska
statistika je oblast koja obuhvata primjenu statistike u kliničkim medicinskim naukama, kao i u
biologiji. Najčešća primjena u okviru ove oblasti je u eksperimentalnim istraživanjima, gdje se
treba utvrditi djelovanje nekog lijeka ili terapije, na način da se uporede eksperimentalna i
kontrolna grupa. Ako je razlika između njih statistički značajna, onda ta razlika zaista i postoji, a
nije rezultat slučaja.

4
Poddiscipline statistike korištene u prirodnim znanostima: biostatistika, kemometrika, data
mining...
2. DESKRIPTIVNA STATISTIKA
Sttistički metodi prikupljanja,sređivanja,obrade i prikazivanja podataka spadaju u domen
deskriptivne statistike.
Deskriptivna statistika sadrži metode i procedure za prezentovanje i
sumiranje podataka.
Svrha deskriptivne statistike je da pomoću nekoliko brojeva opiše značenje podataka koji stoje
iza njih. Podaci se dobijaju na osnovu opservacija na skupu različitih slučajeva koji mogu biti
ljudi, životinje, gradovi, škole, različiti događaji ili neka kombinacija svega navedenog.
Deskriptivna statistika je obično prvi korak u analizi podataka, a služi za opisivanje prikupljenih
podataka. Deskriptivna statistika obično prethodi statističkom zaključivanju i predviđanju, ali
može biti i krajnji cilj statističke analize. Izvođenjem zaključaka se bavi drugo područje statistike
koje se zove statistika zaključivanja.
2.2. Mjere centralne tendencije
Računanje srednje vrijednosti predstavlja jedan od najčešće primjenjivanih statističkih postupaka
kojeg koristimo kako bismo sažeto prikazali određeni skup podataka. Računanjem srednje
vrijednosti cijeli skup podataka zamjenjujemo jednom vrijednošću za koju smatramo da ga dobro
reprezentira, te stoga moramo biti jako pažljivi prilikom odabira prikladne mjere srednje
vrijednosti.
Analizom pojava na svim jedinicama statističkog skupa dobija se veliki broj podataka. Ovako
veliki broj staitstičkih podataka onemogućava izdvajanje jedinstvene, jasne i sveobuhvatne
prestave o karakteristikama posmatrane pojave.Iz tog razloga nameće se potreba da se serija
podataka zamijeni što manjim brojem numeričkuh karakteristika koje daju prihvatljiviju
informaciju o skupu i reprezentuju ga.
Analizom serije podataka može se uočiti da se frekvencije grupišu negdje oko sredine tj. između
najviše i najniže vrijednosti.Na taj način uzeto je da jedna vrijednost zamjenjuje i reprezentuje
cijeli niz podataka posmatrane serije. Tako se, u suštini razlike između kvantitativnih obilježja
5
statističkog skupa poništavaju u srednjoj vrijednosti uz istovremeno uopštavanje zajedničkih
karakteristika individualnih vrijednosti obilježja.
Imajući u vidu da srednje vrijednosti iskazuju rezultat djelovanja općih određujućih
uslova,njihova pravilna upotreba zahtijevat će da grupe za koje se računaju srednje vrijednosti
budu što homogenije.Primjena pojedinih srednjih vrijednosti obilježja uslovljena je prirodom
statističkih varijabli i raspoloživih podataka.Iz ovih razloga osnovni zahtjev naučnog
izračunavanja i upotrebe srednjih vrijednosti zahtijeva prethodno pravilno grupisanje materijala
u vezi s dobijanjem homogenih grupa ili njhovih dijelova.Ako su grupe homogene i jednorodne,
onda će dobijene srednje vrijednosti ispravnije održavati opću centralnu tendenciju posmatrane
pojave.
Podjela srednjih vrijednosti zavisi od načina određivanja centralne vrijednosti obilježja.Postoje
dvije grupe srednjih vrijednosti i to: izračunate i pozicione srednje vrijednosti.
Izračunate srednje vrijednosti su: aritmetička, harmonijska,geometrijska i kvadratna sredina. U
pozicione srednje vrijednosti spadaju: modus i medijana. Ove srednje vrijednosti određene su
pozicijom centralne vrijednosti u nizu podataka, a primjenjuju se u specifičnim okolnostima.
Da bi se izračunala srednja vrijednost, potrebno je poznavati svojstva pojedinih srednjih
vrijednosti. Sve one moraju biti utvrđene određenim kvantitativnim postupkom a vrijednost im
se nalaziti između najviše i najniže vrijdnsoti posmatranog obilježja.Ukoliko su sve vrijednosti
obilježja međusobno jednake, srednja vrijednost je jednaka svakoj pojedinačnoj vrijednosti.
2.2.1. Aritmetička sredina
Aritmetička sredina se u svim statističkim analizama najviše upotrebljava. Njene prednosti
proizilaze iz: jednostavnosti,razumljivosti i sveobuhvatnosti članova serije.Nedostatak joj je
osjetljivost na ekstremne vrijednosti zbog čega kod nekih serija nije reprezentativna. U svim
ostalim slučajevima pogodna je za upotrebu, naročito u slučaju kada se pojava ponaša linearno,
po principima aritmetičke progresije.Primjena je ograničena na podatke iz serije koji pokazuju
visok stepen homogenosti, što znači da podaci nisu raštrkani i bez ikakvog reda.
Prema tome zavisno od vrste masovne pojave i podataka koji reprezentuju tu pojavu, mora se
strogo voditi računa o dosljednoj primjeni aritmetičke sredina.

7
Češći je slučaj da se podaci pojavljuju više puta ( s većom frekvencijom), što znači sa
grupisanim podacima u vidu rasporeda frekvencijaa. Ovakva aritmetička sredina se zove vagana
ili ponderisana aritketička sredina.
Primjer 1.
Na predmetu iz anatomije u januaru 2008. godine postignute su sliedeće ocjene:
5,6,6,7,8,9,8,7,8,7,5,6,7,8,7,9,8,5,6,5,6,5,6,6,6,6,7,7,8. Treba izračunati prosječnu ocjenu na
ovom predmetu.
Radi lakšeg predstavljanja ove pojave formirana je tabela distribucije frekvencija prema broju
pojavljivanja pojedinih ocjena:
Tabela 1 - Distribucija frekvencija
R. broj
Ocjene
Xi
Frekvencije
fi
fiXi
1
5
5
25
2
6
9
54
3
7
7
49
4
8
6
48
5
9
2
18
∑
31
194
Rezultati iz tabele poslužit će za dobijanje ponderisane aritmetičke sredine:
X
'
=
194
31
=
6,26
algebarski izraz u općem obliku je:
X
'
=
∑ fiXi
∑ fi
ili pojedinačno:
X
'
=
f
1
x
1
+
f
2
x
2
+
f
3
x
3
+
...
+
f n x n
f
1
+
f
2
+
f
3
+
...
+
f n
,
Dobijeni rezultat nam govori da je prosječna ocjena iz anatomije 6,26.
U slučajevima kada je raspored frekvencija dat u vidu grupnih intervala, aritmetička sredina
skupa ili uzorka izračunava se na bazi aritmetičke sredine intervala.Da bi se izračunala
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti