Upotreba statistike u ekonomiji

Prof. dr. sc. Maja Biljan-August
Prof. dr. sc. Snježana Pivac
Doc. dr. sc. Ana Štambuk
U
U
P
P
O
O
R
R
A
A
B
B
A
A
S
S
T
T
A
A
T
T
I
I
S
S
T
T
I
I
K
K
E
E
U
U
E
E
K
K
O
O
N
N
O
O
M
M
I
I
J
J
I
I
2. IZDANJE
Izdavač:
Ekonomski fakultet Sveučilišta u Rijeci
Recenzentice:
Prof. dr. sc. Jasna Horvat
Doc. dr. sc. Suzana Marković
Doc. dr. sc. Alemka Šegota
Lektorica:
Kerol Musul-Perić, prof.
Autor naslovnice:
Luka Mičetić, dipl. oec.
Pri izradi naslovnice korišteni su materijali objavljeni na:
www.free-stockphotos.com, www.sxc.hu, www.hnb.hr.
Objavljivanje ovog sveučilišnog udžbenika odobrilo je Povjerenstvo za
izdavačku djelatnost Sveučilišta u Rijeci Odlukom – klasa: 602-09/09-01/29,
ur. broj: 2170-57-05-09-3 od 25. rujna 2009.
Objavljeno na URL: http://www.efri.hr/prikaz.asp?txt_id=6326
i http://oliver.efri.hr/~statist/biljan-pivac-stambuk-uporaba2.pdf.
ISBN: 978-953-6148-86-8
Rijeka, rujan, 2009.
Prof. dr. sc. Maja Biljan-August
Prof. dr. sc. Snježana Pivac
Doc. dr. sc. Ana Štambuk
U
U
P
P
O
O
R
R
A
A
B
B
A
A
S
S
T
T
A
A
T
T
I
I
S
S
T
T
I
I
K
K
E
E
U
U
E
E
K
K
O
O
N
N
O
O
M
M
I
I
J
J
I
I
EKONOMSKI FAKULTET U RIJECI
RIJEKA, 2009.

vii
PREDGOVOR
Ovaj udžbenik namijenjen je prvenstveno studentima Ekonomskog
fakulteta u Rijeci, ali i svim drugim zainteresiranim korisnicima koji u svom
stručnom i znanstvenom radu, baveći se društvenim istraživanjima, primjenjuju
statističke metode i tehnike.
Rad obuhvaća teorijske osnove i objašnjenja za svako, u ovaj rad,
uključeno područje statistike. Kroz rješavanje konkretnih primjera daju se
objašnjenja dobivenih rezultata i njihovo kritičko vrednovanje.
Na kraju udžbenika u privitku nalaze se detaljne upute za upotrebu
statističkog programa za računala
Statistica
. Ovaj program pruža mnoštvo
mogućnosti za provoñenje statičkih metoda i tehnika na konkretnim analizama.
Naime upotrebom statističkih paketa, počevši već od pripremne faze
statističkog istraživanja, znatno se skraćuje i pojednostavljuje vrijeme potrebno
za primjenu statističkih metoda i tehnika. Na taj se način statistički postupci
približavaju mnogim korisnicima. Svaki primjer prezentiran u poglavljima i u
privitku knjige sadrži i rješenja u svrhu kontrole valjanosti usvojenoga gradiva.
Na taj se način studentima ne ostavlja dvojbenim ni način pismene provjere
znanja, a ujedno ih se osposobljava da samostalno statistički analiziraju
odreñene pojave na stručno zadovoljavajući način.
Studenti koji nastave obrazovanje na poslijediplomskim studijima bit će
pripremljeni za stručni i znanstveni rad u svojim istraživanjima, gdje se
ekonomski problemi statistički rješavaju upotrebom računala. Dio studenata
koji će se nakon diplomiranja neposredno uključiti u poslovnu praksu, imat će
koristi zbog mogućnosti upotrebe usvojenog znanja statističke teorijske i
programske potpore pri konkretnim poslovnim i ekonomskim analizama.
Potrebno je napomenuti da je program
Statistica
kompatibilan s
Microsoft Excelom, stoga se već postojeći podaci iz jednog mogu jednostavno
kopirati u drugi program. To je važna činjenica, s obzirom da je poznato da je
Microsoft Excel jedan od najraširenijih programa za tablične izračune te je lako
dostupan većini korisnika.
U radu su rabljene oznake i simboli koji su preuzeti iz standardne
statističke literature. Ako se, pak, u literaturi rabe različite oznake,
upotrijebljena je češće spominjana verzija.
Na kraju treba napomenuti da je ovaj udžbenik nastao kao rezultat
višegodišnjeg iskustva autorica kod primjene statističkih metoda u izradi
brojnih znanstvenih i stručnih radova, studija i analiza te kao rezultat
predavačkog iskustva pri prenošenju znanja iz područja statistike na mnoge
generacije studenata ekonomskog fakulteta.
viii
Za suradnju i korisne sugestije zahvaljujemo recenzenticama prof. dr.
sc. Jasni Horvat, doc. dr. sc. Suzani Marković i doc. dr. sc. Alemki Šegoti.
Rijeka, Split, rujan 2009.
Autorice

x
kvartilne devijacije
1.8.2.2. Varijanca, standardna devijacija i koeficijent varijacije
54
1.8.3. Mjere koncentracije
57
1.8.4. Momenti numeričkih nizova
60
1.8.4.1. Glavni momenti numeričkih nizova
60
1.8.4.2. Pomoćni momenti numeričkih nizova
61
1.8.5. Mjere asimetrije
61
1.8.5.1. Pearsonov koeficijent asimetrije
61
1.8.5.2. Pearsonova mjera asimetrije
62
1.8.5.3. Bowleyeva mjera asimetrije
63
1.8.6. Mjere zaobljenosti
64
2. REGRESIJSKA I KORELACIJSKA ANALIZA
77
2.1. Pojam regresijske i korelacijske analize
77
2.2. Regresijski model
80
2.3. Model jednostavne linearne regresije
82
2.4. Linearna korelacija i procjena koeficijenata korelacije
86
2.4.1. Linearna korelacija
86
2.4.2. Procjena koeficijenata korelacije
87
2.5. Spearmanov koeficijent korelacije
88
2.6. Regresijska dijagnostika
90
3. ANALIZA VREMENSKIH SERIJA
97
3.1. Definicija vremenskog niza
97
3.2. Vrste nizova
97
3.3. Grafičko prikazivanje i usporeñivanje vremenskih nizova
97
3.4. Pokazatelji dinamike
100
3.5. Verižni indeksi i indeksi na stalnoj bazi
101
3.5.1. Verižni indeksi
101
3.5.2. Indeksi na stalnoj bazi
105
3.6. Skupni indeksi
108
3.6.1. Skupni indeksi cijena
108
3.6.2. Skupni indeksi količina
110
3.6.3. Skupni indeksi vrijednosti
112
3.7. Modeli trendova
115
3.7.1. Trend polinomi k-tog stupnja
115
xi
3.7.1.1. Model linearnog trenda
116
3.7.1.2. Trend polinom drugog stupnja
121
3.7.2. Eksponencijalni trend modeli
125
3.7.2.1. Jednostavni eksponencijalni trend
125
3.7.3. Hiperbolički trend modeli
130
3.7.3.1. Jednostavni hiperbolički trend
130
3.7.4. Asimptotski trend modeli
133
3.7.4.1. Modificirani eksponencijalni trend
134
3.7.4.2. Logistički trend
137
3.7.4.3. Gompertzov trend
140
3.8. Procjene parametara
143
3.9. Pomični prosjeci
143
3.10. Standardna dekompozicija vremenske serije
146
LITERATURA
153
PRIVITAK:
UPORABA
PROGRAMSKOG
PAKETA
STATISTICA
159
1. UVOD
159
1.1 Pokretanje programa Statistica
161
1.2. Stvaranje novog dokumenta
163
1.3. Unos podataka
165
1.4 Spremanje dokumenta
170
1.5 Otvaranje dokumenta
171
1.6. Prikazivanje rezultata obrade
171
1.7. Definiranje varijable formulom
174
1.8. Ureñivanje
175
2. GRAFIČKO PRIKAZIVANJE NOMINALNIH
(ATRIBUTIVNIH) NIZOVA
179
3. NUMERIČKI NIZOVI
201
4. REGRESIJSKA I KORELACIJSKA ANALIZA
212
4.1. Jednostavna linearna regresija
212

1
1. UVOD S DESKRIPTIVNOM STATISTIČKOM
ANALIZOM
1.1. Temeljni pojmovi
Pojam statistike mijenjao se kroz povijest. Negdje do 19. stoljeća on je
podrazumijevao brojčane i nebrojčane podatke koji su bili od izričite važnosti
za jednu državu. Danas s razvojem medija (radio, TV, Internet) postaju
dostupne mnoge informacija, stoga vlada potreba za njihovom selekcijom kao i
odvajanjem bitnih od onih koje to nisu. U skladu s jasno postavljenim ciljem pri
komunikaciji vezanoj za različita područja društvenih aktivnosti: od ekonomije,
politike, medicine, sporta i sl., vrši se odabir i analiza prikupljenih podataka.
Statistika je posebna znanstvena disciplina koja u svrhu realizacije
postavljenih ciljeva istraživanja na organiziran način prikuplja, odabire,
grupira, prezentira i vrši analizu informacija ili podataka, te interpretira
rezultate provedene analize.
Da bi ostvarila postavljene ciljeve statistika koristi posebne metode i
tehnike. Uz njihovu primjenu u raznim segmentima društva u ekonomiji se
statističke metode i tehnike koriste na razini poduzeća i na makroekonomskoj
razini. Na razini poduzeća u poslovnoj ekonomiji primjena statistike obuhvaća
sve faze poslovnog sustava kao npr. proizvodnju, financije, marketing,
planiranje poslovanja. U makroekonomskoj analizi pri kreiranju gospodarske
politike statistika se primjenjuje u regionalnoj, nacionalnoj i meñunarodnoj
ekonomiji.
Statistika se kao znanstvena disciplina može podijeliti na deskriptivnu i
inferencijalnu statistiku.
Deskriptivna ili opisna statistika temelji se na potpunom obuhvatu
statističkog skupa, čiju masu podataka organizirano prikuplja, odabire,
grupira, prezentira i interpretira dobivene rezultate analize.
Na taj se način
izračunavanjem različitih karakteristika statističkog skupa, sirova statistička
graña svodi na lakše razumljivu i jednostavniju formu. Ako se statističke
metode i tehnike primjenjuju na čitav statistički skup, dakle ako su
istraživanjem obuhvaćeni svi elementi skupa oni tvore populaciju.
Inferencijalna statistika temelji se na dijelu (uzorku) jedinica
izabranih iz cjelovitog statističkog skupa, pomoću kojeg se uz primjenu
odgovarajućih statističkih metoda i tehnika donose zaključci o čitavom
statističkom skupu.
Uvijek je prisutan odgovarajući stupanj rizika kada se
koriste rezultati iz uzorka, za kojeg je poželjno da bude izabran na slučajan
način i da bude reprezentativan. Inferencijalna statistika pripada skupini
2
induktivnih metoda, kojima se izvode zaključci polazeći od općega prema
posebnome.
Postoji još podjela statistike na teorijsku i primijenjenu.
Teorijska statistika se ne bavi stvarnim podacima, već definira i
nadograñuje opće pojmove i znanstvene okvire.
Primijenjena statistika koristi teorijske i znanstvene statističke
pojmove u analizi stvarnih podataka iz različitih područja.
Statističke metode i tehnike temelj su za provoñenje statističke analize
prirodnih i društvenih pojava.
Predmet proučavanja statistike su odreñene zakonitosti koje se
javljaju u masovnim pojavama. Zadaća statistike je da uoči zakonitosti u
masovnim i slučajnim pojavama, te da ih iskaže brojčano.
Masovne pojave su skupine istovrsnih elemenata koji imaju jedno
ili više zajedničkih svojstava. Takvu skupinu nazivamo statističkom masom
ili statističkim skupom.
Pri definiranju statističkog skupa potrebna je velika preciznost da bi se
na temelju takve definicije moglo jednoznačno utvrditi da li neki element
pripada ili ne pripada tom skupu.
Statistički skup potrebno je definirati pojmovno, prostorno i
vremenski.
Pojmovno odrediti statistički skup podrazumijeva odrediti pojam ili
svojstvo svakog elementa promatranog skupa.
Prostorno odrediti statistički skup znači odrediti prostor na koji se
odnosi ili kojemu pripadaju elementi statističkog skupa.
Vremenski odrediti statistički skup znači odrediti vremenski trenutak ili
razdoblje kojim će se obuhvatiti svi elementi koji ulaze u statistički skup.
Primjer 1.1.1.
Statistički skup
, "studenti I. godine Ekonomskog fakulteta u Rijeci u
Republici Hrvatskoj u akademskoj godini 2007./2008., na dan 30.10.2008.
godine", je vrlo precizno odreñen i iz takve njegove definicije mogu se odrediti
svi njegovi elementi.
Svojstvo svakog elementa odnosno studenta definirano je najprije
pojmovno,
tj.
jasno je da je riječ o studentima I. godine Ekonomskog fakulteta.
Elementi ovog skupa odreñeni su i
prostorno
, tj. nalaze se u Rijeci na području
Republike Hrvatske.

4
2. Kvantitativna statistička obilježja
mogu se izraziti brojčano.
Nazivaju se još i
numerička
statistička obilježja, a mogu se podijeliti na: a)
neprekidna ili kontinuirana
statistička obilježja
i b)
prekidna ili
diskontinuirana statistička obilježja.
a)
Neprekidna ili kontinuirana
statistička obilježja
su takva numerička
obilježja koja mogu poprimiti neprebrojivo beskonačno mnogo vrijednosti (npr.
u skupu realnih brojeva, koji je beskonačan, na zatvorenom intervalu od 1 do 2
ima neprebrojivo mnogo elemenata tog skupa). Primjeri takvog obilježja su:
visina, težina, duljina, starost itd.
b)
Prekidna ili diskontinuirana statistička obilježja
su takva numerička
obilježja koja mogu poprimiti prebrojivo beskonačno mnogo vrijednosti (npr. u
skupu cijelih brojeva koji je beskonačan na zatvorenom intervalu od 1 do 2 ima
prebrojivo mnogo elemenata tog skupa, tj. 2). Primjeri takvog obilježja su: broj
djece, broj učenika u razredu, starost u godinama (godine se mogu prebrojati),
visina plaće u kunama itd.
Kvantitativna statistička obilježja su vezana za intervalnu i omjernu skalu. Kod
intervalne skale
položaj nule je unaprijed dogovoren. Nula u ovom slučaju ne
znači nepostojanje promatrane pojave. Na primjeru numeričkog obilježja
"temperatura zraka" nula (0
0
C) ne upućuje na nepostojanje temperature, već
upućuje da je hladno. Vrijednosti ove skale se ne mogu dijeliti jer temperatura
od 5
0
C na nekom području u odnosu na temperaturu od 15
0
C na nekom drugom
području ne znači da je na jednom mjestu bilo tri puta hladnije u odnosu na
drugo mjesto. Kod
omjerne skale
nula podrazumijeva nepostojanje pojave. Na
primjeru numeričkog obilježja "visina ušteñevine na računu u banci" nula (0)
upućuje na nepostojanje ušteñevine. Ako netko ima ušteñevinu od 20 000 kn,
može se reći da on ima dva puta veću štednju u odnosu na nekoga tko ima na
računu 10 000 kn.
Postoje još i
vremenska statistička obilježja
koja označavaju trenutak
ili vremenski interval s kojim su elementi statističkog skupa u svezi.
1.2. Statistički podaci
Osnovne
faze statističkog istraživanja
su:
a)
statističko promatranje
b)
grupiranje (tabelarno i grafičko prikazivanje statističkih podataka)
c)
statistička analiza i interpretacija rezultata provedene analize.
Statističko promatranje je organizirano prikupljanje statističkih
podataka.
5
Nakon precizne definicije zadatka, cilja i predmeta istraživanja tj.
statističkog skupa pristupa se organiziranom prikupljanju statističkih podataka.
Uspješnost i objektivnost ovog prvog koraka uvjetuje kvalitetu rezultata ostalih
faza statističkog istraživanja. Nepotpune i neistinite prikupljene informacije do
kojih bi se došlo u ovoj fazi značile bi da konačan rezultat statističkog
istraživanja sadrži pogrješku. Pri tom po
grješka može biti sistematska i
slučajna
. Sistematsku pogrješku je lakše uočiti (npr. neispravnost odreñenog
mjernog instrumenta, neistinito izjašnjavanje ispitanika). Slučajnu pogrješku je
teško precizno identificirati jer se ona ne javlja kod svakog mjerenja i ne javlja
se istim intenzitetom, stoga se kod slučajne pogrješke često veže pretpostavka o
poništavanju njenog utjecaja na globalnoj razini promatranja.
U ovisnosti o
karakteru izvora podataka
, statistički podaci se dijele na:
a)
sekundarne podatke
b)
primarne podatke.
Sekundarni podaci su oni koji se pribavljaju iz već postojećih baza
podataka različitih državnih ustanova.
Takvi se podaci prikupljaju sustavno
na odgovarajući način, a njihov opseg ne ovisi o donošenju neke poslovne
odluke ili zadanom cilju nekakvog istraživanja.
Takve podatke u Hrvatskoj prikupljaju: Državni zavod za statistiku,
Hrvatska narodna banka, Hrvatska gospodarska komora, te neke druge
specijalizirane agencije. Jedan od najčešće korištenih sekundarnih izvora
podataka u Hrvatskoj je Statistički ljetopis Hrvatske u izdanju Hrvatskog
zavoda za statistiku. U svjetskim okvirima poznat je World Statistical
Yearbook, a putem Internet-a su danas dostupne mnoge baze sekundarnih
podataka (na primjer: Eurostat, U.S: Census Bureau i slično). Na razini
poduzeća, raznovrsna specifična izvješća o poslovanju imaju sekundarni
karakter.
Sekundarni podaci su uglavnom brojčani. Predočeni su tablicama, a vrlo
često i grafičkim prikazima.
Primarni podaci prikupljaju se neposrednim promatranjem
svojstava elemenata statističkog skupa u skladu s unaprijed definiranim
ciljevima statističkog istraživanja.
Prikupljanje ovih podataka zahtjeva
definiranje statističkog skupa, izbor obilježja koja se žele istražiti, odreñivanje
modaliteta promatranog obilježja, pripremanje anketnih upitnika i/ili pratećih
formulara te organiziranje i provoñenje samog prikupljanja podataka.
Vrlo često istraživanja koja se odnose na svaki član statističkog skupa
zahtijevaju velike troškove, stoga se podaci prikupljaju za podskup osnovnog
skupa, odnosno za uzorak. Takvo promatranje se naziva
reprezentativno
promatranje
.

7
Anketa ili intervju
je metoda kojom se prikupljaju podaci uz pomoć
unaprijed pripremljenih upitnika, na kojima ispitanici svojim odgovorima daju
informacije o promatranim obilježjima statističkog skupa. Da bi anketa uspjela
potrebno je veliku pozornost obratiti sastavljanju upitnika. Sastavlja je
statističar, a može se konzultirati i psiholog. Upiti moraju biti kratki, precizni i
jasni. Moraju biti postavljeni tako da ne sugeriraju odgovor. Broj pitanja ne
smije biti velik da ne zamara one koji odgovaraju. Pri provoñenju ankete pristup
ispitaniku, odnosno jedinici statističkog skupa može biti izravan i neizravan.
Primjer 1.2.1.
Tijekom svibnja 2001. godine studenti četvrte godine Ekonomskog fakulteta u
Splitu željeli su
anketnim upitnikom
doći do podataka koji će pokazati kolika
je zainteresiranost učenika i studenata za poduke iz različitih predmeta, o
zadovoljstvu postojećim uslugama, frekvencijama pohañanja i slično.
Način komuniciranja bio je osobno i telefonom, a upitnik se sastojao od 10
pitanja:
ANKETNI UPITNIK
Poštovani,
Studenti četvrte godine Ekonomskog fakulteta u Splitu obvezni su u
okviru predmeta "Istraživanje tržišta" i "Promocija" izraditi poduzetnički
projekt. U svrhu tog projekta provodimo istraživanje o zainteresiranosti učenika
i studenata za poduke iz različitih predmeta. Molimo Vas pažljivo pročitajte
pitanja i na njih iskreno odgovorite. Ovaj anketni upitnik je u potpunosti
anoniman. Hvala na suradnji!
1. Jeste li do sada koristili usluge
poduka? (zaokružiti)
a)
Da (prijeći na pitanje broj 3)
b)
Ne
2. Zašto niste koristili usluge poduka?
a)
Nisam imala/imao potrebe za
takvim uslugama
b)
Previsoka cijena poduka
c)
Nezadovoljstvo
postojećom
kvalitetom usluga
d)
Ostalo
Prijeći na pitanje broj 8.
3. Iz kojih predmeta ste pohañali
poduke?
a)
Matematika
b)
Fizika
c)
Engleski jezik
d)
Hrvatski jezik
e)
Ostalo
4. Jeste li zadovoljni postojećom
ponudom poduka?
a)
Da (prijeći na pitanje broj 6)
b)
Donekle
c)
Ne
5.
Koji
je
razlog
vašem
nezadovoljstvu?
a)
Kvaliteta
b)
Cijena
c)
Uslužnost
d)
Lokacija
6. Koliko sati tjedno biste željeli
pohañati poduke?
a)
1 - 2 sata
b)
3 - 4 sata
c)
5 i više sati
8
7. Željeli biste pohañati:
a)
Individualne poduke
b)
Grupne poduke
c)
Svejedno mi je
8. Vaša dob:
a)
10 - 14 godina
b)
15 - 19 godina
c)
20 - 24 godine
9. Spol
a)
žensko
b)
muško
10. Ukupni mjesečni prihodi vašeg
kućanstva:
a)
do 2 000 kn
b)
2 001 – 4 000 kn
c)
4 001 – 6 000 kn
d)
6 001 – 8 000 kn
e)
8 001 i više kn
Opis terenskog rada:
Istraživanje je obavljeno tijekom svibnja 2001. godine, i
to u poslijepodnevnim satima. Tijekom anketiranja nije bilo nikakvih problema,
osim što je manji broj ispitanika odbilo anketiranje pravdajući se žurbom.
Ispitanici su bili iznimno susretljivi, stoga smatramo kako su odgovori iskreni i
mogu biti reprezentativni.
Izvor:
Katedra za marketing, Ekonomski fakultet Split, 2005. godine
Izravan pristup
ostvaruje se kada osoba ili tim koji provodi anketu
izlaze na teren i u direktnom kontaktu s ispitanicima prikupljaju odgovore na
pitanja iz upitnika.
Neizravan pristup
ostvaruje se putem pošte, telefonom i
elektroničkom poštom. Na ovaj način smanjuju se troškovi prikupljanja
podataka (npr. putni troškovi osoba koje provode anketu tj. anketara). Iako se i
na ovaj način ispitanicima prezentira tko provodi i koja je svrha istraživanja,
praksa je pokazala da je ovim neizravnim pristupom anketiranja prisutan velik
postotak neodaziva kao i često velik postotak nevaljano i nepotpuno popunjenih
upitnika. Razloge treba tražiti u činjenici da ispitaniku nije na raspolaganju
osoba koja će mu pojasniti nejasna pitanja.
Ovisno o obimu istraživanja
organizaciju prikupljanja podataka
može provoditi jedna osoba, skupina istraživača ili čitavo osoblje neke
specijalizirane ustanove
kojoj je to osnovna djelatnost. Ako se radi o manjem
istraživanju u prikupljanju podataka će sudjelovati manji broj istraživača, dok
će veće istraživanje zahtijevati rad većeg broja istraživača.
Prije početka obrade prikupljenih podataka potrebno je izvršiti kontrolu
sirove statističke grañe. Kontrola se može vršiti tijekom ili na kraju postupka
prikupljanja podataka, što ovisi i o različitim metodama prikupljanja.
Preventivna kontrola
obavlja se već tijekom samog postupka
prikupljanja statističkih podataka. Pri provoñenju ankete to podrazumijeva
kontrolu upitnika pri njegovom preuzimanju od ispitanika. Kontrolira se da li su
dani odgovori na sva pitanja i da li su pravilno popunjena predviñena mjesta za
tražene odgovore.

10
X
i
, i = 1, 2, …, N
.
(1.3.1)
Prema tome postoji N modaliteta, tj. pojavnih oblika promatranih
obilježja.
Broj elemenata statističkog skupa koji pripadaju odreñenoj grupi,
tj. jednom modalitetu ili pojavnom obliku promatranog obilježja naziva se
apsolutna frekvencija.
Oznaka za
apsolutnu frekvenciju
je
f
i
,
i = 1, 2, …,N
.
(1.3.2)
Zbroj svih elemenata statističkog skupa naziva se opseg statističkog
skupa.
Zbog principa isključivosti i iscrpnosti taj broj odgovara i
zbroju svih
apsolutnih frekvencija
što je i prikazano izrazom (1.3.3).
1
∑
=
+
+
+
+
=
N
i
i
N
f
f
f
f
f
1
3
2
1
.
.
.
(1.3.3)
Može se definirati da je
skup ureñenih parova modaliteta
promatranog obilježja i njima pripadajućih apsolutnih frekvencija
statistički niz.
1
U izrazu (1.3.3) dan je znak zbrajanja
∑
=
N
i
i
f
1
koji se čita: zbroj apsolutnih frekvencija
i
f
, gdje i ide od 1 do N. Neke od karakteristika znaka zbrajanja ili znaka sume su
sljedeće:
1.
N
N
i
i
X
X
X
X
+
+
+
=
∑
=
.
.
.
2
1
1
, gdje je i = indeks zbrajanja
2.
(
)
.
.
.
.
.
.
1
1
1
1
±
∑
±
∑
±
∑
=
∑
±
±
±
=
=
=
=
N
i
i
N
i
i
N
i
i
N
i
i
i
i
Z
Y
X
Z
Y
X
3.
∑
⋅
∑
≠
+
+
+
=
∑
=
=
=
N
i
i
N
i
i
N
N
N
i
i
i
Y
X
Y
X
Y
X
Y
X
Y
X
1
1
2
2
1
1
1
.
.
.
(ovdje se za desni dio
nejednakosti, primjenom izraza 1, može zaključiti da suma produkta nije
jednaka produktu suma)
4.
∑
∑
≠
+
+
+
=
∑
=
=
=
N
i
i
N
i
i
N
N
N
i
i
i
Y
X
Y
X
Y
X
Y
X
Y
X
1
1
2
2
1
1
1
.
.
.
(ovdje se može zaključiti da je suma
kvocijenta različita od kvocijenta suma)
5.
(
)
∑
=
+
+
+
=
+
+
+
=
∑
=
=
N
i
i
N
N
N
i
i
X
a
X
X
X
a
aX
aX
aX
aX
1
2
1
2
1
1
.
.
.
.
.
.
, gdje je "a"
konstanta jer ne ovisi o indeksu zbrajanja i.
6.
(
)
.
.
.
.
.
.
1
1
1
1
±
∑
±
∑
±
∑
=
∑
±
±
±
=
=
=
=
N
i
i
N
i
i
N
i
i
N
i
i
i
i
Z
c
Y
b
X
a
cZ
bY
aX
, gdje su a, b, c, …
konstante.
11
Grupiranjem statističkih podataka veliki se broj pojedinačnih podataka
razvrstava u manji broj, ovisno o broju grupa obilježja. Ako se podaci grupiraju
prema
modalitetima
samo
jednog
obilježja,
tada
je
riječ
o
jednodimenzionalnom grupiranju,
a
ako se statistički podaci grupiraju prema
modalitetima dvaju ili više obilježja radi se o
dvodimenzionalnom i
višedimenzionalnom grupiranju.
Primjer 1.3.2.
Statistički skup,
"studenti I. godine Ekonomskog fakulteta u Rijeci u
Republici Hrvatskoj u akademskoj godini 2007./2008., na dan 30.10.2007.
godine" grupira se
prema dva statistička obilježja: spol i visina.
Riječ je o dvodimenzionalnom grupiranju statističkog skupa prema dva
statistička obilježja.
Grupiranjem elemenata statističkog skupa gube se pojedinačne
informacije o njima, stoga pri grupiranju, tj. formiranju, statističkih nizova
istraživač treba biti odgovoran i pažljivo voditi računa o postavljenim ciljevima
istraživanja.
1.3.2. Nizovi kvalitativnih podataka
Kvalitativni statistički nizovi su
nominalni
(atributivni i zemljopisni) i
redoslijedni
.
Nominalni statistički nizovi formiraju se grupiranjem elemenata
statističkog skupa prema modalitetima odgovarajućeg nominalnog
obilježja.
Modaliteti nominalnog obilježja izražavaju se pomoću atributa,
kategorija i slovnih oznaka, a mogu se navoditi abecednim redom, prema
veličini apsolutnih frekvencija, dogovorno ili zakonski utvrñenim popisima. Na
primjer službena statistika koristi: SMTK ili Standardnu meñunarodnu
trgovinsku klasifikaciju i NKD ili Nacionalnu klasifikaciju djelatnosti.
Zemljopisni statistički nizovi formiraju se grupiranjem elemenata
statističkog skupa prema modalitetima odgovarajućeg zemljopisnog ili
prostornog obilježja.
Modaliteti prostornog obilježja najčešće odgovaraju teritorijalno-
administrativnoj podjeli odreñenog geografskog prostora, na primjer: gradovi,
županije, regije, države, kontinenti. Grupe ovog obilježja mogu biti poredane po

13
Grupiranje podataka statističkog skupa prema redoslijednom obilježju
vrši se slično kao kod nominalnih obilježja, ali je redoslijed grupa ovdje
odreñen rangom koji pojedina grupa obilježja predstavlja. Rangiranje se može
vršiti polazeći od najnižeg ranga prema najvišem ili obrnuto.
Primjer 1.3.4.
Statistički skup,
"Diplomirani studenti Ekonomskog fakulteta u Rijeci
akademske godine 2007./2008." prema obilježju "prosječni uspjeh tijekom
studiranja"
podijeljen je na grupe prema redoslijednom obilježju.
Tablica 1.2.
Modaliteti obilježja "prosječan uspjeh tijekom studiranja"
Prosječan uspjeh
dovoljan
dobar
vrlo dobar
odličan
Izvor: Knjiga matične evidencije Ekonomskog fakulteta u Rijeci 2007./2008. godine
U tablici 1.2. dane su grupe, odnosno modaliteti redoslijednog obilježja
"prosječan uspjeh tijekom studiranja" od najnižeg prema najvišem rangu. Ovim
grupama obuhvaćeni su svi pojavni oblici promatranog obilježja.
1.3.3. Tabeliranje
Tabeliranje je postupak svrstavanja grupiranih prikupljenih
statističkih podataka u tablice.
Statističke tablice
kao jedan od oblika prikazivanja statističkih
podataka prisutne su u literaturi svuda oko nas.
Tablica nastaje crtanjem okomitih i vodoravnih linija prema odreñenim
pravilima. Svaka
statistička tablica mora imati: naslov, broj tablice (ako ih
ima više), tekstualni dio, numerički ili brojčani dio i izvor podataka.
14
Tablica 1.3.
Naslov tablice
Zaglavlje
Oznake
stupca
Zbirni
stupac:
∑
=
n
j
1
0
1
2
…
n
Oznake
redak
retka
stu-
pac
polje
Pred
stu-
pac
polje
Zbirni redak:
∑
=
m
i
1
Izvor podataka
Tablica 1.3. prikazuje opći oblik statističke tablice.
Naslov tablice
mora biti jasan i kratak, a istovremeno u sebi mora
sadržavati pojmovnu, prostornu i vremensku definiciju statističkog skupa, da bi
onaj tko je čita mogao precizno odrediti njezine elemente.
Tekstualni dio
statističke tablice sastoji se od dva dijela: zaglavlja i
predstupca. U zaglavlju ili tumaču stupaca opisuje se i objašnjava sadržaj
stupaca. U predstupcu ili tumaču redaka opisuje se i objašnjava sadržaj redaka.
To su najčešće oblici statističkog obilježja po kojemu je promatran statistički
niz. Uz tekstualni dio svaki stupac može biti označen i odgovarajućim brojem.
Kako se vidi u tablici 1.3., predstupac se često označava s nulom, a numeriranje
dalje ide po redu: 1, 2, …, n.
Brojčani ili numerički dio
tablice sastoji se od polja u koja se unose
frekvencije, odnosno rezultati grupiranja statističkih podataka. Zbirni ili
marginalni stupac sadrži zbrojeve pojedinih redaka. Njegova suma
∑
=
n
j
1
zbraja
elemente svakog retka po j - stupcima. Zbirni ili marginalni redak sadrži
zbrojeve pojedinih stupaca. Njegova suma
∑
=
m
i
1
zbraja elemente svakog stupca
po i - redcima.
Izvor podataka
se navodi ispod tablice. On omogućuje provjeru
ispravnosti prikupljenih podataka u tablici kao i eventualnu dopunu podataka,
naravno, ako to zahtjeva statističko istraživanje.
Zbog veće preglednosti tablice, često se zaglavlje, predstupac, zbirni
redak i zbirni stupac odvajaju debljim crtama od brojčanog dijela, kao što se
može vidjeti u tablici 1.3..

16
Jednostavne
statističke tablice prikazuju jedan statistički skup,
grupiran u jedan statistički niz, prema jednom obilježju.
Skupne
statističke tablice prikazuju dva ili više statistička skupa,
grupiran u dva ili više statistička niza prema jednom obilježju.
Kombinirane
statističke tablice prikazuju jedan statistički skup,
grupiran u dva ili više statističkih nizova prema dva ili više obilježja. Ako kod
kombinirane tablice s dva obilježja, jedno obilježje ulazi u tablicu iz predstupca,
a drugo iz zaglavlja za nju se kaže da je tablica s dva ulaza. U skladu s tim
postoje kombinirane tablice s više ulaza, ali pri njihovom kreiranju gubi se
jasnoća i preglednost.
Primjer 1.3.5.
Statistički skup,
"Diplomirani studenti Fakulteta "E" u Rijeci
akademske godine 2007./2008." prema obilježju "prosječni uspjeh tijekom
studiranja"
podijeljen je na grupe prema redoslijednom obilježju.
Tablica 1.4.
Diplomirani studenti Fakulteta "E" u Rijeci godine 2007./2008. prema
prosječnom uspjehu tijekom studiranja
Prosječan uspjeh
Broj studenata
X
i
f
i
dovoljan
42
dobar
65
vrlo dobar
34
odličan
6
Ukupno:
∑
=
4
1
i
147
Izvor: Knjiga matične evidencije Fakulteta "E" u Rijeci 2007./2008. godine, (simulirani podaci)
U tablici 1.4. prikazan je statistički skup "Diplomirani studenti Fakulteta "E" u
Rijeci godine 2007./2008." grupiran prema
redoslijednom obilježju
"prosječni
uspjeh tijekom studiranja". U predstupcu su navedene grupe obilježja. Zaglavlje
opisuje sadržaj stupaca. U drugom stupcu su dane apsolutne frekvencije,
odnosno broj elemenata skupa koji pripadaju pojedinoj grupi obilježja. Suma 2.
stupca je zbroj apsolutnih frekvencija i odgovara opsegu statističkog skupa:
147
4
1
=
∑
=
i
i
f
. Ovo je primjer jednostavne statističke tablice.
17
1.3.4. Numerički niz
Grupiranjem elemenata statističkog skupa prema numeričkom ili
kvantitativnom obilježju nastaje numerički statistički niz.
Grupiranje i ureñivanje elemenata numeričkog statističkog skupa ovisi
o broju podataka i o njihovoj vrsti, odnosno o tome radi li se o neprekidnim
(kontinuiranim) ili prekidnim (diskontinuiranim) numeričkim statističkim
obilježjima.
Ako numeričko obilježje može poprimiti samo mali broj numeričkih
vrijednosti, tada svaka vrijednost može biti posebna grupa u nizu. To je
najčešće slučaj kod prekidnog ili diskontinuiranog numeričkog obilježja.
Ureñen negrupiran prekidni numerički statistički niz ima karakteristiku
da su njegove vrijednosti složene po veličini počevši, najčešće, od najmanje:
.
...,
,
3
,
2
,
;
...,
,
,
1
2
1
N
i
X
X
X
X
X
i
i
N
=
<
−
(1.3.4)
Općenito je pojedina vrijednost obilježja:
k
i
X
i
...,
,
2
,
1
,
=
, a pripadajuća
apsolutna frekvencija:
k
i
f
i
...,
,
2
,
1
,
=
.
Skup ureñenih parova:
k
i
f
X
i
i
...,
,
3
,
2
,
1
),
,
(
=
(1.3.5)
je distribucija frekvencija
promatranog prekidnog numeričkog obilježja.
Takoñer vrijedi da je
suma svih apsolutnih frekvencija jednaka opsegu
statističkog skupa:
N
f
k
i
i
=
∑
=
1
.
Za vrijednosti koje se pojavljuju manje puta formiraju se
zajedničke grupe ili "razredi"
. U razredima se nalaze elementi skupa s
vrijednostima obilježja koje se nalaze izmeñu donje i gornje granice
razreda
.
Na taj način formiranjem razreda postiže se veća preglednost, ali se
gubi na preciznosti i potpunosti informacija. U slučaju
diskontinuiranog
numeričkog obilježja donja granica slijedećeg (i+1) razreda razlikuje se od
gornje granice prethodnog (i) razreda za jedinicu mjere promatranog
obilježja.
Ove originalne granice razreda nazivaju se još i
nominalne granice
.
Prije provoñenja statističke analize potrebno je nominalne granice zamijeniti
preciznim ili pravim granicama
. To se najčešće radi na način da se donja
granica slijedećeg (i+1) nominalnog razreda umanji, a gornja granica
prethodnog (i) nominalnog razreda uveća za polovinu razlike izmeñu tih
granica. Ponekad se precizne granice formiraju jednostavno na način da se sve

19
d)
Kumulativni niz relativnih frekvencija "više od".
Kumulativni niz apsolutnih frekvencija "manje od"
dobije se
postupnim ili sukcesivnim zbrajanjem vrijednosti apsolutnih frekvencija
počevši od prve u nizu prema posljednjoj.
Frekvencije
kumulativnog niza
apsolutnih frekvencija "manje od" pokazuju koliki broj elemenata promatranog
statističkog skupa ima vrijednost obilježja
manju od gornje granice
pripadajućeg razreda.
Kumulativni niz apsolutnih frekvencija "više od"
dobije se
postupnim ili sukcesivnim zbrajanjem vrijednosti apsolutnih frekvencija
počevši od posljednje u nizu prema prvoj.
Frekvencije
kumulativnog niza
apsolutnih frekvencija "više od" pokazuju koliki broj elemenata promatranog
statističkog skupa ima vrijednost obilježja
višu ili jednaku od donje granice
pripadajućeg razreda.
Kumulativni niz relativnih frekvencija "manje od"
dobije se
postupnim ili sukcesivnim zbrajanjem vrijednosti relativnih frekvencija počevši
od prve u nizu prema posljednjoj.
Frekvencije
kumulativnog niza relativnih
frekvencija "manje od" pokazuju koliki udio (ili postotak ako su izražene u %)
elemenata promatranog statističkog skupa ima vrijednost obilježja
manju od
gornje granice pripadajućeg razreda.
Kumulativni niz relativnih frekvencija "više od"
dobije se
postupnim ili sukcesivnim zbrajanjem vrijednosti relativnih frekvencija počevši
od posljednje u nizu prema prvoj.
Frekvencije
kumulativnog niza relativnih
frekvencija "više od" pokazuju koliki udio (ili postotak ako su izražene u %)
elemenata promatranog statističkog skupa ima vrijednost obilježja
višu ili
jednaku od donje granice pripadajućeg razreda.
1.4. Statistička grafika
Uz statističke tablice, pomoćno sredstvo u analizi statističkih nizova su
grafički prikazi.
Grafikonima se na jednostavan i pregledan način uz pomoć
različitih geometrijskih likova prezentiraju osnovne karakteristike
statističkih nizova.
Grafički prikazi statističkih podataka su pregledniji i razumljiviji u
odnosu na njihovo prikazivanje statističkom tablicom. Grafikoni omogućuju
jednostavnije uočavanje glavnih karakteristika promatranih pojava, ali vrlo
često ta preglednost ide na štetu preciznosti statističkih informacija. Stoga je
poželjno uz grafički prikaz prezentirati i tablicu s originalnim vrijednostima
20
statističkog niza. Suvremeni statistički programski paketi, naravno u skladu sa
statističkom teorijom, imaju mnoštvo mogućnosti kreiranja grafičkih prikaza.
Pomoću njih se mogu odabrati različite boje, oblici i linije na grafikonu, što
omogućuje još zorniji prikaz promatrane pojave.
Oznake na grafikonu moraju biti takve da onaj tko čita sliku može jasno
raspoznati koji su elementi i koja je pojava prikana. Stoga i grafikon mora imati
naslov, jedinice mjere promatranog obilježja, oznake modaliteta obilježja,
izvor podataka i po potrebi kazalo ili tumač oznaka.
Postoje
tri skupine grafičkih prikaza:
1)
površinski grafikoni
2)
linijski grafikoni
3)
kartogrami.
1.4.1. Grafičko prikazivanje kvalitativnih nizova
Nominalni atributivni statistički nizovi
grafički se prikazuju
površinskim grafikonima. Površinski grafikoni mogu biti:
jednostavni stupci,
dvostruki i razdijeljeni
stupci, strukturni stupci, proporcionalni strukturni
krugovi i polukrugovi.
Osim nabrojenih mogu se koristiti i neki drugi
geometrijski likovi (trokuti, kvadrati i slično), raznih veličina i strukture u
skladu s frekvencijama promatranog statističkog niza.
Grafikon ima naslov i izvor podataka, koji odgovara izvoru podataka u
tablici po kojoj je konstruiran. Ako se grafikon nalazi na istoj stranici gdje je i
njegova tablica, na njemu se može izostaviti izvor podataka.
Pri konstrukciji
jednostavnih stupaca
na apscisi se označavaju svi
modaliteti obilježja, a na ordinati je skala apsolutnih frekvencija s aritmetičkim
mjerilom, dakle s originalnim jedinicama. Jednostavni stupci imaju jednake
baze i jednako su udaljeni jedan od drugog i razlikuju se samo po visini koja
odgovara veličini apsolutnih frekvencija. Stoga vrijedi da je i površina stupaca
proporcionalna apsolutnim frekvencijama (baza
×
visina).
Dvostruki i razdijeljeni stupci
upotrebljavaju se za grafičko
prikazivanje dvaju ili više statističkih skupova koji su grupirani prema
modalitetima istog obilježja. I ovdje vrijedi da se na apscisi označavaju svi
modaliteti obilježja, a na ordinati skala apsolutnih frekvencija.

22
Nominalni prostorni statistički nizovi,
uz navedene grafikone, mogu
se prikazivati
kartogramima
.
Kartogrami su zemljovidi na kojima se na različite načine
(točkama, geometrijskim likovima, slikama i bojama) prikazuje prostorna
rasprostranjenost elemenata statističkog skupa.
Postoje
tri vrste kartograma:
a)
dijagramske karte
b)
statističke karte
c)
piktogrami.
Dijagramske karte
crtaju se spajanjem zemljovida i površinskih
grafikona, na primjer, kvadrata, trokuta, krugova, i slično. Površinski grafikoni,
odnosno likovi, moraju biti proporcionalni apsolutnim frekvencijama skupa,
čime se izražava intenzitet promatranog obilježja ili pojave. Likovi se ucrtavaju
unutar granica površine na zemljovidu koja predočava odgovarajući modalitet
prostornog statističkog obilježja, čime se izražava prostorna rasprostranjenost
elemenata statističkog skupa. Primjer dijagramske karte:
Grafikon 1.
Europske zemlje prema pretplatnicima
telefona i mobitela na 100 stanovnika
160
80
16
Telefon
Mobitel
Izvor: Human Developmemnt Report, 2003., str. 274.-277.
23
Statističke karte
crtaju se tako da se na zemljovidu različitim bojama
ili sjenčanjem po pojedinim dijelovima nekog područja pokazuje intenzitet neke
pojave koji je najčešće izražen relativnim brojevima. Primjer statističke karte:
Grafikon 2.
Europske zemlje prema
% žena u parlamentu
35 do 45 (9)
30 do 34 (6)
25 do 29 (2)
20 do 24 (6)
15 do 19 (5)
10 do 14 (7)
3 do 9 (6)
Izvor: Human Developmemnt Report, 2003.god., str. 314.-317.
Piktogrami
prostornu rasprostranjenost i intenzitet elemenata
statističkog skupa prikazuju gušće ili rjeñe rasporeñenim točkama (ili nekim
drugim znakovima) na odgovarajućem zemljovidu. Primjer piktograma:

25
Studenti prema ocjenama iz "Statistike"
20.02.2006. god.
0
20
40
Ocjena
S
tu
d
en
ti
Broj studenata
20
33
50
18
10
1
2
3
4
5
Izvor: Podaci su simulirani.
1.4.2. Grafičko prikazivanje numeričkih nizova
Ako je
prekidni numerički statistički skup negrupiran
, može se
grafički prikazati pomoću dvije vrste
grafikona:
a)
dijagram s točkama
b)
dijagram "stablo-list"
(ili "Stem and Leaf" dijagram).
Primjer 1.4.1.
Na području "Z" anketiranjem 20 stanova dobiveni su podaci o broju
djece po obitelji na dan 31.12.2008. godine:
2 2 0 3 1 1 0 2 1 4 2 1 1 2 5 0 2 1 2 1
Ovaj skup potrebno je urediti, ali zbog malog broja numeričkih vrijednosti neće
se grupirati, već će se podaci složiti od najmanjih vrijednosti obilježja "broj
djece" prema najvećima. Dakle vrijednosti obilježja X
i
su sljedeće:
0 0 0 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3 4 5
Zadatak je ovaj
negrupirani diskontinuirani numerički niz
prikazati
na
dijagramu s točkama:
26
Grafikon 5:
Obitelji na području "Z" prema broju djece, stanje 31. 12. 2008. god.
Izvor: Podaci su simulirani.
Dijagram s točkama na grafikonu 10 zorno prikazuje raspored podataka, u
ovom slučaju broj djece, u ovih 10 promatranih obitelji.
Primjer 1.4.2.
U poduzeću "Z" pri donošenju organizacijskih odluka 31.01.2009. god.
izvršena je analiza djelatnika prema navršenim godinama radnog staža. Prema
matičnoj evidenciji svakog od 25 zaposlenika dobiveni su sljedeći podaci:
2 5 14 1 7 10 2 3 4 5 1 3 10 6 3 2 14 9 12 22 5 25 23 2 18
Skup je potrebno urediti, počevši od najmanjih vrijednosti obilježja "navršene
godine radnog staža".
1 1 2 2 2 2 3 3 3 4 5 5 5 6 7 9 10 10 12 14 14 18 22 23 25
Zadatak je ovaj
negrupirani diskontinuirani numerički niz
prikazati na
grafikonu "stablo-list":
Grafikon 6.
Djelatnici poduzeća "Z" prema navršenim godinama radnog staža, stanje
31. 01. 2009. god.
Stablo (Stem) List (Leaf)
0 1 1 2 2 2 2 3 3 3 4 5 5 5 6 7 9
1 0 0 2 4 4 8
2 2 3 5
Izvor: Podaci su simulirani.
Grafikon "stablo-list" nastaje tako da se svaka znamenka podijeli na dva dijela.
Prvi dio predstavlja "stablo", a drugi dio "list". U ovom primjeru znamenke na
mjestu desetica označavaju "stablo", dok "list" predstavljaju znamenke na
mjestu jedinica. U prvom retku grafikona 11 prikazano je 16 brojeva i to: 01,
01, 02, 02, 02, …, 09. U drugom retku prikazano je 6 podataka: 10, 10, 12, …,
18., a u trećem 3 podatka: 22, 23, 25.
Broj djece u obitelji
0
1
2
3
4
5

28
50-55
3
5
52,5
Izvor: Podaci su simulirani.
Zadatak je podatke iz tablice 1.5. prikazati grafički.
S obzirom da su veličine razreda (
i
) jednake grafički se prikazuju originalne
frekvencije (
f
i
), koje se ucrtavaju iznad sredine razreda:
Grafikon 7.
Broj zaposlenih u trgovačkom centru «Z» prema starosti, 2008. god.
0
5
10
15
20
25
30
22,5
27,5
32,5
37,5
42,5
47,5
52,5
Godine starosti
B
ro
j
za
p
o
sl
en
ih
Izvor: Podaci su simulirani.
1.5. Relativni brojevi i njihova primjena
Relativni brojevi su neimenovani, stoga se pomoću njih mogu
usporeñivati i analizirati pojave koje imaju različitu jedinicu mjere ili
različit broj elemenata.
Na taj način dobije se relativna važnost dijela ili
cjeline statističkog niza.
Relativni brojevi nastaju dijeljenjem dviju veličina. Veličina s
kojom se dijeli zove se osnova relativnog broja i po njoj se relativni brojevi
meñusobno razlikuju.
Općenito se
relativni brojevi mogu podijeliti na:
a)
relativne brojeve strukture
b)
relativne brojeve koordinacije
c)
indekse
(niza kvalitativnih podataka).
Relativni brojevi strukture pokazuju odnos dijela prema cjelini
, i
njima se olakšava analiza rasporeda podataka prema modalitetima obilježja u
jednom statističkom nizu, odnosno njihova struktura. Najčešće se izražavaju u
postotcima, a mogu i u promilima.
29
Ako relativni brojevi strukture (P
i
) pokazuju odnos apsolutnih
frekvencija prema opsegu statističkog skupa (tj. ukupnom broju elemenata
statističkog skupa) tada se zovu relativne frekvencije (fr
i
).
∑
=
=
=
n
i
i
i
i
i
f
f
fr
cjelina
dio
P
1
;
(1.5.1)
%)
(
100
%);
(
100
1
u
f
f
fr
u
cjelina
dio
P
n
i
i
i
i
i
⋅
∑
=
⋅
=
=
(1.5.2)
.)
(
1000
.);
(
1000
1
prom
u
f
f
fr
prom
u
cjelina
dio
P
n
i
i
i
i
i
⋅
∑
=
⋅
=
=
(1.5.3)
Zbroj svih relativnih brojeva u jednom statističkom nizu je 1 ili 100 ili
1000, ovisno o tome na koji je način relativni broj izražen.
Relativni brojevi strukture
grafički
se mogu prikazivati pomoću
strukturnih stupaca, strukturnih krugova, polukrugova, ili nekim drugim
geometrijskim likom. Pri tom se konstruiraju geometrijski likovi jednakih
površina jer je zbroj relativnih frekvencija uvijek isti. Likovi će se razlikovati
samo po strukturi.
Primjer 1.5.1.
Statistički niz «Stanovništvo RH prema aktivnosti» prikazan je u tablici
1.6.
Tablica 1.6.
Stanovništvo RH prema aktivnosti, popis 2001. god.
Aktivnost
Broj stanovnika
Postoci
(
P
i
)
Aktivno stanovništvo
1.952.619
44%
Osobe s osobnim prihodom
1.147.554
26%
Uzdržavano stanovništvo
1.337.287
30%
Ukupno
4.437.460
100%
Izvor: www.dzs.hr.
Zadatak je izračunati postotak stanovništva RH prema aktivnosti i dobivene
relativne brojeve strukture prikazati grafički strukturnim krugom:

31
Tablica 1.7.
Površine i stanovništvo u odabranim zemljama 2001. godine
Stanovništvo u
000
Površina u
km
2
Br.stan./km
2
Zemlje
A
i
B
i
R
i
Hrvatska
4437
56594
78,40054
Slovenija
1930
20273
95,20051
Austrija
8151
83871
97,18496
Mañarska
10106
93032
108,6293
Bosna i Hercegovina
3922
51197
76,60605
Izvor: Statistički ljetopis Republike Hrvatske, 2003. godine, str. 743.
Tablica 1.7. prikazuje 2 različita statistička skupa; površine i stanovništvo u
nekim odabranim europskim zemljama. Pomoću tih podataka željela se
prikazati gustoća naseljenosti u tim zemljama, odnosno broj stanovnika po km
2
.
Te vrijednosti su prikazane u posljednjem stupcu tablice. Na primjer, za
Republiku Hrvatsku:
40
,
78
56594
4437000
1
1
1
=
=
=
B
A
R
stan/km
2
Rezultat se može komentirati: u Republici Hrvatskoj je po km
2
bilo prosječno
78,40 stanovnika u 2001. godini. Najveću gustoću naseljenosti od promatranih
zemalja imala je Mañarska (108,63 stan/km
2
), a najnižu Bosna i Hercegovina
(76,61 stan/km
2
).
Ovdje je potrebno napomenuti da je stanovništvo u tablici dano u tisućama,
stoga su kod računanja za vrijednosti A
i
dodane tisuće.
32
Grafikon 9.
Izvor: Statistički ljetopis Republike Hrvatske, 2003. godine, str. 743.
Pri konstrukciji Varzarovog znaka na grafikonu 9 na apscisi se baza stupca crta
proporcionalno površinama odabranih zemalja, odnosno nazivniku (B
i
)
relativnog broja koordinacije. U skladu s tim može se uzeti mjerilo da je
1cm=40000km
2
. Visina stupaca odgovara broju stanovnika po km
2
, tj.
vrijednosti (R
i
). Površina stupaca je proporcionalna broju stanovnika (A
i
).
Indeksima niza kvalitativnih podataka usporeñuje se smjer i
intenzitet varijacija frekvencija nekog statističkog niza s takvim
varijacijama drugog statističkog niza.
Računaju se tako da se svaki član promatranog niza stavi u odnos prema
odabranoj bazi koja može biti jedan od članova niza ili neka druga zadana
veličina.
100
⋅
=
B
f
I
i
i
(1.5.5)
Dakle, prema izrazu (1.5.5), indeksi se računaju kao omjer frekvencije
promatranog niza i odabrane baze (B).
Grafički prikaz
indeksa kvalitativnih nizova su jednostavni stupci koji
imaju jednake baze jer se ovdje članovi niza usporeñuju uvijek s istom
Zemlje
Površina i br.st./km
2
za odabrane zemlje,
2001. god.
S
ta
n
o
v
n
ik
a
n
a
k
m
2
0
20
40
60
80
100
120
56594
20273
83871
93032
51197

34
Grafikon 10.
Indeksi GDP po stanovniku prema kupovnoj moći u zemljama EU i RH,
2003. god. (
ø
EU=100)
Izvor: Human Development Report, 2005., UN, str. 219.-222.; http://epp.eurostat.ec.
1.6. Programska potpora za statističku analizu
Prikupljeni statistički podaci nekom od navedenih metoda predstavljaju
"sirovu" statističku grañu koju je potrebno na odgovarajući način urediti i
pripremiti za analizu. Danas se statistički podaci uglavnom obrañuju prikladnim
programima za računalo. Postoje suvremeni statistički programski paketi koji
omogućavaju, uz vrlo jednostavno rukovanje, unos, pripremu i obradu
prikupljenih statističkih podataka. Primjeri suvremenih statističkih paketa su:
STATISTICA, SAS, SPSS (Statistical Package for the Social Sciences). Oni se
koriste za složenije statističke analize.
Jedan od najpopularnijih softwarea (programskih jezika) za tablične
proračune u provoñenju različitih aspekata statističke analize je Microsoft
Excel. U području programa koji su namijenjeni prvenstveno tabličnim
proračunima su Lotus 1-2-3 i QuatroPro, ali upotreba MS Excela je
najraširenija.
40
60
80
100
120
140
160
180
200
220
240
260
280
B
el
g
ij
a
Č
eš
k
a
D
an
sk
a
N
je
m
ač
k
a
E
st
o
n
ij
a
G
rč
k
a
Š
p
an
jo
ls
k
a
F
ra
n
cu
sk
a
Ir
sk
a
It
al
ij
a
C
ip
ar
L
at
v
ij
a
L
it
v
a
L
u
k
se
m
b
u
rg
M
añ
ar
sk
a
M
al
ta
N
iz
o
ze
m
sk
a
A
u
st
ri
ja
P
o
lj
sk
a
P
o
rt
u
g
al
S
lo
v
en
ij
a
S
lo
v
ač
k
a
F
in
sk
a
Š
v
ed
sk
a
U
K
H
rv
at
sk
a
35
MS Excel je u funkciji svih bitnih faza procesa statističke analize od
formiranja baze podataka, sreñivanja i grupiranja podataka, grafičkog
prikazivanja statističkih nizova, izračuna temeljnih karakteristika statističkog
niza pa sve do složenijih statističkih analiza i procedura i analize vremenskih
nizova. Upotrebom statističkih paketa, počevši već od pripremne faze
statističkog istraživanja, znatno se skraćuje i pojednostavljuje vrijeme potrebno
za primjenu statističkih metoda i tehnika. Na taj se način statistički postupci
približavaju mnogim korisnicima.
Prikupljene statističke podatke potrebno je unijeti i pohraniti u
odgovarajuću datoteku odabranog statističkog paketa. Kada se unose podaci
kvalitativnog ili opisnog karaktera, potrebno je izvršiti šifriranje ili kodiranje
vrijednosti takvih obilježja.
Primjer 1.6.1.
Iz ankete u Primjeru 1.2.1. kodirana su pitanja 3., 7. i 9:
3. Iz kojih ste predmeta pohañali poduke?
a)
Matematika
b)
Fizika
c)
Engleski jezik
d)
Hrvatski jezik
e)
Ostalo
7. Željeli biste pohañati:
a)
Individualne poduke
b)
Grupne poduke
c)
Svejedno mi je
9. Spol
a)
žensko
b)
muško
Tablica 1.9.
Kodna lista
OBILJEŽJE
OBLICI OBILJEŽJA
KOD
poduke iz željenog predmeta(V1)
Matematika
A
Fizika
B
Engleski jezik
C
Hrvatski jezik
D
Ostalo
E
željena vrsta poduka (V2)
Individualne poduke
A
Grupne poduke
B
Nije bitno
C
spol (V3)
ženski
1
muški
2
U tablici 1.9. vidi se da obilježje "poduka iz željenog predmeta" može poprimiti
5 oblika: Matematika, Fizika, Engleski jezik, Hrvatski jezik i ostalo. Svakom

37
1.7. Analiza podataka metodama deskriptivne statistike
Kako je već definirano
deskriptivna ili opisna statistika
temelji se na
potpunom obuhvatu statističkog skupa, čiju masu podataka organizirano
prikuplja, odabire, grupira, prezentira i interpretira dobivene rezultate analize.
Ako se podaci prikupljaju za sve članove nekog skupa, takovo
promatranje naziva se
census
. Primjer takvog prikupljanja je popis
stanovništva.
Prema samoj definiciji statistike, kao posebne znanstvene discipline
koja u svrhu realizacije postavljenih ciljeva istraživanja na organiziran način
koristi svoje metode i tehnike, mogu se definirati koraci pri statističkom
istraživanju:
1. Definiranje zadatka, cilja i predmeta istraživanja, tj. statističkog skupa
U ovoj početnoj fazi istraživanja, u skladu s postavljenim ciljem,
definira se statistički skup, njegove karakteristike ili obilježja. Donosi se i
odluka hoće li se koristiti primarni ili sekundarni izvori podataka, tj. hoće li se
vršiti neposredno promatranje svojstava elemenata statističkog skupa
ili će se
pribavljati iz već postojećih baza podataka.
2. Promatranje i analiza prikupljenih podataka
U ovoj fazi vrši se konkretno prikupljanje podataka iz odabranih izvora,
te se ocjenjuje kvaliteta takve "sirove" statističke grañe. Nakon toga potrebno je
prikupljene statističke podatke unijeti i pohraniti u odgovarajuću datoteku
odabranog statističkog paketa.
3. Grupiranje, tabelarno i grafičko prikazivanje podataka
U ovom koraku statističkog istraživanja vrši se grupiranje prikupljenih
statističkih podataka. Tabelarnim i grafičkim prikazivanjem postiže se jasnija i
preglednija prezentacija grupiranih podataka. Uz vizualnu prezentaciju
statističkih informacija, tablice i grafikoni služe i kao pomoćno sredstvo
istraživanja i analize prikupljenih podataka.
4. a Za podatke koji potpuno obuhvaćaju statistički skup koriste se metode
i tehnike deskriptivne ili opisne statistike
U ovoj fazi kada su prikupljeni svi podaci čitavog statističkog skupa,
računaju se apsolutni i relativni pokazatelji odnosa unutar jedne ili više pojava.
4. b Za podatke koji obuhvaćaju dio tj. slučajni uzorak statističkog skupa
koriste se metode i tehnike inferencijalne statistike
Kada se pri statističkom istraživanju raspolaže samo podacima iz
uzorka, računaju se procjene parametara iz čitavog osnovnog statističkog skupa
te se vrši testiranje hipoteza o tim parametrima.
38
5. Interpretacija rezultata i zaključci provedene analize
Nakon deskriptivne analize čitavog statističkog skupa vrši se tumačenje
dobivenih brojčanih rezultata i statističkih tablica te se donose zaključci u
skladu s postavljenim ciljem statističkog istraživanja.
Nakon inferencijalne analize statističkog skupa na bazi uzorka, opet u
skladu s postavljenim ciljevima istraživanja, donosi se izvješće o procijenjenim
parametrima iz čitavog osnovnog statističkog skupa i rezultatima postavljenih
hipoteza o tim parametrima.
1.8. Mjere centralne tendencije, disperzije, koncentracije,
asimetrije i zaobljenost
1.8.1. Mjere centralne tendencije
Računanjem srednjih vrijednosti dolazi se do informacija o
vrijednostima statističkog obilježja oko kojih se rasporeñuju elementi
statističkog niza.
Srednja vrijednost je vrijednost statističkog obilježja oko koje se
grupiraju podaci statističkog niza. Još se zove i "mjera centralne
tendencije".
Srednje vrijednosti mogu se podijeliti na:
1.
Potpune srednje vrijednosti
računaju se upotrebom svih podataka u
statističkom nizu. Potpune srednje vrijednost su:
a)
aritmetička sredina
b)
harmonijska sredina
c)
geometrijska sredina.
2.
Položajne srednje vrijednosti
odreñuju se položajem podataka u nizu.
Najvažnije položajne srednje vrijednosti su :
a)
medijan
b)
mod.

40
jer veća frekvencija znači veći udio tog oblika obilježja u promatranom skupu.
Zato se frekvencija još naziva težinski faktor ili ponder kod grupiranih nizova.
Vagana ili ponderirana aritmetička sredina računa se prema
izrazu:
∑
∑
=
+
+
+
=
+
+
+
+
+
+
=
=
=
k
i
i
k
i
i
i
k
k
k
k
k
f
x
f
N
x
f
x
f
x
f
f
f
f
x
f
x
f
x
f
X
1
1
2
2
1
1
2
1
2
2
1
1
...
...
...
(1.8.2)
U jednadžbi (1.8.2),
k
predstavlja broj grupa, odnosno modaliteta
promatranog numeričkog obilježja. Nazivnik ovog izraza, kao suma svih
apsolutnih frekvencija, odgovara opsegu statističkog skupa.
S obzirom da su
relativne frekvencije
upravno proporcionalne
apsolutnim frekvencijama,
aritmetička sredina se može izračunati i pomoću
njih:
∑
∑
=
+
+
+
+
+
+
=
=
=
k
i
i
k
i
i
i
k
k
k
fr
x
fr
fr
fr
fr
x
fr
x
fr
x
fr
X
1
1
2
1
2
2
1
1
...
...
(1.8.3)
Nazivnik jednadžbe (1.8.3) može biti 1 ili 100, što ovisi o tome jesu li
relativne frekvencije dane u decimalnom obliku ili u postotcima.
Ako su veličine razreda grupiranog numeričkog niza različite od 1,
za računanje vagane ili ponderirane aritmetičke sredine, potrebno je
izvršiti aproksimaciju pomoću sredine razreda.
Sredina razreda, kako je već
rečeno, dobije se kao jednostavan prosjek donje i gornje granice razreda. Na taj
način ona predstavlja sve vrijednosti obilježja koje se javljaju u jednoj grupi.
Stoga je, u ovom slučaju, aritmetička sredina procjena stvarne aritmetičke
sredine numeričkog niza.
Aritmetička sredina izražava se u originalnim jedinicama mjere
promatranog numeričkog obilježja, obuhvaća sve elemente nekog skupa te se
pomoću nje mogu usporeñivati nizovi koji su grupirani po jednakom obilježju.
Uz ove, aritmetička sredina zadovoljava i sljedeće kriterije:
a)
aritmetička sredina nalazi su izmeñu najveće i najmanje vrijednosti
promatranog numeričkog obilježja:
max
min
x
X
x
≤
≤
(1.8.4)
b)
zbroj odstupanja vrijednosti numeričkog obilježja od aritmetičke
sredine u jednoj distribuciji je uvijek nula.
0
)
(
1
=
−
∑
=
X
x
N
i
i
, za negrupirani niz
(1.8.5)
41
0
)
(
1
=
−
∑
=
X
x
f
i
k
i
i
, za grupirani niz
(1.8.6)
c)
zbroj kvadrata odstupanja vrijednosti numeričkog obilježja od
aritmetičke sredine u jednoj distribuciji je manji ili jednak zbroju
kvadrata odstupanja vrijednosti numeričkog obilježja u istoj distribuciji
od bilo koje druge vrijednosti (a).
2
1
2
1
)
(
)
(
a
x
X
x
N
i
i
N
i
i
−
∑
≤
−
∑
=
=
, za negrupirani niz
(1.8.7)
2
1
2
1
)
(
)
(
a
x
f
X
x
f
i
k
i
i
i
k
i
i
−
∑
≤
−
∑
=
=
, za grupirani niz
(1.8.8)
Ako neki numerički niz sadrži ekstremno male ili velike vrijednosti
obilježja, aritmetička sredina kao prosječna vrijednost gubi na svojoj
reprezentativnosti. Taj problem je dodatno izražen kada u distribuciji postoje
razredi s otvorenom donjom, odnosno gornjom granicom obilježja, i kada nije
moguće te granice objektivno procijeniti.
1.8.1.2. Harmonijska sredina
Harmonijska sredina spada u potpune srednje vrijednosti i
računa
se upotrebom svih podataka u statističkom nizu.
Harmonijska sredina je recipročna vrijednost aritmetičke sredine
recipročnih vrijednosti numeričkog obilježja u jednom nizu.
Ako se radi o
negrupiranom statističkom numeričkom nizu
računa
se jednostavna harmonijska sredina
:
∑
=
+
+
+
=
+
+
+
=
∑
=
=
=
N
i
i
N
N
N
i
i
x
N
x
x
x
N
N
x
x
x
N
x
H
1
2
1
2
1
1
1
1
...
1
1
1
...
1
1
1
1
1
(1.8.9)
Ako se radi o
grupiranom statističkom numeričkom nizu
računa se
složena ili vagana harmonijska sredina
:
∑
∑
=
+
+
+
∑
=
∑
+
+
+
=
∑
∑
=
=
=
=
=
=
=
k
i
i
i
k
i
i
k
k
k
i
i
k
i
i
k
k
k
i
i
k
i
i
i
x
f
f
x
f
x
f
x
f
f
f
x
f
x
f
x
f
f
x
f
H
1
1
2
2
1
1
1
1
2
2
1
1
1
1
...
...
1
1
(1.8.10)

43
c)
ako su dostupni podaci o relativnom broju koordinacije (R
i
) i o veličini
koja se usporeñuje (A
i
), srednja vrijednost (
R
) izračunat će se pomoću
izraza za
složenu ili vaganu harmonijsku sredinu:
∑
∑
=
=
=
k
i
i
i
k
i
i
R
A
A
R
1
1
(1.8.14)
Na temelju osnovne relacije (1.8.12) jasno je da vrijedi, da je veličina iz
nazivnika:
∑
=
∑
=
=
k
i
i
i
k
i
i
R
A
B
1
1
. Ponderi su ovdje vrijednosti veličine koja se
usporeñuje iz brojnika: A
i
.
Primjer 1.8.2.
Za nekoliko odabranih fakulteta u Republici Hrvatskoj dani su podaci o
broju studenata i broju studenata po nastavniku u akademskoj godini
2002./2003.
Tablica 1.11.
Broj studenata i broj studenata po nastavniku u nekim odabranim
fakultetima, u RH u akademskoj godini 2002./2003.
Fakulteti
Broj studenata
(A
i
)
Broj studenata po
nastavniku (R
i
)
Broj nastavnika
(A
i
/R
i
)=B
i
PMF
3238
11,64748200
278
Grañevinski fakulteti
2480
8,70175439
285
Fakult. el. stroj. i brod.
7603
10,20536910
745
Medicinski fakulteti
3116
3,72281959
837
Ekonomski fakulteti
12217
36,03834810
339
Ukupno:
28654
70,3157732
2484
Izvor: Statistički ljetopis Republike Hrvatske, 2003. godine, str. 447., 448., 450.
Zadatak je izračunati prosječan broj studenata po nastavniku za sve promatrane
fakultete zajedno, odnosno
prosjek relativnih brojeva koordinacije (
R
)
.
S obzirom da je u ovom primjeru poznata (A
i
) veličina koja se usporeñuje i
relativni brojevi koordinacije (R
i
), njihov se prosjek računa pomoću izraza za
složenu ili vaganu harmonijsku sredinu, gdje su ponderi (A
i
):
5354
,
11
2484
28654
1
1
1
1
=
=
∑
∑
=
⇒
∑
∑
=
=
=
=
=
k
i
i
i
k
i
i
k
i
i
i
k
i
i
R
A
A
R
x
f
f
H
Prosječan broj studenata po nastavniku za sve promatrane fakultete zajedno
iznosi 11,5354 studenata po nastavniku.
44
1.8.1.3. Geometrijska sredina
Geometrijska sredina spada u potpune srednje vrijednosti i
računa
se upotrebom svih podataka u statističkom nizu.
Geometrijska sredina je N-ti korijen umnoška
3
svih vrijednosti
negrupiranog numeričkog obilježja jednog niza.
N
N
N
N
i
i
x
x
x
x
G
⋅
⋅
⋅
=
∏
=
=
...
2
1
1
(1.8.15)
U izrazu (1.8.15) dana je
jednostavna geometrijska sredina
koja se
koristi za negrupirane statističke numeričke nizove. Ako su nizovi grupirani po
razredima računa se
složena ili vagana geometrijska sredina
:
N
N
N
N
N
i
i
i
x
f
x
f
x
f
x
f
G
⋅
⋅
⋅
=
∏
=
=
...
2
2
1
1
1
(1.8.16)
Ponderi su i ovdje apsolutne frekvencije. Ako su veličine razreda
različite od 1, i za geometrijsku sredinu se radi aproksimacija na način da se
računaju sredine razreda x
i
.
Geometrijska sredina kod numeričkih nizova nema neku logičnu
interpretaciju. U
poslovnoj i makroekonomskoj statistici geometrijska
sredina se najčešće upotrebljava u analizi vremenskih nizova
.
1.8.1.4. Medijan
Medijan je vrijednost statističkog obilježja koja statistički niz dijeli
na dva jednaka dijela.
Medijan se može primijeniti na redoslijedne i kvantitativne statističke
nizove, a spada u položajne srednje vrijednosti. Medijan se ne primjenjuje kod
nominalnih nizova jer poredak oblika ovog obilježja može biti proizvoljan.
Kod
negrupiranog, a ureñenog niza (po veličini vrijednosti
obilježja)
, medijan je vrijednost obilježja koja pripada elementu statističkog
niza koji se nalazi u sredini niza. Ako je broj elemenata statističkog niza paran,
onda se za medijan uzima jednostavan prosjek vrijednosti obilježja dvaju
članova koji se nalaze na sredini statističkog niza. (Npr. za niz s 10 podataka,
3
Znak produkta ili umnoška niza vrijednosti je:
N
N
i
i
x
x
x
x
⋅
⋅
⋅
=
∏
=
...
2
1
1

46
1.8.1.4.1. Kvantili
Kvantili su vrijednosti statističkog obilježja koje statistički niz
dijele na q jednakih dijelova.
Kvartili su vrijednosti statističkog obilježja koje statistički niz
dijele na 4 jednaka dijela. Kvartili se mogu podijeliti na:
a)
donji kvartil (Q
1
)
b)
gornji kvartil (Q
3
) .
Donji kvartil dijeli statistički niz na četiri jednaka dijela u omjeru
1:3, odnosno 25% elemenata statističkog skupa ima vrijednost obilježja
manju od donjeg kvartila, a 75% elemenata statističkog skupa ima
vrijednost obilježja veću od donjeg kvartila.
Gornji kvartil dijeli statistički niz na četiri jednaka dijela u omjeru
3:1, odnosno 75% elemenata statističkog skupa ima vrijednost obilježja
manju od donjeg kvartila, a 25% elemenata statističkog skupa ima
vrijednost obilježja veću od gornjeg kvartila.
Kvartili se, slično kao i medijan, mogu primijeniti na redoslijedne i
kvantitativne statističke nizove, a odreñuju se položajem u nizu. Ni oni se ne
primjenjuju kod nominalnih nizova jer kako je već naglašeno poredak oblika
ovog obilježja može biti proizvoljan.
Kod
negrupiranog, a ureñenog niza (po veličini vrijednosti
obilježja), donji kvartil
je vrijednost obilježja koja pripada elementu
statističkog niza čiji rang (r) tj. mjesto u nizu odgovara:
r
x
Q
=
1
, gdje je
1
)
4
(
+
=
N
INT
r
,
ako N nije djeljiv s 4;
4
2
1
1
+
+
=
r
r
x
x
Q
, gdje je
4
N
r
=
,
1
4
)
1
(
+
=
+
N
r
,
ako je N djeljivo s 4,
računa se prosjek obilježja koji se nalaze na mjestu u nizu:
)
1
(
+
r
i
r
.
Kod
negrupiranog, a ureñenog niza (po veličini vrijednosti
obilježja), gornji kvartil
je vrijednost obilježja koja pripada elementu
statističkog niza čiji rang tj. mjesto u nizu odgovara:
r
x
Q
=
3
, gdje je
1
)
4
3
(
+
=
N
INT
r
,
ako N nije djeljiv s 4;
4
INT predstavlja cijeli dio decimalnog broja dobivenog dijeljenjem (eng. integer). npr.:
.
5
)
7
,
5
(
,
5
)
3
,
5
(
=
=
INT
INT
47
2
1
3
+
+
=
r
r
x
x
Q
, gdje je
4
3
N
r
=
,
1
4
3
)
1
(
+
=
+
N
r
, ako je N djeljivo s 4,
računa se prosjek obilježja koji se nalaze na mjestu u nizu:
)
1
(
+
r
i
r
.
Ako je
statistički niz grupiran u razrede
, prije računanja kvartila
potrebno je izračunati frekvencije kumulativnog niza "manje od" ili "više od", te
se u takvom nizu traži odgovarajući član.
Ako se računaju frekvencije
kumulativnog niza "manje od" za donji kvartil se traži prva frekvencija
niza koja sadrži
4
N
. Za gornji kvartil se traži prva frekvencija niza koja
sadrži
4
3
N
. Razred koji odgovara odabranoj frekvenciji kumulativnog
niza "manje od" je razred donjeg, odnosno gornjeg kvartila.
Ako su veličine razreda obilježja jednake 1, vrijednost obilježja
koja odgovara odabranoj frekvenciji kumulativnog niza je donji, odnosno
gornji kvartil.
Ako su veličine razreda obilježja različite od 1, donji kvartil se
računa po izrazu:
i
f
f
N
L
Q
t
k
q
i
i
⋅
∑
−
+
=
=
var
1
1
1
4
,
(1.8.18)
gdje je:
1
L
- donja prava ili precizna granica razreda donjeg kvartila
4
N
- četvrtina elemenata statističkog niza
∑
=
q
i
i
f
1
- zbroj svih apsolutnih frekvencija do razreda donjeg kvartila, ne
uključujući taj razred (tj. kumulativna frekvencija ispred kumulativne
frekvencije razreda donjeg kvartila)
t
k
f
var
- apsolutna frekvencija razreda donjeg kvartila
i
- originalna veličina kvartilnog razreda.
Ako su veličine razreda obilježja različite od 1, gornji kvartil se
računa po izrazu:
i
f
f
N
L
Q
t
k
q
i
i
⋅
∑
−
+
=
=
var
1
1
3
4
3
,
(1.8.19)
gdje je:
1
L
- donja prava ili precizna granica razreda gornjeg kvartila
4
3
N
- tri četvrtine elemenata statističkog niza

49
Tablica 1.12.
Prodane cipele u prodavaonici "K" na dan 30.05. 2008. god. prema boji
Boja cipela
Broj prodanih
cipela
X
i
f
i
crna
4
bijela
1
ružičasta
3
smeña
2
Ukupno:
10
Izvor: Evidencija prodavaonice "K", svibanj 2008. godine
Kod negrupiranih nizova mod se odreñuje prema najvećoj apsolutnoj
frekvenciji:
4
max
=
f
. Modalitet obilježja koji odgovara ovoj frekvenciji
je:
boja
crna
Mo
=
.
Kod kvantitativnih statističkih obilježja
vrijednost moda odgovara
vrijednosti obilježja kojoj pripada najveća korigirana frekvencija (
i
fc
). Ako su
veličine razreda ili grupa numeričkog obilježja jednake nije potrebno korigirati
frekvencije, već se radi s originalnim apsolutnim frekvencijama. Ukoliko se
vrijednost moda ne može točno odrediti primjenjuje se sljedeći izraz za
izračunavanje moda:
(
)
(
) (
)
i
c
b
a
b
a
b
L
Mo
⋅
−
+
−
−
+
=
1
,
(1.8.20)
gdje je:
1
L
- donja prava ili precizna granica modalnog razreda
b
- najveća korigirana frekvencija (tj. frekvencija modalnog razreda)
a
- korigirana frekvencija ispred frekvencije modalnog razreda
c
- korigirana frekvencija iza frekvencije modalnog razreda
i
- veličina modalnog razreda.
U izrazu (1.8.20) frekvencije ispred (
a
) i iza (
c
) modalnog razreda
(
b
) služe kao ponderi koji pomiču mod od sredine odgovarajućeg modalnog
razreda prema njegovoj donjoj ili gornjoj granici.
Osim
unimodalnih nizova
koji imaju samo jedan mod, postoje
statistički nizovi u kojima se dvije ili više vrijednosti obilježja mogu pojavljivati
češće u odnosu na ostale modalitete obilježja. U tom slučaju kaže se da su to
bimodalni ili multimodalni nizovi
. Kod bimodalne distribucije koja ima dva
vrha postoji glavni mod i lokalni mod. U takvom slučaju kada je u nizu prisutno
više od jednog moda potrebno je statistički skup podijeliti na više podskupova,
50
od kojih će svaki imati svoja karakteristična svojstva, te izvršiti analizu svakog
podskupa posebno.
1.8.1.6. Odnosi meñu srednjim vrijednostima
Srednje vrijednosti oko kojih se grupiraju podaci statističkog niza ili
mjere centralne tendencije odreñuju se položajem podataka u statističkom nizu
kao i obuhvatom svih podataka niza.
Izbor srednje vrijednosti u nekom
skupu ovisi o svojstvima elemenata skupa i o vrsti statističkog obilježja po
kojem se ti elementi promatraju:
a)
za
nominalna obilježja
može se računati:
mod (Mo)
b)
za
redoslijedna obilježja
može se računati:
mod (Mo) i medijan (Me)
c)
za
numerička obilježja
može se računati:
mod (Mo), medijan (Me)
aritmetička sredina (
X
), geometrijska sredina (G) i harmonijska
sredina (H).
Elementi numeričkog statističkog niza mogu biti i negativni. U tom
slučaju može se računati samo geometrijska (G) i harmonijska (H) sredina.
Kod
numeričkih statističkih nizova sa strogo pozitivnim
vrijednostima vrijedi sljedeći odnos
izmeñu harmonijske, geometrijske i
aritmetičke sredine:
max
min
x
X
G
H
x
≤
≤
≤
≤
(1.8.21)
Dakle, harmonijska, geometrijska i aritmetička sredina se nalaze
izmeñu najveće i najmanje vrijednosti numeričkog obilježja, a aritmetička
sredina ima najveću srednju vrijednost. Njihove veličine se poklapaju samo
onda kada u jednom nizu svi elementi imaju jednake vrijednosti obilježja.
Prema rasporedu po veličini srednjih vrijednosti u jednom nizu može se
zaključiti kakav je raspored elemenata skupa. Naime elementi skupa mogu biti
ravnomjerno ili simetrično rasporeñeni oko srednjih vrijednosti, a mogu biti
raspršeni pozitivno tj. na desnu stranu ili negativno tj. na lijevu stranu.

52
1.8.2. Mjere disperzije
Može se dogoditi da neki statistički skupovi imaju jednake npr.
aritmetičke sredine, a da su njihovi elementi potpuno različiti. To znači da je
raspored elemenata u tim skupovima različit.
Informaciju o rasporedu
elemenata daju mjere raspršenosti ili disperzije elemenata numeričkog
statističkog skupa.
Postoje apsolutne i relativne mjere raspršenosti. Apsolutni pokazatelji
izraženi su u originalnim jedinicama mjere i omogućavaju usporedbu nizova
prema istom obilježju (
apsolutni pokazatelji su: raspon varijacije,
interkvartil, varijanca i standardna devijacija
).
Usporedbu raspršenosti elemenata nizova s različitom mjernom
jedinicom omogućuju relativni pokazatelji, koji su najčešće izraženi u
postocima (
relativni pokazatelji su: koeficijent kvartilne devijacije i
koeficijent varijacije
).
Neke mjere raspršenosti temelje se na dijelu podataka, a neke
obuhvaćaju sve elemente promatranog statističkog niza. Stoga se razlikuju:
a)
nepotpune
mjere
raspršenosti:
raspon
varijacije,
interkvartil i koeficijent kvartilne devijacije
b)
potpune
mjere
raspršenosti:
varijanca,
standardna
devijacija i koeficijent varijacije.
1.8.2.1. Raspon varijacije, interkvartilni raspon i koeficijent
kvartilne devijacije
Raspon varijacije je najjednostavnija mjera disperzije, a
predstavlja razliku izmeñu najveće i najmanje vrijednosti numeričkog
obilježja promatranog niza.
min
max
x
x
R
−
=
(1.8.25)
Ovaj apsolutni pokazatelj raspršenosti izražen je u originalnim
jedinicama mjere numeričkog obilježja. Može poprimiti vrijednost 0. To se
dogaña u slučaju kada svi elementi niza imaju jednaku vrijednost obilježja.
Najveća vrijednost ovog pokazatelja nije ograničena jer ona ovisi o konkretnoj
raspršenosti promatranih vrijednosti obilježja.
53
Raspon varijacije je nepotpuna mjera disperzije jer se računa samo na
temelju dvije vrijednosti obilježja, odnosno na temelju najveće i najmanje
vrijednosti. Može se reći da ovo nije precizna mjera raspršenosti elemenata
niza, osobito u slučaju postojanja ekstremno malih i/ili ekstremno velikih
vrijednosti obilježja. Tada se dobije veliki raspon varijacije, a možda je većina
elemenata skupa raspršena usko oko srednjih vrijednosti.
Taj problem preciznosti rješava interkvartilni raspon ili interkvartil.
Interkvartil je apsolutna, nepotpuna mjera raspršenosti, koja
pokazuje disperziju srednjih 50% elemenata ureñenog numeričkog niza.
1
3
Q
Q
I
q
−
=
(1.8.26)
Interkvartil predstavlja razliku gornjeg i donjeg kvartila.
Na taj
način se eliminira 25% ekstremno malih i 25% ekstremno velikih vrijednosti
obilježja u nizu.
Slika 1.2.
Slika 1.2. prikazuje jednu simetričnu distribuciju, gdje su elementi
skupa ravnomjerno rasporeñeni oko srednjih vrijednosti. Poznato je da donji
kvartil (Q
1
) dijeli distribuciju u omjeru 1:3, tj. da 25% elemenata skupa ima
vrijednost obilježja manju od donjeg kvartila, a 75% elemenata skupa ima
vrijednost obilježja veću od donjeg kvartila. Isto tako gornji kvartil (Q
3
) dijeli
distribuciju u omjeru 3:1, tj. da 75% elemenata skupa ima vrijednost obilježja
manju od gornjeg kvartila, a 25% elemenata skupa ima vrijednost obilježja veću
od gornjeg kvartila. Na taj način interkvartil pokazuje disperziju srednjih 50%
elemenata skupa.
Koeficijent kvartilne devijacije je relativna nepotpuna mjera
raspršenosti. Predstavlja relativnu disperziju srednjih 50% elemenata
numeričkog niza.
Računa se na temelju samo dvije vrijednosti obilježja, a to su
donji i gornji kvartil.
1
3
1
3
Q
Q
Q
Q
V
q
+
−
=
(1.8.27)
f
i
x
i
25%
Q
3
Q
1
25%
50%

55
(
)
2
1
2
1
2
2
X
N
x
N
X
x
N
i
i
N
i
i
−
∑
+
=
∑
−
+
=
+
=
=
=
σ
σ
, za negrupirani niz
(1.8.31)
(
)
2
1
1
2
1
1
2
2
X
f
x
f
f
X
x
f
k
i
i
k
i
i
i
k
i
i
k
i
i
i
−
∑
∑
+
=
∑
∑
−
+
=
+
=
=
=
=
=
σ
σ
, za grupirani niz
(1.8.32)
Pomoću standardne devijacije u originalnim mjernim jedinicama
obilježja može se usporeñivati raspršenost oko aritmetičke sredine nizova koji
su grupirani po jednakom obilježju.
Varijanca i standardna devijacija kao apsolutne mjere disperzije ne
omogućuju usporedbu disperzije vrijednosti obilježja koje imaju različitu
jedinicu mjere. Takoñer mogu uputiti na pogrešan zaključak pri usporedbi
disperzije obilježja nizova s različitim pojedinačnim vrijednostima obilježja. U
tom slučaju se može računati:
a)
standardizirano obilježje
b)
relativni pokazatelji disperzije
Standardizirano obilježje (z
i
) je linearna transformacija originalnih
vrijednosti numeričkog obilježja x
i
, a pokazuje odstupanje vrijednosti
obilježja od aritmetičke sredine u standardnim devijacijama.
.
,
...
,
3
,
2
,
1
,
N
i
X
x
z
i
i
=
−
=
σ
(1.8.33)
Vrijede sljedeća svojstva standardiziranog obilježja:
a)
aritmetička sredina standardiziranog obilježja je uvijek jednaka
nuli:
0
=
Z
b)
standardna devijacija standardiziranog obilježja je jednaka
jedinici:
1
=
z
σ
.
Ova svojstva omogućuju usporedbu relativnih položaja elemenata
numeričkih nizova.
Ruski matematičar P. L. Čebišev (1821.-1894.) utvrdio je teorem koji
definira najmanju proporciju vrijednosti numeričke varijable koja pripada
odreñenom intervalu oko aritmetičke sredine.
Teorem Čebiševa: Najmanja proporcija vrijednosti numeričke
varijable koje pripadaju intervalu
)
(
σ
k
X
±
, gdje je
1
>
k
, iznosi:
[
]
2
)
1
(
1
k
−
.
Prema ovom Teoremu vrijedi da se:
•
u intervalu
)
(
σ
±
X
nalazi najmanje 68% svih vrijednosti
numeričke varijable
56
•
u intervalu
)
2
(
σ
±
X
nalazi najmanje 95% svih vrijednosti
numeričke varijable
•
u intervalu
)
3
(
σ
±
X
nalazi najmanje 99,7% svih vrijednosti
numeričke varijable
Ako se definira jedna savršeno simetrična distribucija zvonastog oblika
ovi odnosi aritmetičke sredine i standardne devijacije mogu se prikazati kao na
slici 1.3..
Slika 1.3.
Koeficijent varijacije spada u potpune relativne mjere raspršenosti
jer obuhvaća sve elemente odabranog numeričkog statističkog niza, a izražava
se u postotcima (%).
Koeficijent varijacije je postotak standardne devijacije od
aritmetičke sredine.
100
⋅
=
X
V
σ
(1.8.34)
Vrijednost koeficijenta varijacije se kreće u intervalu
+∞
<
≤
0
0
.
Vrijednost od 0% će poprimiti samo u slučaju kada su sve vrijednosti
numeričkog obilježja u jednom nizu jednake, odnosno kada nema disperzije.
Veća vrijednost ovog pokazatelja upućuje na veću disperziju elemenata
promatranog niza.
Ovaj pokazatelj raspršenosti je izražen u postotcima, pa omogućuje
usporedbu disperzije numeričkih nizova s različitim jedinicama mjere.
f
i
x
i
68%
X-3
σ
X-2
σ
X-
σ
X+3
σ
X+2
σ
X+
σ
95%
99.7%

58
Vrijednost
koncentracijskog
omjera
kreće
se
na
intervalu:
1
1
≤
≤
r
C
N
. Ako su sve vrijednosti promatranog obilježja
jednake, omjer iznosi:
N
1
. Ako su sve vrijednosti obilježja, osim
posljednje u nizu jednake 0, omjer iznosi:
1
.
Koncentracijski omjer
r
-tog reda se tumači na način da
r
prvih
elemenata skupa zauzima odgovarajući postotak u cijelom statističkom
skupu. U skladu s tim u ekonomiji se ovaj omjer često koristi u
odreñivanju stupnja monopola na nekom tržištu.
Herfindahlov indeks
je:
2
1
1
2
∑
∑
=
=
=
N
i
i
N
i
i
X
X
H
,
(1.8.38)
a vrijedi i da je:
(
)
+
=
+
=
1
1
1
1
2
2
2
X
N
V
N
H
σ
(1.8.39)
gdje je:
i
X
- vrijednosti promatranog obilježja
N
- broj modaliteta promatranog obilježja
V
- koeficijent varijacije zadanog niza (nepomnožen sa 100)
2
σ
- varijanca zadanog niza
X
- aritmetička sredina promatranog obilježja.
Vrijednost Herfindahlov indeksa kreće se na intervalu:
1
1
≤
≤
H
N
. Ako su sve vrijednosti promatranog obilježja jednake omjer
iznosi:
N
1
. Ako su sve vrijednosti obilježja, osim posljednje u nizu
jednake 0, omjer iznosi:
1
(koncentracija je najveća).
Herfindahlov indeks ne može se numerički usporeñivati s
koncentracijskim omjerom jer se temelje na različitim polazištima.
Ginijev
koeficijent
koncentracije
je relativna mjera
koncentracije. U konačnoj interpretaciji ovaj pokazatelj se spaja s
Lorenzovom krivuljom
koja nastaje u prvom kvadrantu koordinatnog
sustava spajanjem točaka od točke
)
0
,
0
(
do točke
)
1
,
1
(
na sljedeći
način:
59
( )
( )
.
1
,
1
;
...
;
,
;
...
;
,
1
;
0
,
0
1
1
1
1
∑
∑
∑
=
=
=
N
i
i
I
i
i
N
i
i
X
X
N
I
X
X
N
(1.8.40)
Dakle druga koordinata svake točke dobije se tako da se svaki
član kumulativnog niza «manje od» podijeli s totalom.
Pretpostavlja se da su vrijednosti obilježja za koje se mjeri
koncentracija pomoću ovog pokazatelja nenegativne i poredane po
veličini na način:
i
X
X
X
X
X
i
N
i
∀
≥
≤
≤
≤
≤
≤
,
0
,
...
...
2
1
.
(1.8.41)
Na istu sliku se ucrtava i pravac jednolike distribucije koji
prolazi točkama
)
0
,
0
(
i
)
1
,
1
(
i koji ustvari predstavlja dijagonalu
spomenutog kvadrata. Taj pravac dijeli površinu kvadrata na dva
jednaka dijela, stoga se može reći da je polovina te površine ispod
pravca jednaka 0,5.
Što je koncentracija u promatranom statističkom skupu veća, to
je Lorenzova krivulja udaljenija od pravca. Ako se od 0,5 oduzme
površina ispod Lorenzove krivulje dobiva se temelj ove mjere
koncentracije.
Površina ispod Lorenzove krivulje može se razdijeliti na 1
trokut i
N-1
trapez, pa se ukupna površina ispod krivulje računa kao
zbroj površina trokuta i trapeza.
Površina izmeñu pravca jednolike distribucije i Lorenzove
krivulje varira izmeñu
[
]
5
.
0
,
0
. Ako se dobiveni rezultat pomnoži s 2,
tada on varira u intervalu
[ ]
1
,
0
. Za zadani niz Ginijev koeficijent se
računa:
∑
∑
+
−
∑ ⋅
=
=
=
=
N
i
i
N
i
i
N
i
i
X
N
X
N
X
i
G
1
1
1
)
1
(
2
,
(1.8.42)
a nakon normiranja vrijedi da je:
1
*
0
,
1
*
≤
≤
−
=
G
N
N
G
G
,
(1.8.43)
gdje je:

61
1.8.4.2. Pomoćni momenti numeričkih nizova
Pomoćni momenti numeričkih nizova
su momenti oko nule:
,...
2
,
1
,
0
,
1
=
∑
=
=
r
N
x
m
N
i
r
i
r
- za negrupirani niz.
(1.8.49)
,...
2
,
1
,
0
,
1
1
=
∑
∑
=
=
=
r
f
x
f
m
k
i
i
k
i
r
i
i
r
- za grupirani niz.
(1.8.50)
Pomoćni moment nultog reda:
1
0
=
m
.
Pomoćni moment prvog reda:
X
m
=
1
.
1.8.5. Mjere asimetrije
Asimetrija distribucije podrazumijeva nagnutost distribucije na lijevu ili
desnu stranu.
1.8.5.1. Pearsonov koeficijent asimetrije
Pearsonov koeficijent asimetrije je:
3
3
3
σ
µ
α
=
,
(1.8.51)
gdje je:
3
µ
- centralni moment trećeg reda
3
σ
- standardna devijacija na treću potenciju.
Interval u kojem se kreće vrijednost ovog koeficijenta:
2
2
3
≤
≤
−
α
.
(1.8.52)
62
U slučaju izrazito asimetričnih distribucija ovaj koeficijent može
poprimiti i vrijednosti izvan intervala:
[
]
2
,
2
−
.
Ako je:
0
3
=
α
⇒
simetrična distribucija
2
0
3
≤
<
α
⇒
pozitivna ili desnostrana asimetrija
0
2
3
<
≤
−
α
⇒
negativna ili ljevostrana asimetrija.
1.8.5.2. Pearsonova mjera asimetrije
Pearsonova mjera asimetrije je:
σ
)
(
Mo
X
S
k
−
=
,
(1.8.53)
gdje je:
X
- aritmetička sredina
Mo
- mod
σ
- standardna devijacija.
Za umjereno asimetrične distribucije
vrijedi da je
Pearsonova mjera
asimetrije:
σ
)
(
3
Me
X
S
k
−
⋅
=
,
(1.8.54)
gdje je:
X
- aritmetička sredina
Me
- medijan
σ
- standardna devijacija.
Ako je:
0
=
k
S
⇒
simetrična distribucija
0
>
k
S
⇒
pozitivna ili desnostrana asimetrija
0
<
k
S
⇒
negativna ili ljevostrana asimetrija.

64
1.8.6. Mjera zaobljenosti
Mjera zaobljenosti
predstavlja zaobljenost vrha krivulje distribucije
frekvencija:
4
4
4
σ
µ
α
=
,
(1.8.59)
gdje je:
4
µ
- centralni moment četvrtog reda
4
σ
- standardna devijacija na četvrtu potenciju.
Ako je:
3
4
=
α
⇒
normalno zaobljena distribucija
3
4
>
α
⇒
šiljatiji vrh od normalno zaobljene distribucije
3
8
,
1
4
<
<
α
⇒
tupi oblik distribucije
8
,
1
4
=
α
⇒
pravokutni oblik distribucije
8
,
1
4
<
α
⇒
U - distribucija.
Primjer 1.8.4.
Prodaja kruha u trgovini «Z» tijekom radnih dana jednog tjedna u
srpnju 2008. god. bila je sljedeća:
Tablica 1.13.
Prodaja kruha u trgovini «Z»
Radni dani
Prodano kruha
u kg (
x
i
)
X
x
i
−
(
)
2
X
x
i
−
Ponedjeljak
56
9,9
98,01
Utorak
39
-7,1
50,41
Srijeda
61
14,9
222,01
Četvrtak
44
-2,1
4,41
Petak
52
5,9
34,81
Subota
48
1,9
3,61
Nedjelja
23
-23,1
533,61
Ukupno
323
-
946,87
Izvor: Evidencija trgovine «Z», srpanj 2008.god.
65
Zadatak je izračunati:
a) prosječnu prodaju kruha u tom tjednu i disperziju od prosjeka
b) medijalnu prodaju kruha
c) raspon varijacije, interkvartil i koeficijent kvartilne devijacije.
Rješenja:
a) S obzirom da se radi o negrupiranom nizu računat će se jednostavna
aritmetička sredina:
1
,
46
7
323
1
=
=
=
∑
=
N
X
X
N
i
i
Prosječna
dnevna prodaja kruha u analiziranom tjednu iznosila je 46,1 kg.
Mjere disperzije od aritmetičke sredine su varijanca, standardna devijacija i
koeficijent varijacije.
Varijanca
za negrupirani niz računa se na sljedeći način:
(
)
27
,
135
7
87
,
946
1
2
2
=
=
−
=
∑
=
N
X
x
N
i
i
σ
Standardna devijacija
pokazuje da prosječna odstupanja prodanih količina
kruha od aritmetičke sredine iznose 11,63 kg:
63
,
11
27
,
135
2
=
=
+
=
σ
σ
Koeficijent varijacije
pokazuje da relativna odstupanja prodanih količina
kruha od aritmetičke sredine u prosjeku iznose 25,23%, a to znači da je
disperzija umjerena:
%
23
,
25
100
1
,
46
63
,
11
100
=
⋅
=
⋅
=
X
V
σ
b) Da bi se mogla odrediti vrijednost medijana, niz treba prvo urediti po veličini
vrijednosti obilježja (od
x
min
do
x
max
):
Prodano kruha
u kg (
X
i
)
23
39
44
48
52
56
61

67
Zadatak je izračunati:
a) prosječnu prodaju vozila u tom mjesecu i disperziju od prosjeka
b) medijalnu prodaju vozila
c) raspon varijacije, interkvartil i koeficijent kvartilne devijacije
d) mod
e) Pearsonov koeficijent asimetrije
f) Pearsonovu mjeru asimetrije
g) Bowleyevu mjeru asimetrije
h) mjeru zaobljenosti.
Rješenja:
a) S obzirom da se radi o grupiranom nizu računat će se vagana aritmetička
sredina:
2
88
,
1
26
49
1
1
≈
=
=
=
∑
∑
=
=
k
i
i
k
i
i
i
f
x
f
X
Prosječna
dnevna prodaja vozila u analiziranom mjesecu iznosila je oko 2
automobila.
Mjere disperzije od aritmetičke sredine su varijanca, standardna devijacija i
koeficijent varijacije.
Varijanca
za grupirani niz računa se na sljedeći način:
66
,
1
88
,
1
26
135
2
2
1
1
2
2
=
−
=
−
=
∑
∑
=
=
X
f
x
f
k
i
i
k
i
i
i
σ
Standardna devijacija
pokazuje da prosječna odstupanja prodanih vozila od
aritmetičke sredine iznose 1,29.
29
,
1
77
,
1
2
=
=
+
=
σ
σ
Koeficijent varijacije
pokazuje da relativna odstupanja statističkih obilježja od
aritmetičke sredine u prosjeku iznose 68,62%, znači da je stupanj disperzije
prodaje vozila velik:
%
62
,
68
100
88
,
1
29
,
1
100
=
⋅
=
⋅
=
X
V
σ
b) Da bi se mogla odrediti vrijednost medijana potrebno je prvo izračunati
frekvencije kumultivnog niza:
68
Broj prodanih
vozila (
x
i
)
Broj radnih
dana (
f
i
)
Kumulativni niz
«manje od»
0
4
4
1
6
10
2
9
19
3
4
23
4
2
25
5
1
26
Ukupno
26
-
Medijan
je vrijednost obilježja koja pripada jedinici koja se nalazi u sredini
niza, stoga se traži središnji član:
N/2 = 26/2 = 13
Prva frekvencija kumulativnog niza «manje od» koja sadrži
N/2
odreñuje
položaj medijana, u ovom primjeru to je 19, pa je medijalna vrijednost
numeričkog obilježja uz tu frekvenciju:
Me = 2 vozila
c)
Raspon varijacije
je:
R = x
max
– x
min
= 5 – 0 = 5 vozila.
Interkvartil
predstavlja razliku gornjeg i donjeg kvartila:
I
q
= Q
3
– Q
1
= 56 – 39 = 17
Vrijednosti kvartila:
Prva frekvencija kumulativnog niza «manje od» koja sadrži
N/4
odreñuje
položaj donjeg kvartila (
N/4=26/4=6,5
), stoga je donji kvartil vrijednost
numeričkog obilježja uz tu frekvenciju:
Q
1
= 1
Prva frekvencija kumulativnog niza «manje od» koja sadrži
3N/4
odreñuje
položaj gornjeg kvartila (
3N/4=3·26/4=19,5
), stoga je gornji kvartil vrijednost
numeričkog obilježja uz tu frekvenciju:
Q
3
=3
Koeficijent kvartilne devijacije
relativna je mjera disperzije srednjih 50%
elemenata u nizu i iznosi:
5
,
0
1
3
1
3
1
3
1
3
=
+
−
=
+
−
=
Q
Q
Q
Q
V
q
d)
Mod
je vrijednost statističkog obilježja kojem pripada najveća frekvencija,
stoga mod iznosi 2 prodana vozila dnevno:

70
e)
Pearsonova mjera asimetrije
pomoću moda je:
(
)
(
)
0
29
,
1
2
2
=
−
=
−
=
σ
o
k
M
X
S
Pearsonova mjera asimetrije
pomoću medijana iznosi:
(
)
(
)
0
29
,
1
2
2
3
3
=
−
=
−
=
σ
e
k
M
X
S
f)
Bowleyeva mjera asimetrije
iznosi:
0
1
3
1
2
2
3
2
1
3
1
3
=
−
+
⋅
−
=
−
+
−
=
Q
Q
Q
M
Q
S
e
kq
g)
Mjera zaobljenosti
je:
75
,
2
29
,
1
6
,
7
4
4
4
4
=
=
=
σ
µ
α
6
,
7
88
,
1
3
88
,
1
19
,
5
6
88
,
16
88
,
1
4
96
,
61
3
6
4
4
2
4
1
2
1
2
1
3
4
4
=
⋅
−
⋅
⋅
+
⋅
⋅
−
=
−
+
−
=
m
m
m
m
m
m
µ
Distribucija je zaobljenija od normalne.
Primjer 1.8.6.
Broj zaposlenih prema godinama starosti u trgovačkom društvu «Z»
prikazan je u tablici 1.15.:
Tablica 1.15.
Zaposleni prema godinama starosti u trgovačkom društvu «Z»,
stanje 31.03.2009. god.
Godine starosti
(
x
i
)
Broj zaposlenih
(
f
i
)
Raz. sred.
x
i
i
i
x
f
⋅
2
i
i
x
f
⋅
18-25
8
21,5
172,0
3698,0
25-30
12
27,5
330,0
9075,0
30-35
19
32,5
617,5
20068,7
35-40
30
37,5
1125,0
42187,5
40-50
18
45,0
810,0
36450,0
50-60
10
55,0
550,0
30250,0
60-65
3
62,5
187,5
11718,8
Ukupno
100
-
3792,0
153448,0
Izvor: Evidencija trgovačkog društva «Z», travanj 2009.god.
Zadatak je izračunati:
71
a) prosječnu starost zaposlenih i disperziju od prosjeka
b) medijalnu starost zaposlenih
c) raspon varijacije, interkvartil i koeficijent kvartilne devijacije
d) mod
e) Pearsonov koeficijent asimetrije
f) Pearsonovu mjeru asimetrije
g) Bowleyevu mjeru asimetrije
h) mjeru zaobljenosti.
Rješenja:
a) Veličine razreda grupiranog numeričkog niza različite su od 1 pa je za
izračunavanje prosjeka potrebno izvršiti aproksimaciju pomoću sredina razreda.
Razredna sredina jednostavan je prosjek donje i gornje granice razreda (vidi
treći stupac gornje tablice). S obzirom da se radi o grupiranom statističkom nizu
računat će se vagana aritmetička sredina:
92
,
37
100
3792
1
1
=
=
=
∑
∑
=
=
k
i
i
k
i
i
i
f
x
f
X
Prosječna
starost zaposlenih u trgovačkom društvu «Z» bila je oko 38 godina.
Mjere disperzije od aritmetičke sredine su varijanca, standardna devijacija i
koeficijent varijacije.
Varijanca
za grupirani niz računa se na sljedeći način:
55
,
96
92
,
37
100
153448
2
2
1
1
2
2
=
−
=
−
=
∑
∑
=
=
X
f
x
f
k
i
i
k
i
i
i
σ
Standardna devijacija
pokazuje da prosječna odstupanja starosti zaposlenih od
aritmetičke sredine iznose 9,83 godina:
83
,
9
55
,
96
2
=
=
+
=
σ
σ
Koeficijent varijacije
pokazuje da relativna odstupanja statističkih obilježja od
aritmetičke sredine u prosjeku iznose 25,9%, a to nisu značajna odstupanja:
%
9
,
25
100
92
,
37
83
,
9
100
=
⋅
=
⋅
=
X
V
σ
b) Da bi se mogla odrediti vrijednost medijana potrebno je prvo izračunati
frekvencije kumulativnog niza:

73
33
,
43
10
18
69
75
40
4
3
var
1
1
3
=
⋅
−
+
=
⋅
−
+
=
∑
=
i
f
f
N
L
Q
t
k
q
i
i
Koeficijent kvartilne devijacije
relativna je mjera disperzije srednjih 50%
elemenata u nizu i pokazuje da disperzija nije velika:
16
,
0
32
,
31
33
,
43
32
,
31
33
,
43
1
3
1
3
=
+
−
=
+
−
=
Q
Q
Q
Q
V
q
d)
Mod
je vrijednost statističkog obilježja kojem pripada najveća frekvencija.
Ako veličine razreda nisu jednake uzima se najveća korigirana frekvencija (
fc
i
),
stoga je potrebno frekvencije korigirati:
Godine starosti
(
x
i
)
Broj zaposlenih
(
f
i
)
Veličine
razreda (
i
)
Korigirane
frekvencije (
fc
i
)
18-25
8
7
1,1
25-30
12
5
2,4
30-35
19
5
3,8
35-40
30
5
6,0
40-50
18
10
1,8
50-60
10
10
1,0
60-65
3
5
0,6
Ukupno
100
-
-
Najviša korigirana frekvencija iznosi 6 i odreñuje modalni razred, a vrijednost
moda iznosi:
(
)
(
) (
)
(
)
(
) (
)
72
,
36
5
8
,
1
6
8
,
3
6
8
,
3
6
35
1
=
⋅
−
+
−
−
+
=
⋅
−
+
−
−
+
=
i
c
b
a
b
a
b
L
M
o
M
o
= 36,72 godine.
Modalna, najčešća starost iznosila je oko 37 godina.
e)
Pearsonov koeficijent asimetrije
je:
51
,
0
83
,
9
46
,
478
3
3
3
3
=
=
=
σ
µ
α
i pokazuje da je distribucija pozitivno asimetrična.
Centralni moment trećeg reda izračunan preko pomoćnih momenata iznosi:
46
,
487
92
,
37
2
48
,
1534
92
,
37
3
6
,
65997
2
3
3
3
1
2
1
3
3
=
⋅
+
⋅
⋅
−
=
+
−
=
m
m
m
m
µ
74
Za grupirani niz izraz za pomoćne momente oko nule je:
∑
∑
=
=
=
k
i
i
k
i
r
i
i
r
f
x
f
m
1
1
Za pomoćne momente potrebno je numerička obilježja potencirati i pomnožiti s
frekvencijama:
Raz. sred.
x
i
Broj zaposlenih
(
f
i
)
i
i
x
f
⋅
2
i
i
x
f
3
i
i
x
f
4
i
i
x
f
21,5
8
172,0
3698,0
79507,0
1709400,5
27,5
12
330,0
9075,0
249562,5
6862968,8
32,5
19
617,5
20068,7
652234,4
21197617,2
37,5
30
1125,0
42187,5
1582031,3
59326171,9
45,0
18
810,0
36450,0
1640250,0
73811250,0
55,0
10
550,0
30250,0
1663750,0
91506250,0
62,5
3
187,5
11718,8
732421,8
45776367,2
Ukupno
100
3792,0
153448,0
6599757,0
300190026,6
92
,
37
100
3792
1
1
1
=
=
=
∑
∑
=
=
k
i
i
k
i
i
i
f
x
f
m
48
,
1534
100
153448
1
1
2
2
=
=
=
∑
∑
=
=
k
i
i
k
i
i
i
f
x
f
m
6
,
65997
100
6599757
1
1
3
3
=
=
=
∑
∑
=
=
k
i
i
k
i
i
i
f
x
f
m
3001900
100
300190026
1
1
4
4
=
=
=
∑
∑
=
=
k
i
i
k
i
i
i
f
x
f
m

77
2. REGRESIJSKA I KORELACIJSKA ANALIZA
2.1. Pojam regresijske i korelacijske analize
Poslovna i makroekonomska statistika često, uz analizu kretanja jedne
ekonomske pojave, imaju potrebu istražiti ovisnosti dviju ili više pojava,
odnosno numeričkih nizova, zajedno.
Prvi korak u istraživanju ovisnosti varijabli jeste crtanje grafičkog
prikaza koji se naziva dijagram rasipanja.
Dijagram rasipanja u pravokutnom koordinatnom sustavu
točkama
)
,
(
i
i
y
x
prikazuje parove vrijednosti dviju promatranih
numeričkih varijabli.
Na osnovi takve slike mogu se odmah uočiti osnovne veze meñu
promatranim varijablama.
Slika 2.1.
Na slici 2.1. prikazana su 2 dijagrama rasipanja. Slika (a) prikazuje
funkcionalnu vezu izmeñu 2 varijable X i Y. Zamišljena linija koja povezuje
sve točke na slici je pravac. Matematički oblik veze, ovih dviju promatranih
varijabli, je jednadžba pravca. Od te linije nema nikakvog odstupanja, stoga se
kaže da je ova veza strogo funkcionalna. Zamišljeni pravac je rastući, odnosno
porast vrijednosti jedne varijable prati porast vrijednosti druge promatrane
varijable zato je ova veza pozitivna.
Čest slučaj u praksi prikazan je na slici (b). Ako se izmeñu točaka ovog
dijagrama zamisli krivulja, to bi opet bio pravac. Meñutim ovdje su prisutna
pozitivna i negativna odstupanja od linije pravca, a to se tumači raznim
utjecajima drugih varijabli iz prakse. Stoga ova veza više nije strogo
funkcionalna, već se za nju kaže da je statistička (stohastička ili slučajna) veza.
y
i
x
i
(a) pozitivna funkcionalna
veza
y
i
x
i
(
b) pozitivna statistička
veza

79
Slika 2.3.
Na slici 2.3. su 2 dijagrama rasipanja. Slika (a) prikazuje funkcionalnu
krivolinijsku pozitivnu vezu izmeñu 2 varijable X i Y. Zamišljena linija koja
povezuje sve točke na slici je krivulja. Matematički oblik veze ovih dviju
promatranih varijabli je neka eksponencijalna jednadžba od čije linije nema
nikakvog odstupanja, pa je ova veza strogo funkcionalna. I ovdje vrijedi da
porast vrijednosti jedne varijable prati porast vrijednosti druge promatrane
varijable zato je ova veza pozitivna.
5
U praksi se češće dogaña slučaj prikazan na slici (b). Ako se izmeñu
točaka ovog dijagrama zamisli linija to bi opet bila krivulja. Meñutim ovdje su
prisutna pozitivna i negativna odstupanja zbog utjecaja drugih varijabli iz
prakse. Ova veza je statistička (stohastička ili slučajna). I ovdje porast
vrijednosti jedne varijable u prosjeku prati porast druge varijable, stoga je i ova
veza pozitivna.
5
U poslovnoj i makroekonomskoj statistici promatra se samo prvi kvadrant
koordinatnog sustava jer su u ekonomiji varijable uglavnom pozitivne.
(a) pozitivna funkcionalna
krivolinijska veza
y
i
x
i
y
i
x
i
(b) pozitivna statistička
krivolinijska veza
80
Slika 2.4.
Na slici 2.4. prikazan je dijagram rasipanja koji upućuje na zaključak da
nema povezanosti meñu promatranim pojavama. Naime zamišljena krivulja
koja prolazi izmeñu točaka na ovom grafikonu ne postoji i ne može se definirati
prati li porast jedne pojave rast ili pad druge promatrane pojave, jer se pri jednoj
vrijednosti varijable x
i
može dogoditi više različitih vrijednosti druge varijable
y
i
.
Pod pojmom
korelacija podrazumijeva se meñuzavisnost ili
povezanost slučajnih varijabli.
Po smjeru korelacija može biti pozitivna i
negativna.
Pozitivna korelacija je prisutna kada rast jedne varijable prati
rast druge promatrane varijable, odnosno kada pad jedne prati pad druge
varijable. Negativna korelacija prisutna je kada rast jedne varijable prati
pad druge varijable i obratno.
Za razliku od korelacijske analize
zadaća regresijske analize je da
pronañe analitičko-matematički oblik veze izmeñu jedne ovisne ili
regresand varijable i jedne ili više neovisnih ili regresorskih varijabli.
Osim objašnjavanja prirode ovisnosti promatranih pojava na temelju tog
analitičkog oblika može se vršiti predviñanje vrijednosti ovisne varijable pri
odreñenim vrijednostima neovisne-ih varijabli.
2.2. Regresijski model
U slučaju postojanja samo
jedne ovisne ili regresand, i samo jedne
neovisne ili regresorske varijable
kaže se da je to
jednostavni, jednostruki ili
jednodimenzionalni regresijski model.
Ako se uz
jednu ovisnu ili regresand
(a) nema veze meñu
pojavama
y
i
x
i

82
Na slici 2.5. prikazan je dijagram rasipanja koji upućuje na postojanje
pozitivne statističke veze izmeñu dviju varijabli X i Y. Povlačenjem linije
pravca izmeñu točaka dijagrama rasipanja pretpostavlja se aditivna linearna
veza meñu varijablama.
4.
Statistička analiza modela: ocjena parametara i pokazatelja
reprezentativnosti modela
U ovoj fazi regresijske analize ocjenjuju se parametri konkretnog
izabranog regresijskog modela, te se računaju odgovarajući pokazatelji
reprezentativnosti modela, koji ukazuju na to zadovoljava li model statističke
kriterije.
5.
Testiranje hipoteza o modelu
i statističko teorijskih pretpostavki
a) DA
- ako su ispunjene pretpostavke, vrši se sinteza rezultata i donose
se sudovi o predmetu istraživanja
b) NE -ako nisu ispunjene pretpostavke: vrši se modifikacija modela i
vraća se na korak 2., tj. na izbor novog modela i definiranje varijabli.
Regresijskom analizom traže se i ocjenjuju parametri funkcije koja na
najbolji mogući način opisuje vezu izmeñu varijabli X i Y.
2.3. Model jednostavne linearne regresije
Ako su u analizi prisutne samo dvije varijable tada se radi o
jednostavnoj regresiji. Na temelju uzorka parova vrijednosti varijabli X i Y:
(
) (
) (
)
n
n
y
x
y
x
y
x
,
,
.
.
.
,
,
,
,
2
2
1
1
crta se dijagram rasipanja koji je prikazan na slici 2.6..
Slika 2.6.
y
x
x
i
y
i
83
Dijagram rasipanja pokazuje pozitivnu statističku vezu izmeñu pojava
X i Y.
Slika 2.7.
Ako se na dijagramu rasipanja povuče
pravac
on
je općenito oblika:
X
Y
1
0
ˆ
ˆ
ˆ
β
β
+
=
(2.3.1)
Svaka točka dijagrama rasipanja zadovoljava jednadžbu:
i
i
i
e
X
Y
+
+
=
1
0
ˆ
ˆ
β
β
,
(2.3.2)
odnosno
svaka točka Y
i
odstupa od linije pravca za pozitivnu ili negativnu
razliku
i
e
.
Regresijska analiza traži parametre
1
0
ˆ
ˆ
β
β
i
, tako da pravac
Y
ˆ
prolazi
izmeñu stvarnih točaka promatranih varijabli i da najbolje tumači vezu izmeñu
njih, odnosno pravac mora biti takav da odstupanja
i
e
budu najmanja.
Postoji više različitih metoda za ocjenu ovih parametara, a najčešće
rabljena metoda je
metoda najmanjih kvadrata
koja
upravo procjenjuje
parametre
1
0
ˆ
ˆ
β
β
i
tako da odstupanja e
i
budu najmanja.
7
Ona daje najbolje
7
Pri formiranju modela postavljaju se i pretpostavke slučajne greške
i
e
(tzv. Gauss-
Markovljevi uvjeti):
I.
i
e
E
i
∀
=
,
0
)
(
(očekivanje slučajne pogrješke je nula za svaku opservaciju)
II.
.
)
,
(
2
const
j
i
za
e
e
E
e
j
i
=
=
+∞
<
=
σ
(homoskedastičnost
varijance
reziduala,
tj.
pretpostavlja se da je varijanca reziduala konačna i čvrsta)
III.
j
i
e
e
Cov
tj
j
i
e
e
E
j
i
j
i
≠
∀
=
≠
∀
=
,
0
)
,
(
.
,
,
0
)
,
(
(pogrješka je slučajna i nema korelacije izmeñu varijabli
s pomakom od e
i
)
y
x
x
i
y
i
e
i
X
Y
1
0
ˆ
ˆ
ˆ
β
β
+
=

85
gdje je
0
ˆ
β
konstantni član, tj. očekivana vrijednost zavisne varijable kada
je nezavisna varijabla jednaka nuli
: (
Y
=
0
ˆ
β
kada je X=0). Ovaj parametar
interpretira se i kao odsječak na osi koordinata u kojoj regresijski pravac siječe
os, uz pretpostavku da je apscisa te točke X=0.
Regresijski koeficijent
1
ˆ
β
pokazuje
prosječnu promjenu zavisne
varijable kada nezavisna varijabla poraste za jedinicu.
Ovaj parametar
interpretira se i kao koeficijent smjera, odnosno nagiba regresijskog pravca koji
može imati pozitivni i negativni predznak, ovisno o smjeru veze izmeñu
promatranih varijabli.
Može se postaviti i
suprotna ovisnost u modelu
, na način da je
varijabla X sada ovisna ili regresorska varijabla
:
i
i
i
e
Y
X
+
+
=
1
0
ˆ
ˆ
α
α
(2.3.11)
Ocjena parametara u ovom slučaju vrši se na jednak način kao kod
početnog modela
Y
ˆ
, samo što je sada X ovisna varijabla, pa
u izrazima za
izračunavanje parametara, X i Y mijenjaju mjesta
.
Y
a
X
i
Y
n
Y
Y
X
n
Y
X
n
i
i
n
i
i
i
1
0
2
1
2
1
1
ˆ
ˆ
ˆ
−
=
−
−
=
∑
∑
=
=
α
α
(2.3.12)
Matričnim putem regresijska jednadžba može se napisati:
β
ˆ
X
Y
=
;
(2.3.13)
gdje su matrice:
=
=
=
1
0
2
1
2
1
ˆ
ˆ
ˆ
;
1
..
..
1
1
;
..
β
β
β
n
n
X
X
X
X
Y
Y
Y
Y
(2.3.14)
)
(
)
(
ˆ
1
Y
X
X
X
T
T
⋅
=
−
β
(2.3.15)
gdje su:
∑
∑
=
∑
∑
∑
=
=
=
=
=
=
n
i
i
i
n
i
i
T
n
i
i
n
i
i
n
i
i
T
Y
X
Y
Y
X
i
X
X
X
n
X
X
1
1
1
2
1
1
)
(
)
(
.
(2.3.16)
86
2.4. Linearna korelacija i procjena koeficijenta korelacije
2.4.1 Linearna korelacija
Najpoznatija mjera linearne korelacije izmeñu slučajnih varijabli je
Pearsonov koeficijent linearne korelacije (r):
,
)
(
)
(
)
(
)
(
1
1
2
2
1
∑
∑
−
⋅
−
∑
−
⋅
−
=
=
=
=
n
i
n
i
i
i
n
i
i
i
Y
Y
X
X
Y
Y
X
X
r
ili
y
x
n
i
i
i
n
Y
X
n
Y
X
r
σ
σ ⋅
⋅
⋅
⋅
−
∑
=
=
1
(2.4.1)
gdje su
x
σ
i
y
σ
jednostavne standardne devijacije promatranih varijabli:
2
1
2
X
n
x
n
i
i
x
−
∑
=
=
σ
i
2
1
2
Y
n
y
n
i
i
y
−
∑
=
=
σ
(2.4.2)
Vrijednost koeficijenta linearne korelacije kreće se u intervalu:
1
1
≤
≤
−
r
(2.4.3)
U skladu s veličinom ovog koeficijenta može se zaključiti smjer i
intenzitet linearne korelacije meñu promatranim varijablama:
1
−
=
r
;
1
=
r
⇒
funkcionalna negativna/pozitivna korelacija
8
,
0
1
−
≤
<
−
r
;
1
8
,
0
<
≤
r
⇒
jaka negativna/pozitivna korelacija
5
,
0
8
,
0
−
≤
<
−
r
;
8
,
0
5
,
0
<
≤
r
⇒
srednje jaka negativna/pozitivna korelacija
0
5
,
0
<
<
−
r
;
5
,
0
0
<
<
r
⇒
slaba negativna/pozitivna korelacija
0
=
r
⇒
nema korelacije.
Koeficijent parcijalne korelacije
je pokazatelj korelacije izmeñu dvije
varijable uz istodobno isključenje utjecaja drugih varijabli.
Ako se računa
parcijalna korelacija izmeñu triju varijabli
u
kombinaciji vrijedi da je:
•
korelacija izmeñu 1. i 2. varijable uz isključenje utjecaja 3.
varijable:
)
1
(
)
1
(
)
(
2
23
2
13
23
13
12
3
.
12
r
r
r
r
r
−
⋅
−
⋅
−
=
ρ
(2.4.4)
•
korelacija izmeñu 1. i 3. varijable uz isključenje utjecaja 2.
varijable:

88
se procjena vrši
Fisherovom transformacijom
(
r
u
Z
) - pomoću odgovarajućih
tablica ili računom:
r
tgh
ar
Z
ˆ
ˆ
=
(2.4.9)
Interval povjerenja procjene za
Z
je:
{
}
α
−
=
⋅
+
<
<
⋅
−
1
)
(
ˆ
)
(
ˆ
Pr
Z
Se
Z
Z
Z
Z
Se
Z
Z
(2.4.10)
gdje je:
Z
- odgovarajuća vrijednost iz tablica normalne distribucije
α
−
1
- odgovarajući nivo pouzdanosti procjene (najčešće 95%)
3
1
)
(
−
=
n
Z
Se
.
(2.4.11)
Nakon izračunavanja intervala pouzdanosti za
Z
potrebno je donju i
gornju granicu za
Z
transformirati natrag u
r
(
Z
u
r
) - pomoću odgovarajućih
tablica ili računom:
Z
tgh
r
=
(2.4.12)
Kod negativne korelacije prilikom transformiranja treba voditi računa o
negativnom predznaku koeficijenta korelacije
r.
Napomena: Fisherova transformacija se ne koristi za male uzorke.
2.5. Spearmanov koeficijent korelacije
Ako se želi istražiti meñuovisnost pojava koje su izražene modalitetima
redoslijednog obilježja, odnosno ako su im modaliteti pridruženi na temelju
ordinalne skale računa se korelacija ranga.
Najpoznatija
mjera korelacije ranga izmeñu dviju varijabli je
Spearmanov koeficijent korelacije ranga (r
S
):
N
N
d
r
N
i
i
S
−
∑
⋅
−
=
=
3
1
2
6
1
,
(2.5.1)
gdje je:
N
- broj parova vrijednosti varijabli X i Y,
)
(
)
(
i
i
i
y
r
x
r
d
−
=
- razlika rangova vrijednosti varijabli X i Y.
89
Svakoj vrijednosti varijabli X i Y dodjeljuje se rang iskazan prvim N
prirodnim brojevima. Pri tome se rangiranje može započeti rangom 1, počevši
od najmanje vrijednosti obilježja ili počevši od najveće vrijednosti obilježja. Pri
tom se rangiranje mora provesti na jednak način za obje promatrane varijable.
Ako se javi
više jednakih vrijednosti jedne varijable
mora im se dodijeliti
jednak rang na način da
se izračuna aritmetička sredina njihovih rangova
.
Spearmanov koeficijent korelacije ranga može poprimiti vrijednosti u
intervalu:
1
1
≤
≤
−
S
r
(2.5.2)
Kada ovaj koeficijent poprimi vrijednosti -1 i 1, riječ je o potpunoj
korelaciji ranga meñu varijablama. Vrijednost ovog koeficijenta 0 znači da
nema nikakve korelacije ranga meñu pojavama. Najčešće se vrijednost
Spearmanovog koeficijenta kreće u rasponu
1
1
<
<
−
s
r
. Koeficijent bliži
rubovima ovog intervala, tj. -1 i 1 upućuje na veću korelaciju ranga promatranih
dviju varijabli.
Primjer 2.5.1.
Vlasnik velikog salona automobila «Z» želi utvrditi odnos izmeñu postignutih
bodova na testu koji su prodavači ispunjavali prilikom prijema na posao i
prodanih automobila, koje su ti prodavači uspjeli prodati tijekom svoje prve
godine rada u tom salonu. Slučajni uzorak od 10 prodavača dao je sljedeće
rezultate:
Tablica 2.1.
Bodovi postignuti na testu i broj prodanih automobila 10 prodavača
autosalona «Z», 2008. god.
Rangirane
varijable
Prodavač
Bodovi na
testu
(
x
i
)
Broj prodanih
automobila
(
y
i
)
r(x
i
)
r(y
i
)
d
i
=r(x
i
)-r(y
i
)
2
i
d
A
51
35
8
8
0
0
B
65
46
6
5
1
1
C
49
33
10
9
1
1
D
66
45
5
6
-1
1
E
50
29
9
10
-1
1
F
64
42
7
7
0
0
G
68
47
4
4
0
0
H
72
50
3
3
0
0
I
77
52
1
2
-1
1
J
75
53
2
1
1
1
Izvor: Podaci autosalona «Z», 2009.god.
Zadatak je izračunati Spearmanov koeficijent korelacije ranga.

91
(
)
∑
−
∑
⋅
∑
−
=
∑
−
=
=
=
=
=
n
i
i
i
n
i
i
n
i
i
n
i
i
i
Y
X
Y
Y
Y
Y
SR
1
1
1
0
1
2
2
1
ˆ
ˆ
ˆ
β
β
(2.6.2)
Dakle,
SR je suma kvadrata neprotumačenog dijela
odstupanja
vrijednosti varijable Y od aritmetičke sredine,
odnosno suma kvadrata
odstupanja originalnih ili empirijskih vrijednosti varijable Y od
ocijenjenih vrijednosti
. Ova odstupanja su u stvari slučajne pogrješke
i
e
.
(
)
2
1
2
2
1
Y
n
Y
Y
Y
ST
n
i
i
n
i
i
⋅
−
∑
=
∑
−
=
=
=
(2.6.3)
ST je suma kvadrata ukupnih
odstupanja vrijednosti varijable Y od
aritmetičke sredine.
Vrijedi da je:
ST
SR
SP
=
+
,
(2.6.4)
što se vidi i na slici 2.8. Ovaj izraz koji je u skraćenom obliku dan pomoću
(2.6.4) zove se jednadžba analize varijance i predstavlja temelj analize
reprezentativnosti regresijskog modela.
Standardna
pogrješka
regresije
je
apsolutni
pokazatelj
reprezentativnosti regresijskog modela, a pokazuje prosječni stupanj
varijacije stvarnih vrijednosti ovisne varijable u odnosu na očekivane
regresijske vrijednosti.
2
ˆ
ˆ
−
=
n
SR
Y
σ
(2.6.5)
Izraz (2.6.5) je standardna pogrješka regresije jednostrukog modela.
Ovaj pokazatelj izražen je u originalnim jedinicama mjere ovisne varijable Y.
Stoga je na temelju standardne pogrješke regresije teško usporeñivati
reprezentativnost modela s različitim mjernim jedinicama.
Taj problem eliminira
relativni pokazatelj koeficijent varijacije
regresije, koji predstavlja postotak standardne pogrješke regresije od
aritmetičke sredine varijable Y.
100
ˆ
ˆ
ˆ
ˆ
⋅
=
Y
V
Y
Y
σ
(2.6.6)
Najmanja vrijednost koeficijenta varijacije je 0%, a najveća nije
definirana.
Što je koeficijent varijacije regresijskog modela bliži nuli, to je
model reprezentativniji.
Često se uzima dogovorena granica reprezentativnosti
od 10%. Dakle ako je koeficijent varijacije manji od 10% kaže se da je model
dobar.
Koeficijent determinacije je
pokazatelj reprezentativnosti regresijskog
modela koji se temelji na analizi varijance. On se definira kao
omjer sume
92
kvadrata odstupanja protumačenih regresijom i sume kvadrata ukupnih
odstupanja.
ST
SP
r
=
2
(2.6.7)
Koeficijent determinacije kaže koliko % je sume kvadrata
odstupanja vrijednosti varijable Y od aritmetičke sredine protumačeno
regresijskim modelom.
Prema (2.6.4), vrijedi da je:
ST
SR
r
−
=
1
2
(2.6.8)
Vrijednost koeficijenta determinacije kreće se u intervalu
1
0
2
≤
≤
r
.
Regresijski model je reprezentativniji ako je ovaj pokazatelj bliži 1.
Teorijska granica reprezentativnosti modela je 0,9. U praksi je ponekad vrlo
teško pronaći varijablu koja dobro objašnjava ovisnu pojavu, pa se ta granica
reprezentativnosti spušta i do 0,6.
Korigirani koeficijent determinacije
:
)
1
(
)
1
(
1
1
2
2
r
k
n
n
r
−
⋅
+
−
−
−
=
(2.6.9)
je asimptotski nepristrana ocjena koeficijenta determinacije.
Za jednostruku linearnu regresiju vrijedi da je koeficijent linearne
korelacije:
2
r
r
±
=
,
gdje predznak koeficijenta linearne korelacije odgovara predznaku parametara
ocijenjenog jednostrukog linearnog modela:
1
ˆ
α
i
1
ˆ
β
.
Još vrijedi da je:
Y
X
X
Y
r
i
r
σ
σ
β
σ
σ
α
⋅
=
⋅
=
1
1
ˆ
ˆ
,
gdje su
Y
X
i
σ
σ
standardne devijacije varijabli X i Y.
Primjer 2.6.1.
Ispituje se veza izmeñu obrazovanja i visina plaća u trgovini «Z» u kojoj je
zaposleno 10 djelatnika:

94
b) Jednadžba prvog pravca regresije glasi:
X
X
Y
8
,
249
5
,
1457
1
0
+
=
+
=
β
β
)
)
)
8
,
249
5
,
12
10
1685
4580
5
,
12
10
603100
2
1
2
2
1
1
=
⋅
−
⋅
⋅
−
=
−
−
=
∑
∑
=
=
n
i
i
n
i
i
i
X
n
X
Y
X
n
Y
X
β
)
6
,
1457
5
,
12
8
,
249
4580
1
0
=
⋅
−
=
−
=
X
Y
β
β
)
)
Regresijski koeficijent (
1
β
)
) pokazuje da se mjesečna neto plaća povećava u
prosjeku za 249,8 kn kada se dužina obrazovanje produži za 1 godinu.
Jednadžba drugog pravca regresije glasi:
Y
Y
X
0035
,
0
53
,
3
1
0
+
−
=
+
=
α
α
)
)
)
0035
,
0
4580
10
218620000
4580
5
,
12
10
603100
2
1
2
2
1
1
=
⋅
−
⋅
⋅
−
=
−
−
=
∑
∑
=
=
n
i
i
n
i
i
i
Y
n
Y
Y
X
n
Y
X
α
)
53
,
3
4580
0035
,
0
5
,
12
1
0
−
=
⋅
−
=
−
=
Y
X
α
α
)
)
Regresijski koeficijent (
1
α
)
) pokazuje da se obrazovanje produžilo u prosjeku za
0,0035 godine ukoliko se mjesečna neto plaća povećala za 1 kn.
c)
Pearsonov koeficijent korelacije
(
r
) iznosi:
93
,
0
941
5
,
3
10
4580
5
,
12
10
603100
1
=
⋅
⋅
⋅
⋅
−
=
⋅
⋅
⋅
⋅
−
=
∑
=
y
x
n
i
i
i
n
Y
X
n
Y
X
r
σ
σ
5
,
3
5
,
12
10
1685
2
2
1
2
=
−
=
−
=
∑
=
X
n
x
n
i
i
x
σ
941
4580
10
218620000
2
2
1
2
=
−
=
−
=
∑
=
Y
n
y
n
i
i
y
σ
Izmeñu obrazovanja i plaća postoji jaka i pozitivna korelacija.
95
Koeficijent determinacije
glasi:
86
,
0
8856000
7648460
2
=
=
=
ST
SP
r
7648460
4580
10
603100
8
,
249
45800
6
,
1457
2
1
1
2
1
0
=
⋅
−
⋅
+
⋅
=
⋅
−
+
⋅
=
∑
∑
=
=
n
i
n
i
i
i
i
Y
n
Y
X
Y
SP
β
β
)
)
∑
=
=
⋅
−
=
⋅
−
=
n
i
i
Y
n
Y
ST
1
2
2
2
8856000
4580
10
218620000
Koeficijent determinacije pokazuje da je 86% sume kvadrata odstupanja
vrijednosti varijable
Y
od aritmetičke sredine protumačeno regresijskim
modelom.
Koeficijent linearne korelacije pomoću koeficijenta determinacije iznosi:
93
,
0
86
,
0
2
=
=
=
r
r
d) Koeficijent varijacije regresije glasi:
48
,
8
100
4580
5
,
388
100
=
⋅
=
⋅
=
Y
V
Y
Y
)
)
)
)
σ
Koeficijent varijacije regresije manji je od 10% pa je ocijenjeni model regresije
reprezentativan.
Standardna pogrješka regresije je:
5
,
388
2
10
1207540
2
=
−
=
−
=
n
SR
Y
)
)
σ
∑
∑
∑
=
=
=
=
⋅
−
⋅
−
=
−
−
=
n
i
i
i
n
i
n
i
i
i
Y
X
Y
Y
SR
1
1
1
1
0
2
1207540
603100
8
,
249
45800
6
,
1457
218620000
β
β
)
)

97
3. ANALIZA VREMENSKIH SERIJA
3.1. Definicija vremenskog niza
Praćenje različitih ekonomskih pojava u vremenu veoma je važno za
poslovnu i gospodarsku politiku, stoga u poslovnoj i makroekonomskoj
statistici obrada vremenskih nizova zauzima važno mjesto.
Vremenski niz je skup kronološki ureñenih vrijednosti pojave.
Vrijednosti promatrane varijable vremenskog niza označavaju se:
{ }
N
t
Y
t
...,
,
2
,
1
,
=
,
8
(3.1.1)
i zovu se frekvencije.
3.2. Vrste nizova
S obzirom na vrijeme opažanja vrijednosti pojave postoje dvije
vrste vremenskog niza:
1.
intervalni vremenski niz
2.
trenutačni vremenski niz.
Kod
intervalnog vremenskog niza
vrijednost pojave mjeri se u
vremenskom intervalu.
Kod
trenutačnog vremenskog niza
vrijednost pojave mjeri se u
trenutku vremena.
3.3. Grafičko prikazivanje i usporeñivanje vremenskih
nizova
Grafičkim prikazom vremenskih nizova postiže se jasnija i
preglednija slika kretanja vrijednosti promatrane pojave kroz vrijeme.
Slika grafikona, kao i svi prikazi u statistici, mora biti jasna i potpuna.
Kod vremenskih nizova vrijeme se uvijek nanosi na apscisu dok se na ordinatu
nanose vrijednosti pojave Y
t
. Grafički prikaz treba imati sve potrebne oznake:
8
Indeks "t" ovdje znači:
time
(eng.) - vrijeme.
98
naslov grafikona, izvor grafikona, oznake na ordinati, oznake na apscisi i kazalo
ako se na istom grafikonu prikazuje više različitih vremenskih nizova.
Na jednom grafičkom prikazu može se usporeñivati više vremenskih
nizova s istom jedinicom mjere. Broj vremenskih nizova na jednom grafikonu
ograničen je samo zbog tehničkih mogućnosti jer kod velikog broja nizova
usporeñivanje postaje nepregledno. To su
grafikoni s aritmetičkim mjerilom
na osi ordinata.
Postoje
grafikoni s logaritamskim mjerilom na osi ordinata
. Oni
omogućuju prikazivanje i usporeñivanje vremenskih nizova s različitom
jedinicom mjere na istom grafikonu. Ovim grafikonom mogu se prikazivati i
usporeñivati i vremenski nizovi s istom mjernom jedinicom, ali koji imaju
velike razlike meñu vrijednostima pojave.
Njihova konstrukcija danas je olakšana u raznim statističkim paketima
za računalo (Statistica, SPSS i slično).
Ako je omjer najveće i najmanje frekvencije vremenskog niza:
10
min
max
≤
Y
Y
,
⇒
dovoljan je 1 logaritamski ciklus
100
10
min
max
≤
<
Y
Y
,
⇒
dovoljna su 2 logaritamska ciklusa
1000
100
min
max
≤
<
Y
Y
,
⇒
dovoljna su 3 logaritamska ciklusa... itd.
Karakteristika logaritamske skale na osi ordinata je da se za vrijednost s
kojom počinje jedan logaritamski ciklus uvećava svaka sljedeća vrijednost u
ciklusu. S vrijednošću kojom završava prvi logaritamski ciklus počinje drugi i
uvećavanje na skali se sada nastavlja s tom veličinom i tako redom dalje.
Intervalni vremenski nizovi
mogu se prikazivati:
•
linijskim grafikonom
•
površinskim grafikonom (obično su to stupci koji su naslonjeni jedan na
drugi jer vrijeme teče kontinuirano).
Kod linijskog grafikona za intervalne vremenske nizove (koji prikazuju
vrijednost pojave u vremenskim intervalima) vrijednost pojave se nanosi na
sredinu svakog promatranog razdoblja (mjesec, kvartal, godina i slično.)
Stupci površinskog grafikona naslonjeni su na os apscisu, imaju
jednake baze, a visina im odgovara vrijednostima vremenskog niza za odreñeno
razdoblje. Dakle površine ovih stupaca su proporcionalne vrijednostima niza, a
razlike u njihovoj veličini upućuju na apsolutne razlike vrijednosti promatranih
razdoblja.

100
Zadatak je zadane vremenske nizove prikazati grafički s 2 logaritamska ciklusa
na os ordinate.
Grafikon 12.
Odobreni krediti i štedni ulozi banke «Z» u razdoblju od 1995. do
2005. god.
1
10
100
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
U
m
il
ij
u
n
im
a
k
n
Odobreni krediti
Štedni ulozi
Izvor: Podaci banke «Z», travanj 2006. god.
3.4. Pokazatelji dinamike
Kretanje vrijednosti pojave vremenskog niza jasno se može vidjeti iz
grafičkog prikaza. Meñutim u statističkoj analizi često se javlja potreba
preciznijeg definiranja kretanja vrijednosti neke pojave u vremenu. U tu svrhu
služe apsolutni i relativni pokazatelji.
Apsolutni pokazatelji
računaju se običnim oduzimanjem vrijednosti
pojave u jednom vremenskom razdoblju od vrijednosti iste pojave u drugom
razdoblju i izražavaju se u originalnim jedinicama mjere.
Pojedinačne apsolutne promjene od razdoblja do razdoblja
računaju se tako da se od vrijednosti pojave u tekućem razdoblju oduzme
vrijednost pojave u prethodnom razdoblju:
n
t
Y
Y
Y
t
t
t
,...,
2
,
1
,
1
=
−
=
∆
−
(3.4.1)
Tumače se kao
promjena vrijednosti pojave promatranog
vremenskog niza u originalnim jedinicama mjere u tekućem razdoblju u
odnosu na prethodno razdoblje
.
101
Pojedinačne apsolutne promjene u tekućem razdoblju u odnosu
prema nekom baznom razdoblju
računaju se tako da se od vrijednosti pojave
u tekućem razdoblju oduzme vrijednost pojave u odabranom baznom razdoblju:
n
t
Y
Y
Y
b
t
t
,...,
2
,
1
,
=
−
=
∆
(3.4.2)
Tumače se kao
promjena vrijednosti pojave promatranog
vremenskog niza u originalnim jedinicama mjere u tekućem razdoblju u
odnosu na odabrano bazno razdoblje
.
Relativni pokazatelji, za razliku od apsolutnih, omogućuju usporedbu
kretanja pojava s različitim jedinicama mjere.
Individualni indeksi su relativni pokazatelji dinamike kretanja
vrijednosti pojave vremenskog niza i njima se usporeñuje stanje jedne
pojave u različitim vremenskim intervalima ili momentima.
Individualni indeksi dijele se na:
•
verižne indekse
•
bazne indekse.
3.5. Verižni indeksi i indeksi na stalnoj bazi
3.5.1. Verižni indeksi
Verižni indeksi pokazuju relativne promjene (u %) pojave u
tekućem razdoblju u odnosu na prethodno razdoblje, odnosno pokazuju za
koliko % se vrijednost pojave u jednom razdoblju promijenila u odnosu na
prethodno razdoblje.
Verižni indeksi se računaju:
.
,....
3
,
2
,
100
1
N
t
Y
Y
V
t
t
t
=
⋅
=
−
(3.5.1)
Iz izraza (3.5.1) vidi se da se verižni indeks računa tako da se stavi u
odnos vrijednost pojave iz tekućeg razdoblja s vrijednošću pojave iz prethodnog
razdoblja i sve se množi sa 100. S obzirom da vrijednost vremenskog niza za
prethodno razdoblje od prvog nije poznata, ne može se izračunati prvi verižni
indeks u jednom nizu.
Verižni indeksi se još nazivaju i lančani indeksi
jer
pokazuju promjene pojave u uzastopnim vremenskim razdobljima i nadovezuju
se jedan na drugi.

103
1
1
2
1
3
4
2
3
1
2
1
1
4
3
2
...
...
−
−
−
−
−
−
/
⋅
/
/
⋅
⋅
/
/
⋅
/
/
⋅
/
=
⋅
⋅
⋅
⋅
=
N
N
N
N
N
N
N
N
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
V
V
V
V
V
G
. (3.5.5)
Iz desnog dijela jednakosti (3.5.5) može se vidjeti da se mogu kratiti
sve vrijednosti pojave osim Y
1
i Y
N
, stoga vrijedi da je geometrijska sredina
verižnih indeksa:
1
1
−
=
N
N
Y
Y
G
,
(3.5.6)
dakle, pod korijenom ostaje omjer posljednje i prve frekvencije vremenskog
niza.
Prosječna stopa promjene računa se prema (3.5.7):
100
)
1
(
⋅
−
=
G
S
.
(3.5.7)
Ako su zadani godišnji podaci onda je to prosječna godišnja stopa
promjene, ako su podaci dani po mjesecima, riječ je o prosječnoj mjesečnoj
stopi promjene i slično.
Može se vršiti i preračunavanje prosječne stope promjene s duljeg
na kraće i s kraćeg na dulje vremensko razdoblje.
Na primjer, ako se želi
izračunati prosječna mjesečna stopa promjene od prosječne godišnje stope bit
će:
100
)
1
(
,
12
⋅
−
=
=
mj
mj
god
mj
G
S
G
G
,
(3.5.8)
dakle, računa se dvanaesti korijen od godišnje geometrijske sredine jer godina
ima 12 mjeseci.
Na primjer, ako se želi izračunati prosječna godišnja stopa promjene od
prosječne polugodišnje stope bit će:
100
)
1
(
,
.
2
.
.
⋅
−
=
=
polug
polug
polug
god
G
S
G
G
,
(3.5.9)
odnosno računa se na drugu potenciju od polugodišnje geometrijske sredine jer
godina ima 2 polugodišta.
Uz pretpostavku da će se vrijednosti neke pojave nastaviti kretati
i
u budućnosti na isti način, odnosno
prema izračunatoj prosječnoj stopi
promjene kao i u promatranom razdoblju
preko geometrijske sredine
može
se, počevši od posljednjeg elementa (Y
N
) u nizu, vršiti prognoza njenog
kretanja
:
t
N
t
N
G
Y
Y
⋅
=
+
ˆ
,
(3.5.10)
gdje je:
104
t
N
Y
+
ˆ
- prognostička vrijednost pojave uz pretpostavku neizmijenjenog G u (N+t)
razdoblju
N
Y
- posljednja vrijednost pojave u nizu
G
- izračunata ili pretpostavljena geometrijska sredina verižnih indeksa
t
- broj vremenskih razdoblja nakon posljednjeg u nizu, za koje se vrši
prognoza.
Primjer 3.5.1.
Tablica 3.2.
Proizvodnja vina u vinariji «Z» u razdoblju od 1996. do 2005. god.
Godina
Proizvedene
količine vina u
l
Verižni indeksi
(
V
t
)
Stope promjene
(
S
t
)
1996.
1538
-
-
1997.
1709
111,1
11,1
1998.
1552
90,8
-9,2
1999.
1860
119,9
19,9
2000.
1962
105,5
5,5
2001.
2176
110,9
10,9
2002.
2097
96,4
-3,6
2003.
2263
107,9
7,9
2004.
2481
109,6
9,6
2005.
2315
93,3
-6,7
Izvor: Podaci vinarije «Z», 2006. god.
Zadatak je izračunati verižne indekse i pripadajuće stope promjene te indekse
prikazati grafički stupcima.
Vrijednosti verižnih indeksa navedene su u trećem stupcu tablice, a pripadajuće
stope promjene u četvrtom stupcu. Prvi izračunani verižni indeks iznosi 111,1 i
pokazuje da je na svakih 100 litara vina proizvedenih u 1996. godini dolazilo
111, 1 litara proizvedenih u 1997. godini, ili za 11,1% više.
Grafički prikaz verižnih indeksa stupcima je sljedeći:

106
odabere ono u kojemu je vrijednost pojave najveća u nizu, bazni indeksi će
pokazivati stalan pad u odnosu na izabranu bazu. Na taj način se u praksi može
manipulirati podacima.
Grafički prikaz baznih indeksa je jednostavan linijski grafikon.
Crta se u pravokutnom sustavu, i na njemu mora biti naznačeno koje je
razdoblje uzeto za bazno, uz sve ostale oznake koje statistički grafikon mora
imati (naslov, izvor, oznake na ordinati i oznake na apscisi).
Kako je već rečeno, bazni indeksi se računaju dijeljenjem svakog člana
niza istim brojem (bazom) i množenjem istim faktorom (sa 100). Prema tome se
može zaključiti da su
bazni indeksi upravno proporcionalni originalnim
vrijednostima vremenskog niza, pa sve što se može izračunati dijeljenjem
originalnih vrijednosti pojave, može se dobiti i dijeljenjem baznih indeksa
(naravno po istoj bazi).
Stoga vrijedi da je
geometrijska sredina verižnih indeksa
:
1
1
1
1
−
−
=
⇒
=
N
N
N
N
I
I
G
Y
Y
G
,
(3.5.13)
gdje su I
1
i I
N,
prvi i posljednji bazni indeks u nizu.
Preračunavanje baznih indeksa po jednoj bazi u bazne indekse po
drugoj bazi se vrši na sljedeći način
:
100
*
⋅
=
b
t
t
I
I
I
,
(3.5.14)
gdje je
b
novo bazno razdoblje za indekse
*
t
I
.
Računanje verižnih indeksa preko baznih indeksa je
:
N
t
I
I
V
Y
Y
V
t
t
t
t
t
t
,....
3
,
2
,
100
100
1
1
=
⋅
=
⇒
⋅
=
−
−
,
(3.5.15)
gdje su
t
t
I
i
I
1
−
bazni indeksi jednake baze.
Preračunavanje verižnih indeksa u bazne po nekoj bazi
b
vrši se
preko sljedećih izraza izvedenih iz (3.5.15):
•
za razdoblja prije baznog (b=100), računa se unatrag:
100
1
⋅
=
−
t
t
t
V
I
I
,
(3.5.16)
•
za razdoblja poslije baznog (b=100), računa se unaprijed:
100
1
−
⋅
=
t
t
t
I
V
I
.
(3.5.17)
107
Primjer 3.5.2.
Tablica 3.3.
Uvoz banana na području «Z» u razdoblju od 1996. do 2005. god.
Godina
Uvezene količine
banana u tisućama
t
Bazni indeksi
1996.=100 (
I
t
)
Stope promjene
(
S
t
)
1996.
21
100,0
0,0
1997.
19
90,5
-9,5
1998.
25
119,0
19,0
1999.
20
95,2
-4,8
2000.
18
85,7
-14,3
2001.
23
109,5
9,5
2002.
25
119,0
19,0
2003.
28
133,3
33,3
2004.
24
114,3
14,3
2005.
27
128,6
28,6
Izvor: Statistika područja «Z», 2006. god.
Zadatak je izračunati bazne indekse (1996.=100) i pripadajuće stope promjene
te indekse prikazati linijskim grafikonom.
Vrijednosti baznih indeksa navedene su u trećem stupcu tablice, a pripadajuće
stope promjene u četvrtom stupcu. Posljednji izračunani bazni indeks iznosi
128,6 i pokazuje da je na svakih 100
t
uvezenih banana u 1996. godini dolazilo
128,6
t
uvezenih u 2005. godini, ili za 28,6% više.
Grafički prikaz baznih indeksa linijskim grafikonom je sljedeći:
Grafikon 14.
Bazni indeksi uvoza banana na području «Z», 1996.=100
80
90
100
110
120
130
140
1996. 1997. 1998. 1999. 2000. 2001. 2002. 2003. 2004. 2005.
Izvor: Statistika područja «Z», 2006. god.

109
Laspeyresov skupni indeks cijena je vagana aritmetička sredina
individualnih indeksa cijena, gdje su ponderi količine iz baznog, odnosno
nultog razdoblja.
Laspeyresov skupni indeks cijena pokazuje za koliko posto su se
promijenile cijene skupine pojava zajedno u izvještajnom u odnosu na
bazno razdoblje, računajući uz neizmijenjene količine iz baznog razdoblja.
Agregatni oblik ovog indeksa je:
100
)
(
1
0
0
1
0
1
0
01
⋅
∑
∑
=
=
=
k
i
i
i
k
i
i
i
q
p
q
p
q
P
,
(3.6.1)
gdje je:
∑
=
k
i
i
i
q
p
1
0
1
- suma umnožaka cijena iz izvještajnog i količina iz nultog razdoblja
∑
=
k
i
i
i
q
p
1
0
0
- suma umnožaka cijena iz nultog i količina iz nultog razdoblja.
Paascheov skupni indeks cijena je vagana aritmetička sredina
individualnih indeksa cijena, gdje su ponderi količine iz izvještajnog,
odnosno tekućeg razdoblja.
Paascheov skupni indeks cijena pokazuje za koliko posto su se
promijenile cijene skupine pojava zajedno u izvještajnom u odnosu na
bazno razdoblje, računajući uz neizmijenjene količine iz izvještajnog
razdoblja.
Agregatni oblik ovog indeksa je:
100
)
(
1
1
0
1
1
1
1
01
⋅
∑
∑
=
=
=
k
i
i
i
k
i
i
i
q
p
q
p
q
P
,
(3.6.2)
gdje je:
∑
=
k
i
i
i
q
p
1
1
1
- suma umnožaka cijena iz izvještajnog i količina iz izvještajnog
razdoblja
∑
=
k
i
i
i
q
p
1
1
0
- suma umnožaka cijena iz nultog i količina iz izvještajnog razdoblja.
Odreñene ekonomske analize često u praksi zahtijevaju posebne oblike
skupnog indeksa cijena.
Od posebne je važnosti
indeks potrošačkih cijena
10
10
Do kraja 2003. godine u Republici Hrvatskoj je u službenim statistikama u istoj
funkciji bio
indeks troškova života
.
Indeks potrošačkih cijena
uveden je od 2004.
110
koji odražava promjene cijena dobara i usluga koje koristi referentno
stanovništvo radi finalne potrošnje.
Indeks potrošačkih cijena služi za mjerenje inflacije
(odnosno
porasta cijena)
u privredi, za očuvanje vrijednosti kod ugovora s indeksnim
klauzulama kao osnova za deflacioniranje
(uklanjanje utjecaja inflacije, tj.
porasta cijena)
odreñenih vrijednosnih pokazatelja i slično.
Državni zavod za statistiku Republike Hrvatske ovaj indeks računa na
osnovi reprezentativne košarice koju čini oko 540 proizvoda. Svaki mjesec
prikuplja se više od 25 000 cijena na unaprijed definiranom uzorku prodajnih
mjesta na devet lokacija u zemlji (Zagreb, Slavonski Brod, Osijek, Sisak,
Rijeka, Pula, Split, Dubrovnik i Varaždin), odabranih prema kriteriju broja
stanovnika i reprezentativnosti za pojedinu statističku regiju.
Pomoću ovog indeksa mjeri se utjecaj potrošačkih cijena na nominalne
plaće, odnosno
računaju se realne plaće
.
Realne plaće
100
cijena
potr.
Indeksi
pl.
Nominalne
⋅
=
,
(3.6.3)
gdje su
indeksi u nazivniku izraza bazni po nekom odabranom razdoblju
.
Vrijedi da je:
100
.
.
.
.
min
.
.
.
.
⋅
=
cijena
potr
Ind
pl
no
Ind
pl
real
Ind
,
(3.6.4)
gdje su svi
indeksi bazni po nekom (istom) odabranom razdoblju
radi
usporedivosti podataka.
1.6.2. Skupni indeksi količina
Skupni indeks količina je relativni pokazatelj dinamike kretanja
količina skupine pojava u tekućem razdoblju u odnosu na bazno razdoblje.
Oblici ovog indeksa su:
a)
Laspeyresov skupni indeks količina
b)
Paascheov skupni indeks količina.
godine da bi se službena statistička izvješća u Hrvatskoj uskladila sa svjetskim
obračunima i pokazateljima.

112
Najprije se pomoću skupnog indeksa cijena vrši postupak
deflacioniranja vrijednosnih pokazatelja. Na taj način se iz vrijednosnih
pokazatelja odstranjuje utjecaj cijena (najčešće inflacije, tj. porasta cijena).
Vrijed. u stalnim cijenama
100
cijena
Indeksi
cijenama
tek.
u
Vrijed.
⋅
=
,
(3.6.7)
gdje su
indeksi u nazivniku izraza bazni po nekom odabranom razdoblju
.
Nakon toga se može sagledati kretanje vrijednosnih pokazatelja u
fizičkom obujmu:
100
.
.
.
.
.
.
⋅
=
cijena
Indeks
cij
tek
u
vrijed
Ind
obujma
fiz
Ind
,
(3.6.8)
gdje su svi
indeksi bazni po nekom (istom) odabranom razdoblju
, radi
usporedivosti podataka.
3.6.3. Skupni indeksi vrijednosti
Skupni indeks vrijednosti je relativni pokazatelj dinamike kretanja
vrijednosti skupine pojava u tekućem razdoblju u odnosu na bazno
razdoblje.
Vrijednost je umnožak količine i cijene nekog proizvoda (i):
i
i
i
p
q
V
=
(3.6.9)
Skupni indeks vrijednosti je omjer vrijednosti skupine pojava u
izvještajnom i vrijednosti skupine pojava u baznom razdoblju.
Skupni indeks vrijednosti pokazuje za koliko posto su se
promijenile vrijednosti skupine pojava zajedno u izvještajnom u odnosu na
bazno razdoblje.
Računa se:
100
1
0
0
1
1
1
01
⋅
∑
∑
=
=
=
k
i
i
i
k
i
i
i
p
q
p
q
V
,
(3.6.10)
gdje je:
∑
=
k
i
i
i
p
q
1
1
1
- suma umnožaka količina i cijena iz izvještajnog razdoblja
113
∑
=
k
i
i
i
p
q
1
0
0
- suma umnožaka količina i cijena iz nultog razdoblja.
Isti rezultat može se dobiti i množenjem
Laspeyresovog
skupnog indeksa cijena i Paascheovog skupnog indeksa količina:
100
100
100
100
100
)
(
)
(
1
0
0
1
1
1
1
1
0
1
1
1
1
0
0
1
0
1
1
01
0
01
01
⋅
=
⋅
⋅
⋅
=
⋅
=
∑
∑
∑
∑
∑
∑
=
=
=
=
=
=
k
i
i
i
k
i
i
i
k
i
i
i
k
i
i
i
k
i
i
i
k
i
i
i
p
q
p
q
p
q
p
q
q
p
q
p
p
Q
q
P
V
(
3.6.11)
ili
množenjem
Paascheovog skupnog indeksa cijena i Laspeyresovog
skupnog indeksa količina:
100
100
100
100
100
)
(
)
(
1
0
0
1
1
1
1
0
0
1
0
1
1
1
0
1
1
1
0
01
1
01
01
⋅
=
⋅
⋅
⋅
=
⋅
=
∑
∑
∑
∑
∑
∑
=
=
=
=
=
=
k
i
i
i
k
i
i
i
k
i
i
i
k
i
i
i
k
i
i
i
k
i
i
i
p
q
p
q
p
q
p
q
q
p
q
p
p
Q
q
P
V
(3.6.12)
Primjer 3.6.1.
Treba izračunati indekse količina i cijena po Laspeyresovom i
Paascheovom obrascu za jedinicu koja proizvodi tri različita proizvoda. Podaci
o proizvodnji tri proizvoda u 2007. i 2008. godini su sljedeći:
Tablica 3.4.
Proizvod
Mjerna
jedinica
Količine
2007.
q
0
Količine
2008.
q
1
Cijene
2007.
p
0
Cijene
2008.
p
1
A
komad
10
12
25
30
B
litra
30
40
40
40
C
m
2
20
15
60
72
Izvor: Podaci su simulirani
Zadatak je izračunati:
a) za koliko % su se u prosjeku promijenile cijene u 2008. godini u odnosu na
2007. godinu?
b) za koliko % su se u prosjeku promijenile proizvedene količine u 2008. godini
u odnosu na 2007. godinu?
c) za koliko % se u prosjeku promijenila vrijednost proizvodnje u 2008. godini
u odnosu na 2007. godinu?

115
c) Skupni indeks vrijednosti proizvodnje iznosi:
7
,
114
100
2650
3040
100
1
0
0
1
1
1
01
=
⋅
=
⋅
=
∑
∑
=
=
k
i
i
i
k
i
i
i
p
q
p
q
V
Indeks vrijednosti proizvodnje pokazuje da se vrijednost proizvodnje tri
proizvoda 2008. godine u odnosu na 2007. godinu u prosjeku povećala za
14,7%.
3.7. Modeli trendova
Najčešće su u upotrebi
trend-modeli
:
1.
Trend polinomi k-tog stupnja
2.
Eksponencijalni trend modeli
3.
Hiperbolički trend modeli
4.
Asimptotski trend modeli.
3.7.1. Trend polinomi k-tog stupnja
k
k
X
X
X
Y
β
β
β
β
ˆ
...
ˆ
ˆ
ˆ
ˆ
2
2
1
0
+
+
+
+
=
(3.7.1)
Ocjena parametara najčešće se dobije metodom najmanjih kvadrata
zbog njenih optimalnih svojstava. Kaže se da se tom metodom dobiju najbolje
linearne nepristrane ocjene parametara (BLUE), naravno uz uvjet da su
ispunjene sve pretpostavke koje ova metoda zahtijeva.
Ako je stupanj polinoma 1, tj.
⇒
=
1
k
ocjenjuje se model linearnog
trenda (odnosno kada se vrijednost pojave u svakoj vremenskoj jedinici
mijenja za približno isti apsolutni iznos
1
1
ˆ
ˆ
ˆ
ˆ
β
=
−
=
∆
−
t
t
t
Y
Y
Y
)
116
Ako je stupanj polinoma
⇒
k
ocjenjuje se model trend polinoma k-tog
stupnja, (odnosno ako su k-te diferencije vrijednosti vremenskog niza
približno konstantne ocjenjuje se (k+1) parametar trend polinoma):
.
const
y
t
k
≈
∆
(3.7.2)
3.7.1.1. Model linearnog trenda
Model linearnog trenda objašnjava linearno kretanje (pozitivno ili
negativno) vrijednosti promatranog vremenskog niza kroz vrijeme. Osim
prikaza linearnog kretanja pojave vremenskog niza na temelju ocijenjenog
modela može se vršiti predviñanje vrijednosti pojave za neka buduća
razdoblja.
Model linearnog trenda općenito je oblika:
t
t
t
e
X
Y
+
+
=
1
0
ˆ
ˆ
β
β
,
(3.7.3)
gdje je:
Y- ovisna varijabla, tj. vrijednosti vremenskog niza
X - neovisna varijabla, tj. vrijeme (treba napomenuti da se kod trend
modela mora izabrati ishodišno razdoblje kojemu se dodjeljuje vrijednost 0.
Ako nula nije prva u nizu onda razdoblja prije nultog unatrag imaju vrijednosti:
-1,-2,-3,…, a prema naprijed su vrijednosti: 1,2,3,…)
e
- slučajna komponenta.
Model ima slučajnu komponentu
e
, koja upućuje da veze izmeñu
vrijednosti pojave vremenskog niza i vremena u praksi nisu funkcionalne, nego
su statističke ili stohastičke, odnosno oko linije konkretnog linearnog trend
modela postoje pozitivna i/ili negativna odstupanja originalnih vrijednosti.
Ocijenjeni linearni trend model je:
X
Y
1
0
ˆ
ˆ
ˆ
β
β
+
=
.
(3.7.4)
Parametri
1
0
ˆ
ˆ
β
β
i
ocjenjuju se tako da pravac
Y
ˆ
prolazi izmeñu
stvarnih točaka vremenskog niza i da najbolje tumači vezu izmeñu njih,
odnosno pravac mora biti takav da odstupanja
t
e
budu najmanja.
Postoji više različitih metoda za ocjenu ovih parametara, a najčešće
korištena metoda je
metoda najmanjih kvadrata,
koja
upravo procjenjuje
parametre
1
0
ˆ
ˆ
β
β
i
tako da odstupanja
e
t
budu najmanja. Ona kao i kod

118
U tu svrhu koriste se neki
apsolutni i relativni pokazatelji.
Ovi se
pokazatelji, kao i kod regresijske analize, temelje na raspodjeli odstupanja
vrijednosti ovisne varijable
t
Y
u trend modelu od njene aritmetičke sredine
Y
i
njenih očekivanih vrijednosti
t
Y
ˆ
.
Vrijedi da je:
(
)
2
1
1
1
0
2
1
ˆ
ˆ
ˆ
Y
n
Y
X
Y
Y
Y
SP
n
t
t
t
n
t
t
n
t
t
⋅
−
∑
+
∑
⋅
=
∑
−
=
=
=
=
β
β
(3.7.10)
Dakle
SP je suma kvadrata protumačenog dijela,
odstupanja
vrijednosti varijable vremenskog niza Y od aritmetičke sredine,
odnosno suma
kvadrata odstupanja ocijenjenih vrijednosti varijable Y od aritmetičke
sredine
.
(
)
∑
−
∑
⋅
∑
−
=
∑
−
=
=
=
=
=
n
t
t
t
n
t
t
n
t
t
n
t
t
t
Y
X
Y
Y
Y
Y
SR
1
1
1
0
1
2
2
1
ˆ
ˆ
ˆ
β
β
(3.7.11)
SR je suma kvadrata neprotumačenog dijela,
odstupanja vrijednosti
varijable Y od aritmetičke sredine,
odnosno suma kvadrata odstupanja
originalnih ili empirijskih vrijednosti varijable Y od ocijenjenih
vrijednosti
. Ova odstupanja su u stvari slučajne pogrješke
t
e
.
(
)
2
1
2
2
1
Y
n
Y
Y
Y
ST
n
t
t
n
t
t
⋅
−
∑
=
∑
−
=
=
=
(3.7.12)
ST je suma kvadrata ukupnih
odstupanja vrijednosti varijable
vremenskog niza Y od aritmetičke sredine.
Vrijedi da je:
ST
SR
SP
=
+
,
(3.7.13)
Ovaj izraz
zove se jednadžba analize varijance i predstavlja temelj
analize reprezentativnosti trend modela.
Standardna pogrješka trend modela je apsolutni pokazatelj
reprezentativnosti trend modela, a pokazuje prosječni stupanj varijacije
stvarnih vrijednosti ovisne varijable u odnosu na očekivane trend
vrijednosti.
2
ˆ
ˆ
−
=
n
SR
Y
σ
(3.7.14)
Izraz (3.7.14) je standardna pogrješka linearnog trend modela. Ovaj
pokazatelj izražen je u originalnim jedinicama mjere varijable vremenskog niza
Y. Stoga je na temelju standardne pogrješke trend modela teško usporeñivati
reprezentativnost modela s različitim mjernim jedinicama.
119
Taj problem eliminira
relativni pokazatelj - koeficijent varijacije
trend modela, koji predstavlja postotak standardne pogrješke trenda od
aritmetičke sredine varijable Y.
100
ˆ
ˆ
ˆ
ˆ
⋅
=
Y
V
Y
Y
σ
(3.7.15)
Najmanja vrijednost koeficijenta varijacije je 0%, a najveća nije
definirana.
Što je koeficijent varijacije trend modela bliži nuli, to je model
reprezentativniji.
Koeficijent determinacije je
pokazatelj reprezentativnosti trend
modela koji se temelji na analizi varijance. On se definira kao
omjer sume
kvadrata odstupanja protumačenih trend modelom i sume kvadrata
ukupnih odstupanja.
ST
SP
r
=
2
(3.7.16)
Koeficijent determinacije pokazuje koliko % je sume kvadrata
odstupanja vrijednosti varijable Y od aritmetičke sredine protumačeno
trend modelom.
Vrijedi da je:
ST
SR
r
−
=
1
2
(3.7.17)
Vrijednost koeficijenta determinacije kreće se u intervalu
1
0
2
≤
≤
r
.
Trend model je reprezentativniji ako je ovaj pokazatelj bliži 1.
Teorijska
granica reprezentativnosti modela je 0,9. U praksi je ponekad vrlo teško pronaći
varijablu koja dobro objašnjava kretanje vremenskog niza u vremenu, stoga se
ta granica reprezentativnosti spušta i niže.

121
Koeficijent
1
β
)
pokazuje da se broj zaposlenih u Hrvatskoj, u analiziranom
razdoblju, povećavao prosječno godišnje za 17.460 zaposlenika.
Reprezentativnost ocijenjenog modela linearnog trenda izvodi se iz rezidualnih
odstupanja. Varijanca trenda je:
6
,
353
10
58217
46
,
17
12617
1
,
1183
15947557
1
1
1
1
0
2
2
=
⋅
−
⋅
−
=
−
−
=
∑
∑
∑
=
=
=
n
Y
X
Y
Y
n
t
n
t
n
t
t
t
t
t
Y
β
β
σ
)
)
)
Standardna devijacija trenda iznosi:
8
,
18
6
,
353
2
=
=
=
Y
Y
)
)
σ
σ
Koeficijent varijacije trenda pokazuje da postotak standardne devijacije trenda
od aritmetičke sredine varijable
Y
iznosi 1,49% (manji je od 10%) i ukazuje na
dobru reprezentativnost ocijenjenog linearnog trend modela:
49
,
1
100
7
,
1261
8
,
18
100
=
⋅
=
⋅
=
Y
V
Y
Y
)
)
σ
Trend vrijednosti (
t
Y
)
), izračunane ocijenjenom jednadžbom linearnog trenda,
pokazane su u posljednjem stupcu tablice 3.5.
3.7.1.2. Trend polinom drugog stupnja
Ako su 2. diferencije vrijednosti vremenskog niza približno konstantne
ocjenjuje se (2+1) parametar trend polinoma:
.
2
const
y
t
≈
∆
,
(3.7.18)
čiji je općeniti oblik:
2
2
1
0
ˆ
ˆ
ˆ
ˆ
X
X
Y
⋅
+
⋅
+
=
β
β
β
(3.7.19)
Ocjenom parametara metodom najmanjih kvadrata
traži se
minimum zbroja kvadrata empirijskih odstupanja u odnosu na trend vrijednosti:
Računa se sustav od 3 jednadžbe s 3 nepoznata parametra:
3
2
1
ˆ
ˆ
,
ˆ
β
β
β
i
.
∑
=
∑
+
∑
+
⋅
=
=
=
n
i
i
n
i
i
n
i
i
Y
X
X
N
1
1
2
2
1
1
0
ˆ
ˆ
ˆ
β
β
β
(3.7.20)
122
∑
=
∑
+
∑
+
∑
=
=
=
=
n
i
i
i
n
i
i
n
i
i
n
i
i
Y
X
X
X
X
1
1
3
2
1
2
1
1
0
ˆ
ˆ
ˆ
β
β
β
(3.7.21)
∑
=
∑
+
∑
+
∑
=
=
=
=
n
i
i
i
n
i
i
n
i
i
n
i
i
Y
X
X
X
X
1
2
1
4
2
1
3
1
1
2
0
ˆ
ˆ
ˆ
β
β
β
.
(3.7.22)
Rješenje ovog sustava po parametrima
j
β
ˆ
daje rješenje ocjena
parametara trend polinoma 2. stupnja.
Jednadžbe analize varijance za model trend polinoma 2. stupnja, tj.
za
k=2
:
2
1
2
2
1
1
1
0
1
2
ˆ
ˆ
ˆ
)
ˆ
(
Y
n
Y
X
Y
X
Y
Y
Y
SP
n
t
t
t
n
t
t
t
n
t
t
n
t
t
−
∑
⋅
⋅
+
∑
⋅
⋅
+
∑
⋅
∑
=
−
=
=
=
=
=
β
β
β
(3.7.23)
∑
⋅
⋅
−
∑
⋅
⋅
−
∑
⋅
∑
−
=
∑
−
=
=
=
=
=
=
n
t
t
t
n
t
t
t
n
t
t
n
t
t
n
t
t
t
Y
X
Y
X
Y
Y
Y
Y
SR
1
2
2
1
1
1
0
1
2
1
2
ˆ
ˆ
ˆ
)
ˆ
(
β
β
β
(3.7.24)
2
1
2
1
2
)
(
Y
n
Y
Y
Y
ST
n
t
t
n
t
t
−
∑
=
∑
−
=
=
=
(3.7.25)
Vrijedi da je:
ST
SR
SP
=
+
,
(3.7.26)
što predstavlja jednadžbu analize varijance i predstavlja temelj analize
reprezentativnosti trend modela.
Standardna
pogrješka
trenda
je
apsolutni
pokazatelj
reprezentativnosti trend modela, a pokazuje prosječni stupanj varijacije
stvarnih vrijednosti ovisne varijable u odnosu na očekivane trend
vrijednosti.
1
ˆ
ˆ
−
−
=
k
n
SR
Y
σ
(3.7.27)
Ovaj izraz je standardna pogrješka trenda. Izražen je u originalnim
jedinicama mjere ovisne varijable Y.
Taj problem eliminira
relativni pokazatelj - koeficijent varijacije
trenda, koji predstavlja postotak standardne pogrješke trenda od
aritmetičke sredine vremenskog niza Y.
100
ˆ
ˆ
ˆ
ˆ
⋅
=
Y
V
Y
Y
σ
(3.7.28)
Najmanja vrijednost koeficijenta varijacije je 0%, a najveća nije
definirana.
Što je koeficijent varijacije modela bliži nuli to je model
reprezentativniji.
Često se uzima dogovorena granica reprezentativnosti od
10%. Dakle ako je koeficijent varijacije manji od 10% kaže se da je model
dobar.

124
5
,
288
110
110
1958
11
50418
110
1958
4223
1
1
2
1
2
4
1
1
2
1
2
4
1
0
=
⋅
−
⋅
⋅
−
⋅
=
−
−
=
∑
∑
∑
∑
∑
∑
∑
=
=
=
=
=
=
=
n
t
n
t
t
n
t
t
t
n
t
n
t
t
t
n
t
t
t
n
t
t
X
X
X
n
X
Y
X
X
Y
β
)
49
,
47
110
5224
1
2
1
1
=
=
=
∑
∑
=
=
n
t
t
n
t
t
t
X
Y
X
β
)
54
,
9
110
110
1958
11
4223
110
50418
11
1
1
2
1
2
4
1
1
2
2
1
2
=
⋅
−
⋅
⋅
−
⋅
=
−
−
=
∑
∑
∑
∑ ∑
∑
=
=
=
=
=
=
n
t
n
t
t
n
t
t
t
n
t
n
t
t
t
t
n
t
t
X
X
X
n
Y
X
X
Y
n
β
)
Reprezentativnost ocijenjenog modela trend polinoma drugog stupnja ispitat će
se koeficijentom varijacije trenda:
4
,
9
100
9
,
383
2
,
36
100
=
⋅
=
⋅
=
Y
V
Y
Y
)
)
)
)
σ
9
,
383
11
4223
1
=
=
=
∑
=
n
Y
Y
n
t
t
2
,
36
1
2
11
3
,
10479
1
=
−
−
=
−
−
=
k
n
SR
Y
)
)
σ
k
= 2 (stupanj polinoma)
3
,
10479
)
(
2
1
=
−
=
∑
=
t
n
t
t
Y
Y
SR
)
Koeficijent varijacije trend modela pokazuje da postotak standardne pogrješke
trenda od aritmetičke sredine varijable
Y
iznosi 9,4% i potvrñuje
reprezentativnost ocijenjenog modela trend polinoma drugog stupnja.
125
3.7.2. Eksponencijalni trend modeli
Eksponencijalni trend modeli su oblika:
k
x
k
x
x
Y
β
β
β
β
ˆ
...
ˆ
ˆ
ˆ
ˆ
2
2
1
0
⋅
⋅
⋅
⋅
=
(3.7.31)
ili
k
X
k
X
X
e
Y
β
β
β
β
ˆ
...
2
2
ˆ
1
ˆ
0
ˆ
ˆ
+
+
+
/
+
=
(3.7.32)
Ocjena parametara se najčešće dobije metodom najmanjih kvadrata.
⇒
=
1
k
⇒
1
ˆ
β
100
)
1
ˆ
(
1
⋅
−
=
β
S
- prosječna stopa promjene vrijednosti
vremenskog niza u jedinici vremena u %.
⇒
0
ˆ
β
trend vrijednost u ishodištu.
⇒
k
ako su k-te diferencije logaritama vrijednosti vremenskog niza
približno konstantne ocjenjuje se (k+1) parametar eksponencijalnog
trenda:
.
)
(log
const
y
t
k
≈
∆
(3.7.33)
3.7.2.1. Jednostavni eksponencijalni trend
Model jednostavne eksponencijalne regresije
općenito je oblika:
X
Y
1
0
ˆ
ˆ
ˆ
β
β
⋅
=
(3.7.34)
Da bi se za ocjenu parametara upotrijebila
metoda najmanjih
kvadrata,
potrebno je početni model logaritamskom transformacijom prevesti u
logaritamsko-linearni oblik:
X
Y
⋅
+
=
1
0
ˆ
log
ˆ
log
ˆ
log
β
β
(3.7.35)
Traži se minimum sume kvadrata neprotumačenih ili rezidualnih
odstupanja:
[
]
∑
+
−
=
∑
−
=
=
=
n
t
t
t
n
t
t
t
X
Y
Y
Y
SR
1
2
1
0
1
2
)
ˆ
log
ˆ
(log
log
min
)
ˆ
log
(log
min
min
β
β
(3.7.36)
Nakon primjene matematičkog postupka traženja minimuma dobije se
da je:

127
2
ˆ
ˆ
log
−
=
n
SR
Y
σ
(3.7.45)
Relativni pokazatelj, koeficijent varijacije trenda je:
100
log
ˆ
ˆ
ˆ
log
ˆ
log
⋅
=
Y
V
Y
Y
σ
(3.7.46)
Ako je koeficijent varijacije manji od 10% kaže se da je model dobar.
Koeficijent determinacije je
pokazatelj reprezentativnosti modela koji
se temelji na analizi varijance. On se definira kao
omjer sume kvadrata
odstupanja protumačenih trendom i sume kvadrata ukupnih odstupanja.
ST
SP
r
=
2
(3.7.47)
Koeficijent determinacije pokazuje koliko % je sume kvadrata
odstupanja logaritama vrijednosti niza Y od aritmetičke sredine njenih
logaritamskih vrijednosti protumačeno trend modelom.
V
rijedi da je:
ST
SR
r
−
=
1
2
(3.7.48)
Vrijednost koeficijenta determinacije kreće se u intervalu
1
0
2
≤
≤
r
.
Trend model je reprezentativniji ako je ovaj pokazatelj bliži 1.
Teorijska
granica reprezentativnosti modela je 0,9. U praksi je ponekad vrlo teško pronaći
varijablu koja dobro objašnjava ovisnu pojavu pa se ta granica
reprezentativnosti spušta i do 0,6.
Korigirani koeficijent determinacije
:
)
1
(
)
1
(
1
1
2
2
r
k
n
n
r
−
⋅
+
−
−
−
=
,
je asimptotski nepristrana ocjena koeficijenta determinacije.
128
Primjer 3.7.3.
Tablica 3.7.
Krediti odobreni stanovništvu u banci «Z»
u razdoblju od 1999. do 2008. god.
Godina
Krediti u
mil. kn (
Y
t
)
Varijabla
vrijeme
(
X
t
)
t
Y
log
2
t
X
t
t
Y
X
log
t
Y
)
log
1999.
10,5
0
1,02119
0
0,00000
0,94280
2000.
9,8
1
0,99123
1
0,99123
1,08466
2001.
18,3
2
1,26245
4
2,52490
1,22652
2002.
24,8
3
1,39445
9
4,18336
1,36838
2003.
28,4
4
1,45332
16
5,81327
1,51024
2004.
41,6
5
1,61909
25
8,09547
1,65210
2005.
62,5
6
1,79588
36
10,77528
1,79396
2006.
88,8
7
1,94841
49
13,63889
1,93582
2007.
125,1
8
2,09726
64
16,77806
2,07768
2008.
169,2
9
2,22840
81
20,05560
2,21954
Ukupno
579,0
45
15,81168
285
82,85606
15,81168
Izvor: Podaci banke «Z», 2009. god.
Zadatak je ocijeniti model jednostavnog eksponencijalnog trenda i koeficijent
varijacije trenda.
Model jednostavnog eksponencijalnog trenda glasi:
X
Y
1
0
β
β
)
)
)
⋅
=
Za ocjenu parametara «metodom najmanjih kvadrata» model je potrebno
logaritamski linearizirati:
X
Y
⋅
+
=
1
0
log
log
β
β
)
)
)
Ocjena parametara je sljedeća:
14186
,
0
5
,
4
10
285
58117
,
1
5
,
4
10
85606
,
82
log
log
log
2
1
2
2
1
1
=
⋅
−
⋅
⋅
−
=
−
−
=
∑
∑
=
=
n
t
t
n
t
t
t
X
n
X
Y
X
n
Y
X
β
)
94280
,
0
5
,
4
14186
,
0
58117
,
1
log
log
log
1
0
=
⋅
−
=
−
=
X
Y
β
β
)
)
5
,
4
10
45
1
=
=
=
∑
=
n
X
X
n
t
t
58117
,
1
10
81168
,
15
log
log
1
=
=
=
∑
=
n
Y
Y
n
t
t
Ocijenjeni logaritamski linearizirani model je:
X
Y
⋅
+
=
14186
,
0
94280
,
0
log
)

130
Koeficijent varijacije trend modela iznosi 3,3% i potvrñuje dobru
reprezentativnost ocijenjenog jednostavnog eksponencijalnog modela trenda.
3.7.3. Hiperbolički trend modeli
Hiperbolički trend modeli su oblika:
k
k
X
X
X
Y
β
β
β
β
ˆ
...
ˆ
ˆ
ˆ
1
ˆ
2
2
1
0
+
+
+
+
=
(3.7.49)
Ocjena parametara najčešće se dobije metodom najmanjih kvadrata
(BLUE).
⇒
k
ako su k-te diferencije recipročnih vrijednosti vremenskog niza
približno konstantne ocjenjuje se (k+1) parametar hiperboličkog trenda:
.
)
1
(
const
Y
t
k
≈
∆
(3.7.50)
3.7.3.1. Jednostavni hiperbolički trend
Jednostavni hiperbolički trend model
je općenito oblika:
X
Y
⋅
+
=
1
0
ˆ
ˆ
1
ˆ
β
β
(3.7.51)
Da bi se za ocjenu parametara upotrijebila
metoda najmanjih
kvadrata,
potrebno je početni model invertnom transformacijom prevesti u
linearni oblik:
X
Y
⋅
+
=
1
0
ˆ
ˆ
ˆ
1
β
β
(3.7.52)
Nakon primjene matematičkog postupka traženja minimuma sume
kvadrata neprotumačenih ili rezidualnih odstupanja dobije se da je:
131
X
Y
i
X
n
X
Y
nX
Y
X
t
n
t
t
t
n
t
t
t
1
0
2
1
2
1
1
ˆ
)
1
(
ˆ
)
1
(
)
1
(
ˆ
β
β
β
−
=
−
∑
−
∑
=
=
=
,
(3.7.53)
gdje su:
n
Y
Y
i
n
X
X
n
t
t
n
t
t
∑
=
∑
=
=
=
1
1
1
)
1
(
.
(3.7.54)
Parametar
0
ˆ
β
, u skladu s originalnom formom modela, može se
komentirati:
u ishodišnom razdoblju (kada je X=0) vrijednost pojave
vremenskog niza Y odgovarat će recipročnoj vrijednosti parametra
0
ˆ
β
, tj.
iznositi će
0
ˆ
1
β
jedinica.
Parametar
1
ˆ
β
ovdje nema logičnu interpretaciju.
Jednadžbe analize varijance
kod ovog modela isto se formiraju
odgovarajućom transformacijom.

133
7
15
105
1
=
=
=
∑
=
n
X
X
n
t
t
09481
.
0
15
42222
,
1
/
1
)
/
1
(
1
=
=
=
∑
=
n
Y
Y
n
t
t
t
Ocijenjeni jednostavni hiperbolički model glasi:
X
Y
003143
,
0
116817
,
0
1
−
=
)
X=0
, 1994. godine
Jedinica za
X
je jedna godina
Jedinica za
Y
je 1 tisuća
t
Trend vrijednosti prikazane su u posljednjem stupcu tablice 3.8.
3.7.4. Asimptotski trend modeli
Asimptotski trend modeli spadaju u skupinu
pravih nelinearnih trend
modela.
Koriste se za opisivanje razvojne tendencije pojava koje se na dugi rok
približavaju nekoj graničnoj vrijednosti -
asimptoti
.
Ocjene parametara ne mogu se dobiti metodom najmanjih kvadrata, jer
ove modele nije moguće transformirati da budu linearni u parametrima. Spadaju
u funkcionalne modele (nisu stohastički ili statistički modeli).
Tri
najčešće korištena
asimptotska trend modela:
1.
Modificirani eksponencijalni trend
2.
Logistički trend
3.
Gompertzov trend
Još se zovu
globalni modeli
ocjene prisutnosti trend komponente u
odgovarajućem vremenskom nizu. (Zasnivaju se na primjeni
svih frekvencija
vremenskog niza
koje imaju isto značenje ili ponder pri prognozi, bez obzira
da li se nalaze na početku vremenskog niza ili su bliže tekućem razdoblju).
Parametri
ovih modela
ocjenjuju se
specifičnim metodama ocjena:
a)
iterativne metode
b)
aproksimativna ocjena parametara
Iterativne metode
rade se putem računala pomoću suvremenih
statističkih paketa.
134
Aproksimativne metode
ocjene parametara su:
1. metoda parcijalnih suma
2. metoda triju odabranih točaka.
3.7.4.1. Modificirani eksponencijalni trend
Modificirani eksponencijalni trend je oblika:
x
B
A
L
Y
⋅
+
=
ˆ
.
(3.7.55)
Mogući oblici modela modificiranog eksponencijalnog trenda u
ovisnosti o parametrima A, B i L prikazani su na slici 3.1.:
Slika 3.1.
Modificirani eksponencijalni trend model upotrebljava se za prikaz
trend komponente vremenskog niza kojemu su omjeri prvih diferencija
vremenskog niza približno konstantne:
.
1
const
Y
Y
t
t
≈
∆
∆
−
(3.7.56)
A>0, B>1
0
L
A<0, B>1
0
L
A>0, B<1
0
L
A<0, B<1
0
L

136
Primjer 3.7.5.
Tablica 3.9.
Izvoz područja «Z» u razdoblju od 2000. do 2008. god.
Godina
Izvoz u milijunima
USD (
Y
t
)
Varijabla
vrijeme
(
X
t
)
t
Y
)
2000.
100
0
98
2001.
102
1
103
2002.
109
2
110
2003.
119
3
119
2004.
130
4
130
2005.
145
5
145
2006.
168
6
165
2007.
191
7
191
2008.
222
8
225
Ukupno
1286
36
1286
Izvor: Statistika područja «Z», 2009. god.
Zadatak je ocijeniti model modificiranog eksponencijalnog trenda i trend
vrijednosti.
Model modificiranog eksponencijalnog trenda glasi:
X
B
A
L
Y
⋅
+
=
)
Ocjena parametara modificiranog eksponencijalnog trenda metodom parcijalnih
suma je sljedeća:
31
,
1
311
394
394
581
3
1
2
2
3
=
−
−
=
−
−
=
r
S
S
S
S
B
3
3
9
3
=
=
=
n
r
44
,
16
)
1
31
,
1
(
1
31
,
1
)
311
394
(
)
1
(
1
)
(
2
3
2
1
2
=
−
−
−
=
−
−
⋅
−
=
r
B
B
S
S
A
59
,
81
394
2
581
311
394
581
311
3
1
2
1
2
2
3
1
2
2
3
1
=
⋅
−
+
−
⋅
=
−
+
−
⋅
=
S
S
S
S
S
S
r
L
311
109
102
100
1
=
+
+
=
S
394
145
130
119
2
=
+
+
=
S
581
222
191
168
3
=
+
+
=
S
137
Ocijenjeni model modificiranog eksponencijalnog trenda glasi:
X
Y
31
,
1
44
,
16
59
,
81
⋅
+
=
)
X=0
, 2000. godine
Jedinica za
X
je jedna godina
Jedinica za
Y
je 1 milijun USD-a
Trend vrijednosti prikazane su u posljednjem stupcu tablice 3.9.
3.7.4.2. Logistički trend
Logistički trend je oblika:
x
B
A
L
Y
⋅
+
=
1
ˆ
(3.7.63)
Oblik modela logističkog trenda prikazan je na slici 3.2.:
Slika 3.2.
U ekonomiji se krivulja logističkog trenda upotrebljava kod
opisivanja životnog vijeka nekog proizvoda
(faza uhodavanja, faza ekspanzije
i faza stagnantnog razvoja).
Logistički trend model upotrebljava se za prikaz trend komponente
vremenskog niza kojemu su omjeri prvih diferencija recipročnih vrijednosti
vremenskog niza približno konstantne:
.
)
1
(
)
1
(
1
const
Y
Y
t
t
≈
∆
∆
−
(3.7.64)
x
t
0
y
t

139
Primjer 3.7.6.
Tablica 3.10.
Prodaja proizvoda «Z» u razdoblju od 2000. do 2008. god.
Godina
Prodano tisuća
t
(
Y
t
)
Varijabla
vrijeme
(
X
t
)
t
Y
/
1
t
Y
)
2000.
56
0
0,017857
45,5
2001.
65
1
0,015384
74,1
2002.
88
2
0,011364
109,5
2003.
133
3
0,007519
145,1
2004.
186
4
0,005376
174,0
2005.
204
5
0,004902
193,9
2006.
210
6
0,004762
206,0
2007.
211
7
0,004739
212,8
2008.
214
8
0,004673
216,5
Ukupno
1367
36
0,076576
1377,4
Izvor: Podaci su simulirani.
Zadatak je ocijeniti model logističkog trenda i trend vrijednosti.
Model logističkog trenda glasi:
X
AB
L
Y
+
=
1
)
Ocjena parametara logističkog trenda metodom parcijalnih suma je sljedeća:
513174
,
0
044605
,
0
017797
,
0
017797
,
0
014174
,
0
3
1
2
2
3
=
−
−
=
−
−
=
r
S
S
S
S
B
3
3
9
3
=
=
=
n
r
017448
,
0
)
1
513174
,
0
(
1
513174
,
0
)
044605
,
0
017797
,
0
(
)
1
(
1
)
(
2
3
2
1
2
=
−
−
−
=
−
−
⋅
−
=
r
B
B
S
S
A
004536
,
0
017797
,
0
2
014174
,
0
044605
,
0
017797
,
0
014174
,
0
044605
,
0
3
1
2
1
2
2
3
1
2
2
3
1
=
⋅
−
+
−
⋅
=
−
+
−
⋅
=
S
S
S
S
S
S
r
L
044605
,
0
011364
,
0
015384
,
0
017857
,
0
1
=
+
+
=
S
017797
,
0
004902
,
0
005376
,
0
007519
,
0
2
=
+
+
=
S
014174
,
0
004673
,
0
004739
,
0
004762
,
0
3
=
+
+
=
S
140
Ocijenjeni model logističkog trenda glasi:
X
Y
513174
,
0
017448
,
0
004536
,
0
1
⋅
+
=
)
X=0
, 2000. godine
Jedinica za
X
je jedna godina
Jedinica za
Y
je 1 tisuća
t
Trend vrijednosti prikazane su u posljednjem stupcu tablice 3.10.
3.7.4.3. Gompertzov trend
Gompertzov trend je oblika:
x
B
A
L
Y
⋅
=
ˆ
(3.7.71)
Mogući oblici modela Gompertzovog trenda u ovisnosti o parametrima
A, B i L prikazani su na slici 3.3.:
Slika 3.3.
U ekonomiji se krivulja Gompertzovog trenda upotrebljava
kod opisivanja ekonomskih pojava
(faza uhodavanja, faza ekspanzije,
faza regresivnog rasta i faza stagnantnog razvoja)
logA>0, B>1
0
L
logA<0, B>1
0
L
logA>0, B<1
0
L
logA<0, B<1
0
L

142
Primjer 3.7.7.
Tablica 3.11.
Pretplatnici Interneta na području «Z»
u razdoblju od 2000. do 2008. god.
Godina
Broj pretplatnika
Interneta (
Y
t
)
Varijabla
vrijeme
(
X
t
)
t
Y
log
2000.
4
0
0,852060
2001.
7
1
0,987955
2002.
8
2
1,028090
2003.
12
3
1,162515
2004.
20
4
1,351030
2005.
32
5
1,536400
2006.
68
6
1,847215
2007.
151
7
2,185599
2008.
393
8
2,596937
Ukupno
695
36
13,547801
Izvor: Statistika područja «Z», 2009. god.
Zadatak je ocijeniti Gompertzov trend.
Gompertzov trend ima oblik:
X
B
A
L
Y
⋅
=
)
Ocjena parametara Gompertzovog trenda metodom parcijalnih suma je sljedeća:
297208
,
1
868105
,
2
049945
,
4
040045
,
4
629751
,
6
3
1
2
2
3
=
−
−
=
−
−
=
r
S
S
S
S
B
3
3
9
3
=
=
=
n
r
251039
,
0
)
1
297208
,
1
(
1
297208
,
1
)
868105
,
2
049945
,
4
(
)
1
(
1
)
(
log
2
3
2
1
2
=
−
−
−
=
−
−
⋅
−
=
r
B
B
S
S
A
622993
,
0
049945
,
4
2
629751
,
6
868105
,
2
049945
,
4
629751
,
6
868105
,
2
3
1
2
1
log
2
2
3
1
2
2
3
1
=
⋅
−
+
−
⋅
=
−
+
−
⋅
=
S
S
S
S
S
S
r
L
868105
,
2
028090
,
1
987955
,
0
852060
,
0
1
=
+
+
=
S
049945
,
4
536400
,
1
351030
,
1
162515
,
1
2
=
+
+
=
S
629751
,
6
596937
,
2
185599
,
2
847215
,
1
3
=
+
+
=
S
Transformacijom:
782540
,
1
10
10
251039
,
0
log
log
=
=
=
A
A
197526
,
4
10
10
622993
,
0
log
log
=
=
=
L
L
143
dobiju se vrijednosti parametara modela, stoga ocijenjeni model Gompertzovog
trenda glasi:
X
Y
297208
,
1
782540
,
1
197526
,
4
⋅
=
)
X=0
, 2000. godine
Jedinica za
X
je jedna godina
Jedinica za
Y
je 1 pretplatnik Internata
3.8. Procjene parametara
Intervalna procjena parametra
j
β
trend modela ocijenjenog metodom
najmanjih kvadrata uz odgovarajući nivo pouzdanosti procjene
)
1
(
α
−
je:
{
}
α
β
β
β
β
β
−
=
⋅
+
<
<
⋅
−
1
)
ˆ
(
ˆ
)
ˆ
(
ˆ
Pr
j
j
j
j
j
Se
t
Se
t
(3.8.1)
gdje je:
t
- odgovarajuća vrijednost iz tablica Studentove distribucije
α
−
1
- odgovarajući nivo pouzdanosti procjene (najčešće se uzima da je
95%),
)
ˆ
(
j
Se
β
- standardna pogrješka
ocijenjenog parametra koja se
izračunava:
jj
Y
j
s
Se
⋅
=
ˆ
ˆ
)
ˆ
(
σ
β
,
(3.8.2)
gdje
jj
s
predstavlja vrijednost odgovarajućeg dijagonalnog elementa u matrici
1
)
(
−
X
X
T
.
3.9. Pomični prosjeci
"Lokalni" trend modeli
ili metode izglañivanja vremenskih nizova
izmeñu ostalih su pomični prosjeci. Spadaju u
neparametrijske metode za
utvrñivanje trend komponente.

145
Pri izračunavanju vaganih pomičnih prosjeka uzima se neparan broj
frekvencija vremenskog niza (M=2m+1), ponderi su simetrični u odnosu na
središnji, a njihov zbroj je jednak nuli.
Primjer 3.9.1.
Tablica 3.12.
Instalirana računala u poslovnici «Z»
u razdoblju od 1997. do 2005. god.
Godina
Broj instaliranih
računala (
Y
t
)
Pomični prosjek
M=3
Pomični prosjek
M=4
1996.
45
*
*
1997.
64
49
*
1998.
37
43
47
1999.
29
45
49
2000.
69
52
48
2001.
58
53
53
2002.
33
54
56
2003.
72
52
52
2004.
50
56
*
2005.
46
*
*
Izvor: Podaci poslovnice «Z», 2006. god.
Zadatak je izračunati trogodišnje i četverogodišnje pomične prosjeke i grafički
ih prikazati.
Izraz za jednostavne pomične prosjeke glasi:
∑
−
=
+
=
m
m
s
s
t
t
Y
M
Y
1
*
)
t=m+1, m+2,…,(n-m)
Trogodišnji pomični prosjeci (
M=3, m=1
) iznose:
∑
−
=
+
=
1
1
*
3
1
s
s
t
t
Y
Y
)
t=2,3,…9
pa su vrijednosti sljedeće:
[
]
[
]
49
37
64
45
3
1
3
1
3
2
1
*
2
=
+
+
=
+
+
=
Y
Y
Y
Y
)
…
[
] [
]
56
46
50
72
3
1
3
1
10
9
8
*
9
=
+
+
=
+
+
=
Y
Y
Y
Y
)
Četverogodišnji centrirani pomični prosjeci (
M=4, m=2
) iznose:
146
+
+
=
∑
−
=
+
+
−
1
1
2
2
*
2
1
2
1
4
1
s
t
s
t
t
t
Y
Y
Y
Y
)
t=3,4,…8
vrijednosti su sljedeće:
47
69
2
1
29
37
64
45
2
1
4
1
2
1
2
1
4
1
5
4
3
2
1
*
3
=
⋅
+
+
+
+
⋅
=
+
+
+
+
=
Y
Y
Y
Y
Y
Y
)
…
52
46
2
1
50
72
33
58
2
1
4
1
2
1
7
2
1
4
1
10
9
8
9
6
*
8
=
+
+
+
+
⋅
=
⋅
+
+
+
+
=
Y
Y
Y
Y
Y
Y
)
Grafikon 15.
Instalirana računala u poslovnici «Z», trogodišnji i četverogodišnji
pomični prosjeci
0
20
40
60
80
100
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
M=3
M=4
Yt
Izvor: Tablica 3.12.
3.10. Standardna dekompozicija vremenske serije
Svaka
pojava
čije je kretanje predstavljeno u obliku
vremenskog niza
sastoji se od više komponenata
, koje su ponekad vidljive na prvi pogled (na
primjer iz grafičkog prikaza), a ponekad je potrebna složenija statistička analiza
da bi se te komponente utvrdile i analizirale.
Najčešća dekompozicija
vremenskog niza je
:

148
utjecaji javljaju s nepredvidivim djelovanjem u nekim vremenskim razdobljima.
Na primjer mogu se javiti zbog nepredvidivosti prirode poslovnih i
gospodarskih pojava, zbog iznenadne vremenske nepogode i slično.
Primjer 3.10.1.
Tablica 3.13.
Prevezeni putnici pomorskim prometom na području «Z»,
2001.-2005. god.
Prevezeni putnici
Godina I. kvartal II. kvartal III. kvartal
IV. kvartal
2001.
642
2369
3856
913
2002.
688
2174
4211
1052
2003.
579
2422
4196
863
2004.
727
2519
4327
986
2005.
825
2631
4528
1094
Izvor: Statistika područja «Z», ožujak 2006. god.
Zadatak je izračunati četverogodišnje pomične prosjeke, sezonske faktore,
rezidualne faktore (trend i cikličku komponentu) i seriju desezonirati te grafički
prikazati zadani niz i desezoniranu pojavu.
Rješenje:
Model glasi:
t
St
t
t
I
T
Y
ε
=
pri čemu je:
T
t
trend komponenta, odnosno pomični prosjeci
I
St
sezonska komponenta
t
ε
rezidualna komponenta
149
Godina,
kvartal
Broj
putnika
(
Y
t
)
Pomični
prosjeci
M=4
Prve procjene
sezonskih
faktora
Sezonski
faktori
Desezonirana
serija
Rezidualni
faktori
2001.: I.
642
*
*
0,3387364
1895,28
*
II.
2369
*
*
1,1570488
2047,45
*
III.
3856
1950,75
1,976676
2,0382841
1891,79
0,969774
IV.
913
1932,13
0,472537
0,4659307
1959,52
1,014178
2002.: I.
688
1952,13
0,352436
0,3387364
2031,08
1,040445
II.
2174
2013,88
1,079511
1,1570488
1878,92
0,932987
III.
4211
2017,63
2,087107
2,0382841
2065,95
1,023953
IV.
1052
2035,00
0,516953
0,4659307
2257,85
1,109507
2003.: I.
579
2064,13
0,280506
0,3387364
1709,29
0,828096
II.
2422
2038,63
1,188056
1,1570488
2093,26
1,026798
III.
4196
2033,50
2,063437
2,0382841
2058,59
1,012340
IV.
863
2064,13
0,418095
0,4659307
1852,21
0,897333
2004.: I.
727
2092,63
0,347411
0,3387364
2146,21
1,025607
II.
2519
2124,38
1,185761
1,1570488
2177,09
1,024815
III.
4327
2152,00
2,010688
2,0382841
2122,86
0,986461
IV.
986
2178,25
0,452657
0,4659307
2116,19
0,971511
2005.: I.
825
2217,38
0,372062
0,3387364
2435,52
1,098381
II.
2631
2256,00
1,166223
1,1570488
2273,89
1,007929
III.
4528
*
*
2,0382841
2221,48
*
IV.
1094
*
*
0,4659307
2347,99
*
Četverogodišnji centrirani pomični prosjeci (
M=4, m=2
) iznose:
+
+
=
∑
−
=
+
+
−
1
1
2
2
*
2
1
2
1
4
1
s
t
s
t
t
t
Y
Y
Y
Y
)
t=3,4,…18
i prikazani su u trećem stupcu tablice.
U četvrtom stupcu tablice dane su prve procjene sezonskih faktora kao omjer
odgovarajućih vrijednosti vremenskog niza i pomičnih prosjeka. S obzirom da
procjene sezonskih faktora za iste kvartale variraju treba izračunati prosjek za
iste kvartale, a to je učinjeno u sljedećoj tablici:

151
Grafikon 16.
Prevezeni putnici i desezonirana pojava
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
2001.:
I
II
III
IV
2002.:
I
II
III
IV
2003.:
I
II
III
IV
2004.:
I
II
III
IV
2005.:
I
II
III
IV
Prevezeni putnici
Desezonirana pojava
Izvor: Tablica 3.13.

154
17.
Charniak, E., Statistical Language Learning, A Bradford Book, The MIT
Press, Cambridge and Massachusetts, 1993.
18.
Chiang, A. C., Osnovne metode matematičke ekonomije. Mate, Zagreb,
1994.
19.
Cochran, W. G., Sampling Techniques, Wiley, New York, 1977.
20.
Dicky, D.A. and Fuller, W.A., Distribution of Estimators for Time Series
Regressions with a Unit Root, Journal of the American Statistical
Association, 74, 1979., pp. 427.-431.
21.
Dillon, W. R. and Goldstein, M., Multivariate Analysis, Methods and
Applications, Wiley, New York, 1984.
22.
Dodge, M., Kinata, C. i Stison, C., Kako koristiti Microsoft Excel 97, Znak,
Zagreb, 1997.
23.
Enders, W., Applied Econometric Time Series, 2
nd
edt., Wiley, Alabama,
2004.
24.
Engle, R.F., Autoregressive Conditional Heteroscedasticity with Estimates
of the Variance of United Kingdom Inflation, Econometrica, 50 (4), 1982.,
pp. 987.-1007.
25.
Feller, W., An Introduction to Probability Theory and its Applications, Vol.
I. and Vol. II., Wiley, New York, 1971.
26.
Fisher, R. A., Statistical Methods for Research Workers, 11
th
edt., Oliver
and Boyd, Edinburgh, 1950.
27.
Fisher, R. A., Statistical Methods, Experimental Design and Scientific
Inference, Oxford University Press, Oxford, 1993.
28.
Fruk, M., Sezonalnost prinosa dionica na Zagrebačkoj burzi, Financijska
teorija i praksa, 28 (4), 2004. pp. 435.-444.
29.
Frye, C., Microsoft Excel 2002. Korak po korak, Algoritam, Zagreb, 2003.
30.
Fulton, J., Vodič kroz Excel 97., Znak, Zagreb, 1997.
31.
GaYnor, P. and Kirkpatrick, R. C., Introduction to Time-Series Modelling
and Forecasting in Business and Modelling, McGraw-Hill, Inc., New York,
1994.
32.
Gujarati, D. N., Basic Econometrics, McGraw-Hill, Inc., New York, 1995.
33.
Hadživuković, S., Tehnika metoda uzorka, Naučna knjiga, Beograd, 1975.
34.
Harrell, F. E. Jr., Regression Modelling Strategies, With Applications to
Linear Models, Logistic Regression, and Survival Analysis, Springer, New
York, 2001.
155
35.
Heij, C., et. al. Econometrics Methods with Applications in Business and
Economics, Oxford University Press, New York, 2004.
36.
Horvatić, K., Linearna algebra, Golden marketing-Tehnička knjiga, Zagreb,
2004.
37.
Johnson, R. A. and Wichern, D. W., Applied Multivariate Statistical
Analysis, Prentice Hall, London, 2002.
38.
Jolliffe, I.T., Principal Component Analysis, Springer, Berlin, New York:
2002.
39.
Jovičić, M., Ekonometrijski metodi, Savremena administracija, Beograd,
1981.
40.
Jurun, E. and Pivac, S., Macroeconomic Modelling Relaxing Theoretic
Assumptions in the Croatian Financial Sphere, Proceedings of the 8
th
International Symposium on Operational Research, SOR'05, Nova Gorica,
Slovenia, 2005., pp. 285.-290.
41.
Kaplan, R. S., The Evaluation of Management Accounting, The Accounting
Review, 59 (3), 1984., pp. 95.-101.
42.
Karatzas, I. and Shreve, S E., Methods of Mathematical Finance, Springer,
Berlin, New York, 2001
43.
Kazmier, L. J., Business Statistics, Schaum’s, Outline Series, McGraw-Hill,
1996.
44.
Kendall, M. and Stuart, A., The Advanced Theory of Statistics, Vol I.,
Griffin, London, 1973.
45.
Kendall, M. and Stuart, A., The Advanced Theory of Statistics, Vol II.,
Griffin, London, 1974.
46.
Kendall, M. and Stuart, A., The Advanced Theory of Statistics, Vol III.,
Griffin, London.1976.
47.
Kish, L., Survey Sampling, Wiley, New York, 1965.
48.
Kmenta, J., Počela ekonometrije, MATE d.o.o., Zagreb, 1997.
49.
Kolesarić, V. i Petz, B., Statistički rječnik, Tumač statističkih pojmova,
Naklada Slap, Zagreb, 2003.
50.
De Levie, R., Advanced Excel for Scientific Data Analysis, Oxford
University Press, Oxford, 2004.
51.
Ljung, G.M., and Box G.E.P., On a Measure of Lack of Fit in Time Series
Models, Biometrica, 65 (2), 1978., pp. 297.-303.
52.
Lucey, T., Management Information Systems, DP Publication LTD,
London, 1989.

157
71.
Rozga, A., Statistika za ekonomiste, Sveučilište u Splitu, Ekonomski
fakultet Split, 2003.
72.
Rozga, A. i Grčić, B., Poslovna statistika, Ekonomski fakultet Split, 2003.
73.
Seddighi, H., R., Lawler, K. A. and Katos, A. V., Econometrics, A practical
approach, Routledge, London and New York, 2006.
74.
Seplaki, L., Atorneys' Dictionary and Handbook of Economics and
Statistics, Professional Horizons Press, New York, 1991.
75.
Serdar, V. i Šošić, I., Uvod u statistiku, Školska knjiga, Zagreb, 1994.
76.
Siegel, A. F., Practical Business Statistics, IRVIN Publishing, Boston,
Massachusetts, 1994.
77.
StatSoft, Statistica System Reference, StatSoft Inc., Tulsa, 2001
78.
Studenmund, A. H., Using Econometrics, A Practical Guide, Pearson
International Edition, Boston, New York, 2006.
79.
Šošić, I., Metode statističke analize, Sveučilišna naklada Liber, Zagreb,
1983.
80.
Šošić, I., Zbirka zadataka iz osnova statistike, Sveučilišna naklada Liber,
Zagreb, 1985.
81.
Šošić, I., Primijenjena statistika, Školska knjiga, Zagreb, 2004.
82.
Taylor, S.J., Modelling Financial Time Series, John Wiley & Sons, New
York, 1986.
83.
Tenjović, L., Statistika u psihologiji, Centar za primenjenu psihologiju,
Beograd, 2002.
84.
The Central Bureau of Statistics. Republic of Croatia, http:// www.dzs.hr,
2006.
85.
Vujković, T., Ekonometrijske metode i tehnike, Informator, Zagreb, 1976.
86.
Žarković, S. S., Sampling Methods and Censuses, FAO, Rim, 1965.
87.
Weisberg, H.F., Krosnick, J.A. and Bowen, B.D., Survey research, Polling
and Data Analysis, 3
rd
edt., Ohio State University, Assessment Systems
Corporation, USA, 2005.
88.
Whigham, D., Quantitative Business Methods Using Excel, Oxford
University Press, Oxford, 1998.
89.
Wonnacott, T. H. and Wonnacott, R. J., Introductory Statistics for Business
and Economics, 4
th
edt., Wiley, New York, 1990.
159
PRIVITAK UPORABA PROGRAMSKOG PAKETA
STATISTICA
1. Uvod
S razvojem računala, statistički programski paketi postali su osnovni
alat statističke analize. Neki od programa koji su namijenjeni statističkoj obradi
su
Statistica
,
SPSS
,
SAS
i razni drugi programski paketi. U nastavku je
objašnjena uporaba programskog sustava
Statistica
.
Većina zadataka u
Statistici
može se riješiti na više načina, a naveden je
u pravilu najjednostavniji način. U zadacima u kojima rješenje ovisi o razini
značajnosti ostavljena je razina signifikantnosti 0,05, koja je postavljena kao
pretpostavka u
Statistici
. Vrijednost je moguće promijeniti.
U
Statistici
se zadaci rješavaju otvaranjem odgovarajućih prozora u
kojima se izabiru potrebne varijable i izračuni. Kada se u prozoru označi sve
potrebno izabere se ponuñena tipka, u pravilu
SUMMARY
ili
OK
nakon čega
se dobiju rezultati ili se otvara novi prozor.
Kada se biraju varijable otvara se prozor s ponuñenim varijablama
Za svaku varijablu piše redni broj i kratki naziv varijable. Varijabla se
izabire klikom miša, a za varijablu se upiše redni broj varijable u polju:
Select variables:

161
1.1. Pokretanje programa Statistica
Program se pokreće klikom na tipku Start te izborom odgovarajućih
menija kojim se dolazi do programa
Statistica
. Najčešće se nalazi u meniju
Programs
i pod meniju
Statistica 7
.
START / PROGRAMS / STATISTICA 7 / STATISTICA
Drugi način pokretanja programa je pomoću ikone:
koja se može
nalaziti na radnoj površini (desktopu) ili radnoj traci (task baru).
Kada se
Statistica
pokrene pokazuju se dva prozora:
Manji prozor nudi izbor koji se dio sustava
Statistica
želi otvoriti.
Izborom predložene opcije
Open a STATISTICA Data File
, otvara se
posljednji korišteni dokument.
162
Radni list
(Spreadsheet) namijenjen je unosu, ureñivanju, prikazu i
pohrani podataka, a ima oblik tablice. Osnovni element radnog lista je
polje
(cell) u koje se unosi pojedini podatak. Polje se može odrediti kao presjek
stupca
koji predstavlja varijablu (variable) i
retka
koji predstavlja pojedini
slučaj (case). Polje se selektira klikom na lijevu tipku miša ili navigacijom
pomoću tastature. Polje koje je selektirano je aktivno polje, a koordinate tog
polja prikazane su u statusnoj traci (status baru). Adresa polja označava se s C i
rednim brojem retka te s V i rednim brojem stupca, tako npr. adresa (C3, V8)
označava polje u osmoj varijabli i trećem retku. Varijabla odnosno redak
selektira se klikom na
zaglavlje varijable
odnosno na odgovarajuće polje u
pred stupcu
.
U naslovnoj traci nalazi se naziv dokumenta (radnog lista), a u zagradi
je naveden broj varijabli (v) i redaka (c).
Prilikom unosa podataka iz tablice naslov se zapisuje u
informativno
polje
(info box) i u
zaglavlje
(header). Klikom na informativno polje selektira
se cijeli radni list, a dvostrukim klikom selektira se polje i omogućuje unos i
promjenu podatka. Zaglavlje je moguće selektirati jednim klikom miša, a
podaci se, takoñer, mogu unositi nakon dvostrukog klika lijevom tipkom miša.

164
Ponuñeno je staranje novog
radnog lista
(Spreadsheet),
izvješća
(Report),
makroa
(Macro (SVB) Program),
Radnih zapisa
(Workbook) i
otvaranje internetske stranice
(Browser Window).
Radni list kreira se izborom opcije:
Spreadsheet
Number of variables
–
Broj varijabli
. Unosi se broj stupaca, može se
predvidjeti veći broj stupaca u kojima će biti rezultati izračuna.
Number of cases
–
Broj redaka
. Upisuje se broj redaka u tablici.
Može se ostaviti ponuñeni broj stupaca i redaka (10×10), a broj
varijabli i broj redaka može se na jednostavan način promijeniti tijekom rada.
165
1.3. Unos podataka
Podatke iz primjera 1.1. treba unijeti u dokument.
U
zaglavlje
dokumenta upisuje se naziv tablice:
Starost i spol izabranih studenata upisanih na prvu godinu studija,
akademske godine 2008./2009., na Ekonomski fakultet u Rijeci
U
informativno polje
upisuje se naziv pred stupca:
Student/ica
Prije početka unosa podataka potrebno je definirati varijable.
Definiranje varijabli moguće je izvesti na više načina. U
Statistici
se većina
zadataka može izraditi na više načina, a svejedno je koji se način koristi.
Definiraju se dvije varijable: godine i spol izabranih studenata. Nakon
pozicioniranja na polje u odreñenoj varijabli može se izabrati:
DATA / VARIABLE SPECS...
ili
2 puta kliknuti na zaglavlje varijable
čime se otvara prozor za specifikaciju varijable:

167
Long name (label or formula with Functions )
–
Dugi naziv varijable
(ili formula)
– Unosi se dugi naziv, nema ograničenja dužine, stoga
treba dati što bolji opis
1. varijabla: upisati
Godine starosti izabranih studenata
2. varijabla: upisati
Spol izabranih studenata
U ovu rubriku može se upisati i formula kojom se izračunavaju vrijednosti
varijable. Formula započinje znakom jednakosti (=). Dugi naziv varijable u
tom slučaju dolazi nakon formule, a izmeñu se stavlja znak (;) točka sa
zarezom.
Type
–
Tip varijable
Predviñeni tip je
Double
. To je jedini tip varijable koji podržava
decimale. Moguće je unositi brojeve, slova i ostale znakove. Najbolje
je ostaviti ovaj tip varijable.
Umjesto otvaranja prozora za specifikaciju svake varijable posebno, moguće je
izabrati opciju za specificiranje svih varijabli na sljedeće načine:
Na već otvorenom prozoru za specifikaciju varijable izabere se:
168
ALL SPECS...
ili se preko sustava menija izabere
DATA / ALL VARIABLE SPECS…
Nakon čega se otvara prozor za specifikaciju svih varijabli.
Ukoliko varijabla može poprimiti neke odreñene vrijednosti modaliteta,
tada se mogu kodirati vrijednosti. Varijabla Spol može poprimiti dvije
vrijednosti:
Ženski
i
Muški
.
Pozicionirati se na drugoj varijabli i otvoriti prozor za specifikaciju
varijable ukoliko već nije otvoren
DATA / VARIABLE SPECS...
Izabrati tipku
Text Labels…
te se otvara prozor za kodiranje varijabli.

170
1.4. Spremanje dokumenta
Kod prvog spremanja
FILE / SAVE ili SAVE AS…
ili
<Crtl> + S
ili
Ikona
Ako se dokument snima prvi put, otvara prozor
Save As
u koji se unosi
naziv dokumenta i izabere direktorij u koji će biti spremljen. Radni list ima
nastavak
.sta
, izvješće ima nastavak
.str
, nastavak makroa je
.svb
, radni zapisi
označavaju se s
.stw
.
Ukoliko se u rubrici
Save as type
izabere neki drugi nastavak, tada se
dokument snima u nekom drugom formatu, npr. Excelu, SPSS-u i sl.
Kad je dokument jednom snimljen, za spremanje izmjena više se ne
koristi
Save As
, nego samo
Save
. Promjene se tada snimaju u već postojeću
datoteku.
171
1.5. Otvaranje dokumenta
Postojeći dokument otvara se:
FILE / OPEN…
ili
<Crtl> + O
ili
Ikona
Prikazuje se prozor u kojem se izabere direktorij i dokument koji ima
neki od ponuñenih nastavaka. U rubrici
Files of Type
može se izabrati neki
drugi tip dokumenta.
1.6. Prikazivanje rezultata obrade
Rezultati statističkih izračuna prikazuju se u prozoru radnih zapisa
(Workbook), a moguće ih je dobiti i u obliku izvješća.
Da bi se pokrenulo zapisivanje rezultata u izvješće, potrebno je putem
menija izabrati:
TOOLS / OPTIONS...
Nakon otvaranja prozora izabere se rubrika:
OUTPUT MANAGER

173
Zapisivanje rezultata u izvješće može se izvršiti na više načina:
Multiple Reports (one for each Analysis/graph)
– stvaranje više
prozora, po jedan prozor za svaku analizu ili grafički prikaz
Single Report (common for all
Analysis/graphs)
– kreira se jedno
izvješće, zajedničko za sve analize i grafikone
Existing Report
– rezultati se unose u neko već postojeće izvješće
Uz to moguće je izabrati i:
Display supplementary information:
Brief
– kratke
Medium
– srednje
Long
– duge
Comprehensive
– iscrpne
– prikazuju se dodatne informacije
174
1.7. Definiranje varijable formulom
Varijabla se može definirati formulom. Tada se u rubrici dugi naziv
varijable, upisuje znak = , a nakon toga slijedi formula. Moguće je koristiti
standardne matematičke operacije ili neku od ponuñenih funkcija koja se dobije
pritiskom na tipku
Functions
.
Ako se nakon formule upiše
;
može se u nastavku upisati dugi naziv
varijable.

176
Osim mijenjanja izgleda, moguće je i dodavanje ili brisanje pojedinog
stupca ili retka.
Dodavanje novih stupaca:
INSERT / ADD VARIABLES…
Otvara se prozor za dodavanje varijabli:
177
How many
– broj novih stupaca
After
– nakon koje varijable se unose nove
Dodavanje novih redaka:
INSERT / ADD CASES…
Otvara se prozor za dodavanje redaka:

179
2. Grafičko prikazivanje nominalnih (atributivnih) nizova
U
Statistici
je moguće napraviti razne vrste grafikona kao i njihove
kombinacije. Prikazani su jednostavni stupci, dvostruki stupci i strukturni krug.
Primjer 2.1.
Stanovništvo prema spolu u jadranskim županijama, popis 2001. god.
Županija
Žene
Muškarci
Istarska
106.375
99.969
Primorsko – goranska
158.290
147.215
Ličko – senjska
27.182
26.495
Zadarska
82.404
79.641
Šibensko – kninska
58.225
54.666
Splitsko – dalmatinska
237.545
226.131
Dubrovačko – neretvanska
63.492
59.378
Izvor: Popis stanovništva 2001, DZS, str. 86. – 97.
a)
Prikažite grafički jednostavne stupce za žene
b)
Prikažite grafički dvostruke stupce
c)
Strukturnim krugom prikažite raspodjelu muškaraca po županijama
Rješavanje zadatka započinje kreiranjem novog dokumenta.
U zaglavlje dokumenta upisati:
Stanovništvo prema spolu u jadranskim županijama, popis
2001. god.
180
Definirati pred stupac:
U informativno polje upisati
Županija
Upisati vrijednosti u pred stupac:
Županija
Istarska
Primorsko – goranska
Ličko – senjska
Zadarska
Šibensko – kninska
Splitsko – dalmatinska
Dubrovačko - neretvanska
Definirati varijable:
Kratki naziv:
Zene
, dugi naziv:
Žene
Unijeti vrijednosti (unositi brojke bez točke i bez razmaka):
Žene
106375
158290
27182
82404
58225
237545
63492
Kratki naziv:
Muskarci
, dugi naziv:
Muškarci
Unijeti vrijednosti:
Muškarci
99969
147215
26495
79641
54666
226131
59378

182
Variables:
1 – Zene
183
OPTIONS 1

185
Ukoliko se želi promijeniti nešto na grafikonu, potrebno je prvo
selektirati željeni dio klikom miša. Nakon toga se izabere:
FORMAT / SELECTION
ili
2 puta kliknuti
186
Promjena formata ispisa vrijednosti na ordinati:
Selektirati os y
FORMAT / SELECTION ili 2 puta kliknuti¸
SCALE VALUES
Automatic – at major tickmarks
Value Format:
General

188
Ukloniti legendu:
Selektirati legendu
FORMAT / SELECTION ili 2 puta kliknuti
DISPLAY – ukloniti oznaku
Graf sada izgleda:
189

191
OPTIONS 1
Case labels:
Case Names
Display Default Title – ukloniti oznaku
Custom Title:
Stanovništvo prema spolu u jadranskim županijama, popis
2001. god.
Show on Top
Footnote:
Izvor: Popis stanovništva 2001, DZS, str. 86. – 97.
192
Dobije se grafikon:

194
Area pattern
Foreground color
Background color
Area style
Type
Automatski se promijeni legenda.
Isto se može napraviti za “muškarce”. Sljedeći grafikon je primjer s
promijenjenim izgledom stupaca i promijenjenim formatom ispisa vrijednosti
na ordinati.
195
c) Strukturnim krugom treba prikazati raspodjelu muškaraca po županijama
GRAPHS / 2D GRAPHS / PIE CHARTS
QUICK
Graph type:
Pie Chart – Values
Variables:
2 – Muskarci
OPTIONS 1

197
Ukloniti natpis “Muskarci” na grafikonu:
Selektirati natpis “Muskarci”
FORMAT / SELECTION ili 2 puta kliknuti¸
198
DISPLAY – ukloniti oznaku
Za svaki kružni isječak može se napisati naziv županije, broj muškaraca
u županiji te udio u ukupnom broju muškaraca jadranskih županija
Selektirati nazive županija
FORMAT / SELECTION ili 2 x kliknuti
PROPERTIES
Text labels
(prikazuje se naziv pojedinog kružnog
isječka “županije”)
Counts
(vrijednost varijable “broj muškaraca”)
Counts format
Value Format: General
Percentage
(udio u ukupnom zbroju varijable)
Percentage format
Decimal
Places:
2
(Broj
prikazanih
decimala)

200
FORMAT / SELECTION ili 2 puta kliknuti
SLICES DISPLAY
(izgled pojedinog kružnog isječka)
Area
Exploded
SHAPE
(oblik)
TYPE
(dodavanje treće dimenzije)
PLACEMENT
(smještaj grafa)
Grafikon s promijenjenim izgledom:
201
3. Numerički nizovi
Primjer 3.1.
Zaposleni u ustanovi “A” prema pripadajućem broju dana
godišnjeg odmora, na dan 31.12. 2008.
Dani godišnjeg odmora
Broj zaposlenih
X
i
f
i
25
7
26
12
27
14
28
18
29
13
30
11
Ukupno
75
Izvor: Kadrovska služba (simulirani podaci)
Zadatak je:
a)
izračunati srednje vrijednosti
b)
odrediti ukupan broj dana godišnjih odmora svih zaposlenih
c)
izračunati mjere disperzije
d)
odrediti kvartile
e)
izračunati najmanju i najveću vrijednost
f)
odrediti asimetriju
g)
odrediti zaobljenost.
Prisutne su dvije varijable: varijabla “
Dani godišnjeg odmora
” koja
predstavlja numeričko obilježje i označava se s
X
i
i varijabla “
Broj zaposlenih
”
koja predstavlja frekvenciju odnosno ponder što se označava s
f
i
.
Kreira se novi dokument:
U
zaglavlje
dokumenta upisati:
Zaposleni u ustanovi “A” prema pripadajućem broju dana
godišnjeg odmora, na dan 31.12. 2008. godine.

203
Funkcije deskriptivne statistike moguće je pokrenuti putem menija:
STATISTICS / BASIC STATISTIC/TABLES
U rubrici QUICKzabere se:
DESCRIPTIVE STATISTICS
ADVANCED
čime se otvara prozor s mjerama deskriptivne statistike.
204
Prilikom računanja potrebno je označiti na koju se varijablu odnose
izračuni:
Izabere se tipka:
Variable
Otvara se prozor za izbor varijable te se izabere varijabla koja
predstavlja numeričko obilježje: Xi.

206
Računati se mogu i neke nepotpune mjere raspršenosti, kao i mjere koje
su potrebne za njihovo računanje:
Range
–
raspon varijacije
Quartile range
–
interkvartil
Minimum & maximum
–
najmanja i najveća vrijednost
Lower & upper quartiles
–
donji i gornji kvartil
Ponuñeno je odreñivanje asimetrije i zaobljenosti:
Skewness
–
koeficijent asimetrije
uzorka
Kurtosis
–
eksces uzorka
– Gleda se je li mjera manja ili veća od 0, a
ne od 3.
Mogu se označiti funkcije koje se traže ili označiti:
Select all stats
Čime se pokreće izračun svih funkcija.
U primjeru 3.1. za kontrolu unosa može se označiti:
a)
Izračunajte srednje vrijednosti
MEAN, MEDIAN, MODE
b)
Odredite ukupan broj dana
godišnjih
odmora
svih
zaposlenih
SUM
c)
Izračunajte mjere disperzije
STANDARD
DEVIATION,
VARIANCE,
RANGE,
QUARTILE RANGE
d)
Odredite kvartile
LOWER
&
UPPER
QUARTILES
e)
Izračunajte najmanju i najveću
vrijednost
MINIMUM & MAXIMIM
f)
Odredite asimetriju
SKEWNESS
g)
Odredite zaobljenost
KURTOSIS
207
Osim toga za kontrolu unosa može se izabrati :
Valid N
Pritiskom na tipku
SUMMARY
pokreće se računanje.
Otvara se prozor za prikaz rezultata:

209
Provjera: “ukupan broj zaposlenih” (zbroj frekvencija) je 75 kao što je
zadano (Valid N).
a)
Izračun srednjih vrijednosti:
8888
= 27,68 dana
M
e
= 28 dana
M
o
= 28 dana
Prosječan broj dana godišnjeg odmora zaposlenih u ustanovi A iznosi
27,68 dana.
Meñu zaposlenima u ustanovi A 50% ima 28 ili manje dana godišnjeg
odmora, odnosno 50% zaposlenih ima 28 dana godišnjeg odmora ili više.
Najčešći broj dana godišnjeg odmora je 28, što je slučaj kod 18 radnika.
b)
Odreñivanje ukupnog broja dana godišnjih odmora svih zaposlenih (total):
ΣX = 2076 dana
Ukupan broj dana godišnjeg odmora svih zaposlenih je 2076 dana.
c)
Izračun mjera disperzije:
σ
σσ
σ
= 1,534821 dana*
σ
σσ
σ
2
= 2,355676 dana*
R
x
= 5 dana
I
Q
= 3 dana
* Pretpostavlja se da se radi o uzorku, a ne o cijelom osnovnom
skupu. Standardna devijacija i mjere koje iz toga proizlaze nešto se razlikuju
od stvarnih.
Razlika izmeñu najdužeg i najkraćeg godišnjeg odmora je 5 dana.
Raspon varijacija središnjih 50% jedinica je 3 dana. Prosječno odstupanje od
prosjeka je 1,534821 dana (ovo je približna vrijednost).
210
d)
Odreñivanje kvartila:
Q
1
= 26 dana
Q
3
= 29 dana
U 25% slučajeva zaposleni imaju 26 ili manje dana godišnjeg odmora, a
75% zaposlenih ima 26 ili više dana godišnjeg odmora.
Zaposleni u 75% slučajeva imaju 29 ili manje dana godišnjeg odmora, a
u 25% slučajeva odmor traje 29 ili više dana.
e)
Izračun najmanje i najveće vrijednosti:
X
min
= 25 dana
X
max
= 30 dana
Zaposleni u ustanovi A imaju najmanje 25, a najviše 30 dana godišnjeg
odmora.
f)
Odredite asimetriju
Skewness =
α
α
α
α
3
= -0,108270
Mjera asimetrije
α
3
iznosi -0,108270, a to znači da je raspodjela blago
negativno ili lijevostrano asimetrična.
g)
Odreñivanje zaobljenosti:
Kurtosis =
Eksces =
κκκκ
=
-0,965234
Eksces je -0,9652342, a to znači da je raspodjela zaobljenija od
normalne.

212
d)
izračun mjera odstupanja od prosjeka:
σ
σσ
σ
2
= 6011
σ
σσ
σ
= 77,53064 t
e)
odreñivanje najmanje i najveće proizvodnje po pogonu i raspon varijacija:
X
min
= 128 t
X
max
= 333 t
R
x
= 205 t
f)
odreñivanje kvartila i interkvartila:
Q
1
= 199 t
Q
3
= 275 t
I
Q
= 76 t
4. Regresijska i korelacijska analiza
4.1. Jednostavna linearna regresija
Primjer 4.1.
Brodarska kompanija “C” vrši isporuke na udaljenosti do 1000
nautičkih milja. Upravu zanima odnos izmeñu udaljenosti koje teret mora
prijeći i vremena isporuke u danima. U tu svrhu slučajno je izabrano 10
isporuka izvršenih u ožujku 2006. godine. Udaljenosti u nautičkim miljama i
vrijeme isporuke u danima prikazani su u sljedećoj tablici:
213
Isporuka
Udaljenost
(nautičke milje)
Vrijeme isporuke
(dani)
1
751
7
2
532
3
3
632
2
4
917
12
5
503
2
6
732
4
7
830
6
8
866
8
9
601
5
10
763
4
Izvor: Podaci brodarskog društva “C”
Zadatak je:
a)
odrediti jednadžbu jednostavne linearne regresije
b)
prikazati dijagram rasipanja
c)
u dijagramu rasipanja prikazati pravac regresije
d)
izvršiti interpolaciju
e)
procijeniti vrijeme trajanja isporuke za udaljenost od 600
nautičkih milja.
a)
Izračun srednjih vrijednosti:
U
zaglavlje
dokumenta upisati:
Udaljenosti i vrijeme isporuke u brodarskom društvu “C” za izabrane
isporuke

215
STATISTICS / MULTIPLE REGRESSION
QUICK
Variables
Dependenet:
2-Vrijeme
(zavisna varijabla)
Independenet:
1-Udaljenost
(nezavisna varijabla)
216
Pritiskom na tipku OK pokreće se računanje:

218
Nakon toga provjerava se reprezentativnost svakog parametra.
Izračunati parametri uvrštavaju se u jednadžbu samo ako su dovoljno značajni.
To je postignuto ako je
p-level < 0,05
za svaki parametar. Te retke
Statistica
dodatno označava crvenom bojom (odbacuje se nul-hipoteza da je parametar =
0).
Regression Summary for Dependent Variable: Vrijeme (Udaljenost i vrijeme isporuke.sta)
R= ,82710398 R2= ,68410100 Adjusted R2= ,64461362
F(1,8)=17,325 p<,00316 Std.Error of estimate: 1,8439
N=10
Beta
Std.Err.
of Beta
B
Std.Err.
of B
t(8)
p-level
Intercept
Udaljenost
β0
= -7,628889 3,160459 -2,41385
0,042253<0,05
0,827104 0,198714
β1
= 0,01814
0,004358
4,16228
0,003155<0,05
Svi parametri su reprezentativni.
Jednadžba linearne regresije glasi:
Ŷ = -7,62889 + 0,01814 X
X je udaljenost u nautičkim miljama
Y je vrijeme isporuke u danima
219
b)
Prikaz dijagrama rasipanja:
GRAPHS / SCATTERPLOTS
QUICK
Graph type:
Regular
Variables:
X:
1 - Udaljenost
Y:
2 – Vrijeme
Fit type:
Linear

221
-
dobije se grafikon s jednadžbom regresije i ucrtanim pravcem regresije:
222

224
-
u grafikonu su dodani i r
2
, r, p te jednadžba regresije.
225
d)
Interpolacija:
Interpolacija je procjena regresijskih vrijednosti zavisne varijable na
temelju zadanih vrijednosti nezavisne varijable. Interpolirati se može ako
postoji jednadžba regresije.

227
RESIDUAL/ASSUMPTIONS/PREDICTION
PERFORM RESIDUAL ANALISYS
228
ADVANCED
Summary: residuals & predicted
Rezultati:
Interpolacija je izračunata u varijabli
Predicted Value
Predicted & Residual Values (Udaljenost i vrijeme isporuke.sta)
Dependent variable: Vrijeme
Case No.
Observed
Value
Predicted
Value
Residual
Standard
Pred. v.
Standard
Residual
Std.Err.
Pred.Val
Mahalanobis
Distance
1
2
3
4
5
6
7
8
9
10
Minimum
Maximum
Mean
Median
7,00000
5,994790
1,00521
0,27159
0,54516 0,606507
3,00000
2,021972
0,97803
-1,28136
0,53042 0,979914
2,00000
3,836044
-1,83604
-0,57225
-0,99575 0,680950
12,00000
9,006148
2,99385
1,44871
1,62368 1,064342
2,00000
1,495892
0,50411
-1,48700
0,27340 1,084107
4,00000
5,650116
-1,65012
0,13686
-0,89492 0,589120
6,00000
7,427906
-1,42791
0,83179
-0,77441 0,775467
8,00000
8,080972
-0,08097
1,08707
-0,04391 0,886788
5,00000
3,273682
1,72632
-0,79208
0,93625 0,759598
4,00000
6,212478
-2,21248
0,35668
-1,19991 0,622934
2,00000
1,495892 -2,21248
-1,48700
-1,19991 0,589120
12,00000
9,006148
2,99385
1,44871
1,62368 1,084107
5,30000
5,300000
0,00000
0,00000
0,00000 0,804973
4,50000
5,822453
0,21157
0,20422
0,11474 0,767532
U 1. slučaju, kada je udaljenost iznosila 751 nautičku milju, predviñeno vrijeme
isporuke bi bilo 5,99 dana.

230
RESIDUAL/ASSUMPTIONS/PREDICTION
Predict dependent variable
Specifiy values for indep. vars: Udaljenost
600
231
Rezultati:
Predicting Values for (Udaljenost i vrijeme isporuke.sta)
variable: Vrijeme
Variable
B-Weight
Value
B-Weight
* Value
Udaljenost
Intercept
Predicted
-95,0%CL
+95,0%CL
0,018141 600,0000 10,88443
-7,62889
3,25554
1,49745
5,01364
Predviñeno vrijeme trajanja isporuke za udaljenost od 600 nautičkih milja, na
razini 95% pouzdanosti, je izmeñu 1,49745 i 5,01364 dana.
4.2. Linearna korelacija
Primjer 4.2.
Za podatke iz primjera 4.1. odredite koeficijent linearne korelacije.

233
Varijable je moguće unijeti na dva načina:
One variable list
–
ako se želi dobiti matrica koeficijenata korelacije
Two variable list (rect. matrix)
–
za izračun samo odreñenih
koeficijenata korelacije.
234
Two variable list (rect. matrix)
First variable list:
1-Udaljenost
Second variable list (optional):
2-Vrijeme

236
4.3. Spearmanov koeficijent korelacije ranga
Bruto domaći proizvod po stanovniku u USD u tekućim cijenama i prema
paritetu kupovne moći u zemljama srednje i istočne Europe u 2007. god.
Zemlja
BDP po stanovniku,
tekuće cijene, USD
BDP po stanovniku,
PPP, USD
Albanija
3.431
6.319
BIH
3.809
7.081
Bugarska
5.186
11.311
Češka
16.856
24.088
Hrvatska
13.199
17.732
Mañarska
13.752
18.956
Makedonija
3.874
8.561
Poljska
11.143
16.323
Rumunjska
7.850
11.456
Slovačka
13.898
20.275
Slovenija
23.511
27.901
Srbija
5.477
10.019
Izvor: International Monetary Fund, World Economic Outlook Database, April 2009. god.
Zadatak je odrediti korelaciju ranga:
U zaglavlje dokumenta treba upisati:
Bruto domaći proizvod po stanovniku u USD u tekućim cijenama i prema
paritetu kupovne moći u zemljama srednje i istočne Europe u 2007. god.
Stupac zemlja može se unijeti kao pred stupac:
U informativno polje upisati
Zemlja
Definiranje varijabli:
Kratki naziv:
BDP_pc
, dugi naziv:
BDP po stanovniku u tekućim cijenama USD
237
Kratki naziv:
BDP_pc_PPP
, dugi naziv:
BDP po stanovniku, PPP, USD
Unijeti vrijednosti.
Korelacija ranga računa se na sljedeći način:
STATISTICS / NONPARAMETRICS
QUICK
Izabire se:
CORRELATIONS (SPEARMAN, KENDALL TAU, GAMMA)
Otvara se prozor za izračun Spearmanove korelacije ranga:

239
Rezultat:
Spearman Rank Order Correlations (GDP pc.sta)
MD pairwise deleted
Marked correlations are significant at p <,05000
Variable
BDP_pc BDP_pc_PPP
BDP_pc
BDP_pc_PPP
1,000000
0,993007
0,993007
1,000000
Ako je koeficijent statistički značajan na razini 0,05 označen je
crvenom bojom. Spearmanov koeficijent korelacije ranga izmeñu bruto
domaćeg proizvoda po stanovniku u USD u tekućim cijenama i prema paritetu
kupovne moći iznosi 0,993. Koeficijent je statistički značajan.
5. Analiza vremenskih nizova
5.1. Bazni i verižni indeksi
Primjer 5.1.
Proizvodnja proizvoda “D” u Hrvatskoj u razdoblju 1999.-2005. god.
Godina
Proizvodnja u
tisućama T
1999.
1361
2000.
1130
2001.
1078
2002.
1274
2003.
1434
2004.
1288
2005.
1602
Izvor: Podaci tvornice D (simulirani podaci)
Zadatak je:
a)
izračunati indekse na bazi proizvodnje u 1999. god.
b)
protumačiti dobivene vrijednosti
c)
izračunati verižne indekse
d)
preračunati indekse 1999.=100 u verižne
e)
protumačiti dobivene vrijednosti
f)
izračunati indekse prosjek=100
g)
protumačiti dobivene vrijednosti.
240
a)
Izračun indeksa na bazi proizvodnje u 1999. god:
U
zaglavlje
dokumenta upisati:
Proizvodnja proizvoda “D” u Hrvatskoj u razdoblju 1999.-2005. god.
Stupac godine može se unijeti kao pred stupac:
U informativno polje upisati
Godina
Definirati varijablu:
Kratki naziv:
Yt
, dugi naziv:
Proizvodnja proizvoda D u tisućama tona
Unijeti vrijednosti.
Bazni indeksi računaju se po formuli:
100
⋅
=
b
t
t
Y
Y
I
Baza je proizvodnja u 1999. god., tj. 1361 tisuća
t
. Otvara se nova
varijabla, b1999, u kojoj se bazni indeksi računaju prema formuli:
100
1361
⋅
=
t
t
Y
I
Definirati novi stupac –
b1999
Long name:
=Yt/1361*100

242
Nakon upozorenja o računanju vrijednosti nove varijable dobiju se tumačenja
indeksa:
243
Po želji mogu se prikazati vrijednosti varijable zaokružene na dvije decimale:
DATA / VARIABLE SPECS...
Display format
Number
Decimal places
2
Varijabla porast s vrijednostima zaokruženima na 2 decimale:

245
Stvaranje nove varijable s kopiranim vrijednostima varijable Yt:
Definirati varijablu: Y_lani, dugi naziv
=Yt
Pomicanje varijable za 1 godinu Yt:
DATA / SHIFT (LAG)
Variables:
4 – Y_lani
Lag:
1
Direction :
Forward
246

248
d)
Tumačenje dobivenih vrijednosti:
Definirati novi stupac –
porast_ver
Long name:
=verizni-100;Tumačenje verižnih indeksa
Varijabla se može zaokružiti na 2 decimale:
Display format
Number
Decimal places
2
249

251
Definirati varijablu: b1999_lani, dugi naziv =b1999
DATA / SHIFT (LAG)
Variables:
7 – b1999_lani
Lag:
1
Direction :
Forward
252
2. korak – preračunati bazne u verižne indekse:
Definirati novi stupac –
verizni2
Long name:
=b1999/b1999_lani*100
Vrijednosti su iste kao pod c).

254
Prosjek je zapisan u novome, 13., retku. Kod kreiranja novih varijabli izračunat
će se i vrijednosti za taj redak, ali one ne spadaju u rješenje zadatka.
Definirati novi stupac –
b_prosjek
Long name:
=Yt/1309,571*100
g)
Tumačenje dobivenih vrijednosti:
Definirati novi stupac –
porast_pros
Long name:
=b_prosjek-100;Porast proizvodnje u odnosu na prosjek
Varijabla se može zaokružiti na 2 decimale:
255
Display format
Numbe
r
Decimal places
2

257
5.2. Linearni trend
Primjer 5.3.
Izvoz zemlje “B” u razdoblju 2002.-2008. god. u milijunima USD
Godina
Izvoz u mil. USD
2002.
6616
2003.
6534
2004.
7204
2005.
7349
2006.
6946
2007.
7856
2008.
8136
Izvor: Zavod za Statistiku zemlje B (simulirani podaci)
Zadatak je:
a)
ocijeniti jednadžbu linearnog trenda
b)
izvršiti interpolaciju
c)
procijeniti koliki će biti izvoz prema trendu u 2011. godini.
a)
Ocjena jednadžbe linearnog trenda:
Jednadžba trenda računa se na isti način kao i jednadžba regresije, s time da je
nezavisna varijabla vremenska jedinica.
U
zaglavlje
dokumenta upisati:
Izvoz zemlje “B” u razdoblju od 2002. do 2008. u milijunima USD
Stupac “godine” može se unijeti kao pred stupac:
U informativno polje upisati
Godina
Definirati varijablu:
Kratki naziv:
Izvoz
, dugi naziv:
Izvoz u milijunima USD
258
Vremenska varijabla odreñuje se na sljedeći način:
Definirati varijablu:
Kratki naziv:
X
, dugi naziv:
Vremenska varijabla
-
Unijeti vrijednosti:
30.06.2002.
2005
.
2004
.
2006
.
2007
.
2008
.
1
0
2
3
4
5
6
2002
.
2003
.

260
Variables
Dependenet:
1-Izvoz
(zavisna varijabla)
Independenet:
2-X
(nezavisna varijabla)
OK
261
Za prikaz rezultata u prozoru radnih zapisa izabere se:
QUICK
Summary: Regression Results

263
b)
Izvršiti interpolaciju
Interpolacija se vrši na isti način kao i kod regresije. Započinje se kao i kod
računanja parametara:
STATISTICS / MULTIPLE REGRESSION
QUICK
Variables
Dependenet:
1-Izvoz
Independenet:
2-X
OK
264
RESIDUAL/ASSUMPTIONS/PREDICTION
PERFORM RESIDUAL ANALISYS
ADVANCED
Summary: residuals & predicted
Predicted & Residual Values (izvoz - linearni trend.sta)
Dependent variable: Izvoz
Case No.
Observed
Value
Predicted
Value
Residual Standard
Pred. v.
Standard
Residual
Std.Err.
Pred.Val
Mahalanobis
Distance
Deleted
Residual
Cook's
Distance
2002.
2003.
2004.
2005.
2006.
2007.
2008.
Minimum
Maximum
Mean
Median
6616,000
6490,214
125,786
-1,38873
0,42098 203,5907
1,928571
234,800 0,143358
6534,000
6738,286
-204,286
-0,92582
-0,68371 159,7097
0,857143 -286,000 0,130889
7204,000
6986,357
217,643
-0,46291
0,72842 126,2616
0,214286
264,957 0,070210
7349,000
7234,429
114,571
0,00000
0,38345 112,9318
0,000000
133,667 0,014295
6946,000
7482,500
-536,500
0,46291
-1,79558 126,2616
0,214286 -653,130 0,426630
7856,000
7730,571
125,429
0,92582
0,41979 159,7097
0,857143
175,600 0,049343
8136,000
7978,643
157,357
1,38873
0,52665 203,5907
1,928571
293,733 0,224352
6534,000
6490,214 -536,500
-1,38873
-1,79558 112,9318
0,000000 -653,130 0,014295
8136,000
7978,643
217,643
1,38873
0,72842 203,5907
1,928571
293,733 0,426630
7234,429
7234,429
0,000
0,00000
0,00000 156,0079
0,857143
23,375 0,151297
7204,000
7234,429
125,429
0,00000
0,41979 159,7097
0,857143
175,600 0,130889
Rezultati su zapisani u stupcu
Predicted Value
:
Izvoz bi prema trendu iznosio 6490,2 milijuna USD za 2002. godinu.

266
OK
RESIDUAL/ASSUMPTIONS/PREDICTION
Predict dependent variable
Specifiy values for indep. vars: x
9
267
Rezultati:
Predicting Values for (izvoz - linearni trend.sta)
variable: Izvoz
Variable
B-Weight
Value
B-Weight
* Value
x
Intercept
Predicted
-95,0%CL
+95,0%CL
248,0714 9,000000 2232,643
6490,214
8722,857
7804,847
9640,868
Na razini 95% pouzdanosti procjenjuje se da će izvoz zemlje “B” u 2011.
godini iznositi izmeñu 7804,8 i 9640,9 milijuna USD.
Primjer 5.4.
Proizvodnja proizvoda „A“ na području “Z” u razdoblju od 1998. do
2008. god.
Godina
Proizvodnja čelika u tis. t
1998.
1741
1999.
1645
2000.
1972
2001.
1921
2002.
2215
2003.
2068
2004.
2297
2005.
2268
2006.
2548
2007.
2415
2008.
2746
Izvor: Zavod za statistiku područja Z (simulirani podaci)
Zadatak je:
a)
Odrediti linearni trend
b)
Odrediti interpolaciju za 2004. godinu
c)
Procijeniti koliki će biti izvoz prema trendu 2014. godine

269
a)
Izračun paraboličnog trenda drugog stupnja
U
zaglavlje
dokumenta upisati:
Uvoz zemlje C u milijunima USD u razdoblju 2000. – 2008.
god.
Stupac godine može se unijeti kao pred stupac:
U informativno polje upisati
Godina
Definirati varijable:
Kratki naziv:
Uvoz
, dugi naziv:
Uvoz u milijunima USD
Kratki naziv:
X
, dugi naziv:
Vremenska varijabla
270
Opći oblik jednadžbe trend polinoma drugog stupnja je:
......
,
0
.....
.....
ˆ
ˆ
ˆ
ˆ
2
1
0
=
=
=
⋅
+
⋅
+
=
X
Y
za
jedinica
X
za
jedinica
X
X
Y
β
β
β
Računa se:
- reprezentativnost trenda i
- parametri jednadžbe
Tek ako je trend reprezentativan može se napisati jednadžba trenda.
STATISTICS / ADVANCED LINEAR/NONLINEAR MODELS /
GENERAL REGRESSION MODELS
QUICK

272
OK
Quick
All effects
273
Test of SS Whole Model vs. SS Residual (trend polinom 2 stupnja.sta)
Dependnt
Variable
Multiple
R
Multiple
R2
Adjusted
R2
SS
Model
df
Model
MS
Model
SS
Residual
Uvoz
0,899632 0,809339
0,745785
10804514
2 5402257 2545294
(Nastavak ispisa)
Test of SS Whole Model vs. SS Residual (trend polinom 2 stupnja.sta)
Dependnt
Variable
df
Model
MS
Model
SS
Residual
df
Residual
MS
Residual
F
p
Uvoz
2 5402257
2545294
6 424215,6 12,73470
0,006931
Trend je reprezentativan:
2
R
= 0,745785
> 0,6
P = 0,006931
< 0,05
Istovremeno su se izračunali i parametri jednadžbe trenda.
Lijevi dio prozora u rezultatima zapisa služi za navigaciju meñu rezultatima.
Izborom rubrike
Parameter Estimates
prelazi se u prozor s izračunatim
parametrima modela.
(Rubrika
Test of SS Whole Model vs. SS Residual
,
sadrži korištene podatke o reprezentativnosti trenda u cjelini).
Parameter Estimates (trend polinom 2 stupnja.sta)
Sigma-restricted parameterization
Effect
Uvoz
Param.
Uvoz
Std.Err
Uvoz
t
Uvoz
p
-95,00%
Cnf.Lmt
+95,00%
Cnf.Lmt
Intercept
X
X^2
β0=
6577,109
529,3764 12,42426 0,000017 5281,772 7872,447
β1=
1136,468
308,5757
3,68295 0,010295
381,411 1891,526
β2=
-96,617
37,1123 -2,60336 0,040479 -187,427
-5,806

275
Resids
Predicted and residuals
Rezultati:
Interpolacija je zapisana u rubrici
Predictd
.
Observed, Predicted, and Residual Values (trend polinom 2 stupnja.sta)
Sigma-restricted parameterization
(Analysis sample)
Case name
Uvoz
Observed
Uvoz
Predictd
Uvoz
Resids
2000.
2001.
2002.
2003.
2004.
2005.
2006.
2007.
2008.
6825,00
6577,109
247,89
6885,00
7616,961
-731,96
8671,00
8463,578
207,42
9609,00
9116,962
492,04
9642,00
9577,113
64,89
9762,00
9844,029
-82,03
10173,00
9917,712
255,29
8710,00
9798,161
-1088,16
10120,00
9485,376
634,62
Trend vrijednost za 2000. godinu je 6577,109 milijuna USD.
Vrijednost trenda u 2001. godini je 7616,961 milijuna USD itd.
...
276
Primjer 5.6.
Proizvodnja proizvoda “Y” u razdoblju od 1999. do 2008. god. u
milijunima kn
Godina
Proizvodnja
(u milijunima kn)
1999.
5297
2000.
5394
2001.
6655
2002.
7135
2003.
7408
2004.
7565
2005.
7822
2006.
8478
2007.
8194
2008.
8772
Izvor: Tvornica Y (simulirano)
Zadatak je:
a)
Odrediti trend polinom drugog stupnja
b)
Odrediti interpolaciju za 2007. godinu
Rezultati:
a)
Ŷ = 5197,873 + 660,177 X – 31,462 X
2
jedinica za X = 1 godina
jedinica za Y = proizvodnja u milijunima kn
X=0, 30.06.1999.
b)
Ŷ
2007
= 8465,715 milijuna kn

278
STATISTICS / ADVANCED LINEAR/NONLINEAR MODELS /
TIME SERIES/FORECASTING
Otvara se prozor za izračun krivolinijskog trenda.
Variables
1- Prodaja
279
Exponential smoothing & forecasting
Quick

281
Exponential smoothing: S0=128,7 (pomicni prosjeci.sta)
No trend,no season; Alpha= ,100
PRODAJA : Prodaja proizvoda "B" u tonama
Case
PRODAJA Smoothed
Series
Resids
1
2
3
4
5
6
7
8
9
10
11
12
138,0000
128,6667
9,3333
122,0000
129,6000
-7,6000
84,0000
128,8400
-44,8400
158,0000
124,3560
33,6440
144,0000
127,7204
16,2796
171,0000
129,3484
41,6516
102,0000
133,5135
-31,5135
91,0000
130,3622
-39,3622
148,0000
126,4260
21,5740
128,5834
128,5834
128,5834
Rezultati se nalaze u stupcu:
Smoothed Series
. Brojke koje su zapisane u
kasnijim redcima su projekcije za budućnost, ali nisu reprezentativne.
5.5. Sezonska dekompozicija vremenskog niza
Primjer 5.8.
Mjesečni prosjeci srednjeg deviznog tečaja Hrvatske narodne banke za
EUR 1997. – 2003. god.
God./mj.
1
2
3
4
5
6
1997.
6,906000 6,940200 6,948000 6,989500 6,941000 6,997200
1998.
6,936200 6,974000 7,035200 7,069200 7,146000 7,203800
1999.
7,387139 7,567448 7,596698 7,591112 7,591861 7,596586
2000.
7,720042 7,730457 7,727280 7,710201 7,683790 7,639108
2001.
7,675722 7,703111 7,680701 7,526926 7,278507 7,320680
2002.
7,568480 7,437848 7,402535 7,395818 7,377827 7,320722
2003.
7,555767 7,620482 7,692318 7,567308 7,546434 7,508844
282
God./mj.
7
8
9
10
11
12
1997.
100,9408 100,3987
99,7651
99,8072 100,3697 100,2350
1998.
99,8215
99,1672 100,3706 101,1151 100,1417
99,5963
1999.
99,9183
99,9537 100,1552 100,0052
99,8051 100,2180
2000.
100,0170 100,0866
99,5682
99,7673
99,7966 100,1944
2001.
97,0205 102,9684 101,8713 100,3085 100,1084
99,7843
2002.
100,2837 100,2358
99,6603 101,3438
99,8800
99,8567
2003.
99,9275
98,9594 100,1955
99,9126 100,1749 100,1176
Izvor: http://www.hnb.hr/publikac/bilten/statisticki_pregled/h8.xls
Zadatak je:
a)
Izvršiti sezonsku dekompoziciju zadanog niza
b)
Desezonirati niz
a)
Sezonsko dekomponiranje niza
Sezonska dekompozicija je metoda kojom se izdvajaju pojedine komponente
vremenskog niza. Model sezonske dekompozicije može biti aditivni ili
multiplikativni.
Kod multiplikativnog modela vrijednost zavisne varijable Y
t
dobije se kao
umnožak sljedećih komponenti:
Y
t
= T
t
· C
t
· S
t
· I
t
gdje je:
t – vremensko razdoblje
Y
t
– vrijednost vremenskog niza u trenutku t
T
t
– vrijednost trenda u trenutku t
C
t
– vrijednost cikličke komponente u trenutku t
S
t
– vrijednost sezonske komponente u trenutku t
I
t
– vrijednost slučajne komponente u trenutku t.
Trend-komponenta – T
t
Trend pokazuje putanju rasta ili pada vrijednosti kroz duže vremensko
razdoblje. Neki faktori koji dugoročno djeluju na trend su: kulturalne snage kao
što je npr. veća prihvaćenost žena na poslu, demografske sile (npr. skokovi u
veličini populacije, starenje baby boom generacije i posljedično promjene u
navikama kupovanja), ekonomske sile (porast raspoloživog prihoda),
tehnološke sile (ekspanzija tehnologije mikročipa). U ekonomskim podacima
trend se smatra dugoročnim kretanjem koje traje nekoliko godina, općenito 3 do

284
Prikazan je način zapisa u odvojenim varijablama za mjesec i godinu
U
zaglavlje
dokumenta upisati:
Mjesečni prosjeci srednjeg deviznog tečaja Hrvatske narodne
banke za EUR 1997. – 2003. god.
Definirati varijable:
Kratki naziv:
Godina
Kratki naziv:
Mjesec
,
Kratki naziv:
Tecaj
, Dugi naziv
Srednji tečaj EUR-a
Podaci se unose na način kako je prikazano na slici:
285
STATISTICS / ADVANCED LINEAR/NONLINEAR MODELS /
TIME SERIES/FORECASTING

287
X11/Y2k (Census 2) – monthly
QUICK
288
Multiplicative
(multiplikativni model)
From – Month
1
(početni mjesec)
Year:
1997
(početna godina)
U prozoru radnih zapisa izaberu se traženi rezultati:

290
D 10. Final seasonal factors (tecaj.sta)
Table total: 8399,33 Mean: 99,9920 Std.Dev.: ,5934192
TECAJ : Srednji tecaj EUR-a
Year January
February
March
April
May
June
July
August
Septembr
October
November
December
Avge
1997
1998
1999
2000
2001
2002
2003
99,8816 100,6415 100,6917 100,6038 100,3107 100,1971 99,65994 99,32159
99,50977 99,44300
99,84194
99,62573
99,9774
100,0364 100,7476 100,7917 100,6084 100,2887 100,0792 99,63833 99,31188
99,46633 99,44834
99,83188
99,63490
99,9903
100,2062 100,8722 100,8804 100,5542 100,2398
99,8421 99,61977 99,30889
99,44227 99,53920
99,89001
99,74496 100,0117
100,3233 100,9699 100,9799 100,4290 100,0948
99,5393 99,58641 99,26405
99,35699 99,52702
99,82101
99,68111
99,9644
100,6216 101,1705 101,1606 100,4005 100,0127
99,2934 99,58288 99,28130
99,34277 99,62489
99,91938
99,79317 100,0170
100,6815 101,1812 101,2242 100,2990
99,8648
99,0979 99,58380 99,29314
99,33360 99,65667
99,96665
99,79259
99,9979
100,7521 101,2051 101,2668 100,2686
99,8201
98,9971 99,58473 99,28344
99,31569 99,65274
99,96227
99,71490
99,9853
Tablica 2. Sezonski faktori srednjeg tečaja EUR-a 1997. – 2003. god.
God./mj.
1
2
3
4
5
6
1997.
99,8816 100,6415 100,6917 100,6038 100,3107 100,1971
1998.
100,0364 100,7476 100,7917 100,6084 100,2887 100,0792
1999.
100,2062 100,8722 100,8804 100,5542 100,2398 99,8421
2000.
100,3233 100,9699 100,9799 100,4290 100,0948 99,5393
2001.
100,6216 101,1705 101,1606 100,4005 100,0127 99,2934
2002.
100,6815 101,1812 101,2242 100,2990 99,8648 99,0979
2003.
100,7521 101,2051 101,2668 100,2686 99,8201 98,9971
God./mj.
7
8
9
10
11
12
Prosjek
1997.
99,65994 99,32159 99,50977 99,44300 99,84194 99,62573 99,9774
1998.
99,63833 99,31188 99,46633 99,44834 99,83188 99,63490 99,9903
1999.
99,61977 99,30889 99,44227 99,53920 99,89001 99,74496 100,0117
2000.
99,58641 99,26405 99,35699 99,52702 99,82101 99,68111 99,9644
2001.
99,58288 99,28130 99,34277 99,62489 99,91938 99,79317 100,0170
2002.
99,58380 99,29314 99,33360 99,65667 99,96665 99,79259 99,9979
2003.
99,58473 99,28344 99,31569 99,65274 99,96227 99,71490 99,9853
Opća je ocjena da smanjeni priljev eura u početnim mjesecima svake godine
uzrokuje povećanje deviznog tečaja, dok sezonski priljev temeljem pritjecanja
deviznih sredstava od naplaćenih prihoda za turističke usluge dovodi do
relativnog obilja eura na tržištu i posljedičnog smanjenja cijene eura.
S obzirom da se glavnina prihoda ostvaruje na tržištima adoptiranog eura, a
sezona svake godine sve više produžuje u netradicionalne turističke mjesece, to
je i sezonski činitelj sve ranije opadajući, što je prikazano u tablici 3.
vrijednostima manjim od 100 već od 5. mjeseca 2002. i 2003. godine. Slična se
kretanja predmnijevaju i za 2004. godinu (tablica 3), što sugerira isplativost
konverzije kune za euro u 6. mjesecu i njegovu prodaju u 4. mjesecu uz zaradu
na promjeni deviznih tečajeva od otprilike 2,2% u navedenom razdoblju.
Drugim riječima, vidljivo je da je sezonski faktor jači u prvoj polovici godine,
dok u drugoj polovici godine opada. Meñutim zadnjih godina počeo je opadati
291
već u lipnju i polako u svibnju. Taj trend pretpostavljen je i za 2004. godinu, pa
se pretpostavlja da će sezonski faktor biti ispod 100 već u svibnju.
Projekcija sezonske komponente za 2004. god. nalazi se u tablici
D 10a.
Seasonal factors, one year ahead
. Pretočena je u tablicu 3.
D 10a. Seasonal factors, one year ahead (tecaj.sta)
TECAJ : Srednji tecaj EUR-a
Year January
February
March
April
May
June
July
August
Septembr
October
November
December
Avge
2004 100,7873 101,2171 101,2881 100,2533 99,79771 98,94678 99,58520 99,27859
99,30673 99,65077
99,96008
99,67606 99,97898
Tablica 3. Projekcija sezonskih faktora srednjeg tečaja EURu 2004. god.
God./mj.
1
2
3
4
5
6
2003.
100,7873 101,2171 101,2881 100,2533 99,79771 98,94678
God./mj.
7
8
9
10
11
12
Prosjek
2003.
99,58520 99,27859 99,30673 99,65077 99,96008 99,67606 99,97898
Slučajna komponenta
zapisana je u tablici
D 13. Final irregular series
, koja je
prenijeta u tablicu 4. Ukoliko su neke vrijednosti prepoznate kao ekstremi, tada
su zamijenjene s vrijednošću 100 čime su dobivene vrijednosti slučajne
komponente modificirane za ekstreme. Modificirane slučajne vrijednosti
prikazane u tablici 5, dobivene su u iz tablice
E 3. Modified irregular series
.
D 13. Final irregular series (tecaj.sta)
Table total: 8403,39 Mean: 100,040 Std.Dev.: ,7292857
TECAJ : Srednji tecaj EUR-a
Year
January
February
March
April
May
June
July
August
Septembr
October
November
December
S.D.
1997
1998
1999
2000
2001
2002
2003
Std.Dev.
100,2485
99,8845
99,7718 100,2305
99,5475 100,1882 100,9408 100,3987
99,7651
99,8072
100,3697
100,2350 0,381740
99,7153
99,3648
99,7835
99,8741 100,6010 100,9213
99,8215
99,1672
100,3706 101,1151
100,1417
99,5963 0,580715
99,2138 100,3775 100,2081
99,9708
99,8917 100,0305
99,9183
99,9537
100,1552 100,0052
99,8051
100,2180 0,279267
100,2064
99,7390
99,7103 100,0675 100,1483 100,3043 100,0170 100,0866
99,5682
99,7673
99,7966
100,1944 0,231174
100,2514 100,3012 100,5125
99,8632
97,4742
99,0659
97,0205 102,9684
101,8713 100,3085
100,1084
99,7843 1,555406
101,9571
99,9506
99,4816 100,1784 100,1488
99,9243 100,2837 100,2358
99,6603 101,3438
99,8800
99,8567 0,721885
100,0086 100,0191 100,6060
99,7869
99,8796 100,1650
99,9275
98,9594
100,1955
99,9126
100,1749
100,1176 0,368911
0,8192
0,3210
0,4008
0,1560
1,0011
0,5187
1,1885
1,2428
0,7614
0,6807
0,2045
0,2343

293
E 3. Modified irregular series (tecaj.sta)
Table total: 8400,76 Mean: 100,009 Std.Dev.: ,3696678
TECAJ : Srednji tecaj EUR-a
Year
January
February
March
April
May
June
July
August
Septembr
October
November
December
S.D.
1997
1998
1999
2000
2001
2002
2003
Std.Dev.
100,2485
99,8845
99,7718 100,2305
99,5475 100,1882 100,9408 100,3987
99,7651
99,8072
100,3697
100,2350 0,381740
99,7153
99,3648
99,7835
99,8741 100,6010 100,9213
99,8215
99,1672
100,3706 101,1151
100,1417
99,5963 0,580715
99,2138 100,3775 100,2081
99,9708
99,8917 100,0305
99,9183
99,9537
100,1552 100,0052
99,8051
100,2180 0,279267
100,2064
99,7390
99,7103 100,0675 100,1483 100,3043 100,0170 100,0866
99,5682
99,7673
99,7966
100,1944 0,231174
100,2514 100,3012 100,5125
99,8632 100,0000
99,0659 100,0000 100,0000
100,0000 100,3085
100,1084
99,7843 0,348959
100,0000
99,9506
99,4816 100,1784 100,1488
99,9243 100,2837 100,2358
99,6603 100,0000
99,8800
99,8567 0,226817
100,0086 100,0191 100,6060
99,7869
99,8796 100,1650
99,9275
98,9594
100,1955
99,9126
100,1749
100,1176 0,368911
0,3519
0,3210
0,4008
0,1560
0,3015
0,5187
0,3798
0,5346
0,2820
0,4532
0,2045
0,2343
Tablica 5. Modificirana slučajna komponenta srednje vrijednosti EUR
1997. – 2003. god.
God./mj.
1
2
3
4
5
6
1997.
100,2485 99,8845 99,7718 100,2305 99,5475 100,1882
1998.
99,7153 99,3648 99,7835 99,8741 100,6010 100,9213
1999.
99,2138 100,3775 100,2081 99,9708 99,8917 100,0305
2000.
100,2064 99,7390 99,7103 100,0675 100,1483 100,3043
2001.
100,2514 100,3012 100,5125 99,8632
100,0000
99,0659
2002.
100,0000
99,9506 99,4816 100,1784 100,1488 99,9243
2003.
100,0086 100,0191 100,6060 99,7869 99,8796 100,1650
St. dev.
0,3519
0,3210
0,4008
0,1560
0,3015
0,5187
God./mj.
7
8
9
10
11
12
St. dev.
1997.
100,9408 100,3987 99,7651 99,8072 100,3697 100,2350 0,381740
1998.
99,8215 99,1672 100,3706 101,1151 100,1417 99,5963 0,580715
1999.
99,9183 99,9537 100,1552 100,0052 99,8051 100,2180 0,279267
2000.
100,0170 100,0866 99,5682 99,7673 99,7966 100,1944 0,231174
2001.
100,0000 100,0000 100,0000
100,3085 100,1084 99,7843 0,348959
2002.
100,2837 100,2358 99,6603
100,0000
99,8800 99,8567 0,226817
2003.
99,9275 98,9594 100,1955 99,9126 100,1749 100,1176 0,368911
St. dev.
0,3798
0,5346
0,2820
0,4532
0,2045
0,2343
*Modificirane vrijednosti prikazane su kurzivom (italic)
294
b)
Desezoniranje vremenskog niza
Kada su prikazane sve komponente vremenskog niza moguće je izračunati
desezonirani vremenski niz. U slučaju ekstremnih vrijednosti zamjenjuju se s
trend-cikličkim vrijednostima. Desezonirani niz prikazan je u tablici 6., koja je
dobivena iz tablice
D 11. Final seasonally adjusted series
. Modificirani
desezonirani niz zapisan je u tablici 7 koja je dobivena iz tablice
E 2. Modified
seasonally adjusted series
.
D 11. Final seasonally adjusted series (tecaj.sta)
Table total: 621,890 Mean: 7,40346 Std.Dev.: ,2519019
TECAJ : Srednji tecaj EUR-a
Year
January
February
March
April
May
June
July
August
Septembr
October
November
December
Totl
1997
1998
1999
2000
2001
2002
2003
Average
6,914186 6,895964 6,900274 6,947551 6,919502 6,983438 7,052382 7,023951
6,979415 6,973241
6,997160
6,973299 83,56036
6,933673 6,922251 6,979937 7,026450 7,125429 7,198096 7,166018 7,160069
7,285681 7,379711
7,351359
7,355957 85,88463
7,371936 7,502019 7,530401 7,549273 7,573696 7,608603 7,620306 7,642280
7,675363 7,676177
7,666644
7,698643 91,11534
7,695167 7,656197 7,652298 7,677264 7,676512 7,674463 7,632339 7,615630
7,559922 7,571232
7,581297
7,622642 91,61497
7,628303 7,613990 7,592581 7,496902 7,277583 7,372777 7,216033 7,665733
7,591928 7,472034
7,438039
7,385305 89,75121
7,517251 7,351016 7,313012 7,373770 7,387817 7,387366 7,425759 7,429081
7,390594 7,524256
7,433657
7,457760 88,99133
7,499368 7,529737 7,596091 7,547040 7,560037 7,584910 7,572961 7,511722
7,623539 7,620449
7,658037
7,668773 90,97266
7,365697 7,353025 7,366371 7,374036 7,360082 7,401379 7,383685 7,435496
7,443778 7,459586
7,446599
7,451768
Tablica 6. Desezonirane vrijednosti srednjeg tečaja EUR-a 1997. – 2003. god.
God./mj.
1
2
3
4
5
6
1997.
6,914186 6,895964 6,900274 6,947551 6,919502 6,983438
1998.
6,933673 6,922251 6,979937 7,026450 7,125429 7,198096
1999.
7,371936 7,502019 7,530401 7,549273 7,573696 7,608603
2000.
7,695167 7,656197 7,652298 7,677264 7,676512 7,674463
2001.
7,628303 7,613990 7,592581 7,496902 7,277583 7,372777
2002.
7,517251 7,351016 7,313012 7,373770 7,387817 7,387366
2003.
7,499368 7,529737 7,596091 7,547040 7,560037 7,584910
Prosjek
7,365697 7,353025 7,366371 7,374036 7,360082 7,401379
God./mj.
7
8
9
10
11
12
Ukupno
1997.
7,052382 7,023951 6,979415 6,973241 6,997160 6,973299 83,56036
1998.
7,166018 7,160069 7,285681 7,379711 7,351359 7,355957 85,88463
1999.
7,620306 7,642280 7,675363 7,676177 7,666644 7,698643 91,11534
2000.
7,632339 7,615630 7,559922 7,571232 7,581297 7,622642 91,61497
2001.
7,216033 7,665733 7,591928 7,472034 7,438039 7,385305 89,75121
2002.
7,425759 7,429081 7,390594 7,524256 7,433657 7,457760 88,99133
2003.
7,572961 7,511722 7,623539 7,620449 7,658037 7,668773 90,97266
Prosjek
7,383685 7,435496 7,443778 7,459586 7,446599 7,451768

296
Grafikon se može promijeniti ako se dva puta klikne na dio koji se želi
promijeniti i tada se naprave izmjene.
Promijenjen je naslov, a legenda je prevedena na hrvatski jezik:
297
Grafikon 1. Vrijednosti desezoniranog niza i trend-cikličkih vrijednosti srednjeg
tečaja EUR 1997.-2003. god.

Prof. dr. sc. Maja Biljan-August
Prof. dr. sc. Snježana Pivac
Doc. dr. sc. Ana Štambuk
U
U
P
P
O
O
R
R
A
A
B
B
A
A
S
S
T
T
A
A
T
T
I
I
S
S
T
T
I
I
K
K
E
E
U
U
E
E
K
K
O
O
N
N
O
O
M
M
I
I
J
J
I
I
2. IZDANJE
Izdavač:
Ekonomski fakultet Sveučilišta u Rijeci
Recenzentice:
Prof. dr. sc. Jasna Horvat
Doc. dr. sc. Suzana Marković
Doc. dr. sc. Alemka Šegota
Lektorica:
Kerol Musul-Perić, prof.
Autor naslovnice:
Luka Mičetić, dipl. oec.
Pri izradi naslovnice korišteni su materijali objavljeni na:
www.free-stockphotos.com, www.sxc.hu, www.hnb.hr.
Objavljivanje ovog sveučilišnog udžbenika odobrilo je Povjerenstvo za
izdavačku djelatnost Sveučilišta u Rijeci Odlukom – klasa: 602-09/09-01/29,
ur. broj: 2170-57-05-09-3 od 25. rujna 2009.
Objavljeno na URL: http://www.efri.hr/prikaz.asp?txt_id=6326
i http://oliver.efri.hr/~statist/biljan-pivac-stambuk-uporaba2.pdf.
ISBN: 978-953-6148-86-8
Rijeka, rujan, 2009.
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti