1

Nezavisni Univerzitet Banja Luka

STATISTIKA

                                                   Dr.sc.Branka Marković

2

1.UVOD

1.1.Pojam i zadaća statistike

Sam naziv potiče od novolatinskog  

ratio status

  i italijanskog ekvivalenta  

ragione di stato

-

državni interes, te izvedenice 

statista

-osoba vješta u vođenju državnih poslova.

Značenje pojma

 statistika se mjenjalo sa vremenom.Danas se pod statistikom podrazumjeva:

1.Nauka o prikupljanju brojčanih podataka različite vrste , o njihovom uređenju, metodama 

analize i tumačenju

2.Skup   uređenih   brojčanih   podataka   o   različitim   prirodnim   i   društvenim   pojavama,   koje 

prikupljaju i objavljuju statističke , stručne ,naučno-istraživačke i druge ustanove.

Predmet   statistike

  sastoji   se   u   donošenju   odluka   brojčane   prirode   o   nepoznatim 

karakteristikama   skupa   na   osnovu   rezultata   izučavanja   varijacija.Statistički   podaci   su 

mnogobrojni.Pomoću statističkih metoda oni se redukuju sa ciljem da se isključe nevažne, a 

izdvoje   zančajne   informacije   o   pojavi   koju   oni   predstavljaju.Podaci   su   posmatrana 

kvalitativna i kavntitativna obilježja objekata, osoba,pojava odnosno elemenata statističkog 

skupa.

Obilježje 

je svojstvo po kome se jedinice skupova razlikuju ili jedna drugoj liče.Ona se 

pojavljuju u više oblika(modaliteta), pa se pojam obilježja izjednačuje s pojmom varijable.

Statistička   analiza

,   statističke   informacije,   analitičke   metode   i   modeli   osnova   su   svake 

empirijske   analize   prirodnih   i   društvenih   pojava.Metodama   se   procjenjuju     nepoznati 

parametri modela osnovnih skupova ili testiraju  hipoteze o njima.Statističke metode služe u 

postupcima   predviđanja,   kontroli   proizvodnih   procesa,   poslovnom   odlučivanju.Statistički 

podaci dio su velikog skupa informacija kojima je izloženo moderno društvo.

Statistika kao naučnoanalitička metoda istraživanja pojava i procesa dijeli se na deskriptivnu i 

inferencijalnu (analitičku, induktivnu, matematičku)statistiku.

Deskriptivna statistika

  se bavi prikupljanjem podataka, njihovim grupiranjem, tabelarnim i 

grafičkim   prikazivanjem   ,izračunavanjem   različitih   brojčanih   pokazatelja   koji   izražavaju 

karakteristike promatrane pojave. Svi se rezultati odnose samo na analiziani skup podataka .U 

deskriptivnu statistiku ubrajaju se   postupci analize nizova i specifičnih mjera npr.srednje 

vrijednosti, mjere disperzije mjere asimetrije itd.

background image

4

intervalu.Primjer:popis stanovništva tačno u ponoć 31.12.2012. godine i on se definiše u tačno 

određenom trenu, dok se proizvodnja električne energije definiše u određenom razdoblju.

Statistički   skup   čiji   elementi   zadovoljavaju   spomenute   definicije   je  

homogen.

Samo   takvi 

skupovi mogu biti predmet statističke analize.

Statistički skup ćemo upoznati ako upoznamo njegove jedinice, a njih ćemo upoznati ukoliko 

upoznamo njihova obilježja(svojstva).Pod statističkim obilježjem podrazumjevamo ona opšta 

svojstva   jedinica   skupa   po   kojima   se   međusobno   razlikujuSvaka   jedinica   ima   više 

obilježja.Primjer:jedinica „zaposlena osoba“ ima ova obilježja .pol;kvalifikaciju;dob;dužina 

staža;mjesto i vrsta zaposlenja itd.

Često je nemoguće, vršiti statističku analizu na čitavom statističkom skupu. Zbog toga se vrlo 

često iz  čitavog statističkog skupa vrši izbor nekih elemenata skupa na kojima se sprovodi 

dalja statistička analiza, koja rezultira određenim kvantitativnim zaključcima koji važe za 

čitav statistički skup. Podskup statističkog skupa dobijen izborom nekih njegovih elemenata 

zove se 

uzorak.

Obim uzorka je uvijek manji od obima osnovnog skupa.

1.3.Vrste obilježja i njihova svojstva

Svojstvo po kome se jedinice skupa razlikuju ili sliče nazivaju se obilježje.U pravilu ona se 

javljaju   u   dva   ili   više   oblika(modaliteta).Svojstva   elemenata   statističkog   skupa   se 

mjere.Mjerenjem se smatra pridruživanje brojeva ili oznaka jedinicama statističkog skupa 

prema   određenom   pravilu.Pravila   pridruživanja   data   su  

mjernim   skalama(nivo 

mjerenja)

.Razlikuju   se   četiri   vrste   mjernih   skala:  

nominalna,ordinalna,   intervalna   i 

numerička(racio).

Nominalna skala  

je data u obliku nenumeričkog skupa tj. liste naziva(atributa, kategorija, 

slovnih oznaka..).Našla je primjenu na podatke koji su razvrstani u različite kategorije u svrhu 

identifikacije.Redosljed   je   utvrđen   ,   najčešće   abecednim   redom   Primjeri:   imena,   marke, 

bračno stanje.Tim se kategorijama mogu pridružiti numeričke vrijednosti,ali nisu dopuštene 

nikakve brojčane operacije.

Nominalna obilježja se dijele na:

atributivna i geografska

.Atributivno obilježje je svojstvo 

jedinice   statističkog   skupa   koje   se   izražava   opisno   tj.   riječima.Primjer:   pol,   narodnost, 

5

zanimanje   ,   uzrok   smrti   itd.Geografsko(prostorno)   obilježje   označava   mjesto   s   kojim   je 

jedinica u nekoj vezi.Primjer: mjesto rođenja; mjesto stalnog boravka;mjesto zaposlenja itd.

Ordinalna   skala

  pridružuje   brojeve,   slovne   oznake   ili   simbole   elementima   skupa   prema 

stepenu intenziteta nekog svojstva.Ima primjenu na podatke koji se razvrstavaju u kategorije 

koje se mogu rangirati, tj. poredati.Primjer: rangiranje izvrstan, zadovoljavajući, loš. Mogu im 

se pridružiti brojčane vrijednosti koje ima smisla upoređivati, ali nisu dopuštene brojčane 

operacije.Pošto se mogu podaci rangirati(poredati) prema stepanu svog intenziteta pri tome se 

ordinalno obilježje zove još i obilježje ranga.

Intervalna skala 

je skala kod koje se pridružuju brojevi mjernim svojstvima elemenata.Kod 

njih znamo redosljed i razliku između brojeva na skali, jer je kod tih skala definisana razlika 

jednaka   na   svakom   dijelu   skale.Primjer:   temperaturna   skala.Za   intervalnu   skalu   je 

karakteristično što je položaj nule i mjerne jedinice određene dogovorom.

Omjerna skala 

se sastoji od brojeva za koje vrijedi da njihove jednake razlike predstavljaju 

jednake razlike mjernog svojstva.Primjenjuje se na podatke koji se mogu rangirati, imaju sva 

svojstva intervalnih skala i za koje imaju smisla sve osnovne aritmetičke operacije.Primjer: 

dužina, težina, zapremina itd.

Vrijednosti koje su pridružene elementima pomoću omjerne skale nazivaju se 

vrijednostima 

numeričkog obilježja

 Ako se numeričko obilježje može izraziti samo cijelim brojevima onda 

se takvo obilježje naziva 

diskretno ili diskontinuirano.

Primjer: broj zaposlenih u radnji.Ako se 

numeričko obilježje može izraziti i cjelim i decimalnim brojem , kao primjer:težina, dužina , 

visina, tada se takvo numeričko obilježje naziva 

kontinuirano

 numeričko obilježje.

Statistička obilježja se mogu podjeliti na 

kvalitativna i kvantitativna

 statistička obilježja.

Kvalitativna   (kategorijska)   obilježja   su   ona   obilježja   koja   ne   mogu   poprimati   brojčane 

vrijednosti,ali   mogu   biti   razvrstana   u   dvije   ili   više   nebrojčanih   kategorija.U   ovu   grupu 

obilježja ubrajamo statistička obilježja mjerena nominalnoj i ordinalnoj skali.

Kvantitativna   obilježjaje   obilježja   koja   imaju   brojčanu   (numeričku)   vrijednost.Takve 

karakteristike imaju obilježja mjerena intervalnom i omjernom skalom.

1.4. Izvori podataka

background image

7

Za brojčano izražavanje odnosa između obilježja, do sada smo upotrebljavali postotke, u tu 

svrhu primjenjuje se 

relativna frekvencija, 

a ona je odnos apsolutne frekvencije tog obilježja i 

zbira svih apsolutnih frekvencija.Relativna frekvencija se označava sa  

p

i

.

p

i

=

f

i

N

i=1,2.....k

Zbir frekvencija mora biti jednak 1.

U statističkoj analizi nominalnih nizova koriste se i relativne frekvencije. 

Relativna frekvencija je relativni broj koji pokazuje udio grupe podataka u 

ukupnom broju podataka

 

Nominalni   nizovi

    nastaje   grupisanjem   podataka   prema   modalitetima   nominalnog 

obilježja.Pošto se nominalna obilježja dijele na atributivna i geografska to se u nizovi dijele 

na atributivne i geografske.Kod ovih nizova primjenjuju se apsolutne i relativne frekvencije.

Nominalni nizovi se prikazuju pomoću tabela i grafikona.Svaka statistička tabela nastaje od 

horizontalnih i vertikalnih crta.U predkoloni se navodi naziv obilježja i njegovi modaliteti ,a u 

zaglavlju je opis sadržaja kolone.Statističkom tabelom povećava se preglednost grupisanih 

podataka.Nominalne   nizove   grafički

 prikazujemo   korištenjem   površinskog 

grafikona(stubčasti grafikon).Mogu biti uspravni ili položeni stubci.Stubci su jednakih baza , 

pa se poređenjem njihovih visina mogu vidjeti razlike frekvencija u odnosu na pojedine oblike 

obilježja. U istu svrhu može se koristiti i kružni dijagram.

Kod stubčastog dijagramana horizontalnoj osi nanosi se vrijednost obilježja X.Kod grafikona 

apsolutnih frekvencija na Y osi se nanose vrijednosti odgovarajućih frekvencija obilježja X, i 

konstruišu se pravougaonici iznad vrijednosti na X osi sa visinama jednakim frekvencijama.

Geografski nizovi prikazuju se osim grafikonom i kartogramima, pri čemu se geografska 

obilježja   prikazuju   geometrijskim   likovima..Grafičko   i   statističko   prikazivanje   predstavlja 

sredstvo deskriptivne statistike.

Redosljedni(ordinalni)   niz

  nastaje   grupisanjem   elemenata   osnovnog   skupa   prema   stepenu 

intenziteta svojstav.I u ovom kao i u prethodnom nizu skup od N podataka dijeli se na k 

podskupova,   koji   se   međusobno   ne   poklapaju.Apsolutna   frekvencija   f

r

i

  predstavlja   broj 

elemenata osnovnog skupa s oblicima ranga 

r

i

.

R

elativna frekvencija p(

r

i

) je odnos apsolutne frekvencije i zbira apsolutnih frekvencija.

8

Prikazivanje redosljednog niza se vrši tabelarno i grafički.Za tebelarno prikazivanje služi 

kombinovana   tabela,   čiji   sadržaj   zavisi   od   oblika   dviju   ili   više   obilježja.Za   grafičko 

prikazivanje koristi se površinski grafikon jednostavnih stubaca i kružni dijagram.

Numerički   nizovi

  nastaju   uređenjem   vrijednosti   kvantitativnog   obilježja.Najjednostavniji 

način uređivanja vrijednosti tog obilježja sastoji se u nizanju po veličini.Ako su pojedinačne 

vrijednosti obilježja x:

x

1

;

;

x

2

;......

x

N ,

  pri čemu vrijedi 

x

i

≤ x

i

+

1

 ,  i=1,2,...,N-1

Kada   je   N   veliki   broj,   uređivanje   pojedinačnih   vrijednosti   je   otežano,zbog   toga   se   mora 

izvršiti grupisanje podataka.

Grupisanjem podataka nastaje distribucija frekvencija.Funkciju 

koja svakom obilježju xi pridružuje odgovarajuću   frekvenciju fi   ; i = 1......; k, nazivamo 

funkcijom distribucije frekvencije.(

x

i

,

f

i

).

Relativna frekvencija p(

x

i

) dobije se dijeljenjem i-te 

apsolutne frekvencije zbirom apsolutnih frekvencija :

p

i

=

f

i

N

  ; 

i=

1,2,3...k

Relativna frekvencija numeričkog niza je broj koji se nalazi između nule i jedan, a zbir im je 

uvijek jedan.

Oblici u kojima se pojavljuje numeričko obilježje razlikuju se međusobno prema načinu na 

koji   se   ono   može   mjeriti   ,   jer   se   numeričko   obilježje   izražava   brojem.Vrijednosti 

kontinuiranog   obilježja

  se   grupišu   na   osnovu   razreda.Te   se   grupe   nazivaju  

razredi   ili 

klase

.Apsolutna frekvencija razreda je broj podataka razvrstan u dati razred.

Svaki razred ima donju i gornju granicu.Donja granica  

i

-tog razreda označava se sa   

L

1

i

  a 

gornje sa 

L

2

i

 pa je  

i

 –ti razred dat izrazom:

L

1

i

≤ x

i

<

L

2

i

i=

 1,2....,k

Distribucija   frekvencija   kontinuiranog   numeričkog   obilježja   je   skup   parova   razreda   i 

pridruženih frekvencija.

background image

10

Šema br.4: Prikaz numeričkog obilježja

Ako su date pojedinačne vrijednosti numeričkog obilježja x, i ako ih je mali broj, prikladan je 

grafički prikaz pomoću tačaka.

_

.

___

.._

___________________

....

_________

.._

___________________

10    15                               60               80     Plata(u hiljadama din.)

Šema br. 5:Prikaz numeričkog niza pomoću tačaka

Osim   dijagramima   s   tačkama   pojedinačni   podaci   o   vrijednostima   numeričkog   obilježja 

prikazuju se S_L dijagramom, on je specifična vrsta histograma.

Distribucija frekvencija grafički se prikazuje   

linijskim i površinskim grafikonom  

, odnosno 

histogramom.Linijski grafikon konstruiše se u pravougaonom koordinatnom sistemu.Na osi 

apscise   nalazi   se   aritmetičko   mjerilo   za   obilježje   X,   a   na   osi   ordinata   mjerilo 

frekvencije.Ukoliko izvršimo spajanje tačaka , koordinate kojih su vrijednosti x i pripadajućih 

frekvencija tada ćemo dobiti  

poligon frekvencija.Histogram j

e površinski grafikon koji se 

konstruiše   u   pravougaonom   sistemu   s   artimetičkim   mjerilima   na   osi.Umjesto   crta 

upotrebljavaju se pravougaonici.Pravougaonici se oslanjaju na os apscise, na kojoj se nalazi 

aritmetičko mjerilo za vrijednosti X, a visina pravougaonika određena je frekvencijom.

Numerička obilježja

grupisani podaci 

distribucija 

frekvencija 

kumulativni niz

Negrupisani podaci

 S-L dijagram

dijagram tačaka

11

broj garnitura 5

0

1

2

3

4

5

6

7

8

9

10

Šema br 6: histogram frekvencija

broj garnitura

Category 2

Category 3

Category 4

0

2

4

6

8

10

broj dana

Šema br.7: poligon frekvencija

Kumulativni niz

  distribucije frekvencija „manje od“ ili empirijska funkcija distribucije nastaje 

postepenim sabiranjem frekvencija.Sabirati se mogu apsolutne i relativne frekvencije.

Kumulativni niz „manji od“ prikazuje se za diskontinuirano obilježje stepenastim grafikonom, 

a za kontinuirano linijskim grafikonom. 

Primjer 1.

Anketirana je populacija od 50 studenata o broju položenih ispita

i tjelesnoj težini. Dobijeni su sledeći rezultati:

a) broj položenih ispita:

7 4 12 3 7 8 6 5 9 9 10

background image

13

Interval 
težine(kg)

Apsolutna 
frekvencija 

f

i

Relativna 
frekvencija 

p

i

Kumulativna 
frekvencija 

50-60

2

2/50

2

60-70

14

14/50

16

70-80

13

13/50

29

80-90

9

9/50

38

90-100

6

6/50

44

100-110

4

4/50

48

110-120

2

2/50

50

50

1

Numeričkim metodama deskriptivne statistike dolazi se do određenih pokazatelja i 

dalje redukcije informacija.Pokazatelji kojima se opisuje gomilanje podataka oko neke 

vrijednosti nazivaju se 

srednjim vrijednostima ili mjerama centralne tendencije.

Stepen 

varijabilnosti   podataka   mjeri   se

 

mjerama   disperzije(raspršenosti)

.Način 

raspoređivanja   u   odnosu   na   neku   vrijednost  

mjerama   asimetrije

.Oblik   rasporeda 

podataka  mjeri se  

mjerama  zaobljenosti

.Gomilanje  podataka  ,  njihova  raspršenost, 

način   i   oblik   raspoređivanja   karakteritike   su   pojava   što   ih   podaci 

predstavljaju.Brojčane   vrijednosti   pokazatelja   tih   karakteristika   izračunate   za 

populaciju nazivaju se 

parametrima.

1.2.SREDNJE VRIJEDNOSTI NUMERIČKOG NIZA

U praksi se vrlo često javlja problem kvalitetnoga prezentovanja velikih nizova podataka 

kvalitativnih   ili   kvantitativnih   obilježja   vezanih   za   relativno   velike   statističke   skupove 

(npr.cjelokupno stanovništvo nekoga grada/

države

). I dok je u slučaju kvalitativnih obilježja 

najbolji mogući rezultat tablični ili grafički prikaz podataka, za kvantitativna se obilježja 

uvode posebni numerički pokazatelji, i to su tzv. 

srednje vrijednosti

.

Srednja   vrijednost  

je     konstanta  čiji   je   cilj   na   što   reprezentativniji   način   predstavi   niz 

varijabilnih podataka numeričkog niza. U pravilu je riječ o vrijednosti oko koje se ''gomila'' 

većina podataka numeričkog niza, pa se zato naziva i 

mjera središnje 

(

centralne

)

tendencije

Što   je   više   podataka   ''nagomilano''   oko   pojedine   srednje   vrijednosti,   njezina  će 

reprezentativnost biti bolja.Postoji više vrsta srednjih vrijednosti a dijele se na  

potpune i 

14

položajne

.Podjela je izvršena s obzirom  da li se pri računanju pojedinih srednjih vrijednosti 

pojavljuju svi članovi numeričkog niza ili samo dio tih članova.

U  

potpune   srednje   vrijednosti  

ubrajamo   aritmetičku   sredinu,   geometrijsku   sredinu   i 

harmonijsku sredinu. U računanju tih vrijednosti koriste se 

svi 

elementi numeričkoga niza. U 

položajne   srednje   vrijednosti  

ubrajamo   medijan   i   mod.   Njihova   je   vrijednost   određena 

položajem  

unutar   numeričkog   niza,   pa   u   njihovu   računanju   ne   učestvuju   svi   elementi 

numeričkoga niza.

Osnovne vrste srednjih vrijednosti su 

aritmeti

c

ka sredina

geometrijska sredina

harmonijska 

sredina

medijan 

mod

. Vrlo je važno istaknuti da je primjena svake pojedine vrste srednje 

vrijednosti odredena  

karakterom  

(

svojstvima

) promatranog kvantitativnoga obilježja, pa ne 

postoji  ''univerzalna''  srednja vrijednost koja  će dovoljno  reprezentativno  opisati  

bilo  koji 

numerički niz podataka. U praksi se ovo pravilo često vrlo neopravdano zanemaruje, pa se za 

spomenutu   ''univerzalnu''   srednju   vrijednost,   zbog   relativno   jednostavnoga   načina 

računanja,uzima aritmetička sredina. 

Istaknimo   da   svaku   od   navedenih   srednjih   vrijednosti   možemo   računati   iz   negrupiranih 

(''sirovih'')   i   grupiranih   podataka.   Zajednička   karakteristika   svih   takvih   računa   je   da   su 

vrijednosti dobivene obračunom iz grupiranih podataka nepreciznije od vrijednosti dobivenih 

obračunom iz negrupiranih podataka, naročito ako su podaci grupirani u razrede relativno 

velikih širina.

1.2.1.Aritmetička sredina

Aritmeti

č

ka   sredina  

(oznake:  

X

)

je   najraširenija   i   najčešće   korištena   srednja 

vrijednost.Aritmetička sredina dobije se tako da se suma podijeli s ukupnim 

brojem 

elemenata 

numeričkoga   niza.Postoji   nekoliko   različitih   vrsta   aritmetičkih   sredina.   Najpoznatija   i 

najraširenija je 

jednostavna aritmetička sredina

. Za njezino je izračunavanje potrebno zadati 

konačan  

niz  

negrupiranih  

numeričkih podataka

x

1

; x

2

....

x

i

  Tada se jednostavna aritmetička 

sredina računa pomoću formule:

X

=

x

1

+

x

2

+

x

3

…. x

N

N

Ili kraće               

X

=

I

=

1

N

x

i

N

background image

16

X

=

7

x

0

+

12

x

1

+

17

x

2

+

25

x

3

+

21

x

4

+

18

x

5

100

 =3,61

Dobiveni rezultat obično interpretiramo ovako:  

Prosje

č

an broj položenih jednosemestralnih 

ispita po jednom studentu približno iznosi 

3.61 Ovdje treba pripaziti i na red riječi u rečenici: 

prilog 

prosječno 

uvijek dolazi neposredno ispred velicine na koju se odnosi. 

Primjer 4

.Visina igrača jednog košarkaškog tima iznosi u centrimetrima 195, 180, 190, 202, 

205, 201, 198, 199, 200, 204. Naći prosečnu visinu igrača.

Rešenje:  

Aritmetička sredina može se računati i ukoliko su, umjesto, apsolutnih zadane odgovarajuće 

relativne frekvencije. Radi jednostavnosti, pretpostavimo da su relativne frekvencije iskazane 

u postotcima. Formalno, ako su  

x

1

; x

2

....

x

i

  vrijednosti

  kvantitativnoga obilježja, a  

p

1

;

p

2

..

p

k

njima odgovarajuće 

relativne 

frekvencije 

iskazane u postotcima

, onda se vagana aritmetička 

sredina računa pomoću izraza:

X

=

i

=

1

k

p

i x

i

Raširenost primjene aritmeričke sredine je karakteristika njenih svojstava. Osnovna svojstva 

aritmetičke sredine koja se mogu koristiti pri gruboj procjeni je li izračunata aritmetička 

sredina dobar reprezentant numeričkog niza.

Svojstvo   1.  

Svaka  

podjela   u   kojoj   su   vrijednosti   obilježja   pridružene   elementima   skupa 

natemelju 

intervalne 

ili 

omjerne 

skale ima aritmeticku sredinu.

Svojstvo 2.

  Pri izracunu aritmetičke sredine niza numeričkih podataka obuhvaćene su sve 

vrijednosti numeričkoga niza.

Svojstvo 3. 

 Svaki numerički niz ima 

tačno jednu 

aritmeticku sredinu.

Svojstvo   4.  

Aritmeticka   sredina   se   uvijek   nalazi   između   najmanje   (

xmin

)   i   najveće 

(

xmax

)vrijednosti numeričkoga niza, tj. vrijede nejednakosti:

x

min

≤ x ≤ x

max

Svojstvo 5. 

Aritmetička je sredina 

jedina 

srednja vrijednost takva da je 

zbir odstupanja svih 

elemenata numeri

č

koga niza 

od nje 

uvijek jednak nuli

.   

17

i

=

1

N

(

x

i

X

) = 0

Svojstvo   6.  

(

svojstvo   minimuma   zbira   kvadrata

)   Neka   je  

x

1

; x

2

....

x

i

zadani   numerički   niz 

podataka. Tada realna funkcija poprima minimalnu vrijednost za  

x  

=  

X  

,tj. navedeni zbir 

kvadrata poprima minimalnu vrijednost kad je vrijednost varijable  

x

  jednaka aritmetičkoj 

sredini elemenata zadanog niza.

i

=

1

k

(

x

i

-

x

¿

i

=

1

k

(

x

i

-a)² ; a

≠ x

Svojstvo   7.  

Aritmetička   sredina  

nije   dobar   reprezentant   numeri

c

koga   niza  

ukoliko   u 

numerickom nizu  

postoje ekstremno male ili velike vrijednosti  

promatranog kvantitativnog 

obilježja. 

Svojstvo 8.

Ako su vrijednosti numeričkog obilježja jednake konstanti c, aritmetička sredina 

tog obilježja jednaka je toj konstanti:

x

=c ; 

x

1

=

x

2

=......

x

N

=c

Ako imamo skup od 

elemenata a svi elementi su raspoređeni u 

podskupova ,zajednička 

sredina za skup tj. 

aritmetička sredina aritmetičkih sredina 

se izračunava:

x

=

i

=

1

k

N

i

x

i

N

   N=

i

=

1

k

N

i

Aritmetička   sredina   skupa   je   ponderisana   aritmetička   sredina   podskupova   ,   pri   čemu   su 

ponderi veličine podskupova.Članovi zbira u brojniku su podtotali.

Na isti način se računa i  

aritmetička sredina relativnih brojeva

  koordinacije i artimetičke 

sredine prosjeka.

Relativni brojevi koordinacije ili odnosa su veličine koje se dobiju kada se frekvencije jednog 

statističkog niza upoređuju sa frekvencijama drugog statističkog niza.Obe serije su samostalne 

, a nalaze se u nekom odnosu.Računa se po formuli

 

Relativni broj koordinacije (R)=

veličina koju upoređujemo

veličina s kojom upoređujemo

Primjer relativnog broja koordinacije: gustoća stanovništva; dohodak po stanovniku.

Pojava koja se upoređuje dobit će se pomoću formule:

D

i

=

P

i

C

i

Prosjek   relativnih   brojeva   koordinacije

  dobit   ćemo   računanjem   aritmetičke   sredine 

artimetičkih sredina:

background image

19

Pretpostavimo sada da su podaci grupisani, tj. da imamo ukupno 

različitih oblika

 

x

1

; x

2

....

x

i

Za svaki 

= 1, 2, …, 

označimo s 

fi  

apsolutnu frekvenciju oblika

xi

. Tada je 

vagana 

(

ponderirana

geometrijska sredina 

izračunata iz grupiranih podataka dana izrazom:

G=

N

x

1

f

1

… . x

k

f

k

  N=

i

=

1

k

f

i

log G =

1

N

i

=

1

k

f

i

log

x

i

   N=

I

=

1

k

f

i

Primjer 1.

Proizvodnja jednog artikla po mjesecima bila je 8, 12, 16, 19, 21 i 23. Izračunati 

prosječnu mjesečnu proizvodnju datog artikla

.

Primjer 2.

Raspored radnika prema random stažu u jednoj fabrici  bila je:

Godine 
staža

5-10

10-15

15-20

20-25

25-30

30-35

Broj 
zaposlenih

28

21

38

24

15

8

Izračunati prosečan radni staž zaposlenih

Godine staža
         (x

i

)

Broj zaposlenih 
(fi)

Razredna 
sredina

Logx

i

filogx

i

5-10

28

7,5

0.87506

24,50168

10-15

21

12,5

1,09691

23,03511

15-20

38

17,5

1,24303

47,23514

20-25

24

22,5

1.35218

32,45232

25-30

15

27,5

1,43933

21,58995

30-35

8

32,5

1,51188

12,09504
160,90924

G=15,87

Prosečni radni stažu fabrici bio je 15,87 godina.

Geometrijska sredina primjenjuje se u analizi vremenskih nizova.Nalazi se između najmanje i 

najveće vrijednosti niza.brojčano je manja od aritmetičke sredine.

20

1.2.3.Harmonijska sredina

Neka   je  

x

1

; x

2

....

x

i

konačan   numerički   niz   podataka   takav   da   za   svaki  

i  

=   1,   2,   …,  

vrijedinejednakost  

xi  

> 0.  

Harmonijska sredina  

(oznaka:  

H

) navedenog numeričkoga niza 

definiše   se   kao  

recipro

č

na   vrijednost   aritmetičke   sredine   recipro

č

nih   vrijednosti   svih 

elemenata   niza

..   Za   numeričke   nizove   kojima   je   barem   jedan   član   najviše   jednak   nuli 

harmonijska   sredina   se  

ne   definiše

.Prema   navedenoj   definiciji,   harmonijska   sredina 

negrupiranih numeri

č

kih podataka 

računase iz izraza:

H=

N

i

=

1

N

1

x

i

, x

i ≠

0

Izraz predstavlja jednostavnu harmobijsku sredinu.

Pretpostavimo sada da su podaci grupirani, tj. da imamo ukupno 

različitih oblika

x

1

; x

2

....

x

i

Za   svaki  

i  

=   1,   2,   …,  

n  

označimo   s  

fi  

apsolutnu   frekvenciju   oblika  

xi

.   Tada   je  

vagana 

(

ponderirana

harmonijska sredina 

izračunata iz grupiranih podataka data izrazom:

H=

i

=

1

k

f

i

i

=

1

k

f

i

x

i

Primjer1.

Prosjeĉna prodajna cijena proizvoda 2002.godine, te struktura vrijednosti prodaje 

prema prodajnim područjima:

Područje

Prosječna prodajna cijena 

u EUR

Struktura vrijednosti 

prodaje (%)

Sjever

490

35,0

Središnja regija

500

40,0

Jug

494

25,0

Odredite kolika je prosječna prodajna cijena za sva tri područja zajedno.

H=

i

=

1

k

f

i

i

=

1

k

f

i

x

i

 =

35

+

40

+

35

35

490

+

40

500

+

25

494

 =

100

0,2020359

 =494,96

Prosjeĉna prodajna cijena za sva tri područja zajedno je (zaokruţeno) 495EUR

background image

22

Primjer 2.Izračunavamje moda distribucije frekvencija sa razredima.

Broj saobraćajnih nezgoda prema godinama starosti.

God starosti

Broj učesn.

U saob.nezg.

Precizne 

granice raz.

Razredna 

sredina

Veličina 

razreda

f

i

x

si

i

0-4

12

0-5

2,5

5

5-9

20 (a)

5-10

7,5

5

10-14

28 (b)

10-15

12,5

5

15-19

19(c)

15-20

17,5

5

20-24

11

20-25

22,5

5

x

si

=

l

1

+

l

2

2

Precizne   granice   razreda   (kolona   3)   određujemo   tako   da   donja   granica   razreda   kojeg 

promatramo mora biti jednaka gornjoj granici prethodnog razreda.

M

o

=

10

+

(

28

20

)

(

28

20

)+(

28

19

)

5

=

12,35

Dobna grupa koja najčešće stradava u saobraćajnim  nezgodama je stara 

12, 35 godina.

Mod, kao mjera centralne tendencije , određen je položajem u nizu.Na njega ne djeluju izraziti 

male ili velike vrijednosti numeričkog niza.Prednost je što se može utvrditi i kod kvalitativnih 

i   kvantitativnih   obilježja.Ne   može   se   odrediti   ako   nema   bar   dva   podatka   sa   istim 

obilježjem.Određivanje moda je nepouzdano kod izrazito asimetrične distribucije u kojima je 

otvoren modalni razred.

1.2.5. Medijana

Medijan-Medijana (oznaka  

M

e

) je vrijednost numeričkog obilježja X, koja niz  

uređen po 

veličini

  dijeli   na   dva   jednaka   dijela.Prva   polovina   članova   niza   ima   vrijednost   obilježja 

jednaku medijani ili manju od nje, a preostalih 50% članova nizaima vrijednost obilježja veću 

od medijane..Medijana je određena položajem u nizu i zbog toga se ubraja u grupu položajnih 

srednjih vrijednosti

Medijana, kod negrupisanih vrijednosti obilježja, određuje se tako da se one najprije urede po 

veličini, od najmanje prema najvećoj.

23

Ukoliko je broj članova uređenog statističkog  niza neparan, N  =  2 k +1, tada jemedijana 

jednaka vrednosti {

N

+

1

2

} -og člana niza, a ukoliko je broj članova uređene statističkog niza 

paran, N = 2  k , tada je medijana jednaka

aritmetičkoj sredini {

N

2

}-og i {

N

2

+1}-og člana tog niza.

Za negrupisane vrijednosti medijana je:

N=2k+1   

M

e

=

x

N

+

1

2

N=2k     

M

e

=

x

N

2

+

X

{

N

2

+

1

}

2

Primjer 1.

Odrediti medijanu za sljedeći niz podataka:

18, 25, 19, 22, 26, 28, 30, 16, 36

Prvo se niz podataka uredi po veličini:

16, 18, 19, 22, 25, 26, 28, 30, 36.

Pozicija medijane je 

, što znači da je medijana vrijednost petog člana niza: 

M

e

=25

Kod grupisanih obilježja(distribucija frekvencija) polazi se od predpostavne da su članovi 
niza u medijalnom razredu međusobno jednako udaljeni.Da bismo odredili Me za grupisane 
podatke neprekidnog tipa, potrebno je prvo da pronađemo medijalnu razreda Me.pronalaženje 
vrijednosti obilježja srednjeg člana niza, pojednostavljuje se upotrebom empirijske funkcije 
distribucije tj. kumulativnog niza „manje od“.

Za izračunavanje medijane distribucije frekvencija s razredima može se primjeniti sljedeći 
izraz:

M

e

=

L

1

N

2

f

i

f

med

pri čemu je u navedenom izrazu:

L

1

¿¿

donja prava ili precizna granica medijalnog razreda,to je razred s najmanjom vrijednosti 

empirijske funkcije distribucije(kumulativnog niza „manje od“)koja uključuje veličinu N/2.

N- je zbir apsolutnih ili relativnih frekvencija

f

i

–zbir frekvencija do medijalnog razreda

i

-veličina medijalnog razreda

f

med

¿¿

frekvencija medijalnog razreda

background image

25

Kvantili(

oznaka p) su vrijednosti numeričkog obilježja koji niz uređen po veličini dijeli na q 

jednakih dijelova.Broj kvantila pje za jedan manji od njegova reda q.Pa iz ovog možemo 
zaključiti da je medijana   kvantil q=2, pa je p=1, jer je dovoljna jedna vrijednost da se niz 
podjeli na dva dijela.Kvantili koji niz dijele na deset jednakih dijelova nazivaju se  

decili. 

Ukupni broj decila je devet.Percentili dijele niz na sto jednakih dijelova i njih je ukupno 
devedeset devet.kvantile su značajne deskriptivno statističke veličine.

Kvartili 

su 

položajne

vrijednosti koje uređeni numerički niz dijele na ukupno 4 jednaka dijela. 

Ima ih ukupno4 – 1 = 3,p=3 a imaju svoja posebna imena i oznake:

– 

prvi 

ili 

donji kvartil 

(oznaka: 

Q

1);

– 

drugi kvartil 

ili 

medijan 

(oznake: 

Q

2, 

Me

);

– 

tre

ć

ili 

gornji kvartil 

(oznaka: 

Q

3)

Prvi ili donji kvartil

 je vrijednost obilježja koja članove niza dijeli u dvije grupe.U prvoj se 

grupi nalazi ¼ elemenata s vrijednostima obilježja koja je jednaka ili manja od kvartila a u 

drugoj su grupi ¾ članova s većim vrijednostima od kvartila.

Treći kvartil

 je vrijednost obilježja, koja dijeli niz na dva dijela.U prvoj su grupi članovi, nih 

¾, s vrijednostima obilježja koja je jednaka ili manja od gornjeg kvartila.Posljednja četvrtina 

ima vrijednost obilježja veću od trećeg kvartila.

Tumačenje drugog kvartila, već je dato, jer je drugi kvartil jednak medijani.

Sve   ovo   prethodno   što   je   napisano   odnosi   se   na   negrupisane   numeričke   ili 

redosljedne(ordinalne) podatke

Primjer 1.

Negrupirani numerički podaci Mjesečna proizvodnja istovrsnog proizvoda na 10 

dislociranih proizvodnih mjesta (u tonama):

72 81 74 85 88 74 86 94 79 90 

Niz uređen po veličini:

72 

74

 74 79 81 

M

e

 85 86 

88

 90 94

Q

1

Q

2

Q

3

26

Kod   grupisanih   numeričkih   obilježja(distribucije   frekvencija)   podaci   su   već   uređene   po 

veličini,   pa   se   postupak   određivanja   kvantila   svodi   na   utvrđivanje   rednih   brojeva 

podataka.postupak se ubrzava upotrebom kumulativne frekvencije.

Izraz za izračunavanje 

donjeg kvartila

 kod grupisanih podataka je :

Q

1

L

1

+

N

4

f

i

f

kvar

i

A za gornji kvartil

:

Q

3

L

1

+

3

N

4

f

i

f

kvar

i

L

1

-

donja granica kvartilnog razreda

N-ukupan zbir članova niza

f

i

-zbir frekvencija do kvartilnog razreda

f

kvar

-frekvencija kvartilnog razreda

i

-veličina kvartilnog razreda

background image

28

1.3. MJERE DISPERZIJE

Srednjim vrijednostima se opisuje gomilanje podataka oko nekog oblika obilježja.srednja je 

vrijednost   konstanta,   kojom   se   niz   varijabilnih   podataka   opisuje   jednim   brojem   .za 

upoznavanje   karakteristika   podataka   važna   je   značajna   i   informacija   o   stepenu   njihove 

varijabilnosti.Moguće je da različiti skupovi imaju jednake srednje vrijednosti, ali se razlikuju 

po stepenu varijabilnosti(raspršenosti) obilježja.

Izračun   neke   od   potpunih   ili   položajnih   srednjih   vrijednosti   predstavlja   tek   jedan   korak 

ustatističkoj   analizi   nekoga   obilježja.   Sljedeći   je   korak   analiza  

reprezentativnosti 

izračunatesrednje   vrijednosti,   odnosno,   pojednostavljeno   rečeno,   određivanje  

pokazatelja 

kolikoizračunata srednja vrijednost dobro opisuje elemente osnovnoga skupa. Ti pokazatelji 

gotovosu jednako važni kao i izračunate srednje vrijednosti. 

Kako   bi   se   moglo   što   bolje   opisati  

stepen   varijabilnosti  

statističkih   podataka,   definišu 

seodgovarajući   statistički   pokazatelji   pod   zajednickim   imenom

 

mjere 

raspršenosti

(stepenvarijabilnosti;   disperzije).   Mjere   disperzije     mogu   biti  

apsolutne  

relativne

.

Apsolutne 

mjere disperzije su:

raspon varijacije, interkvartil

,varijansa i standardna devijacija.

Zajedničko   obilježje   svih   navedenih   mjera   jest   iskazivanje   u   jedinicama   mjere 

obilježjastatistickog skupa (KM, €, kg, cm itd.)

MJERE 

DISPERZIJE

APSOLUTNE 

MJERE 

DISPERZIJE

1. Raspon 

varijacije (R)

2.Interkvartil (I 

Q)

3.Varijansa(δ2)

4.Standardna 

devijacija (δ)

RELATIVNE 

MJERE 

DISPERZIJE

1.Koeficijent 

varijacije(V)

2.Koeficijent 

kvartalne 

devijacije (I Q)

29

Relativne  

mjere   raspršenja   obično   se   izražavaju   u   postocima,   a   dvije   najčešće   su 

koeficijentkvartilne devijacije i koeficijent varijacije

.

Ukoliko je posmatrano obilježje  

kvantitativno

, potrebno je izračunati   sve navedene mjere. 

Ukoliko   je   posmatrano   obilježje  

kvalitativno   redosljedno

,   zaanalizu   disperzije   mogu   se 

koristiti   raspon   varijacije,   interkvartil   i   koeficijent   kvartilnedevijacije.   Grubu   sliku   (''prvi 

utisak'')   o   raspršenosti   podataka   u   osnovnom   skupu     možepredstavljati   i   odgovarajući 

grafikon, a riječje o 

dijagramu rasipanja 

ili 

dijagramu raspršenja.

Navedene mjere disperzije su svojevrsne mjere reprezentativnosti srednjihvrijednosti. Manja 

mjera disperzije znači bolju reprezentativnost srednje vrijednosti iobrnuto. 

1.3.1. Raspon varijacije

Raspon varijacije 

(oznaka: 

R

) je najjednostavnija mjera disperzije, definiše kao razlikaizmedu 

najveće   (

X

max

)   i   najmanje   (

X

min

)   vrijednosti

 

kvantitativnog

(ili,   eventualno, 

kvalitativnogredosljednog) obilježja. Dakle,

X

max

-

X

min

Najmanja moguca vrijednost raspona varijacije jednaka je nuli i nastupa u slučajevima kad 

jeniz vrijednosti kvantitativnoga obilježja 

konstantan

. Najveca vrijednost rasponavarijacije ne 

može se  odrediti.

Primjer 1. 

Navršene godine radnoga staža svih 10 zaposlenika firme čine niz: 20, 12, 7, 29, 

32, 10, 18, 16, 8, 17. Najveća vrijednost u tom nizu je  

X

max

= 32, anajmanja  

X

min

= 7. Pa je 

raspon varijacije vrijednosti posmatranog obilježja

R  

= 32 – 7 = 25 (godina).

Raspon varijacije distribucije frekvencija s razredima može se odrediti ako je poznata najveća 

i najmanja vrijednost promjenljive.raspon je razlika gornje granice posljednjeg i donje granice 

prvog razreda.

Nedostatak raspona varijacije je u tome što uzima samo dvije vrijednosti niza, i to najmanju i 

najveću, a ne uzima u obzir raspoređivanje ostalih podataka.Primjenjuje se za mjerenje 

varijacija npr. cijena, izmjene kursa dionica na berzi. 

background image

31

Raspon   varijacije   i   interkvartil   su   nepotpune   mjere   disperzije.primjenjuju   se   za   mjerenje 

disperzije numeričkih i redosljednih nizova.

1.3.3.Varijansa i standardna devijacija

Varijansa   i   iz   nje   izvedena   standardna   devijacija   obično   se   svrstava   u   red 

najvažnijihpokazatelja varijabiliteta ili raspršenosti   kvantitativnih obilježja. Osnovni razlog 

je,   da   je   zbir   odstupanja   svih   vrijednosti   kvantitativnog   obilježja   od   njihovearitmetičke 

sredine  

uvijek  

jednak   nuli,   pa   taj   pokazatelj   ne   možemo   koristiti   za   opisvarijabiliteta 

statističkoga niza. Drugi je razlog tome što u računanju varijanse, a samim tim i standardne 

devijacije,   koristimo   sve   elemente   statističkog   niza,   pa   je   možemo   svrstatikao  

potpunu 

mjerom   disperzije.Varijansa   i   standardna   devijacija   mogu   seračunati   i   iz   ''sirovih'' 

(negrupiranih ili neuređenih) i iz grupiranih podataka

.

Varijansa  

(oznaka:     σ

2  

grčko   slovo    

sigma

)   se   definiše   kao  

aritmetička   sredinakvadrata 

odstupanja   vrijednosti   kvantitativnoga   obilježja   od   aritmeti

c

ke   sredine   svihvrijednosti

Varijansa   se   definiše   kao  

prosječno   kvadratno   odstupanje  

vrijednosti   kvantitativnoga 

obilježja odaritmetičke sredine tih vrijednosti.Formula za izračunavanje varijanse je:

σ

²

=

i

=

1

N

(

X

i

X

)

2

N

 ; 

Kako je varijansa mjera data u drugom stepenu, što otežava njeno tumačenje.Radi lakšeg 

objašnjavanja   stepena   varijabilnosti   obilježja   ,   kao   mjera   disperzije,   uzima   se   standardna 

devijacija.

Pošto je varijansa ''kvadratna'' mjera disperzije, relativno teško  je tumačiti. Pomoćudrugoga 

korijena   iz   varijanse   dolazimo   do     najprimjenjenije   potpune   mjeredisperzije:  

standardne 

devijacije

.  

Standardna devijacija  

je po definiciji,  

drugikorijen iz varijanse

. Takva formalna 

definicija obično se zamjenjuje matematički netačnom,ali prihvatljivijom definicijom prema 

kojoj je standardna devijacija  

prosječnoodstupanje vrijednosti kvantitativnoga obilježja od 

aritmeti

č

ke sredine tih vrijednosti  

ili, joškraće i još nepreciznije,  

prosje

č

no odstupanje od 

prosjeka

. Istaknimo da je ''mjerna jedinica''za standardnu devijaciju jednaka ''mjernoj jedinici'' 

odgovarajućeg kvantitativnog obilježja(KM, €, kg, cm itd.).

32

σ=

i

=

¿¿

N

(

X

i

X

)

²

N

Primjer 1

.Visina petoro slučajno odabranih studenata EF-a

Visina u cm

|

X

i

X

)

|

(

X

i

X

)

2

178

168

176

172

202

  1.2

11.2

  3.2

  7.2

22.8

    1.44

125.44

  10.24

  51.84

519.84

896

45.6

708.80

X

=

896

5

 =179,2

σ

²

=

i

=

1

N

(

X

i

X

)

2

N

=

708,80

5

=141,76 cm

σ=

i

=

¿¿

N

(

X

i

X

)

²

N

 =

σ

²

 =11,90cm

Varijansa distribucije frekvencija numeričkih obilježja je 

vagani prosjek kvadrata odstupanja 

vrijednosti te promjenljive od njenog prosjeka.

Ponderi predstavljaju apsolutne frekvencije.

Uzraz varijanse distribucije frekvencija je:

σ

²

=

i

=

1

N

f

i

(

X

i

X

)

2

N

     N=

i

=

1

k

f

i

Primjer 2

Posmatramo statistički skup svih stanova u onim stambenim zgradama(novogradnja 

i dogradnja) koje su 2006. godine dobile građevinsku dozvolu u Srbiji. Posmatrani skup 

dijelimo prema broju soba u stanu:

background image

34

10 – 15

29

15

11

20

3

20 – 40

8

Ukupno:

3 742

Odredimo   prosječno   trajanje   kazne   po   jednom   izvršiocu,   te   varijansu   i   standardnu 

devijacijutrajanja kazni. U tablici imamo ukupno 7 pravih razreda i dva obilježja koja nisu 

grupisanau razrede. Za svaki pojedini razred računamo 

razrednu sredinu

, a potom i vaganu 

aritmetičkusredinu:

Trajanje kazne 

(godine)

Broj izvršitelja (f

i

)

Razredna 

sredina (x

i

)

f

i

 x

i

f

i

(

X

i

X

)

2

0 – 1

2 535

0.50

1267.50

1 866,17

1 – 2

658

1.50

987

13,26

2 – 3

232

2.50

580

302,56

3 – 5

164

4

656

1 144,74

5 – 10

102

7.50

765

3 847

10 – 15

29

12.50

362.50

3 600,18

15

11

15

165

2 047,14

20

3

20

60

1 042,57

20 – 40

8

30

240

6 562,91

Ukupno:

3 742

5083

20 426,53

Vagana aritmetička sredina jednaka je:

35

X

=

i

=

1

k

f

i X

i

N

=

5083
3742

=

1,358god

σ

²

=

i

=

1

N

f

i

(

X

i

X

)

2

N

=

20 426,53

3742

 =5,45 god

σ

=

σ

²

=

¿

2,33 god.

1.3.3.1.Koeficijent varijacije

Vec  smo istakli da je standardna devijacija potpuna apsolutna mjera disperzije iskazana u 

jedinicamaposmatranog   kvantitativnog   obilježja.   Kao   takva,   standardna   devijacija   nije 

pogodna   zapoređenjepromjenljivih   sanajmanje   dva   različita   tipa   kvantitativnih   obilježja 

premakojima se može podijeliti isti statistički skup. Posmatramo li npr. skup svih takmičara 

uizboru za ovogodišnjeg Mistera   i podijelimo li sve njegove elemente prema obilježjima 

masa  

i  

visina

,   onda   na   osnovu   standardne   devijacije   ne   možemo   reći   razlikuju   lise 

posmatranitakmičari   više   prema   masi   ili   prema   visini.   U   takvim   se   slučajevima 

obavezno

primjenjuju  

relativne  mjere  disperzije  

jer  one ne  zavise o  ''mjernim  jedinicama'' 

posmatranogobilježja.   Koeficijen   varijacije   je   odnos   standardne   devijacije   i   aritmetičke 

sredine pomnožen sa sto:

V=

σ

X

 100

Dvije najčešce primjenjivane mjere su 

koeficijent varijacije 

koeficijent kvartilnedevijacije

, a 

koriste   se   ponajprije   za   poređenje   varijabiliteta.     Slobodno   govoreći,   možemo   reci   da   je 

koeficijent   varijacije  

zapravo   prosječno   odstupanje   vrijednosti   kvantitativnoga   obilježja   od 

aritmetičke sredineiskazano u postotcima. Koeficijent varijacije nezavisno otome jesu li podaci 

grupirani ili nisu računamo prema istoj formuli.

Istaknimo   da   se   koeficijent   varijacije   primijenjuje   gotovo   isključivo   u   statistickoj 

analizikvantitativnih obilježja vezanih za  

ordinalnu  

skalu (zbog dogovorno definirane nule 

nijeprimjenjiv u obilježjima vezanima za  

intervalnu  

skalu). Njegovi osnovni nedostaci su 

lošareprezentativnost u slučaju ekstremnih vrijednosti ili otvorenih razreda, te osjetljivost na 

malepromjene aritmetičke sredine u slučajevima kad je aritmetička sredina vrlo blizu nuli.

Primjer 1. 

Utvrdimo varijabilitet navršenih godina starosti svih nezaposlenih osoba uSomaliji 

u februaru 2008. godine:

background image

37

Ovakvi   problemi   rješavaju   se   računanjem   vrijednosti   tzv.  

standardiziranoga   obilježja 

(oznaka:

z-obilježje;   z-skoro

).Standardizirano   obilježje   služi   za   utvrđivanje   položaja 

numeričkog   podatka   u   nizu.   Riječje   o   linearnoj   transformaciji   vrijednosti   kvantitativnoga 

obilježja definisanoformulom

:

z

i

=

x

i

x

σ

 i

=1,20.....N

gdje je uobicajeno 

x

aritmeticka sredina, a standardna devijacija vrijednosti varijable 

x

.Zbog 

svog svojstva standardizirano obilježje ima veliku primjenu.Njegovo svojstvo je:

Aritmetička 

sredina standardiziranog obilježja jednaka je nuli, a standardna devijacija jedan  

tj:  

z

  =0 ; 

σ

z

=

1

Standardizirano   obilježje   pokazatelj   je   relativnog   položaja   pojedinačne   vrijednosti 

numeričkog obilježja u nizu, ne zavisi o mjernim jedinicama, može poslužiti za poređenje 

položaja   podataka   u   različitim   nizovima.Standardizirana   obilježja   može   imati   različite 

vrijednosti, koje mogu biti pozitivne ili negativne.Po pravilu rijetko odstupaju od aritmetičke 

sredine za više od tri standardne devijacije na lijevu ili desnu stranu., pa s tim u vezi koristi se 

teorema Čebiševa.Prema teoremi pojas od

X ±

2σ obuhvata najmanje proporciju od 75% svih 

podataka, pojas od 

X ±

3σ sadrži najmanje 88,89% podataka.

1.4.

Vrste distribucija

Podjela statističkih skupova prema 

kvantitativnim 

obilježjima grupišemo prema tome kakosu 

vrijednosti   obilježja   elemenata   tog   skupa   raspoređene   oko   najvažnije   srednje 

vrijednosti:aritmetičke sredine. Prema tome razlikujemo tri osnovne vrste  statističkoga skupa:

Ako   su   vrijednosti   obilježja   elemenata   statističkoga   skupa   ravnomjerno   raspoređene 

okoaritmetičke sredine, govorimo o  

simetrč

c

noj distribuciji

.  

Kod simetrične distribucije sve 

tri srednje vrijednosti su jednake (

X

Me 

Mo

)

.

Ako skup vrijednosti obilježja elemenata statističkoga skupa sadrži bar jednu 

ekstremnoveliku 

vrijednost,   govorimo   o  

pozitivno   asimetričnoj     distribuciji

.   Kod   pozitivnoasimetrične 

distribucije vrijede nejednakost: 

X

>

Me 

>

Mo

.

38

Ako skup vrijednosti obilježja elemenata statističkoga skupa sadrži bar jednu 

ekstremnomalu 

vrijednost,   govorimo   o  

negativno   asimetri

č

noj   distribuciji

.   Kod   negativnoasimetrične 

distribucije vrijede nejednakosti: 

X

<

Me 

<

Mo

.

1.4.1. 

Mjere asimetrije

Pri   opisu   distribucije   vrijednosti   obilježja   elemenata   određenoga   statističkog   skupa, 

osimsrednjih vrijednosti i mjera disperzije, koristimo i 

mjere asimetrije

. Tim mjerama nastoji 

sejednim   numeričkim   pokazateljem   opisati  

na

č

in   rasporeda  

kvantitativnih  

podataka 

premaaritmetičkoj sredini ili nekoj drugoj srednjoj vrijednosti. U praksi se najcešce koriste tri 

mjereasimetrije:

1.)

Pearsonovamjera   asimetrije  

(oznaka:  

Sk

)   je   mjera   asimetrije   definirana   kao  

omjer 

aritmeti

c

ke sredine x i medijana Me

, odnosno 

moda Mo

izražen u jedinicama standardne 

devijacije .

U simetričnim distribucijama kontinuirane varijable sve su tri vrijednosti 

jednake, pa je razlika moda ili medijana i aritmetičke sredine jednaka nuli. U pozitivno 

asimetričnim distribucijama ta je razlika pozitivna, a u negativno asimetričnim razlika je 

negativna. Pearsonova mjera uobičajeno poprima vrijednosti iz intervala +3, ali moţe biti 

i izvan tog intervala. 

Pearsonova mjera asimetrije:

S

k

=

(

x

M

o

)

σ

 ; 

S

k

1

=

3

(

x

M

e

)

σ

2.)

Bowleyevamjera asimetrije 

(oznaka: 

SkQ

) racuna se iz medusobnoga odnosa 

tri kvartila

prvog   (

Q

1),   trećeg   (

Q

3)   i   medijana   (

Me

).   Na   temelju   toga   odnosa   odreduje   se 

asimetri

c

nost   središnje   polovice  

(središnjih   50%)  

elemenata   ure

d

enoga   statisti

c

koga 

niza

.U simetričnom rasporedu vrijednosti razlika gornjeg kvartila i medijana, jednaka je 

razlici medijana i donjeg kvartila tj. Q1+ Q3-2Me=0 

U pozitivno asimetričnom rasporedu razlika gornjeg kvartila i medijana veća je od razlike 

medijana   i   donjeg   kvartila,   a   u   negativno   asimetričnom   razlika   gornjeg   kvartila   i 

medijana manja je od razlike medijana i donjeg kvartila. 

Mjera poprima vrijednosti iz intervala + 1.Računamo je prema formuli:

S

kQ

=

Q

1

+

Q

3

+

2

M

e

Q

3

Q

1

background image

40

Standardna devijacija = 6,03

μ

=

i

=

1

N

f

i

(

x

i

x

)

³

N

 =

839,919

90

=9,32

α

3

=

μ

3

δ

3

 =

9,32

6,03

3

=0,043

1.4.2. Mjere zaobljenosti

Vecina pojava u prirodi, raznim privrednim i tehničkim procesima i sl. raspoređena je uskladu 

s   tzv.  

normalnom   distribucijom

.   Ova   se   distribucija   vrlo   precizno   definiše   u 

matematičkojstatistici i za to je potreban nešto složeniji aparat teorije vjerojatnoće. Ovdje 

ćemo samonapomenuti da je riječo potpuno simetričnoj unimodalnoj distribuciji takvoj da se 

otprilike svipodaci (tačnije,njih 99.73% ) posmatranog obilježja nalaze u rasponu [

x

– 3, 

x

3],gdje   je  

x

aritmetička   sredina,   a

δ

standardna   devijacija   distribucije.   Ova   je  činjenica 

korisna pri procjenjivanju je li neka distribucija (približno) normalna ili nije.

S obzirom na veliki značaj normalne distribucije u statistici, definisane su posebne mjere 

kojima   se   pojedine   distribucije   uspoređuju   s   normalnom.   To   su   tzv.  

mjere   zaobljenosti. 

Zaobljenost u okolini modalnog vrha krivulje distribucije frekvencija brojčano se opisuje 

koeficijentom zaobljenosti.Koeficijen je definisan kao odnos četvrtog momenta oko sredine i 

standardne devijacije na četvrtu potenciju.

Koeficijent je:

α

4

=

μ

4

δ

4

Zaobljenost normalne distribucije mjerena koeficijentom zaobljenosti iznosi 3., ako je za neku 

empirijsku   distribuciju   vrijednost   koeficijenta   veća   od   3,   ta   je   distribucija   šiljastija   od 

normalne,a ako je koeficijent manji od tri , tada je distribucija plosnatija od normalne.da bi se 

izračunala   vrijednost   koeficijenta   zaobljenosti   ,   potrebno   je   odrediti   vrijednost   četvrtog 

momenta   oko   sredine.Četvrti   moment   oko   sredine   je   prosječno   odstupanje   vrijednosti 

numeričkog obilježja od njezine aritmetičke sredine podignuto na četvrtu potenciju.

μ

4

=

i

=

1

N

(

x

i

x

)

4

N

za negrupisane podatke

41

μ

4

=

i

=

1

N

f

i

(

x

i

x

)

N

za grupisane podatke

Primjer 1.Izračunavanje mjera asimetrije 
Tabela: Učesnici saobraćajnih nesreća prema godinama starosti

Godina 
starosti

Broj 
sudionik
a
f

i

Precizne 
granice

Sredin
a
razred
a Xsi

Veli
ĉina 
razre
da

fi Xsi

fi (Xi 
-X)³

fi (Xi 
-X)4

0-4

12

0-5

2,5

5

3,0

-11294
,13

110684,1

5-9

20

5-10

7,5

5

150,0

-2211,
8

10616,83

10-14

28

10-15

12,5

5

350,0

0,224

0,0448

15-19

19

15-20

17,5

5

332,5

2871,2

13872,07

20-24

11

20-25

22,5

5

247,5

11673,
288

119067,5

ukupno

90

-

-

-

1110,

838,91

254260,6

μ

4

=

i

=

1

N

f

i

(

x

i

x

)

N

254260,6

90

=2825,12

α

4

=

μ

4

δ

4

 =

2825,12

6,03

4

 =

2,1368

Koeficijent zaobljenosti je manji od 3, pa se može zaključiti da se radi o distribuciji koja je 

plosnatija od normalne.

1.5.

Programska pomoć deskriptivnoj statističkoj analizi

Danas   je   u   uporabi   više   različitih   računarskih   programa   namijenjenih   statističkim 

analizama.Najpoznatiji   od   njih   su  

SAS

,  

SPSS  

i  

STATISTICA

.   U  

MS   EXCEL

-u   potpunu 

statističku analizuvrijednosti 

kvantitativnoga 

obilježja elemenata statističkoga skupa možemo 

dobiti koristeći alat

Descriptive Statistics 

smještenu u izborniku 

Alati 

(

Tools

), opcija: 

Analiza 

podataka 

(

DataAnalysis

). Taj je alat dio 

Analysis ToolPak 

alata za analizu, a stvara statistički 

background image

43

2.TEORIJA VJEROVATNOĆE

Dio matematike koja proučava slučajne pojave jeste upravo  

teorija vjerovatnoće

. Postanak 

teorije   vjerovatnoće   pripadali   su   hazardnim   igrama,   a   posebno   igrama   sa   kockom.   Prva 

teorijska   razmatranja   o   teoriji   vjerovatnoće   nalaze   se   kod   francuskih   matematičara   Bleza 

Paskala   i   Pjera   Ferma.   Švajcarski   matematičar   Jakov   Bernuli   dokazao   je   zakon   velikih 

brojeva (Bernulijev zakon) i time otvorio novu oblast u teoriji vjerovatnoće i njenu primjenu u 

statistici.                                                                                  

Značajan rezultat u razvoju teorije vjerovatnoće dali su  francuski matematičari Abraham De 

Moavr i Pjer Laplas, a njemački matematičar Karl Gaus je analizirao slučajne greške pri 

mjerenju i došao do normalnog zakona (Gausov zakon normalne krive). Ruski matematičar 

Čebišev i njegovi učenici A.Markov, A.Ljapunov i A.Kolmogorov takođe su dali značajan 

razvoju i primjeni teorije vjerovatnoće, čime je ova teorija postala ravnopravna matematička 

disciplina sa geometrijom i algebrom.

2.1.Osnovni pojmovi vjerovatnoće

U okviru osnovnih pojmova iz teorije verovatnoće neophodno je prije svega definisati: Ako 

izvodimo   neki   eksperiment   rezultat   tog   eksperimenta     nazivaju   se  

događaji.

Svaki   proces 

posmatranja   nekog   događaja   naziva   se  

eksperiment

,    

ogled(pokus)

,a   rezultat   takvog 

posmatranja je 

ishod

.

  Neki događaji proizilaze uvijek prilikom izvođenja eksperimenta i njih nazivamo  

sigurnim 

događajima

. Za događaje koji se ne mogu pojaviti pri izvođenju eksperimenata kaže se da je 

nemoguć događaj

. Slučajan događaj nastupa sa nekom vjerovatnoćom, jer unaprijed se ne 

može utvrditi njegov ishod.

Primjer 1

:

Kolika je vjerojatnoća da će kod bacanja  novčića,novčić pasti na ”pismo”?

2.2..Vrste vjerovatnoće

Postoje sljedeće vrste vjerovatnoće: 

- Klasična vjerovatnoća(a priori) 

- Statistička vjerovatnoća(a posteriori) 

- Subjektivna vjerovatnoća 

- Geometrijska vjerovatnoća 

44

- Uslovna vjerovatnoća 

- Totalna vjerovatnoća  i Bajesova formula

2.2.1. Klasična vjerovatnoća (a priori)

Klasična (a priori) vjerovatnoća nekog događaja predstavlja odnos broja za njega povoljnih 

ishoda (m) prema broju svih jednako mogućih ishoda (n). Ili još jednostavnije: ako se jedan 

događaj (A) može desiti na (m) načina, onda se vjerovatnoća ostvarenja događaja (A) izražava 

odnosom 

:

p(A)=

m

n

0 ≤ p(A) ≤ 1.

Vjerovatnoća da će se desiti neki događaj označava se s p, a vjerovatnoća da se neći desiti 

neki  događaja s q. Prema tome vjerovatnoća nenastupanja nekog događaja bit će

q

=

1

p

Ako je potpuno sigurno da će se neki događaj dogoditi onda je vjerovatnoća tog događaja 

p=1, a takav događaj naziva se siguran događaj (npr. Poslije noći dolazi dan).

Ako je potpuno sigurno da se neki događaj neće dogoditi onda je vjerovatnoća tog događaja 

p=0, a takav događaj naziva se nemoguć događaj (npr. Visina čovjeka je 100 metara).

Događaji čija je vjerovatnoća nastupanja veća od 0 i manja   od 1 nazivaju se vjerovatni 

događaji, a njihova vjerovatnoća je

0 < p < 1.

Samo vjerovatni događaji predmet su izučavanja.

Primjer   1:

Posmatrajući   slučajan   eksperiment   u   kojem   bacamo   pravilnu   kocku   i   zbog 

simetričnosti kocke prihvatamo predpostavku o jednakoj mogućnosti javljanja svake strane 

kao ishoda eksperimenta. Kako je n=6, vjerovatnoća javljanja svake pojedinačne strane iznosi 

P

(

A

)=

1
6

.

2.2.2.Statistička vjerovatnoća 

Statistička vjerovatnoća je vjerovatnoća slučajnog događaja A ako se neki eksperiment može 

pod istim uslovima ponoviti neograničen broj puta. Izračunava se na osnovu sledeće formule:

background image

46

Ako   je   dat  

a

1

;

a

2

… . a

n

povoljnih,   međusobno   isključivih,   elementarnih   događaja   onda   je 

vjerovatnoća   da   će   se   dogoditi   bilo   koji   od   tih   događaja  

a

i

(i=1,2,...,n)     jednaka   zbiru 

vjerovatnoća nastupanja pojedinih događaja. To znači da je:

p = p(

a

1

)+p(

a

2

)+p(

a

3

)+...+p(

a

n

)

Npr. kod bacanja kocke dogadaji A = ”pojavit će se paran broj manji od 6 i B = pojavit će se 

neparan   broj   manji   od   5”   su   međusobno   isključivi   jer   nijedan   od   elementarnih   dogadaja 

(pojavljivanje 1, 2, 3, 4, 5 ili 6), ne vodi na istovremeno ostvarenje dogadaja A i B. Oni vode 

na ostvarenje  ili događaja A ili događaja B.

Za dva događaja A i B kažemo da su isključivi, ako ne postoji elementarni događaj koji 

ostvaruje oba ova dogadaja.Iz ovog slijedi da je vjerovatnoća :

P(AiliB)=P(A)+P(B)

Primjetimo da znak + kada stoji između događajima, ne znači isto kao i

znak + kada stoji između brojeva. Takoder riječ ili ovdje ima svoje  

isključivo  

značenje:ili 

jedno ili drugo, ali ne i oba zajedno.

Zakon multiplikacije:

Ako su dati povoljni elementarni događaji 

a

1

;

a

2

…..

a

n

koji se međusobno ne isključuju (mogu 

se   istovremeno   pojaviti),   vjerovatnoća   da   će   nastupiti   više   takvih   nezavisnih   događaja 

istovremeno jednaka je proizvodu vjerovatnoće pojavljivanja svakog od tih događaja. To 

znači da je

p = p(

a

1

) x p(

a

2

) x  p(

a

3

) x  ...x p(

a

n

).

Pretpostavimo   sada   da   postoje   dva   dogadaja   A   i   B   čija   se   ostvarenja   međusobno   ne 

isključuju. Npr. bacaju se istovremeno novčić i kocka.  

Događaj A je

  da će novčić pasti 

na“pismo” (bez obzira na kocku), a događaj B je da će kocka pasti na paran broj(bez obzira 

šta pokazuje novčić).Svaki mogući događaj od A možemo kombinovati sa svakim mogućim 

događajem od B I tako dobijemo da je vjerovatnoća događaja A I događaja B:

                                                 P(A i B) =P(A) x P(B)

47

Slučajna promjenljiva

, x, je promjenljiva koja poprima pojedinačne vrijednosti s određenom 

vjerovatnoćom. Dva su osnovna tipa:  

diskretna ili diskontinuirana

  slučajna promjenljiva: 

numeričke vrijednosti su cijeli brojevi (primjer: broj nezrelih ćelija u nekom preparatu može 

biti   0;1;2..k  

kontinuirana

  slučajna   promjenljiva:   numeričke   vrijednosti   su   realni   brojevi 

(primjer:  težina 72,35 kg, glukoza u krvi 7,2 mmol/l ).

Distribucija(raspodjela)vjerovatnoće

 

prikazuje   način   na   koji   je   ukupna 

vjerovatnoćaraspodijeljena na pojedine vrijednosti slučajne promjenljive.Svaku distribuciju 

vjerovatnoće   definišu   parametri   (npr.   prosjek,   varijansa).

Zavisno   od   tipa   slučajne 

promjenljive i distribucije dijelimo na diskretne i kontinuirane.

Diskretne   distribucije   vjerovatnoće

:

  Možemo   izvesti   vjerovatnoću   za   svaku   moguću 

vrijednosti slučajne promjenljive.Zbir svih mogućih vjerovatnoća slučajne promjenljive je 

1.Primjeri: Binomna raspodjela, Poissonova raspodjela.

Binomna   distribucija

:To   je   teorijska   distribucija   za   diskretne   slučajne   promjenljive   kada 

imamo dva moguća ishoda,jedan je  “uspjeh” I drugi “neuspjeh”, u “n” mogućih događaja.Pri 

čemuje vjerojatnoća da u seriji od n ogleda događaj A nastupi tačno x puta. 

P(x)=

(

n

x

)

p

x

q

n

x

Skup svih parova {x, P(x)}, x = 0, 1, 2, ..., n čini binomnu distribuciju.

Osnovne karakteristike binomne distribucije

:

background image

49

1. parametar koji opisuje Poissonovu distribuciju je aritmetička sredina

2.  aritmetička sredina i varijansa imaju jednake vrijednosti;

3. unimodalna je krivulja, zakrenuta u desno kada je vrijednost aritmetičke sredine mala;

4. kako raste aritmetička sredina, asimetrija se smanjuje i na kraju aproksimira normalnu 

raspodjelu.

Slika br: Poissonova distribucija

Kontinuirane distribucije vjerovatnoće:

  Vjerojatnoćase izvodi za slučajnu promjenljivu, x, 

koja poprima vrijednosti u određenim razredima.

Vrijednosti promjenljive x predstavlja horizontalana os, prema jednačini distribucije može se 

nacrtati   kriva.   Ova   jednačina   zove   se   funkcija   gustoće   vjerojatnoće.Površina   ispod   krive 

iznosi 1 i ujedno je vjerovatnoća svih mogućih događaja.Površina ispod krive između dvije 

vrijednosti jednaka je vjerovarnoći da x leži između dvije vrijednosti.

Sloka   br:   Vjerovatnoća   da   x   leži 

između dvije vrijednosti

50

U   kontinuirane   distribucije   vjerovatnoće   ubrajamo:normalna   distribucija,  

x

2

distribucija;   t 

distribucija, F distribucija.

Normalna distribucija

:najčešće primjenjivana distribucija.Primjenjuje se u modelima analize 

podataka, a veliki broj bioloških mjerenja ima normalnu distribuciju.

Slika br.Standardna normalna distribucija (zeleno)

Karakteristike normalne distribucije:

1.Aritmetička sredina i varijansa je opisuju

2.područje slučajno promjenljive x je(

+

)

3.zvonolikog je oblika i unimodalna;

4.ukoliko se povećava vrijednost aritmetičke sredine kriva se pomiče udesno, a ukoliko se 

vrijednost aritmetičke sredine smanjuje kriva se pomiče ulijevo (uz pretpostavku jednake 

varijanse);

Slika br: Kriva normalne distribucije sa različitim vrijednostima aritmetičke sredine

5. simetrična oko aritmetičke sredine;

6.ukoliko se vrijednost varijanse povećava kriva se snižava   i širi, a ukoliko se vrijednost 

varijanse smanjuje kriva se povisuje i sužava (uz nepromijenjenu aritmetičku sredinu);

background image

52

Studentova t-distribucija:

Karakteristike Studentove t-distribucije:

1.karakterišu je stepeni slobode;

2. ima sličan oblik kao normalna distribucija samo što je šira i položenija;

3. kako raste broj stepena slobode oblikom je sve sličnija normalnoj raspodjeli;

4.primjenjuje se u računanju intervala pouzdanosti i testiranju hipoteza o razlici između dva 

uzorka.

Slika br.. Kriva t – distribucije

X

2

distribucija

se   definiše   kao   zbir   odnosa   kvadrata   razlika   izmeđustvarnih   i   očekivanih 

vrijednosti prema očekivanim vrijednostima.

Slika br. Krivulja 

X

2

distibucije

1. distribucija je pozitivnih vrijednosti, zakrivljena u desno;

2. karakterišu je stepeni slobode;

3.oblik distribucije zavisi o broju stepena slobode: kako raste broj stepena slobode distribucija 

postaje sve više simetrična i sličnija normalnoj distribuciji

4. primjenjuje se u analizi kategorijskih podataka.

53

F distribucija

se koristi ukoliko se želi ustanoviti da li je promjenljivost osnovnog skupa veća 

ili manja od promjenljivosti drugog osnovnog skupa.Kao pokazatelj se uzima odnos dviju 

varijansi.

Slika br :F distribucija

Opšte karakteristike F distribucije:

zakrivljena prema desno;

1.distribucija je omjera dvije varijanse izračunatih iz normalno distribuiranih podataka;

2. karakterišu je stepeni slobode brojnika i nazivnika omjera varijansi;

3. upotrebljava se za poređenje dvije varijanse, kao i za poređenje više od dvije aritmetičke 

sredine analizom varijance.

2.3.Kombinatorika

Teorija vjerojatnoće i statistika  koristi pojmove i rezultate jednog dijela

matematike   koji   se   zove  

kombinatorika

.Kombinatorika   se   bavi   prebrojavanjem   elemenata 

konačnih skupova i prebrojavanjem broja načina da se ti elementi poredaju.

Da bi mogli razumjeti pojmove kombinatorike , moramo ponoviti već poznate pojmove:

Faktorijel

nekog prirodnog broja je proizvod svih prirodnih brojeva koji su manji ili jednaki 

njemu.Označava se 

n!

(n faktorijel), računa se na sljedeći način:

n!=n

(

n

1

)

(

n

2

)

∙∙∙∙∙

2

1

Po definiciji 0!=1

Primjer1

:Koliko je 5!

5!=5

4

3

2

1

=

120

Binomni koeficijent:

neka su 

r

prirodni brojevi, za koje vrijedi 

r

≤ n

tada

 binomni koeficijent 

označavamo 

(

n

r

)

 i računamo po formuli:

background image

55

P

10

3,2,2

=

10

!

3

!

2

!

2

!

 =151200 ; od slova riječi matematika može se napisati 151 200 riječi.

2.Varijacije

su   dio   kombinatorike   kod   koje   na   dva   postavljena   pitanja   dobijemo   jedan 

potvrdan odgovor (raspored izabranih elemenata je bitan) i jedan negativan odgovor(nisu svi 

elementi početnog skupa izabrani).Varijacije mogu da budu sa i bez ponavljanja.

Varijacije bez ponavljanja

.Varijacije r-te klase ćemo dobiti tako što ćemo prvo dobiti sve 

kombinacije r-te klase koje ćemo permutovati.Varijacijesu permutirane kombinacije.

Varijacije   su   skupine   određenog   broja   elemenata   odabranih   iz   skupa   od   n   elemenata 

razmještenih na sve moguće načine.

Broj varijacija r-te klase od n elemenata bez ponavljanja računamo po formuli:

V

n

k

=

n !

(

n

r

)

!

Primjer   1

:

Koliko   ima   trocifrenih   brojeva,   čiji   su   brojevi   različiti   elementi   skupa   S=

{

1,2,3,4,5,6,7,8

}

V

3

8

=

8

!

(

8

3

)

!

=

8

!

5

!

=336

Varijacije sa ponavljanjem

 Kod varijacija sa ponavljanjem svaki se element u varijaciji r-te 

klase može pojaviti r puta.Broj varijacija sa ponavljanjem 

r-te

 klase skupa od 

elemenata je:

V

r

n

 =

n

r

Primjer   1

:

  Na   koliko   se   različitih   načina   može   popuniti   test   s   10   pitanja   i   3   ponuđena 

odgovora na svako pitanje?

 Na svako pitanje može se odgovoriti s jednim od tri ponuđena odgovora, te 

V

3

10

=

3

10

 =59.049 načina popunjavanja testa

3.Kombinacije

na dva pitanja daju dva negativna odgovora(nisu svi elementi početnog skupa 

izabrani) i (raspored izabranih elemenata nije bitan).

I kombinacije mogu biti sa i bez ponavljanja.

Kombinacije   bez   ponavljanja

r-te   klase   su     podskupovi   zadanog   skupa   od  

n  

elemenata   u 

kojima se isti element pojavljuje samo jednom.

Ukupan broj kombinacija r-te klase od 

n

 elemenata iznosi:

K

n

k

=

(

n
k

)

=

n !

(

n

r

)

! r !

Primjer 1

:Skup se sastoji od 20 proizvoda.na koliko se načina može formirati uzorak od 5 

proizvoda.

56

K

n

k

=

(

n
k

)

=

n !

(

n

r

)

! r !

 =

20

!

15

!

 =

16

17

18

19

20

120

 =15.504

Kombinacije sa ponavljanjem:

Kod kombinacija sa ponavljanjem broj elemenata u podskupu 

može biti manji, jednak ili veći od broja zadanih elemenata (r  

  n) tj da se isti element u 

podskupu 

r

-teklase može pojaviti 

puta.

Broj kombinacija s ponavljanjem r-te klase od 

n

 zadanih elemenata jednak je broju 

kombinacija r-teklase bez ponavljanja od (n+r -1) elemenata:

K

n

k

=

(

n

+

r

1

r

)

Primjer   1

:   U   cvjećari   se   prodaju   mini   ruže,   ruže   i   ljiljani.Na   koliko   načina   je   moguće 

napraviti buket od 9 cvjetova?

K

n

k

=

(

n

+

r

1

r

)

 =

(

9

+

3

1

9

)

=

11

!

9

!

2

!

 =55 , 

buket možemo napraviti na 55 načina

2.3. Subjektivna vjerovatnoća

U praksi često dešavaju događaji koji se javljaju samo jedanput, ili su okolnosti u kojima su 

oni ponavljaju među sobom toliko različiti da događaj moramo posmatrati kao jedinstvene 

(plasman   novog   proizvoda,   rezultati   političkih   izbora   i   slično).   U   ovakvim   situacijama, 

vjerovatnoću neizvjesnih događaja ne možemo da odredimo empirijskim putem, a često ne 

možemo ni da prihvatimo predpostavku klasične koncepcije o jednakim vjerovatnoćama svih 

elementarnih događaja. Tada koristimo tzv.

subjektivnu vjerovatnoću

Po ovoj koncepciji, vjerovatnoća predstavlja stepen uvjerenja koji osoba ima za ostvarenje 

datog događaja kao ishoda slučajnog eksperimenta. Pojedinac na osnovu znanja, iskustva i 

raspoloživih informacija pripisuje događaju broj od 0 do 1 kojima izražava svoje uvjerenje u 

mogućnost javljanja datog događaja.Subjektivna vjerovatnoća se koristi u teoriji odučivanja u 

uslovima neizjvesnosti koja je poznata pod nazivom Bayesova teorija odlučivanja. Ona se 

dosta   izučava,   naročito   u   vezi   sa   kockanjem   i   tržištima   hartija   od   vrijednosti.   Prednost 

subjektivne vjerovatnoće je što može da se dopiše svakom događaju, pa čak i onom koji se 

dešava samo jednom ili situaciji koja ne uključuje slučajni proces.

2.4.Uslovna vjerovatnoća

Imamo dva događaja, događaj A i događaj B ;ako je realizacija 

događaja   A   uslovljena   nastupanjem   još   nekog   drugog   događajaB   tada   se   vjerovatnoća 

događaja A pod uslovom da se desio događaj B naziva 

uslovnomvjerovatnoćom

 i obilježava 

se

 

sa

 

P(A|B). 

Posmatrajući neki eksperiment od dva slučajna događaja A i B. Ako je poznato da se jedan od 

background image

58

Primjer 1

.

U jednoj kutiji nalazi se  6 bijele i 7 crnih kuglica, a u drugoj 4 bijele i 8 crnih.  

Izvlačimo iz svake kutije po jednu kuglicu. Odrediti vjerovatnoću da je iz obe kutije izvučena 

bijela?

Događaj A: bijela kuglica iz prve kutije

Događaj B: bijela kuglica iz druge kutije.

Događaji A i B su nezavisni.

P

(

AB

)=

P

(

A

)

∙ P

(

B

)=

6

12

4

12

=

1
6

2.5.Totalna vjerovatnoća i Bajesova formula

Ukoliko se dogadjaj H

1

,H

2

,.....H

n

, međusobno isključuju realizacija proizvoljnog događaja A 

mora se realizovati uz realizaciju bar jednog od ovih događaja Vjerovatnoće  P(H

i

) su obično 

poznate   unaprijed   prije   realizacije   eksperimenta   pa   se   često   nazivaju   apriornim 

vjerovatnoćama, a sami događaji hipiotezama.

  Ako   događaji   H

1

,H

2

,.....H

n

,   čine   potpun   sistem   događaja,   i   ako   je   A   neki   događaj,   tada 

formula za totalnu vjerovatnoću glasi:

P(A)=P(H

1

)P(A| H

1

)+P(H

2

)P(A| H

2

)+···+P(H

n

)P(A| H

n

).

Primjer1.U fabrici "Volkswagen" 40% proizvidnje otpada na prvu mašinu, 30% na drugu 

mašinu i ostalo na treću mašinu. Na prvoj mašini pojavljuje se 2% škarta, na drugoj mašini 

3% i na trećoj mašini 4% škarta. Tokom dana ove mašine proizvedu 10.000 artikala.Koliko je 

vjerovatnoća da će slučajno izabrani proizvod biti škart?

A je događaj da je slučajno izabrani proizvod škart.

H

1

,H

2

,H

su proizvodi izrađeni na mašinama.

P(H

1

)= 0.40     P(H

2

) =0.30       P(H

)= 0.30

P(A|H

1

)= 0.02     P(H

2

) =0.03       P(H

)= 0.04

P (A| H(A)=P(H

1

)P(A| H

1

)+P(H

2

)P(A| H

2

)+P(H

3

)P

 3

)=0.008+0.009+0.012=0.029

Za totalnu vjerovatnoću je vezana Bayesova formula.

Ako događaji H

1

,H

2

,.....H

n

, čine potpun sistem događaja, i ako je A neki događaj, tada je 

P(A)

0 tada je za svako 

i

= 1.2,....,n

P

(

H

1

A

)=

P

(

AHi

)

P

(

A

)

=

P

(

Hi

)

P

(

A

Hi

)

P

(

H

1

)

P

(

A

|

H

1

)+

P

(

H

2

)

P

(

A

|

H

2

)+

···

+

P

(

Hn

)

P

(

A

|

Hn

)

"

59

Bajesova formula

  se koristi kada je potrebno odrediti vjerovatnoću nekog događaja koji je 

prethodio

 

ostvarenju

 

konačnog

 

događaja.

Primjer 2.

U prvoj kutiji se nalaze 9 listića numerisani brojevima od 1-9, a u drugoj kutiji se nalazi 5 

listića numerisani brojevima od 1-5. Biramo nasumice kutiju i iz nje izvlačimo jedan listić. 

Ako je broj na listiću paran izračunati kolika je vjerovatnoća da je listić izvađen iz prve 

kutije?

M :  izvađen je paran broj
H

1

- izabrana je prva kutija 

H

2

- izabrana je druga kutija

P

(

H

1

)=

1
2

P

(

H

2

)=

1
2

, , jer imamo dvije kutije od kojih biramo jednu

            ,

P

(

M

|

H

1

)=

4
9

, , pošto iz prve kutije ima

4

parna broja

(

2,4,6,8

)

P

(

M

|

H

2

)=

2
5

, pošto iz druge kutije ima

2

parna broja

(

2.4

)

P(M)=P(H

1

)P(M| H

1

)+P(H

2

)P(M| H

2

P

(

M

)=

1
2

4

9

+

1
2

2

5

=

19
45

Totalna vjerovatnoća iznosi

19
45

.

Vjerovatnoća da ako je izvučen paran listić, da je uzet iz kutije A se obilježava P(H

1

|M)  i 

računa se na sljedeći način

::

P

(

H

1

M

)=

P

(

H

1

)

P

(

M

H

1

)

)

P

(

M

)

P

(

H

1

M

)=

1
2

4
9

19
45

=

10
19

II DIO

background image

61

koeficijenta jednostavne , višestruke i parcijalne korelacije, koeficijenta korelacije ranga i 

koeficijenta asocijacije.

Regresijska analita modela uključuje ocjenjivanje nepoznatih parametara, računanje mjera 

disperzije,primjena postupaka o modelu kojim se ispituje kvalitet dobivenih podataka.

Područje korelacijske i regresijske analize u čvrstoj su vezi.Ako je primarni cilj istraživanja 

utvrđivanje prediktivnog oblika odnosa, polazi se od regresijskog modela i njegove analize, a 

zatim nastavlja sa korelacijskom analizom.

2.2. Model jednostavne regresije

Ovim   modelom   se   izražava   odnos   između   dvije   pojave.Vrijednosti   pojave   čije   se 

promjenljivosti objašnjavaju predstavljaju vrijednost zavisno promjenljive Y , dok stvarne 

vrijednosti pojave kojom se objašnjava promjenljivost prve pojave predstavljaju vrijednost 

nezavisno promjenljive X.Opšti oblik modela jednostavne regresije :

Y = f(X) +u

Kod ovog modela izbor oblika modela svodi se na izbor funkcije 

f(X)

.Oblik funkcije zavisi od 

priprode odnosa između analiziranih pojava.Npr. ukoliko se potrošnja u domaćinskvu mijenja 

linearno s promjenama raspoloživog dohotka, 

f(X)

 će imati linearnu funkciju.

Pomoćno sredstvo za izbor oblika funkcije je  

dijagram rasipanja

  .To je grafički prikaz u 

pravougaonom   koordinatnom   sistemu,   pri   čemu   na   osi   apscise   upisujemo   vrijednosti 

nezavisno   promjenljive   X   ,   a   na   osi   ordinate   upisujemo   zavisno   promjenljivu   Y.Prema 

rasporedu tačaka donosi se prvi sud o obliku veze tj. obliku funkcije 

f(X).

a) 

b)

c)

d)

62

Slika br. Dijagrami rasipanja

Ako su tačke, u dijagramu rasipanja, raspoređene od donjeg lijevog do gornjeg desnog ugla 

oko   zamišljenog   pravca,   onda   se   odnos   između   pojava,   analitički   može   izraziti   pomoću 

modela   jednostavne   linearne   regresije.

Što   je   rasipanje   oko   pravca   manje,   povezanost   je 

uža.Ako su tačke raspoređene u dijagramu oko neke krive linije tada kažemo da se radi o 

modelu krivolinijske regresije.Ako je riječ o linearnoj vezi, istovremeno se utvrđuje i 

smjer 

veze

.Po smjeru linearna veza može biti pozitivna ili negativna.Pozitivna je ako vrijednost 

nezavisno   promjenljive   prati   linearni   ili   približno   linearni   porast   vrijednosti   zavisno 

promjenljive.Povećavali   se   vrijednost   nezavisno   promjenljive,   a   vrijednost   zavisno 

promjenljive   linearno   se   ili   približno   linearno   smanjuje,   govorimo   o   negativnom   smjeru 

linearne veze.

2.2.1. Jednostavna linearna regresija 

Za model jednostavne linearne regresije karakteristično je da promjene jedne pojave prati 

približna linearna promjena druge pojave., ako se pođe od takve predpostavke   u modelu 

funkcija 

f(X)

 će imati sljedeći oblik:

f(X)= a+bX

Uzimajući u obzir opšti oblik modela i oblik linearne funkcije, model jednostavne linearne 

regresije  je:

Y= a+bX+u

U navedenom modelu X je nezavisno promjenljiva , a Y zavisno promjenljiva.Promjenljiva 

predstavlja   nepoznate   uticaje   na   promjene   promjenljive   Y   i   predstavlja   odstupanje   od 

background image

64

a=

y

bx

Model jednostavne linearne regresije sa ocjenjenim parametrima ima ovaj oblik

^

y

=

a+bx

^

y

regresijska funkcija s ocjenjenim parametrima

je konstantni član, to je vrijednost regresijske funkcije za vrijednost nezavisne promjenljive 

x=0.

b

  je regresijski koeficijen i pokazuje za koliko se linearno mijenja vrijednost regresijske 

funkcije  za  jedinični  porast  vrijednosti  nezavisne  promjenljive X.Predznak  koeficijenta je 

pozitivan ili negativan.

Primjer 1

.Analiziraj odnos  po modelu jednostavne linearne regresije između broja zaposlenih 

i iznosa poreza iz dohotka i ostalih dohodaka u budžetu odabranih 8 opština u 1989 godini.

Tabela br. Zaposleni i prihod od poreza odabranih zajednica opština

Zajednica 

opština

Broj zapos.

U 000

Prihod u

Mil.

x

i

y

i

x

i

2

y

i

2

x

i

y

i

Sarajevo

Beograd

Titograd

Novi Sad

Priština

Zagreb

92,8

312,4

34,2

51,1

21,7

263,7

28,4

82,4

10,7

14,1

4,2

91,0

8611,84

97593,46

1169,64

2611,21

470,89

69537,69

806,56

6789,76

114,49

198,81

17,64

8281,00

2635,52

25741,76

365,94

720,51

91,14

23996,70

65

Ljubljana

Skoplje

54,9

56,9

16,4

20,1

3014,01

3237,61

268,96

404,01

900,36

1143,69

ukupno

887,7

267,3

186246,65

16881,23

55595,62

Za nezavisnu promjenljivu uzet je broj zaposlenih, a za zavisno promjenljivu iznos poreza iz 

dohotka i ostalih dohodaka.

Model   jednostavne   linearne   regresije:

y

i

=  

a+b

x

i

+

u

i

        a   sa   ocjenjenim   parametrima

^

y

=

a+bx.

Treba prema formuli izračunati parametre

 a i b:

b

=

i

=

1

n

x

i

y

i

n x y

i

=

1

n

x

i

2

n x

²

 =

55595,62

8

110.9625

33.4125

186246,65

8

110.9625²

 =0,295575

Konstantni član 

a

 je:

a=

y

bx

=

33.4125

0,295575

110.9625

 =0,614759

Model jednostavne linearne regresije s ocjenjenim parametrima metodom najmanjih kvadrata 

je.

^

y

=a+bx =

 0,614759+0,295575

x

Tumačenje: ako se broj zaposlenih poveća za jednu hiljadu , regresijska vrijednost poreza od 

dohotka i ostalih dohodaka povećat će se za 0,295575 milijona.

2.2.2.Regresijske   vrijednosti,   rezidualna   odstupanja   i   analiza   varijanse   za   model 

jednostavne linearne regresije

Pomoću regresijske jednačine s ocjenjenim parametrima utvrđuju se  

regresijske vrijednosti. 

One su date izrazom :

^

y

=a+bx

Izračunavaju se uvrštavanjem empirijskih vrijednosti nezavisno 

promjenljive   X  u   jednačinu   s   ocjenjenim   parametrima.Te   vrijednosti   predstavljaju   ocjenu 
nivoa zavisno promjenljive za date stvarne vrijednosti nezavisno promjenljive.

background image

67

28.400

82.400

10.700

14.100

4.200

91.000

16.400

20.100

28.044

92.952

10.723

15.719

7.029

78.558

16.842

17.433

0.3559

-10.552

-0.02338

-1.619

-2.829

12.442

-0.4418

2.667

1.253

-12.806

-0.2186

-11.480

-67.350

13.673

-2.694

13.269

0,05171

-1.533

-0.003398

-0.2352

-0.4110

1.808

-0.06419

0.3875

Razlika između stvarne veličine prihoda za tu zajednicu i regresijske vrijednosti predstavlja 
prvo rezidualno odstupanje:

u

i

=

y

i

 - 

^

y

i

 =28.4-28.0441=0.3559

Prvo relativno rezidualno odstupanje je :

u

i rel

=

y

i

−^

y

i

y

i

100

 =

0.3559

28.4

100

=1,253%

Po istom se postupku dolazi i do preostalih regresijskih vrijednosti, rezidualnih odstupanja i 
relativnih   rezidualnih   odstupanja.Rezidualna   odstupanja,   odnosno   odstupanje   stvarne 
vrijednosti za Sarajevo od procjenjene svega je 0.3559 milijona ili 1,253% 

i

ˆ

i

y

C

У

Ukupno,objasnjeno i neobjasnjeno odstupanje zavisne promenljive У

i

68

Stepen varijacije stvarnih vrijednosti zavisne varijable u odnosu na procjenjene vrijednosti 
pomoću regresije mjeri se različitim mjerama.Najvažnije su: 

varijansa; standardna devijacija 

i koeficijent varijanse regresije

.Mjere disperzije oko regresije služe kao pokazatelji za ocjenu 

kvaliteta modela.Ukoliko se pogleda graf ispred , dolazi se do zaključka da je:

(

y

i

y

) =(

^

y

i

y

)

+

¿

(

y

i

−^

y

i

), ukoliko se kvadrira prethodni izraz  dobit će se jednačina,  temelj 

analize varijanse:

i

=

1

n

(

y

i

y

)

²

=

i

=

1

(

n

( ^

y

i

y

)

²

+

i

=

1

n

(

y

i

−^

y

i

)

²

Prvi član sa desne strane jednačine predstavlja zbir 

kvadrata onog dijela odstupanja zavisne varijable koji  je

 protumačen

 vezom između pojava, 

dok   drugi   član   s  desne   strane   jednačine  predstavlja  zbir   kvadrata  onog   dijela  odstupanja 
zavisne varijabe koji je ostao 

neprotumačen.

Ukoliko se svaki član jednačine podijeli ukupnim zbirom kvadrata i ako se strane jednačine 
zamjene, dolazi se do ukupnog zbira kvadrata u relativnom iznosu:

i

=

1

(

n

( ^

y

i

y

)

²

i

=

1

n

(

y

i

y

)

²

+

i

=

1

n

(

y

i

−^

y

i

)

²

i

=

1

n

(

y

i

y

)

²

  =

1;  

prvi   član   s   lijeve   strane   jednačine   naziva   se  

koeficijent 

determinacije

U razvijenom obliku zbir kvadrata dati su jednačinama:

i

=

1

n

(

y

i

y

)

²

=

i

=

1

n

y

i

2

¿

n

y

²

background image

70

i

=

1

n

(

y

i

y

)

²

=

i

=

1

n

y

i

2

¿

n

y

²=

16881,23-8

3

3.4125²=7950.069

Neprotumačeni dio zbira kvadrata:

i

=

1

n

(

y

i

−^

y

i

)

²

=

i

=

1

n

y

i

2

¿

  a

I

=

1

n

y

i

¿

  b

i

=

1

n

x

i

y

i

=

16881,23-0.614759  

267.3   –   0.295575  

 

55595.62=284.216

Protumačeni dio zbira kvadrata je razlika ukupnog i neprotumačenog dijela:

i

=

1

n

(

y

i

y

)

²

=

i

=

1

(

n

( ^

y

i

y

)

²

+

i

=

1

n

(

y

i

−^

y

i

)

²

=

7950.069 -284.216=7665.853

Pomoću rezidualnog zbira kvadrata izračunat će se varijansa regresije i standardna devijacija.

Varijansa regresije:

σ

^

y

2

=

i

=

1

n

(

y

i

−^

y

i

)

²

n

 =

284.216

8

=35.527

Standardna devijacija:

σ

^

y

=

i

=

1

n

(

y

i

−^

y

i

)

²

n

35.527

=

5,960

Standardna   devijacija   regresije   pokazuje   da   je   prosječno   odstupanje   stvarnih   vrijednosti 
zavisne varijable od regresijskih vrijednosti prihoda 5,96 milijona.

Relativna mjera disperzije oko regresije je 

koeficijent varijacije regresije:

V

^

y

=

σ

^

y

y

100

=

5.960

33.4 125

 100=

17,838%

Stvarne vrijednosti prihoda odstupaju od procjenjenih vrijednosti u prosjeku 17.838%

Varijansa, standardna devijacija i koeficijent varijacije omogućavaju donošenje zaključka o 
statističkoj reprezentativnosti modela, a u istu svrhu služi i koeficijent determinacije:

71

r

2

=

i

=

1

(

n

( ^

y

i

y

)

²

i

=

1

n

(

y

i

y

)

²

 = 

7665.853
7950.069

 =

0,9642

Modelom jednostavne linearne regresije protumačeno je 96,42% odstupanja.Neprotumačeni 
je dio 0,0358 ili 3,58%

U praksi se ponekad raspolaže s grupnim podacima o dvije numeričke promjenljive.Takvi 
grupni podaci prikazani su u dvodimenzionalnoj tabeli.

2.3. Višestruka regresija

U modelu jednostavne regresije varijacije zavisne varijable  objašnjavaju se pomoću varijacija 
jedne   nezavisne   varijable   i   slučajne   veličine(slučajnih   odstupanja)U   istraživanju   često   na 
jednu   pojavu   djeluje   više   varijabli(na   krvni   pritisak   djeluje   dob;težina,   spol   i   druge 
promjenljive).Statističko –analitički se varijacija jedne pojave u zavisnosti od dvije pojave ili 
o više njih izražava pomoću modela višestruke regresije.

Pojavu koja se objašnjava predstavljaju vrijednosti zavisne varijable, a za pojave pomoću 
kojih se objašnjava varijacija date su brojčane vrijednosti i   one predstavljaju vrijednosti 
varijable u modelu višestruke regresije. 

U analizi višestrukih odnosa polazi se od opšteg modela Y

= f (

X

1

,

X

2

X

K

) + u

,za primjenu 

modela nužno je odrediti koja je varijabla zavisna, a koje su nezavisne.Zatim treba utvrditi 
oblik funkcije u modelu(deterministički dio modela), te svojstva slučajne varijable.Često je 
oblik funkcije  

linearan,  

a varijabla

  u aditina  

komponenta, pa je riječ o

  modelu višestruke 

linearne regresije.

2.4.Korelacijska analiza

Mjerenje   stepana   jakosti   statističkih   veza   provodi   se   metodama  

korelacijske 

analize

.Korelacijska i regresijska analiza često su povezane.

Kod korelacije

 pri analizi dvije pojave nije bitno koja je pojava označava kao nezavisna , a 

koja kao zavisna varijabla.Međutim kod ispitivanja korelacione veze između tri ili više pojava 
mora se prethodno jedna od njih definisati kao zavisna varijabla.

Cilj korelacione analize

  je da se ispita da li između varijacija posmatranih pojava postoji 

kvantitativno slaganje i, ako postoji, u kom stepenu.

Pokazatelji stepena statističkih veza su  

koeficijenti korelacije

.Ako su odnosi dvije pojave 

linearni u statističkom smislu, utvrđivat će se 

koeficijen jednostavne linearne korelacije.

2.4.1.Koeficijent jednostavne linearne korelacije

background image

73

r=

5595.62

8

110.9625

33.4125

(

186246.65

8

110.9625²

)(

16881.23

8

33.4125²

)

=+0,98196

Do   istog   rezultata   dolazimo   pomoću   koeficijenta   determinacije,   izračunatog   pomoću 
elemenata analize varijanse:

r=

7665.853
7950.069

=0,98196

Regresijski koeficijent je pozitivnog predznaka(b=0,295575), pa se koeficijentu pridružuje 
pozitivni predznak.Do istog rezultata se dolazi i na treći način:

R=b

σ

x

σ

y

=0,295575

87745.23875

/

8

7950.06879

/

8

=0,98196

Koeficijentom linearne korelacije mjeri se jakost i smjer statističke povezanosti dvije pojave 
predstavljenih u obliku parova vrijednosti numeričkih varijabli.Koeficijent varira u intervalu 
od -1 do +1.Utvrđivanje jakosti veze pomoću koeficijenta linearne korelacije kao deskriptivno 
statističke veličine treba povezati s veličinom koeficijenta determinacije.Orjentaciono u tome 
mogu poslužiti sljedeći odnosi:

Tabela br. Odnosi koeficijenata determinacije i korelacije

Koeficijent determinacije

Apsolutna vrijednost koeficij.

linearne korelacije

Tumačenje

r

2

|

r

|

0

0,00-0,25

0,25-0,64

0,64-1

1

0

0,00-0,50

0,50-0,80

0,80-1

1

Odsutnost korelacije

Slaba korelacija

Korelacija srednje jačine

Čvrsta korelacija

Potpuna korelacija

Na osnovu raspona vrijednosti koeficijenta zaključuje se da je linearna povezanost slabija što 
je koeficijent bliži nuli.

Mjerenje   stepena   statističke   veze   opisanim   koeficijentima   korelacije   odnosi   se   na   pojave 
predstavljene vrijednostima numeričkih varijabli.

Ispitivanje stepena veze između pojava datih u obliku  

redosljedne(rang) promjenljive

  nije 

moguće na isti način kao i za ove date u obliku numeričkih nizova, jer varijable ranga  nemaju 
za to  potrebna metrička svojstva.Korelacija se može mjeriti za dvije varijable ranga.Postoji 
više različitih koeficijenata korelacije ranga, jedan od njih je  

Spearmanov koeficijent.

  Pri 

74

analizi polazi se od parova vrijednosti varijabli ranga:  

r(

x

i ;

) ;r(

y

i

)     i=1,2.........,n .P

olazna 

veličina za mjerenje korelacije varijabli ranga je razlika rangova:

d

i

  =

  r(

x

i ;

)

¿

  r(

y

i

)

                  i=1,2,3....,n  

pri   čemu   je

  d  

razlika   vrijednosti   rangova   dvije 

posmatrane varijable, a 

broj različitih serija.

D

a bi se uklonio uticaj predznaka na veličinu 

razlika, polazi se od kvadrata razlika.Koeficijen korelacije ranga Spearmana dat je izrazom:

r

s

=1-

6

i

=

1

n

d

i

2

n

3

n

    -1

≤ r

s

1

Pri korištenju  

Spearmanov koeficijent

, vrijednosti varijabli potrebno je rangirati i na takav 

način   svesti   na   zajedničku   mjeru.Najjednostavniji   način   rangiranja   je   da   se   najmanjoj 
vrijednosti svake varijable dodijeli rang 1,sljedeći po veličini rang 2 i tako sve do posljednje 
kojoj se dodjeljuje max. rang.

Spearmanov koeficijent

 mjeri korelaciju dviju varijabli ranga.U praksi se pokazuje potreba da 

se izrazi korelacija skupa od tri i više varijabli ranga.Pri tome se koristi 

Kendallov koeficijent

zasniva se na koeficijentu višestruke korelacije ranga, čija se vrijednost kreće od 0-1, što je 
bliža 1 višestruka korelaciona veza je čvršća.

2.4.2.Koeficijent multiple linearne korelacije, korelacijska matrica

Koeficijent multiple linearne korelacije

 mjeri se jakost veze između zavisne varijable Y  i više 

nezavisnih varijabli.On je drugi korjen iz koeficijenta determinacije:

R

y ,

1.

K

=

i

=

1

(

n

( ^

y

i

y

)

²

i

=

1

n

(

y

i

y

)

²

     0

≤ R

y ,

1.

K

1

Koeficijent će biti bliže 1 što je veći dio protumačenog zbira kvadrata u ukupnom zbiru, 
odnosno   što   su   manje   razlike   između   stvarnih   vrijednosti   zavisne   varijable   i   regresijskih 
vrijednosti.

Osim   koeficijenta   multiple   i   parcijalne   korelacije   u   cjelovitoj   analizi   višedimenzionalnih 
modela primjenjuje se i koeficijent jednostavne linearne korelacije.Koeficijenti se prikazuju u 
uređenoj šemi.Nakon što se posmatranjem međusobnog odnosa svih parova dvije varijable 
utvrdi njihova međusobna korelacija, izrađuje se 

matrica korelacije.

Redovi i kolone matrice 

predstavljaju posmatrane varijable, a podatak na presjeku određenog reda i kolone predstavlja 
koeficijent korelacije između varijabli u odgovarajućem redu i koloni.Vrijednost koeficijenta 
neće se promjeniti ako se zamijene mjesta varijabli.Iz tog proizilazi da prvi red i prva kolona 
korelacijske  matrice imaju  iste elemente:  

r

yj

=

r

jy

      j=1,2

K

.

Ostali  elementi  korelacijske 

background image

76

Frekvencije   vremenskog   niza   izražene   su   u   različitim   mjernim   jedinicama.Neke   su   date 
vrijednosno tj. u novčanim jedinicama.Vrijednost novca mijenja se s vremenom, pa tako iste 
količine u različitim vremenima imaju različite nominalne vrijednosti.

3.1.1.Analiza vremenskih nizova:zadaci i pristupi

Analiza vremenskih nizova treba omogućiti donošenje brojčanih sudova o obilježjima razvoja 
pojava u vremenu.Zadaci anlize su:

1.deskripcija razvoja pkojava   u vremenu  

opis se vrši različitim metodama.Među njima su 

grafički   prikazi   jednostavni   brojčani   pokazatelji(relativni   brojevi-sve   vrste   numeričkih 
vrijednosti , do kojih se dolazi mjerenjem jedne veličine drugom veličinom zovu se 

relativni 

brojevi)

Analitički se razvoj izražava modelima vremenskih pojava.

2.

objašnjenje varijacije pojave u vremenu

   pomoću drugih pojava.To se obavlja pomoću 

regresijske i korelacijske analize.

3.predviđanje   razvoja   pojave

  ,predviđanje   je   donošenje   sudova   o   budućen   nivou 

pojave.Predviđa se pomoću jednostavnih rezultata, kao što su pokazatelji dinamike ili modela 
vremenskih pojava.

4.kontrola procesa

, proizvodni procesi se odvijaju u vremenu.Praćenje karakteristike procesa 

pojavljuju   se   kao   zapisi   generirani   pomoću   analognog   računala.Zapisi   su   u   vremenu   te 
predstavljaju vremensku seriju prikazanu na kontrolnoj karti.

Predmet analize

  može biti jedna pojava(jedan vremenski niz) ili više njih, zavisi od datih 

slučajeva.Metode analize mogu biti iz deskriptivne statistike.

Statistička analiza vremenskih pojava provodi se u 

vremenskoj domeni

 i u 

domeni frekvencija. 

U analizi pojave u vremenskoj domeni pomoću modela postoje dva pristupa:

Prvi

 sastoji se u utvrđivanju analitičkih izraza kojima se statistički opisuje razvoj nivoa pojave 

u vremenui to pomoću neke funkcije vremena.

Drugi

  nastoji   da   se   statistički   opiše   dinamička   struktura   pojave   ,   a   ne   kretanje   nivoa   u 

vremenu.Ovdje je riječ o mjerenju stepena i smjera korelacije članova iste serije razmaknutih 
jedno razdoblje, dva ili više njih , kao i analitičkom istraživanju takve međuzavisnosti.

Statistička analiza kretanja nivoa pojave u vremenu provodi se polazeći od 

klasične podjele 

serije u komponente.

Vremenske pojave se mogu predstaviti pomoću manjeg broja tipičnih 

komponenti.To su: 

trend;ciklična;sezonska i slučajna komponenta.

Trend

  komponenta vremenske serije predstavlja osnovnu dugoročnu(sekundarnu)tendenciju 

njezina razvoja u vremenu.Predstavlja se funkcijama vremena.Ako se pojava od razdoblja do 
razdoblja mijenja za približno jednak iznos, njezin je trend linearan.Trend se može uočiti 

77

samo   ako   se   raspolaže   s   dovoljno   dugim   vremenskim   nizom.U   praksi   se   uzima   niz   od 
najmanje deset godišnjih frekvencija.

Ciklične  

promjene pojave prisutne su ako se pojava obnavlja na približno jednak način s 

periodom   od   dvije   i   više   godina.Privredni   ciklus   pokazuju   strukturne   promjene,   koje   su 
posljedica privrednog razvoja.

Sezonske 

pojave mogu se obnavljati u periodu od jedne godine.One se javljaju samo ako se 

raspolaže serijom mjesečnih ili kvartalnih podataka.

Trend   komponenta,   ciklična   i   sezonska   zovu   se   sistematskim   ,   determinističkim 
komponentama jer predstavljaju kovarijacije pojave koje se daju predstaviti nekom funkcijom 
vremena.Slučajna komponenta je nesistematska.

Vremenska serija ne mora sadržavati sve navedene komponente i u pravilu ih i ne sadrži.

3.1.2.Grafičko prikazivanje vremenskih nizova

Postoji  nekoliko   vrsta   grafikona  pomoću   kojih   se   mogu   prikazivati   statističke   vremenske 
serije , a u primjeni su najčešće linijski grafikoni, odnosno površinski grafikoni.

Trenutni nizovi se prikazuju linijskim grafikonom, dok se intervalni vremenski nizovi mogu 
prikazivati i površinskim grafikonom.Grafikoni nam omogućavaju prikaz prvih impresija o 
nekoj pojavi i pri tome nam pomažu pri izboru matematičko-statističke metode.

Intervalni niz prikazuje se površinskim i linijskim grafikonom.Na „Y“ ordinatu nanosimo 
aritmetičko   mjerilo   za   frekvencije,   i   ono   uvijek   počinje   od   nule   a   na   „X“   osi   nalazi   se 
aritmetičko mjerilo za vrijeme.Ako intervali promatranja nisu jednaki , potrebno je izvršiti 
korekciju   frekvencija.Pri   konstrukciji     površinskog   grafikona   upotrebljavaju   se 
pravougaonici.Linijski grafikon intervalnog vremenskog niza nastaje spajanjem tačaka čije su 
koordinate date sredinama vremenskih razdoblja i frekvencijama.

1980

1981

1982

1983

1984

1985

0

5

10

15

20

25

30

35

Broj stanova u 

000

background image

79

3.2. Brojčana analiza vremenskih nizova

Uz grafičku analizu po pravilu moramo provesti i brojčanu analizu.Grafičko prikazivanje 

omogućava uvid u osnovnu sliku o dinamici jedne pojave ili više njih.Kod brojčane analize 

počet će se sa jednostavnim pokazateljem dinamike(relativni brojevi).

Sve   vrste   numeričkih   vrijednosti   ,   do   kojih   se   dolazi   mjerenjem   jedne   veličine   drugom 

veličinom , zovu se 

relativni brojevi.

 Svi relativni brojevi računaju se na isti način:

Broj koji 

želimo upoređivati stavljamo u odnos prema broju s kojim se upoređuje.

Relativni broj=

veličina koju upoređujemo

veličina s kojom upoređujemo

3.2.1.Osnovni numerički pokazatelji dinamike

Među   osnovne   pokazatelje   razvoja   pojave   u   vremenu   ubrajaju   se:pojedinačne   razlike 

frekvencija niza u uzastopnim razdobljima ili u odnosu na neko fiksno razdoblje u apsolutnom 

i relativnom isnosu:

Ako   se   sa  

{

y

t

}

,   t=1,2,3

, n

  označe   frekvencije   vremenskog   niza   s  jednakim   intervalima 

posmatranja(jednako udaljenim vremenskim tačkama), pojedinačne promjene  u apsolutnom 

iznosu u uzastopnim razdobljima date su 

prvim diferencijama

 serija(

apsolutna razlika nivoa):

ΔY

t

=

Y

t

-

Y

t

1

 ;  

t=2,3,....., n

Promjene su izražene u istim mjernim jedinicama kao i frekvencije.Izraz pokazuje za koliko 

se apsolutno promjenio nivo pojave u vremenu 

prema vremenu 

t-1.

Za seriju od N članova može se odrediti N-1 apsolutnih razlika, s obzirom da se do apsolutnih 

razlika dolazi odbijanjem jednog broja od drugog njihov predznak može biti pozitivan ili 

negativan.Predznak ukazuje na smjer kretanja promjene..Ukoliko se mjeri razlika neke pojave 

u odnosu na bazno razdoblje, to se može izraziti na sljedeći način:

ΔY

t

=

Y

t

-

Y

b

 ;       

t=1,2,3....N  ;      

Y

b

=

Y

t

1

Pri poređenju dinamike različitih pojava, nemoguće je uporediti diferencije različitih jedinica 

mjere.Kao posljedicu imamo mjerenje promjena relativnim brojevima.

80

Pojedinačne relativne promjene mjere se 

koeficijentom dinamike:

K

t

=

ΔY

t

Y

t

1

odnosno 

K

t

=

Y

t

Y

t

1

Y

t

1

=

Y

t

Y

t

1

-1

pomnožimo li koeficijent dinamike sa 100, dobijemo 

prvu relativnu diferenciju ili pojedinačnu stopu promjene:

S

t

=

K

t

100; s obzirom da je 

verižni index

v

t

=

Y

t

Y

t

1

; pojedinačna stopa promjene može se pisati 

i:

S

t

=

v

t

– 100

Nivo pojave u različitim vremenskim razdobljima može da se uporedi i s nivoom pojave u 

nekom fiksnom periodu:tada se relativna promjena računa na sljedeći način:

S

t

=

Y

t

Y

b

Y

b

 100 =

[

Y

t

Y

b

1

]

100

I

t

=

Y

t

Y

b

100

S

t

=

I

t

100

Nivo pojave

Apsolutna 

promjena

Verižni indeksi

Pojedinačna   stopa 

promjene

Y

1

Y

2

ΔY

2

=

Y

2

-

Y

1

V

2

=

Y

2

Y

1

100

S

2

=

I

2

100

Y

3

ΔY

3

=

Y

3

-

Y

2

V

3

=

Y

3

Y

2

100

S

3

=

I

3

100

Y

4

ΔY

4

=

Y

4

-

Y

3

V

4

=

Y

4

Y

3

100

S

4

=

I

4

100

Primjer 1:Proizvodnja pšenice u tonama u individualnim domaćinstvima opštine A.Izračunaj 

pokazatelje dinamike za podatke iz sljedeće tabele:

background image

82

U 1993. godini proizvodnja pšenice u individualnom sektoru opštine A bila je 2337 tona 

manja od proizvodnje u 1992. godini ili za 21,3%.U 1995.godini proizvedeno je 1217 tona 

više nego u 1994. Godini ili za 14,5% i tako redom.Posmatrajući predznake pojedinačnih 

stopa promjena mogu se primjetiti godine smanjene vrijednosti proizvodnje, kao i godine 

porasta proizvodnje u odnosu na prethodne godine, dok vrijednost stope govori o intenzitetu 

tih promjena.

3.2.2. Srednje vrijednosti vremenskih serija 

Za vremenski niz od n članova ima (n-1) vrijednosti apsolutnih promjena(prvih diferencija), 

ponekad se izračunava  

prosječna  

vrijednost uzastopnih apsolutnih promjena(

prosječna prva 

diferencija):

Δ

Y

=

t

=

2

N

ΔY

t

N

1

 =

(

Y

2

Y

1

)

+

(

Y

3

Y

1

)

+

..

(

Y

N

Y

N

1

)

N

1

Δ

Y

=

Y

N

Y

1

N

1

Primjer 2: Koristeći prethodni primjer izračunati prosječnu vrijednost uzastopnih apsolutnih 

promjena.

Δ

Y

=

Y

N

Y

1

N

1

=

7566

10990

9

¿

380,4

Prosječna   vrijednost   prve   diferencije   pokazuje   da   prizvodnja   pšenice   u   opštini   A   u 

uzastopnim razdobljima smanjivao u prosjeku za 380,4 tone.

3.2.3. Relativni brojevi dinamike-indeksi

Upoređivanje dva ili više stanja jedne te iste pojave ili skupine pojava na različitim mjestima, 

ukazuje na dinamiku promjena pojave ili skupine pojava u prostoru.U deskriptivnostatističkoj 

analizi vremenske serije veoma se često upotrebljavaju relativni brojevi, koji se nazivaju 

indeksnim brojevima.

Indeksi su relativni brojevi koji pokazuju odnos stanja jedne te iste pojave ili skupine pojava 

na različitim mjestima ili u različitim vremenskim razdobljima.

83

Ako indeksima pratimo dinamiku jedne pojave oni se zovu  

individualnim indeksima,  

a oni 

koji pokazuju odnose stanja heterogene grupe pojava nazivaju se 

skupni indeksi.

Frekvencije jedne atributivne ili geografske statističke serije označimo sa:

X

1

;

X

2

...

X

n

, prije 

računanja indeksa potrebno je jedan od članova serije, odabrati kao baznu.Uzme li se veličina 

X

b

za baznu, matematički izraz za izračunavanje indeksa ima oblik:

I

i

=

X

i

X

b

100

;     

i=1,2,3,....N

izračunavanje indeksa moguće je uz uslov: 

X

i

>

0

  i   

X

b

>

0

Za indekse vrijedi sljedeća relacija:

1.

X

i

>

X

b

→ I

i

>

100

Prva relacija ima značenje da je pojava u 

i

-tom modalitetu obilježja veča za (I-100)% 

nego u baznom modalitetu istog obilježja.

2.

X

i

<

X

b

→ I

i

<

100

Druga relacija ima značenje da je pojava u 

i

-tom modalitetu obilježja manja za (100-I)

%nego u baznom modalitetu istog obilježja.

3.

X

i

=

X

b

→ I

i

=

100

Treća relacija ukazuje na jednakost pojave u 

i

-tom i baznom modalitetu istog obilježja.

Indeksi 

I

 , su indeksi sa stalnom bazom.

3.2.4. Indeksi u statističkoj analizi vremenskih serija

Statistička   analiza   vremenskih   serija   predpostavlja   međusobnu   uporedivost   frekvencija 

vremenske serije, pri čemu prostorna i pojmovna definicija pojave mora u svim posmatranim 

intervalima   ili   trenucima   ostati   nepromjenjena.Intervali   posmatranja   mora   da   budu 

jednaki.Kod trenutnih vremenskih serija razmaci između vremenskih tačaka ne mora da budu 

ekvidistantni.Trenutne   i   intervalne   vremenske   serije   mogu   da   se   analiziraju   indeksnim 

brojevima.Indeksi imaju funkciju da prate dinamiku jedne pojave ili grupe pojava u vremenu , 

background image

85

Y

2

Y

1

100

Y

3

y

2

100

Y

n

Y

n

1

100

Matematički izraz za računanje lančanih ili verižnih individualnih indeksa:

V=

Y

t

Y

t

1

100

;  t=1,2,3,.......,N

Verižni indeks je uvijek pozitivna veličina.Za njih se upotrebljavaju sljedeće relacije:

1.

Y

t

>

Y

t

1

→V

t

>

100

2.

Y

t

<

Y

t

1

→V

t

<

100

3.

Y

t

=

Y

t

1

→V

t

=

100

Verižni indeks 

V

t

 pokazuje koliko jedinica pojave u vremenu t dolazi na svakih 100 jedinica 

pojave u vremenu t-1.Indeksi mogu da posluže:

-kao pokazatelji dinamike jedne pojave

-za upoređivanje dinamike dvije ili više raznorodnih pojava.

Primjer 1:

Izračunati i uporediti verižne indekse za nekoliko osnovnih podataka o razvoju 

kulture i umjetnosti na području države.

Godina

Profesionalna pozorišta

Pretplatnici u 000

Broj

Posjeti.u 000

Radija

TV

1992

1993

1994

1995

1996

1997

1998

1999

2000

36

36

38

37

40

41

42

41

41

1411

1337

1053

998

778

905

1021

916

1065

1786

1738

1412

1469

1420

1284

1185

1300

1175

1624

1582

2376

2676

2664

2692

2685

2163

2257

 

86

Tabela verižnih indeksa izračunatih iz prethodne tabele:

Godina

Profesionalna pozorišta

Pretplatnici u 000

Broj

Posjeti.u 000

Radija

TV

1992

1993

1994

1995

1996

1997

1998

1999

2000

-

100

106

97

108

102

102

98

100

-

95

79

95

78

116

113

90

116

-

97

80

104

97

90

92

110

90

-

97

150

112

99

101

99

81

104

Serija indeksa na stalnoj bazi je upravo proporcionalna seriji originalnih podataka iz kojih je 
izračunata.Iz ovog možemo zaključiti da se serija indeksa na stalnoj bazi može preračunati u 
seriju verižnih indeksa .Indeksi na stalnoj bazi:

I

1

 ; 

I

2

........

I

N

¿

¿

Lančani indeksi predstavljeni su sljedećim izrazom:

I

2

I

1

100   ; 

I

3

I

2

100

 ;   

I

n

I

n

1

100

Matematički izraz za preračunavanje indeksa na stalnoj bazi u seriji lančanih indeksa glasi:

I

t

=

V

t

I

t

1

1

100

  ;    

t=1,2,3......,N

Ako  serija indeksa na stalnoj bazi može  da se prepačuna u seriju verižnih indeksa, onda je 
moguće i obrnuto.

V

t

=

I

t

I

t

1

100  

t=1,2,3....n

background image

88

-skupnih indeksa količina

-skupnih indeksa vrijednosti

-indeksa troškova života

3.2.4.3.1.Skupni indeksi cijena

Indeksima cijena mjeri se intenzitet promjena cijena tekućeg razdoblja u odnosu na bazno 
rardoblje.Bazno razdoblje je bilo koje u vremenskom nizu.Označit će se sa 

t

0

,

Individualni indeks cijena označava se :

I

i

(

p

)

=

p

¿

p

i

0

 ; 

i=1,2,....k   ;  t=1,2....n

Gdje je  

p

¿

  cijena  

i-

to npr. proizvoda u vremenu  

t,

  a  

p

i

0

  cijena  

i-

tog proizvoda u baznom 

razdoblju.Navedeni   indeksi   cijena   tumače   se   kao   indeksi   na   stalnoj   bazi.Ako   se   odredi 
jednostavna aritmetička sredina indeksa cijena, doći će se do pokazatelja promjena cijena za 
grupu.

Jednostavna sredina indeksa cijena je:

I

(

p

)

=

i

=

1

k

p

¿

i

=

1

k

pi

0

100

Skupni indeks cijena može se definisati kao nevagani indeks odnosa zbira tekučeg i baznog 
razdoblja pomnožen sa 100.U njemu svaka cijena ima jednak ponder, što predstavlja jedan 
nedostatak.Zbog toga se umjesto nevaganog primjenjuje vagani skupni indeks.

Kako  se varijacije  cijena    i  količina  posmatraju  za  

n

  razdoblja ,  prije računanja  indeksa 

potrebno je odrediti pomoću kojih će se količina provesti postupak ponderisanja.

Ako su ponderi cijena određuju pomoću količina baznog razdoblja doći će se do Laspeyrov 
indeks cijena

P

0

t

(

q

0

)

=

i

=

1

k

p

¿

q

i

0

i

=

1

k

p

i

0

q

i

0

 100

 ; 

t=1,2,....,n

Iz navedenog izraza se vidi da se ponderisanje cijena provodi nepromjenjenim količinama 
baznog razdoblja.Skupni indeks cijena pokazuje prosječnu promjenu cijena grupe pojava u 
vremenu 

t

u odnosu na bazno razdoblje.Laspeyrov skupni indeks cijena naziva se još i skupni 

indeks cijena postojanog sistema ili postojane strukture prometa.

89

Ako su ponderi cijena određuju pomoću količina tekućeg razdoblja doći će se do Paascheov 
indeks cijena.

P

0

t

(

q

t

)

=

i

=

1

k

p

¿

q

¿

i

=

1

k

p

i

0

q

¿

 100

 ; 

t=1,2,....,n

Ponderi indeksa cijena se revidiraju za svaki period za koji se računa taj indeks.Ovaj indeks se 
zove   i   skupni   indeks   cijena   nepostojanog   sastava,   nepostojane   strukture   prometa   ili 
proizvodnje.Paasche   uzima   za   pondere   uvijek   količine   izvještajnog   razdoblja   tako   da 
promjena, u tom razdoblju , dovodi do promjene pondera.

Skupni   indeksi   cijena   po  

Laspeyrov   indeksu     cijena   i   Paascheova   indeksa   cijena   se 

razlikuju.

Razlika je nastala usljed različitih ponderacionih sistema jednog i drugog indeksa tj. 

razlika u sadržaju indeksa.Oba ova indeksa mjere promjene cijena.

Specifičnu sintezu ta dva indeksa čini  

Fisherov idealni indeks cijena.  

To je geometrijska 

sredina   Laspeyrov   indeksa     cijena   i   Paascheova   indeksa   cijena.On   sadrži   svojstav   oba 
indeksa.Njegovo tumačenje je komplikovano.

Primjer1

:

Date su cijene tri najčešće namirnice koje se troše na području Beograda za 2002 i 

2007. Godinu

Namirnice

Količinska

jedinica

Prosječna cijena

Potrošnja po stanov/mj

2002

(

p

i

0

)

2007 (

p

¿

)

2002(

q

i

0

)

2007(

q

¿

)

Mlijeko

Hljeb

Jaja

Litar

Kg

tucet

4,7

4,9

9,3

5,6

8,9

10,1

5,7

9,0

0,9

7,3

8,6

1,5

Izračunajte Laspeyresov skupni indeks za 2007. Godinu za tri namirnice uzevši da je 2002. 
Godina bazna.

Namirnice

Laspeyresov  indeks

Paascheova indeksa

p

¿

q

i

0

p

i

0

q

i

0

p

i t

q

¿

p

i

0

q

¿

background image

91

Q

0

t

(

p

0

)

=

i

=

1

k

q

¿

p

i

0

i

=

1

k

q

i

0

p

i

0

10 0

 ;   

t=1,2......n

Alternativno   taj   se   indeks   može   pisati   u   obliku   vagane   aritmetička   sredina   individualnih 
indeksa količina:

Q

0

t

(

p

0

)

=

i

=

¿¿

k

q

¿

qi

0

W

i

0

i

=

1

k

W

i

0

 100;    t=1,2......,n

Q

0

t

označava skupni indeks količina razdoblja t , tok 0 je oznaka za bazno razdoblje  

t

0

.U 

zagradi 

p

0

 nam govori da se ponderisanje količina vrši polazeći od cijena baznog razdoblja.

W

i

0

 su ponderi , ako su ponderi vrijednosti baznog razdoblja onda imamo izraz:

Q

0

t

(

p

0

)

=

i

=

¿¿

k

q

¿

qi

0

p

i

0

i

=

1

k

q

i

0

p

i

0

100

 ;   t=1,2.....,n

Ako je skupni indeks količina izračunat polazeći od stalnih cijena tekućeg razdoblja dobit će 
se 

Paascheov skupni indeks količina

 :

Q

0

t

(

p

t

)

=

i

=

1

k

q

¿

p

¿

i

=

1

k

q

i

0

p

¿

100

 ;   

t=1,2......,n

Alternativno   taj   se   index   može   pisati   u   obliku   vagane   aritmetička   sredina   individualnih 
indeksa količina:

Q

0

t

(

p

t

)

=

i

=

¿¿

k

q

¿

qi

0

W

¿

i

=

1

k

W

¿

100

 ;    t=1,2...., n

Ako su ponderi vrijednosti količina obračunate po cijenama tekućeg razdoblja, indeks postaje:

92

Q

0

t

(

p

0

)

=

i

=

¿¿

k

q

¿

qi

0

q

i

0

p

¿

i

=

1

k

q

i

0

p

¿

100

 ;   t=1,2.....,n

Laspeyresov   skupni   indeks   količina  

pokazuje   za   koliko   se   u   prosjeku   relativno   mijenja 

vrijednost fizičkog obima heterogene grupe pojava usljed promjena količina pojedinih pojava 
uz   nepromjenjene   cijene   baznog   razdoblja.

Paascheov   skupni   indeks   količina

  izražava 

prosječnu relativnu promjenu količina grupe pojava zbog promjena količina pojedinih pojava 
u  grupi,  polazeći  od  strukture  vrijednosti obračunate  po  cijenama tekućeg  razdoblja.Ni  u 
jednom indeksu ne dolazi do izražaja varijabilnost 

cijena , jer su one stalne.

Primjer 1:

 Data su četiri najčešće proizvedena proizvoda u poljoprivrednom domaćinstvu za 

2000 i 2001. Godinu.

Proizvod

Jed. mjere

Količina

Cijena

2000

2001

2000

2001

Mlijeko

Jaja

Puter

Meso

Lit.

Kom

Kg

kg

30 000

4 000

500

1 640

36 000

5 200

480

1 200

14

6

233

534

18

7

350

620

Izračunati skupne indekse količina

Proizvod

q

i

0

p

i

0

q

i

0

p

i

0

q

¿

p

¿

q

¿

p

i

0

q

¿

p

¿

Mlijeko

Jaja

Puter

Meso

30 000

4 000

500

1 640

14

6

233

534

420 000

24 000

116 500

875 760

36 000

5 200

480

1 200

18

7

350

620

504 000

31 200

111 840

640 800

648 000

36 400

168 000

744 000

Ukupno

-

-

1436260

-

-

1287840

1596400

Laspeyresov skupni indeks količina:

Q

0

t

(

p

0

)

=

i

=

1

k

q

¿

p

i

0

i

=

1

k

q

i

0

p

i

0

100

background image

94

V

0

t

 = 

i

=

1

k

p

¿

q

¿

i

=

1

k

p

i

0

q

i

0

100

Skupni   indeks  vrijednosti   ,   količina   i   cijena   su   u   međusobnoj  vezi.Vrijednost   je  produkt 
količine i cijene.Indeks vrijednosti je produkt indeksa količina i indeksa cijena.

Primjer 1.

 Promatraju se prosječne prodajne cijene (PDV uračunat) i prodane količine četiri 

različite vrste proizvoda u trgovini  tokom oktobra i novembra 2008. g. Podaci su navedeni u 
donjoj tabeli.

Proizvod

Prosj.prodajna 
cijena u oktobru 
2008. God
(KM/kg)

Prosj.količina 
prodatih proiz.u 
oktobru 
2008.god.
(kg)

Prosj.prodajna 
cijena 
unovembru 
2008. God
(KM/kg)

Prosj.količina 
prodatih proiz.u 
oktobru 
2008.god.
(kg)

Brašno
Kafa
So
Šećer

0,95
19,80
0,80
2,20

190
50
170
290

1,10
19,30
0,75
2,30

200
54
150
180

V

0

t

 = 

i

=

1

k

p

¿

q

¿

i

=

1

k

p

i

0

q

i

0

100

 =

(

1,10

200

+

19,30

54

+

0,75

150

+

2,30

180

0,95

190

+

19,80

50

+

0,80

170

+

2,20

290

 =

1788,70
1944,50

100

=

¿

 91,99

Zaključujemo da je ukupna vrijednost posmatrane skupine robâ u novembru 2008. bila za 
približno8,01% manja nego u oktobru 2008.

Vrijednost   izražena   pomoću   cijena   tekućeg   razdoblja   naziva   se  

nominalnim 

vrijednostima   .

Ako   cijene   u   vremenu   nisu   postojane,   što   je   pravilo,sud   stvarnog   razvoja 

pojave u vremenu nije moguć na osnovu vrijednosti izraženih u tekućim cijenama.Da bi 
shvatili   stvarnu   dinamiku,   treba   odbaciti   uticaj   promjena   cijena   na   vrijednost   izražene 
pojave.Taj se postupak naziva 

deflacioniranje.

Provodi se djeljenjem nominalnih vrijednosti s 

odgovarajućim   indeksom   cijena   nemnoženim   sa   sto.Takav   indeks   se   zove  

deflacijskim 

indeksom ili deflatorom

3.2.4.3.4.Indeks troškova života

Indeks   troškova   života   je   skupni   indeks   cijena   i   primjeljuje   se   u   svojstvu   deflatora.Tim 
indeksom se deflacioniraju nominalne plate, ako se one podjele indeksom troškova života , 
nemnoženim sa sto, doći će se do veličine realnih plata.Realne plate govore nam o kupovnoj 
moći novca, koja je bitna u doba inflacije.

95

Ponekad se vrijednosti za niz razdoblja daju u stalnim cijenama, cijenama jednog vremenskog 
razdoblja.Takve   vrijednosti   zbog   niza   razloga   treba   uskladiti   s   nastalim   promjenama 
cijena.Postupak   usklađivanja   vrijednosti   a   nastalim   promjenama   cijena   naziva   se 

revalorizacija.

 I suprotna je od deflacije.Revalorizacija se provodi množenjem vrijednosti u 

stalnim cijenama odgovarajućim indeksima cijena nemnoženim sa sto ili pomoću propisanih 
koeficijenata.

3.3.Modeli vremenskih pojava

Modeli vremenskih pojava su analitički izraz njihova razvoja u vremenu.Izbor modela zavisi 
od cilja     analize i obilježjima vremenskog niza koji predstavlja datu pojavu.Zavisno od 
karaktera faktora koji djeluju u vremenu na neku pojavu, kažemo da vremenske serije čine 
sljedeće komponente:

1.

trend

 ili osnovna tendencija kretanja neke pojave kroz vrijeme

2.

sezonske oscilacije

 koje se pojavljuju unutar jedne godine

3.

slučajne   komponente

  koje   čine   slučajni,   teško   predvidivi   događaji(rat,potres,novi   zakon 

itd).Slučajne tj. sve ostale komponente skreću pojavu od njene osnovne tendencije kretanja.

3.3.1.Trend

Trend   je   osnovna   tendencija   kretanja   pojave   kroz   određeno   vremensko   razdoblje.Prvu 
informaciju o kretanju pojave pruža grafički prikaz originalnih podataka.Raspored tačaka koje 
predstavljaju veličinu pojave u pojedinim vremenskim periodima omogućuje lako utvrđivanje 
smjera kretanja pojave.U statistici trend znači karakterističnu i zakonomjernu liniju kretanja 
pojave   u   vremenu.Trend   se   ponekad   zove   i   dinamička   sredina   vrijednosti,   jer   izražava 
prosječno ili srednje stanje pojave u posmatranom periodu.Linija koja reprezentuje originalne 
vrijednosti može biti prava ili kriva.Koju ćemo matematičku funkciju izabrati , zavisi od 
ocjene vrste i oblika kretanja posmatrane pojave.Ona treba da bude odabrana tako da se 
najbolje prilagođava originalnim podacima. Ako postoji dilema u izboru, treba izabrati onaj 
trend čija je standardna devijacija manja.

Teoretski   metod   trenda   može   se   primjeniti   kad   imamo   formiranu   vremensku 
seriju.Najpogodnije   su   vremenske   serije   koje   su   date   u   jednogodišnjim   vremenskim 
intervalima i kada se posmatrana pojava razvija kao dugoročna.

Za   utvrđivanje   trenda   postoje   neparametarske   i   parametarske   metode.Neparametarskim 
metodama se utvrđuje samo približno osnovnu tendenciju kretanja pojave, one su dobre kao 
prethodnica   parametarskim   metodama   ,   koje   treba   da   dovedu   do   linije   koja   će   najbolje 
reprezentovati originalne podatke.

background image

97

1996/1997
1997/1998
1998/1999
1999/2000
2000/2001

1232
1090
1157
1279

943

 Za izračunavanje parametara a i b potrebno je sljedeće:

Školska god.

Y

i

X

i

X

i

2

X

i

Y

i

1994/1995
1995/1996
1996/1997
1997/1998
1998/1999
1999/2000

2000/2001

1351
1496
1232
1090
1157
1279
943

0
1
2
3
4
5
6

0
1
4
9
16
25
36

0
1496
2464
3270
4628
6395
5658

Ukupno

8548

21

91

23911

Izračunavamo aritmetičku sredinu za vrijeme  

X

i

X

=

x

i

N

 =

21

7

 =3

Izračunavamo aritmetičku sredinu za prosječnu vrijednost posmatrane pojave 

Y

i

Y

=

y

i

N

=

8548

7

 =1221,143

Izračunamo parametre a i b

b=

i

=

1

n

X

i

y

i

N xy

i

=

1

N

X

i

2

N x

²

 =

23511

7

x

3

x

1221,14

91

7

x

9

b=-61,893

a=

y

-b

x

=

1221,143 + 61,893x3

a=1406,822

pošto imamo sve potrebne veličine možemo da napišemo jednačinu linearnog trenda:

y

t

=1406,822-61,893

x

i

Početak: 30.09.1994

98

Oznaka za Y:1 student

Oznaka za X: 1 godina

i ovo tumačimo:prema trendu 30.09 1994. godine na fakultetu bilo je upisano 1407 studenata 
s prosječnim godišnjim smanjenjem od 62 studenta.

Parametar „a“ je vrijednost trenda na početku razdoblja, jer je tu vrijednost x=0.Parametar „b“ 
označava pad ili porast pojave, zavisno od predznaka.

Izračunavanje trend vrijednosti za ostale godine serije :potrebno je na vrijednost parementa a 
(1406,822) dodavati vrijednost parametra b(-61,893).

Trend bolje reprezentuje originalne vrijednosti vremenske serije što su razlike originalnih i 
trend vrijednosti manje.

Škol. godina

Y

i

Y

ci

Y

i

Y

ci

(

Y

i

Y

ci

1994/1995
1995/1996
1996/1997
1997/1998
1998/1999
1999/2000

  2000/2001

1351
1496
1232
1090
1157
1279
943

1406,822
1344,929
1283,036
1221,143
1159,250
1097,357
1035,464

-55,82
15,07
-51,04
-131,14
-2,25
181,64
92,46

3116,10
82822,45
2604,67
17198,49
5,06
32994,18
8504,60

Ukupno

8548

8548,001

0

87290,55

Varijansa linearnog trenda:

σ

^

y

2

=

(

Y

i

−^

y

t

)

²

N

 = 

87290,55

7

 =124770,08

Standardna devijacija:

σ

^

y

=

σ

y

2

 =

12470,08

 =111,67

Koeficijent varijacije linearnog trenda:

V

^

y

=

σ

y

y

 100 =

111,67

1591,857

 100 =9,14%

Prosječno odstupanje originalnih vrijednosti od trend vrijednosti iznosi 111,67 studenata.Što u 
relativnom iznosu znači 9,14%, što znači da su odstupanja vrlo mala i da linearni trend dobro 
reprezentuje originalne podatke.

3.3.1.2.Parabolični trend drugog stepena

Za   primjenu   modela   linearnog   trenda   polazi   se   od   predpostavke   da   se   pojava   mijenja   u 
uzastopnim   razdobljima   za   približno   isti   apsolutni   iznos.Ako   su   promjene   promjena   po 
jedinici vremena približno jednake, umjesto linearnog primjenit će se parabolični trend.

background image

100

2001

53

godina

y

i

x

i

x

i

2

x

i

4

y

i

x

i

x

i

2

y

i

1995
1996
1997
1998
1999
2000

   2001

53
46
79
96
88
62

     53

-3
-2
-1
0
1
2
3

9
4
1
0
1
4
9

81
16
1
0
1
16
81

-159
-92
-79
0
88
124
159

477
184
79
0
88
248
477

ukupno

477

0

28

196

41

1553

Broj posjetilaca iz Njemačke jedno vrijeme je rastao, a zati je padao.To nas je opredjelilo za 
parabolični trend.

Računamo parametre „a“,“b“,i „c“

a=

i

=

1

N

x

i

4

i

=

1

N

y

i

¿

i

=

1

N

x

i

2

i

=

1

N

x

i

2

y

i

N

i

=

1

N

x

i

4

i

=

1

N

x

i

2

i

=

1

N

x

i

2

¿

 =

196

(

477

)−

28

(

1553

)

7

(

196

)−

28

(

28

)

=85,05

b

=

i

=

1

N

x

i

y

i

i

=

1

N

x

i

2

 =

41
28

=1,46

c=

i

=

1

N

x

i

2

y

i

i

=

1

N

x

i

2

i

=

1

N

y

i

N

i

=

1

N

x

i

4

i

=

1

N

x

i

2

i

=

1

N

x

i

2

 =

7

(

1553

)−

28

(

477

)

588

=-4,23; zbog predznaka parametra 

„c“ otvor parabole će biti okrenut prema dole.Jednačina trenda je:

Y

t

=85,05+1,46

x

i

-4,23

x

i

2

Početak:30.06.1998. godine

Oznaka x: 1 posjetilac iz Njemačke

Oznaka y:1 godina

Godina

y

i

x

i

1,46

x

i

x

i

2

4,23

x

i

2

Y

ci

101

1995
1996
1997
1998
1999
2000

   2001

53
46
79
96
88
62

     53

-3
-2
-1
0
1
2
3

-4,38
-2,92
-1,46
0
1,46
2,92
4,38

9
4
1
0
1
4
9

-38,07
-16,92
-4,23
0
-4,23
-16,92
-38,07

42,60
65,21
79,36
85,05
82,28
71,05
51,36

Da   bi   provjerili   reprezentativnost   izračunatog   paraboličnog   trenda   računamo   njegovu 
standardnu devijaciju i koeficijent varijacije.

godina

y

i

Y

t

y

i

Y

t

(

y

i

Y

t

)

²

1995
1996
1997
1998
1999
2000

2001

53
46
79
96
88
62

     53

42,60
65,21
79,36
85,05
82,28
71,05
51,36

10,4
-19,2
-0,4
11,0
5,7
-9,1
1,6

108,16
368,64
0,16
121,00
32,49
82,81
2,56

ukupno

477

477

0

715,82

Varijansa paraboličnog trenda:

σ

^

y

2

y

=

i

=

1

N

(

y

i

y

t

)

²

N

 =

715,82

7

=102,26

Standardna devijacija:

σ

^

y

=

σ

y

2

 =

102,26

 =10,11 turista

Koeficijent varijacije:

V

^

y

=

σ

y

Y

 100 =

10,11

68,14

 100 =14,84

Prosječno odstupanje originalnih vrijednosti serije turista iz Njemačke od paraboličnog trenda 
je 10,11 turista ili 14,84% , i smatra se tolerantnim odsupanjem, tj . da parabolični trend dobro 
reprezentuje kretanje pojave u posmatranom intervalu.

3.3.1.3.Eksponencijalni trend

Eksponencijalni trend spada u grupu krivolinijskih trendova.Koristi se kod pojava koje rastu 
ili padaju približno istom uzastopnom stopom promjene.To su promjene koje , prikazane 
grafički,   pokazuju   prvo   slabi   porast   ili   pad   ,   a   zatim   strmije.Kod   modela   jednostavnog 
eksponencijalnog trenda funkcija vremena je predstavljena eksponencijalnom funkcijom.

background image

103

godina

log

y

t

log

^

y

t

^

y

1993
1994
1995
1996
1997
1998
1999
2000
2001

0,079189
0,255273
0,310211
0,602060
0,662758
0,681241
0,832509
0,929419
1,100371

0

,140937

0,259120
0,377303
0,495486
0,613668
0,731858
0,850035
0,968218
1,086401

1,4
1,8
2,4
3,1
4,1
5,4
7,1
9,3
12,3

ukupno

5,533023

5,523021

46,9

Za računanje staandardne devijacije i koeficijenta varijacije:

Type equation here .

godina

y

t

^

y

t

Y

t

−^

y

t

(

Y

t

−^

y

t

)

²

1993
1994
1995
1996
1997
1998
1999
2000
2001

1,2
1,8
2,4
4,0
4,6
4,8
6,8
8,5
12,6

1,4
1,8
2,4
3,1
4,1
5,4
7,1
9,3
12,3

-0,02
0
0
0,9
0,5
-0,6
-0,3
-0,8
0,3

0,04
0
0
0,81
0,25
0,36
0,09
0,64
0,09

ukupno

46,7

46,9

2,28

Standardna devijacija:

σ

^

y

=

σ

^

y

2

=

i

=

0

N

(

Y

t

−^

y

t

)

²

N

=0,5

Koeficijent varijacije:

V

^

y

=

σ

y

y

=9,63%

Relativno prosječno odstupanje originalnih podataka od vrijednosti eksponencijalnog trenda 
je   9,63%,   te   zaključujemo   da   eksponencijalni   trend   dobro   reprezentuje   dinamiku 
kratkoročnog kretanja.Jednačina eksponencijalnog trenda glasi:

104

^

y

t

=4,1

1,315

xi

Početak: 31.12.1997.

Oznaka Y:1 mil EUR

Oznaka X:1 godina

Parametar „a“ predstavlja vrijednost trenda u početku, dok parametar“b“ svojim predznakom 
govori o smjeru promjene pojave, dok vrijednošću pokazuje intenzitet te promjene.

3.3.2.Sezonske oscilacije

Neke pojave pri svom kretanju kroz vrijeme u određenim dijelovima vremenskih perioda 
pokazuju tendenciju pada ili porasta.Takve pojave zovemo periodičnim pojavama.Ako je taj 
ciklus godinu dana , tj ako pojava pokazuje u određenim dijelovima godine pad a u drugim 
rast   govorimo   o   sezonskim   pojavama(proizvodnja   i   ptrošnja   velikog   broja   proizvoda   je 
sezonskog karaktera).Različiti faktori utiču na kretanje pojave tako da ona odstupa od svoje 
osnovne   tendencije   utvrđene   trendom.Treba   utvrditi   kolika   su   ta   odstupanja   ,   koji   imaju 
pravac.Polazimo od predpostavke da na pojavu utiču sljedeći faktori:

Y=TxSxR

T=trend

S=sezona

R=rezidualni uticaji

Pošto smo u prethodnom dijelu vidjeli kako se utvrđuje trend, moramo utvrditi sezonski i 
rezidualni   uticaj.S   ekonomske   strane   sezonski   uticaj   ima   nepovoljno   djelovanje.Pri 
utvrđivanju ovog uticaje trebamo se voditi sljedećim zadacima:

1.da li postoji sezonski karakter pojave

2.izmjeriti jačinu sezonskog uticaja, ako ima taj karakter

3.eliminisati uticaj sezone tj. kolika bi pojava bila kada sezonskog uticaja ne bi bilo.

Sezonski karakter pojave možemo vidjeti iz tabela ,a lakše je uočiti sa grafikona.

Primjer 1.

Data je proizvodnja piva u hl za pet godina, a za svaku godinu data je mjesečna 

proizvodnja.
Mjesec

1997

1998

1999

2000

2001

1
2
3
4

36
39
88
153

37
75
105
212

45
54
111
170

64
99
139
205

80
92
144
287

background image

106

5
6
7
8
9
10
11
12

402
432
534
502
315
215
179
82

272
272
272
272
272
272
272
272

148,8
158,8
193,3
184,6
115,8
79,9
65,8
30,2

ukupno

3264

3264

1200,00

Suma sezonskih indeksa iznosi 1200.Baza iznosi 100, a koristili smo 12 puta za dvanasest 
mjeseci.Originalne podatke smo 12 puta stavljali u odnos prema bazi i dobili indekse od kojih 
je neki iznad , a neki ispod 100.U januaru je proizvodnja piva zbog uticaja sezone manja za 
70,6%, nego što bi bila da  nema sezonskog uticaja.U junu je proizvodnja piva veća za 58,8% 
nego što bi bila da nema sezonskog uticaja. 

Kod pojava koje kroz vrijeme pokazuju zapaženu tendenciju pada ili porasta potrebno je pri 
izračunavanju   jačine   sezonskih   uticaja   uzeti   u   obzir   osnovnu   tendenciju   kretanja   ili 
trend.Treba izračunati mjesečne trend vrijednosti svih posmatranih godina, a zatim podatke 
stavljati u odnos prema trend vrijednostima.Ako razvoj pojave dobro reprezentira linearni 
trend,   onda   se   kao   baza   izračunavanja   sezonskih   indeksa   računaju   vrijednosti   linearnog 
trenda.Mjesečne trend vrijednosti dobiju se tako  da se izračunaju prvo vrijednosti linearnog 
trenda i to godišnja jednačina linearnog trenda a zatim preračuna na mjesečnu jednačinu.

Sezonski indeks se izračunava:

I

s

=

y

t

^

y

t

I

s

 =sezonski indeks ; 

y

t

=originalna vrijednost;

^

y

t

 =trend vrijednost

Na osnovu gore navedenog primjera proizvodnje piva , izračunaćemo godišnju jednačinu 
linearnog trenda proizvodnje piva za rezdoblje 1997-2001. Godina.

godina

Y

i

X

i

X

i

2

Y

i

X

i

1997
1998
1999
2000
2001

1568
1847
2108
2553
3264

-2
-1
0
1
2

4
1
0
1
4

-3136
-1847
0
2553
6528

ukupno

11340

0

10

4098

b

=

i

=

1

N

x

i

y

i

i

=

1

N

x

i

2

 = 

4098

10

=409,8

a=

y

=2268

107

Jednačina linearnog trenda: 

^

y

t

=2268+409,8

x

i

Početak: 30.06.1999

Oznaka Y:stotina hl piva

Oznaka X: 1 godina

Uzračunaćemo sve godišnje vrijednosti trenda i provjeriti njegovu reprezentativnost:

godina

Y

t

^

y

t

Y

t

−^

y

t

(

Y

t

−^

y

t

1997
1998
1999
2000
20001

1568
1847
2108
2553
3264

1448,4
1858,2
2268,0
2677,8
3087,6

119,6
-11,2
-160,0
-124,8
176,4

14304,16
125,44
25600,00
15575,04
31116,96

ukupno

11340

11340

0

86721,60

Varijansa linearnog trenda:

σ

^

y

2

=17344,32 =

86721,60

5

Standardna devijacija:

σ

^

y

=131,7=

17344,32

Koeficijent varijacije linearnog trenda: 

V

^

y

=5,81%=

131,7

2268

 100

Koeficijent varijacije govori o dovoljno reprezentativnom linearnom trendu.Preračunaćemo 
njegovu godišnju jednačinu na mjesečnu:

^

y

t

=

2268

12

 + 

409,8

144

x

i

^

y

t

=189+2,846

x

i

Početak:30.06.1999

Oznaka Y:100hl piva

Oznaka X:1 godina

Potrebne su nam mjesečne trend vrijednosti za sve mjesece svih godina.Zato ćemo početak 
jednačine trenda premjestiti u prvi mjesec prve posmatrane godine tj. 15.01.1997 godine.Od 
30.06.1999. godine do 15.01.1997. godine ima (-29,5)mjeseci, pa ćemo za „x“ uvrstiti-29,5.

^

y

t

=189+2,85x(-29,5)=104,92

^

y

t

=104,92+2,85

x

i

background image

109

11
12

43,5
55,8

45,3
42,8

48,1
34,7

56,8
41,0

66,2
30,0

Razpolažemo   sa   podacima   za   5   godina   i   za   svaki   mjesec   imamo   po   5   sezonskih 
indeksa.Moramo   imati   samo   jedan   reprezentativni   indeks,   a   za   reprezentativni   se   uzima 
medijana indeks.Medijana indeks za januar:

26,0  ;  26,6  ;  30,8  ;  33,1  ;  34,3      M=30,8

Medijana indeks za februar:

30,6  ;  36,2  ;  37,6  ;  47,1  ;  52,8      M=37,6, na isti način se određeuje medijana indeksa za 
sve ostale mjesece.

Izračunavanjem medijana indeksa –srednje pozicione vrijednosti indeksa smo uklonili.Suma 
grubih sezonskih indeksa mora biti 1200, ukoliko je različita , računamo korektor, s kojim 
linearno množimo sve medijana indekse, kako bi njihovu sumu sveli na 1200.U našem sličaju 
suma   medijana   indeksa   je   1185.Korektor   računamo   :   1200/1185=1,027(   sa   korektorom 
množimo sve medijana indeksa , da bi sumu sveli na 1200)

Mjesec

Medijana indeksi

Sezonski indeksi

1
2
3
4
5
6
7
8
9
10
11
12

30,8
37,6
65,2
134,8
141,5
155,1
190,6
153,0
109,9
77,4
48,1
41,0

31,2
38,1
66,0
136,5
143,3
157,1
193,0
154,9
111,3
78,4
48,6
41,5

Ukupno

1185,0

1200,00

Sezonski indeks za februar 38,1, znači da je proizvodnja piva u mjesecu februaru manja za 
61,9%, zbog djelovanja sezonskog uticaja.
Vrijednosti koje su očišćene od sezonskih uticaja :

Mjesec

1997

1998

1999

2000

2001

1
2
3
4
5
6
7
8
9
10
11

115
102
133
112
124
141
153
123
126
119
119

119
197
159
155
149
146
131
151
160
195
156

144
142
168
125
158
173
188
214
193
196
199

205
260
211
223
202
219
219
188
181
213
275

156
241
218
210
281
275
277
324
283
274
368

110

12

183

176

171

236

198

Originalne podatke ćemo očistiti od sezonskih uticaja ukoliko originalne vrijednosti stavimo u 
omjer sa sezonskim faktorom.

Ukoliko nema sezonskog uticaja, imali bi proizvodnju piva u januaru 1997 godine 115hl.U 
ovom iznosu su uključeni trend i rezidualna komponenta.

Čistu   rezidualnu   komponentu   ćemo   dobiti   djeljenjem   vrijednosti   očišćenih   od   sezonskog 
uticaja s vrijednostima trenda.Pri tome rezidualne komponente u obliku indeksa su:

Mjesec

1997

1998

1999

2000

2001

1
2
3
4
5
6
7
8
9
10
11
12

109,6
94,9
120,2
98,7
106,6
118,3
125,4
98,5
98,6
91,1
89,2
134,3

85,5
138,8
109,8
105,0
99,0
95,2
83,9
98,7
120,4
118,3
93,1
103,2

83,1
80,6
93,8
68,7
85,5
92,2
98,7
110,7
99,9
99,9
99,9
99,9

98,9
123,6
98,9
103,2
92,3
98,8
97,7
82,6
92,5
91,3
116,3
98,8

105,9
98,5
88,1
83,9
111,0
107,4
107,8
123,8
103,6
102,5
136,2
72,5

U januaru 1997. godine proizvedeno je zbog rezidualnih faktora 9,6% više piva.

Utvrtili   smo   tri   komponente,   koje   multiplikativno   stvaraju   originalni   podatak   u   jednom 
vremenskom razdoblju, on se može rasčlaniti :

Uzmimo podatke iz avgusta 2000. godine:

-prema trendu je trebala biti proizvedeno                         227,47

-zbog uticaja sezone proizvedeno je za 54,9% više ili        124,88

to je ukupno                                                                   352,35

-zbog rezidualnih faktora proizvedeno je za 17,4% manje  -61,3

-stvarno je proizvedeno                                                    291,05

Izračunavanje mjesečnog trenda vrijednosti na bazi krivolinijskog trenda je komplikovanije 
od linearnog trenda. Da bi izbjegli nastale probleme mjesečne trend vrijednosti računamo 
mjesečne trend vrijednosti metodom pomičnih prosjeka.U tabeli su prikazane izračunate trend 
vrijednosti za sve mjesece vremenske serije:

Mjesec

1997

1998

1999

2000

2001

1
2
3

21
34
45

12
14
28

14
19
36

12
27
34

26
33
45

background image

112

4
5
6
7
8
9
10
11
12

1667
1638
1601
1533
1446
1369

1118
1068
1035
1030
1037
1050
1064
1086
1118

1338
1371
1382
1387
1384
1390
1402
1412
1395

1227
1220
1215
1230
1250
1267
1303
1388
1515

2042
2096
2133

24-mjesečne pomične totale smo dobili sumiranjem susjednih 12-mjesečnih totala

838+829=1667
829+809=1638
809+792=1601 itd.
24-mjesečne pomične totale ćemo podijeliti s 24 i dobiti 24-mjesečne pomične prosjeke, tj 
trend   vrijednosti   krivolinijskog   trenda   izračunate   metodom   pomičnih   prosjeka.Ttrend 
vrijednosti 

^

y

t

Mjesec

1997

1998

1999

2000

2001

1
2
3
4
5
6
7
8
9
10
11
12

69
68
67
64
60
57

54
51
48
47
45
43
43
43
44
44
45
47

48
51
54
56
57
58
57
58
58
58
58
58

56
53
52
51
51
51
51
52
53
54
58
63

70
77
82
85
87
89

Djeljenjem originalnih vrijednosti s odgovarajućim vrijednostima trenda dobićemo proizvode 
uticaja sezone i reziduala.

Mjesec

1997

1998

1999

2000

2001

1
2
3
4
5
6
7
8
9
10
11
12

197
138
100
84
75
56

22
27
58
109
127
172
221
144
107
68
42
53

29
37
68
102
128
155
205
184
124
86
54
40

21
51
65
139
135
151
159
152
111
91
45
38

37
43
55
113
148
162

Za svaki mjesec imamo   po četiri indeksa.Različiti su zbog rezidualnih uticaja.Uzimajući 
njihovu srednju vrijednost , eliminisat ćemo rezidualne uticaje.

113

Pri izboru srednje vrijednosti opredjelili smo se za medijalnu , jer je ona manje osjetljiva na 
ekstreme od aritmetičke sredine.

Mjesec

Medijana 
indeksi

1
2
3
4
5
6
7
8
9
10
11
12

25,5
40
61,5
111
131,5
158,5
201
148
109
85
49,5
46,5

Ukupno

1167,0

Suma medijana indeksa nije 1200, pa prema tome to nije konačni sezonski indeksi.Moramo 

izračunati korektor: 

1200
1167

 =1,0283

Mjesec

Medijana indeksi

Sezonski indeksi

1
2
3
4
5
6
7
8
9
10
11
12

25,5
40
61,5
111
131,5
158,5
201
148
109
85
49,5
46,5

26
41
63
114
135
164
207
152
112
88
51
48

ukupno

1167

1200

Da bi dobili čiste podatke od sezonskog uticaja, moramo podijeliti svaku originalnu vrijednost 
s odgovarajućum sezonskim indeksom

Mjesec

1997

1998

1999

2000

2001

1
2

81
83

46
34

54
46

46
66

100
80

background image

115

Kretanje rezidualne komponente prikazano grafički.

Analiza proizvodnje piva za januar 200.godine:

-prema trendu realizacija je             56hl

-zbog sezonskog uticaja                -41,44hl

-ukupno                                        14,56hl

-zbog rezidualnih faktora proizvedeno je  -2,6hl

Realizacija januara 200.godine                  11,96hl

4.0.Osnovni skup i uzorak

Ako statistički skup , koji se ispituje statističkom metodom, ima mnogo elemenata, treba 
skupiti   mnogo   informacija,   veliki   broj   mjerenja,što   predstavnja   dugotrajan   i   skup   posao, 
pristupa se prikupljanju manje, podataka samo za jedan dio elemenata statističkog skupa.Dio 
osnovnog skupa koji se ispituje zove se  

uzorak.

Uzorak je  

reprezentativni

  ako je po svojim 

osnovnim karakteristikama  liči na osnovni skup ili ako je uzorak umanjena slika od osnovnog 
skupa.

Metode pomoću kojih se određuje pouzdanost i preciznost procjene karakteristika osnovnog 
skupa jednim imenom zovemo 

metoda uzorka ili reprezentativna metoda.

Ako se u uzorak izaberu elementi redom , a nakon izbora se ne vraćaju u osnovni skup tada 
imamo   izbor   uzorka  

bez  ponavljanja.U

koliko   se   svaki  izabrani  element   za   uzorak   nakon 

izbora vraća u osnovni skup, tako da učestvuje u izboru sljedećeg elementa za uzorak tada 
imamo izbor uzorka 

sa ponavljanjem.

Izbor elemenata osnovnog skupa u uzorak može biti:

namjernim izborom elemenata

 pri čemu 

istraživač za uzorak izabere elemente iz osnovnog skupa prema ličnom nahođenju, iskustvu 
itd.

Slučajan izbor elemenata

  za uzorak pri čemu za svaki element postoji mogućnost da bude 

podjednako izabran za uzorak.

4.1.Procjena karakteristika osnovnog skupa pomoću uzorka

Ako je osnovni skup beskonačan ili ako se veličina osnovnog skupa ne može odrediti, onda se 
karakteristike ne mogu izračunati iz podataka o svim elementaima skupa, nego iz podataka 
samo jednog dijela osnovnog skupa.Ako je taj dio elemenata osnovnog skupa reprezentativni 
uzorak onda karakteristike izračunate za uzorak mogu poslužiti za procjenu tih karakteristika 
osnovnog skupa

θ

.

116

Procjena   karakteristika   osnovnog   skupa

θ

pomoću   izračunate   karakteristike   iz   uzorka   je 

intervalna procjena

^

θ

.Izračinavaju se granice u kojima se s određenom vjerovatnoćom nalazi 

karakteristika osnovnog skupa.

Opšti oblik intervala izgleda ovako

:

^

θ

 – greška procjene 

¿

θ

< ^

θ

+greška procjene

4.1.1.Procjena aritmetičke sredine osnovnog skupa

U  svakom   od   izabranih   uzoraka   možemo   izračunati   sve   karakteristike,   koje   ima   osnovni 
skup   ,   pa   prema   tome   i   aritmetičku   sredinu.Aritmetičke   sredine   uzorka   su   različite.One 
variraju,   a   što   je   posljedica   numeričkog   obilježja   elemenata   ,   izabranih   u   pojedini 
uzorak.Postavlja se pitanje:kako se može karakteristika osnovnog skupa procjeniti pomoću 
karakteristika samo jednog uzorka?

Vezu osnovnog skupa i uzorka pokušaćemo objasniti na primjeru.Imamo jedan mali osnovni 
skup   od   deseteto   djece.Iz   tog   skupa   biraćemo   na   slučajan   način   uzorak   od   2.Djecu 
označavamo sa slovima:

Djete

a

b

c

d

e

f

g

h

i

j

Starost

3

3

4

5

6

7

7

8

8

9

Suma osnovnog skupa svih godina starostI:

i

=

1

10

x

i

=60.

Broj elemenata osnovnog skupa N=10

Aritmetička sredina osnovnog skupa 

x

=60:10=6 godina; 

Standardna devijacija osnovnog skupa :

σ=

i

=

¿¿

N

(

X

i

X

)

²

N

 =

2,05

Iz osnovnog skupa od 10 elemenata možemo izabrati 45 različitih uzoraka po 2 elementa.Sve 

kombinacije su prikazane:

ab   ac   ad   ae   af   ag   ah   ai   aj    9

       bc   bd   be   bf   bg   bh   bi   bj   8

              cd   ce   cf   cg   ch   ci   cj     7

                    de   df   dg   dh   di   dj    6

                           ef   eg   eh   ei   ej     5

      fg   fh    fi   fj     4

  gh   gi   gj    3

         hi   hj   2

background image

118

Kao   što   možemo   zaključiti,   aritmetička   sredina   uzoraka(

očekivana   vrijednost

)   veličine 

n“

koji se mogu izabrati iz jednog osnovnog skupa , uvijek je jednaka aritmetičkoj sredini tog 

osnovnog skupa.

Distribucijaaritmetičkih sredina ima i svoju varijansu i standardnu devijaciju.U toj distribuciji 
aritmetička sredina uzoraka  

x

je varijabla, a aritmetička sredina te varijable je aritmetička 

sredina osnovnog skupa (

μ

).Odstupanje aritmetičkih sredina uzoraka od aritmetičke sredine 

osnovnog skupa ima „

k

“.varijansa distribucije sredina uzoraka glasi:

σ

x

2

=

1

k

i

=

1

k

(

x

i

μ

)

²

Drugi   korijen   iz   varijanse   distribucije   sredina   uzoraka    

σ

x

  daje   standardnu   devijaciju 

distribucije   sredina   uzoraka,   koja   se   zove  

standard   error   ili   standardna   greška   p

rocjene 

aritmetičke sredine osnovnog skupa.zašto se standardna devijacija distribucije sredina uzoraka 
zove standardna greška?Aritmetičkom sredimom uzorka procjenjuje se aritmetička sredina 
osnovnog   skupa,   pa   je   razlika   (odstupanje

x

i

μ

)   greška   u   procjeni   aritmetičke   sredine 

osnovnog   skupa.prosječna   greška   je   standardna   devijacija,   zato   se   u   tom   slučaju   zove 
standardnom greškom (

σ

x

).

U našem primjeru standardna greška je:

σ

x

 =1,37

Ako   se   može   izvršiti   identifikacija   teorijske   distribucije   prema   kojoj   sampling   varijabla 
poprima   svoje   vrijednosti,   onda   se   može   odrediti   i   vjerovatnoća   kojom   će   karakteristika 
uzorka, ako je ona diskretna varijabla, poprimiti vrijednosti nekog realnog broja 

x

, odnosno 

ako karakteristika uzorka kontinuirana varijabla, može se odrediti vjerovatnoća kojom će se 
karakteristika uzorka nalaziti u intervalu između dva realna broja 

x

1

 i 

x

2

.

Aritmetičke sredine uzoraka se raspoređuju oko aritmetičke sredine osnovnog skupa u obliku 
normalne distribucije ili oblika koji je blizi normalnoj distribuciji.To znači da se pomoću 
tablica   površina   ispod   normalne   krive   može   naći   da   će   68,27%   mogućih   uzoraka   imati 
aritmetičku sredinu koja  od aritmetičke sredine osnovnog skupa neće odstupati više od jedne 
standardne greške u lijevu i desnu stranu te da će se 95,45% svih sredina uzoraka nalaziti u 
pojasu   od   dvije   standardne   greške   od   aritmetičke   stredine   osnovnog   skupa.Gotovo   sve   , 
tačnije 99,73%aritmetičkih sredina uzorakaneće odstupiti od aritmetičke sredine osnovnog 
skupa   više nego za tri standardne greške.U 5% slučajeva možemo očekivati da će sredina 
uzorka odstupiti od aritmetičke sredine osnovnog skupa za više od 1,96 standardnih grešaka. 
Ili, vjerovatnoća da će se sredina uzoraka razlikovati od aritmetičke sredine osnovnog skupa 
za više od 1,96

σ

x

 iznosi 0,05.

Kako smo naglasili u prethodnom izlaganju, aritmetičke sredine uzoraka mogu da se nalaze u 
bilo kom intervalu.Ukoliko se one izraze u obliku standardizovanog obilježja (spomenuli smo, 
prethodno,   1,96,   to   je   vrijednost   standardizovanog   obilježja),   tada   sempling   distribucija 
aritmetičkih sredina uzoraka iznosi:

119

z

=

x

i

μ

σ

x

Aritmetička sredina slučajno odabranog uzorka većeg od 30 elemenata sa vjerovatnoćom 0,95 
će se nalaziti između +1,96 i -1,96 i vrijedi nejadnačina:

-1,96

¿

x

i

μ

σ

x

<

¿

1,96

Ako je u našem primjeru greška 1,37.Šta nam to znači?To znači da se aritmetičke sredine 
uzoraka veličine 2 grupišu oko prave aritmetičke sredine osnovnog skupa po raspodjeli , kojoj 
standardna devijacija iznosi 1,37, pošto ne zanmo aritmetičku sredinu osnovnog skupa onda 
zaključujemo   sljedeće:ako   standardna   greška   iznosi   1,37,   onda   naša   dobijena   aritmetička 
sredina iz uzorka može od prave stredine odstupiti praktično najviše 3 standardne greške ili u 
našem slučaju 4,11, pa zaključujemo da se aritmetička sredina osnovnog skupa nalazi negdje 
u in tervalu artimetička sredina uzorka 

±

4,11

 ili uopšteno: 

x

-3

σ

x

<

X

<

x

+3

σ

x

Ako   standardu   grešku   množimo   sa   3   vjerovatnoća   da   se   aritmetička   sredina   nalazi   u 
navedenom intervalu je 0,9973.Pomnožimo li standardnu grešku sa 2, vjerovatnoća da se 
aritmetička   sredina   nalazi   u   tako   izračunatom   intervalu   je   0,9545.Brojevi   3   i   2   su 
standardizovano obilježje, i može se napisati opšti oblik:

x

-z

σ

x

<

X

<

x

+z

σ

x

Ako   je   aritmetička   sredina   slučajnog   uzorka   veličine  

n

¿

30

  upotrebljena   za   procjenu 

aritmetičke sredine osnovnog skupa  

μ

  , tada možemo s vjerovatnoćom 0,95 tvrditi da je 

veličina greške te procjene manja od +1,9

6

σ

x

 i veća od -1,96

σ

x

.

Budući da je standardna greška veličina greške koja se može očekivati u procjeni aritmetičke 
sredine   osnovnog   skupa,   to   je   standardna   greška   najvažniji   element   analize   tačnosti 
procjenena   na   osnovu   uzorka   uz   oblik   distibucije   vjerovatnoće   i   očekivanu   vrijednost   te 
distribucije. 

U   praksi   se   nikad   neće   izabrati   svi   mogući   uzorci   iz   jednog   osnovnog   skupa,   pa   se   za 
računanje standardne greške koristi standardna devijacija osnovnog skupa.Ako se iz osnovnog 
skupa sa N elemenata, koji ima aritmetičku sredinu 

μ

 i standardnu devijaciju 

σ

 izabere uzorak 

od 

elemenata, tada će standardna grešaka procjene aritmetičke sredine osnovnog skupa biti:

σ

x

=

σ

n

N

n

N

1

ako je N(broj elemenata osnovnog skupa) veliki, , a uzorak relativno mali u 

odnosu na osnovni skup, tada će frakcija izbora(

f

 )biti veoma mala a izraz

N

n

N

1

N

n

N

 =

N
N

 - 

n

N

=1-f 

1

 približit će se broju 1.U tom slučaju standardna greška računa 

se pomoću formule:

background image

121

2.Koliku   max.grešku   možemo   tolerisati.Izražava   se   u   jedinici   mjere   u   kojoj   je   izraženo 
obilježje.

3.Standardnu devijaciju  osnovnog skupa

Standardnu devijaciju ne znamo, zato što smo u fazi određivanja veličine uzorka, tako da ne 
znamo ni standardnu devijaciju uzorka.Zbog toga moramo standardnu devijaciju osnovnog 
skupa veoma grubo procjeniti, ako uzmemo pri procjeni uzmemo veću standardnu devijaciju 
od stvarne, posljedica je to što ćemo za uzorak izabrati nešto veći broj elemenata , nego što je 
potrebno.Ali veći broj elemenata za uzorak daje nešto precizniju procjenu od procjene kojom 
bi smo se zadovoljili.

Poslije izračunatog broja elemenata u uzorku moramo provjeriti kolika je frakcija izbora.Ako 
je manja od 0,05 onda je izračunata veličina uzorka 

konačna.Ako je frakcija izbora veća od 

0,05, mora se uzeti faktor korekcije, i pri tome ćemo dobiti konačan broj elemenata u uzorku:

n=

n

0

1

+

n

0

N

Rezime u kojem ćemo objasniti šta sve treba napraviti ukoliko želimo procjeniti aritmetičku 
sredinu osnovnog skupa pomoću uzorka:

1.iz osnovnog skupa izaberemo određen broj elemenata za uzorak na slučajan način, pomoću 
tablica slučajnih brojeva

2.u uzorku izračunamo:

X

 –aritmetičku sredinu

σ

x

2

varijansu

σ

x

 –

standardna devijaciaj

3.izračunamo standardu grešku procjene aritmetičke sredine osnovnog skupa po formuli:

σ

x

=

σ

n

N

n

N

1

ili po formuli

σ

x

=

σ

n

ako je f

¿

0,05

4. iz tablica površina ispod normalne krive određujemo koeficijent pouzdanosti“ 

z

 „ za željenu 

pouzdanost.tablice   površina   ispod   normlne   krive   koristimo   za   određivanje   koeficijenata 
pouzdanosti za sve uzorke veće  od  30  elemenata.Ako  je  uzorak  manji  od  30  elemenata, 
koeficijent   pouzdanosti   određujemo   pomoću   Studentove   t-distribucije.U   slučaju   procjene 
malim uzorkom treba za koeficijent pouzdanosti uvrstiti vrijednost za 

t

 iz Studentove tablice 

za   određen   broj   stepena   slobode.interval   procjene   aritmetičke   sredine   osnovnog   skupa 
pomoću malog uzorka će biti:

x

-t

σ

x

<

X

<

x

+t

σ

x

122

5.pomoću izračunatih veličina sastavljamo intervalnu procjenu aritmetičke sredineosnovnog 
skupa

x ±

z

σ

x

6.donosimo zaključak u kome tvrdimo s određenom pouzdanošću da se aritmetička sredina 
osnovnog skupa nalazi između donje i gornje granice izračunatog intervala procjene.

Primjer1:Izračunati prosječnu površinu posjeda  na 615000 domaćinstava.

Površina u ha

Broj domaćinstva 000

-2

2-3
3-5
5-8

8-

256
109
124

84
42

Ukupno

615

Pomoću   ovog   uzorka   sastavićemo   95%   pouzdan   interval   procjene   aritmetičke   sredine 
osnovnog skupa, to znači da moramo uvrstiti veličinu 1,96 iz tablica.Spremni smo u procjeni 
tolerisati max. Grešku od 0,25ha tj d=025.Trebamo procjeniti standardnu devijaciju osnovnog 
skupa.Površina posjeda u rasponu od 0-20 obuhvata sav domaćinstav.Prije smo naveli da su 
elementi gotovo svake distribucije obuhvaćeni u rasponu od šest standardnih devijacija, pa 
gruba procjena standardne devijacije :20:6=3,33ha.Zaokružićemo ma 3,5ha.Sada imamo sve 
za određivanje broja elemenata u uzorku:

n=

[

1

,

(

3,5

)

0,25

]

²

=27,44² =753 elementa

za   preciznost   procjene   prosječne   površine   od   0,25   ha   uz   pouzdanost   0,95   i   procjenjenu 
standardnu   devijaciju   osnovnog   skupa   od   3,5   trebalo   bi   izabrati   753   poljoprivredna 
domaćinstva.

Frakcija iznosi:

F=

753

615000

=0,0012

Distribucija domaćinstva prema površini zemljišta

Površona
U ha

Sredina
razreda

Broj
Domaćin.

x

i

f

i

x

i

f

i

f

i

x

i

2

f

i

x

i

3

f

i

x

i

4

-2

2-3
3-5
5-8

     8-

1
2,5
4
6,5
12,5

285
143
148
112
59

285
357,5
592
728
737,5

285
893,75
2368
4732
9218,75

285
2234375
9472
30758
115234,3

285
5586
37888
199927
1440430

747

2700

17497,5

157983,7

1684116

background image

124

Total je suma vrijednosti numeričkog obilježja.Total se računa kao proizvod broja elemenata i 
njihove   aritmetičke   sredine.kako   nam   aritmetička   sredina   osnovnog   skupa   nije   poznata, 
uzorak će nam pomoći da procjenimo total osnovnog skupa.Total osnovnog skupa dobijemo 
ako aritmetičku sredinu uzorka pomnožimo s brojem elemenata u osnovnom skupu N:

x

=N

x

Procjenom totala čini se N puta toliko grešaka , koliko ima elemenata u osnovnom skupu.Pa 
iz toga se zaključuje, standardna greška procjene totala osnovnog skupa jednaka je N puta 
standardna greška procjene aritmetičke sredine:

σ

x

=N

σ

x

Interval procjene totala osnovnog skupa pomoću uzorka je:

N x

-z

x

<

X

<

N x

+z

N σ

x

Veličina uzorka za procjenu totalu osnovnog skupa pomoću uzorka je:

n=

[

N

d

]

²

U našem prethodnom primjeru interval procjene totala osnovnog skupa glasi:

615000(3,6144)-1,96(615000)0,1178

¿

x

<

615000

(

3,6144)+1,96(615000)0,1178

2222856-1,96(72 452 772)

¿

x

<

¿

2222856+1,96(72 452 772)

            2222856-142007

¿

x

<

¿

2222856+142007

                    2 080 849

¿

x

<

¿

2 364 863

Zaključak:Ukupna   površina   zemlje   svih   615   000   poljoprivrednih   domaćinstava   s 
vjerovatnoćom od 0,95 , veća je od 2 080 849 hektara i manja od 2 364 863 hektara.

4.1.3.Procjena merdijane osnovnog skupa

Procjenu   medijane   osnovnog   skupa   objašnjavamo   na   osnovu   rezultata   uzorka.Sampling 
distribucija će biti distribucija medijana svih „

k“

 uzoraka.Ako veličina uzorka raste sampling 

distribucija   medijana   približava   se   obliku   normalne   krive.Varijansa   sampling   distribucije 
medijana uzoraka je:

σ

^

Me

2

=

σ

2

π

n

2

 =

σ

2

n

1,570796

Standardna greška procjene medijane osnovnog skupa na bazi uzorka je:

125

σ

^

Me

=

σ

n

π

2

 = 

σ

x

 1,253 31

Interval procjene medijane osnovnog skupa .

^

M

e

-z

σ

^

Me

<

M

e

< ^

M

e

+z

σ

^

Me

Iz prethodnog primjera izračunali smo da je medijana uzorka:

^

M

e

=2,619 hektara.Standardna 

greškaprocjene medijana osnovnog skupa pomoću uzorka iznosi :

σ

^

Me

=

σ

n

π

2

 = 

σ

x

1,253 31 =0,1178 

1.253 31=0,147 64

Interval procjene medijana osnovnog skupa je:

2,619-1,96(0,147 64)

¿

M

e

<

¿

2,619+1,96(0,147 64)

2,619-0,289

¿

M

e

<

¿

2,619+0,289

                           2,33

¿

M

e

<

¿

2,91

Zaključak:S vjerovatnoćom 0,95 možemo tvrditi da je medijana osnovnog skupa veća od 2,33 
ha i manja od 2,91 ha.

4.1.4.Procjena kvartila osnovnog skupa

Sampling distribucijakvartila uzoraka približava se obliku normalne distribucije ako veličina 
uzorka   raste.Standardna   greška   procjene   bilo   donjeg   ili   gornjegkvartila   osnovnog   skupa 
pomoću uzorka iznosi:

σ

Q

σ

x

1.362 63

U našem primjeru ne može se izračunati donji kvartil jer prvi razred sadrži više od četvrtine 
svih   elemenata.Iz   tih   podataka   izračunali   smo   gornji   kvartil   uzorka:

Q

3

=

4,787

.standardna 

greška procjene kvartila iznosi:

σ

^

Q

=0,1178(1,362 63)=0,1605

Interval procjene gornjeg kvartila osnovnog skupa uz pouzdanost 95% je:

4,787-1,96(0,1605)

¿

Q

3

<

¿

4,787+1,96(0,1605)

            4,787-0,315

¿

Q

3

<

¿

4,787+0,315

4,472

¿

Q

3

<

¿

5,095

background image

127

Određivanje veličine uzorka za procjenu proporcije osnovnog skupa je u fazi određivanja 
varijanse osnovnog skupa mnogo jednostavnije, nego što je pri određivanju veličine uzorka za 
procjenu aritmetičke sredine.S obzirom da je 

p+q=1 , 

najveća moguća vrijednost varijanse je 

u slučaju kada

 je: p=q=0,5

 tada varijansa može imati najveću vrijednost 0,25.Ako ne znamo 

varijansu osnovnog skupa predpostavićemo najveću moguću varijansu.Pri čemu ćemo imati, 
uz preciznost i pouzdanost , veći uzorak nego što bi bio dovoljan.

Sampling   distribucija   proporcija   svih   uzorakakoji   se   mogu   izabrati   iz   osnovnog   skupa 
određene veličine 

ima oblik blizu normalnoj distribuciji ako je 

n

¿

30

.

Standardna greška procjene proporcije osnovnog skupa je:

^

σ

p

=

pq

n

(

N

n

n

1

)

 , u najvećem broju slučajeva nećemo znati proporciju osnovnog skupa, niti 

njegovu   varijansu   i   standardnu   devijaciju,   zato   ćemo   proporciju   procjeniti   iz   uzorka   na 
sljedeći način:

^

σ

p

=

^

p

^

q

n

1

(

N

n

N

1

)

ako je frakcija izbora manja od 0,05:

^

σ

p

=

^

p

^

q

n

1

Interval procjene osnovnog skupa s određenom preciznošću nalazi unutar intervala:

^

p

-z

σ

^

p

<

¿

¿

^

p

+z

σ

^

p

U prethodnom primjeru uzorka želimo procjeniti proporviju poljoprivrednih domaćinstava 
koja imaju površinu zemljišta veličine do 2 ha.Procjenu želimo dati sa 95%pouzdanosti.ne 
želimo veću grešku procjene od 0,035.Proporciju osnovnog skupa ne znamo , pa ćemo za 
računanje veličine uzorka uzeti najnepovoljniju varijansu :0,25.Računamo veličinu uzorka:

n

0

=

[

z

pq

d

]

²=

[

1,96

0,25

0,025

]

²

=

784

Veličina je uzoka n=747.Proporcija uzorka je 

^

p

=

285
747

 =

0,3815

Standardna greška procjene:

σ

^

p

=

(

0,385

)(

0,6185

)

0,035

=

0,01777

Interval procjene proporcije osnovnog skupa :

0,3815-1,96(0,01777)

¿

p

¿

0,3815+1,96(0,01777)

         0,3815-0,03483

¿

p

¿

0,3815+0,03483

128

                     0,34667

¿

p

¿

0,41633

Zaključak:Sa   95%pouzdanosti   možemo   tvrditi   da   je   osnovnom   skupu   proporcija 
domaćinstava s površinom zemljišta do 2ha veća od 0,34667 i manja od 0,41633.

5.0.Testiranje hipoteza

U prethodnom poglavlju objasnili smo metodu i postupke , koji nam omogućavaju da iz dijela 
osnovnog skupa, slučajno izabranog uzorka, procjenimo određenu karakteristiku osnovnog 
skupa uz određenu grešku.Moguće je isto uraditi i na drugi način.Predpostavimo da neka 
karakteristika osnovnog skupa , koja je poznata, ima određenu numeričku vrijednost.Da bi tu 
vrijednost   provjerili,   iz   osnovnog   skupa   izabere   se   uzorak   i   izračuna   ta 
karakteristika.Izračunata   karakteristika   uzorka   upoređuje   se   sa   predpostavljenom 
vrijednostima karakteristika osnovnog skupa.Na osnovu razlike donosimo zaključak:

1.ako razlika nije velika smatra se slučajnom i kaže se da je moguća, a predpostavka može biti 
istinita

2.ako je razlika velika kažemo da je značajna , te da je predpostavka nemoguća ili lažna

Pretpostavke se sreću pod imenom istraživačke ili radne hipoteze.ispitivanje pretpostavki se 
zove testiranje hipoteza.postupak testiranja hipoteza temelji se na istim teoretskim osnovama 
kao i procjena karakteristika osnovnog skupa.Hipoteze se mogu odnositi na sve karakteristike 
osnovnog skupa.

5.0.1.Testiranje   hipoteze   da   je   aritmetička   sredina   osnovnog   skupa   jednaka   nekoj 
pretpostavljenoj numeričkoj vrijednosti

Često u praksi moramo odrediti ima li nepoznata aritmetička sredina osnovnog skupa neku 
određenu   vrijednost(  

μ

0

  ).U   vezi   s   tim   posavljamo   hipotezu   da   je   aritmetička   sredina 

osnovnog skupa jednaka nekoj pretpostavljenoj aritmetičkoj sredini:

H

0

μ

=

μ

0

Takva   hipoteza   zove   se  

nul-hipoteza

  i   označava   se   sa  

H

0

.Nul   –hipotezom   tumačimo 

nepostojanje razlike između stvarne aritmetičke sredine osnovnog skupa i predpostavljene 
aritmetičke sredine osnovnog skupa.

Nasuprot ovoj hipotezi stoji pretpostavka da aritmetička sredina osnovnog skupa nije jednaka 
pretpostavljenoj aritmetičkoj sredini, to je tz. 

alternativna hipoteza 

označava se sa 

H

1

H

1

μ ≠ μ

0

Treba li nul hipotezu prihvatiti ili odbaciti?Odgovor na to pitanje daje postupak testiranja 
hipoteza s podacima iz uzorka.Broj elemenata koje ćemo izabrati za uzorak računamo na isti 
način kao kada se određuje broj elemenata za uzorak koji će poslužiti za procjenu aritmetičke 

background image

130

Grafički prikazano područje odbacivanja i prihvatanja nul hipoteze

(1 - α )

α/2

α/2

Z ~ N

 (0,1)

    -z               0             +z    

Područje odbacivanja        Područje prihvaćanja       Područje odbacivanja

U   slučaju   testiranja   hipoteze   pretpostavlja   se   za   aritmetičku   sredinu   osnovnog   skupa 
vrijednost  

μ

0

,   te   se   interval   prihvatanja   nul   hipoteze   formira   tako   da   se   pođe   od 

pretpostavljene aritmetičke sredine osnovnog skupa tj. od 

μ

0

± z σ

x

Pri čemu je 

tablična vrijednost

.

U testiranju hipoteza cilj nam je da odbacimo što više lažnih i što manje istinitih hipoteza.Nul 
hipoteza je ili istinita ili lažna, možemo je prihvatiti ili odbaciti.Ako je nul hipoteza istinita i 
prihvaćena,   a   lažna   i   odbačena,   odluka   je   bila   ispravna.A   ako   je   nul   hipoteza   istinita   a 
odbačena učinili smo grešku , koja se u statistici zove  

greška tipa I

  , a ako je nul hipoteza 

lažna, a mi je prihvatimo učinili smo grešku koju zoveme 

greška tipa II.

Šematski prikazano:

131

Nul-hipoteza
je prihvaćrna

Nul-hipoteza
je odbačana

Nul-hipoteza je istinita

Odluka je ispravna

Učinjena je greška
tipa II

Nul-hipoteza je lažna

Učinjena je greška
tipa II

Odluka je ispravna

Područjem   prihvatanja   hul   hipoteze   obuhvaćene   su   vrijednosti   aritmetičkih   sredina   svih 
uzoraka   koji   se   mogu   izabrati   iz   osnovnog   skupa   s   aritmetičkom   sredinom   koju   smo 
pretpostavili.praktično ne možemo učiniti grešku tipa I.Kako možemo pri tom učiniti grešku 
tipa II?

            Aritmetička sredina izabranog uzorka, što smo izabrali iz osnovnog skupa, udaljava se 
za manje od tri standardne greške a više od 2,58 standardnih grešaka od pretpostavljene 
aritmetičke   sredine   osnovnog   skupa,   vjerovatnoća   izbora   takvog   uzorka   je   mala.Veća   je 
vjerovatnoća da je uzorak s takvom aritmetičkom sredinom izabran iz osnovnog skupa koji 
ima veću, tj. manju aritmetičku sredinu od pretpostavljene.To prikazuju grafikoni:

     -z                   0

Područje odbacivanja               Područje prihvaćanja

α

1 - 

α

Z ~ N

 (0 , 1)

                          0                     z 

               Područje prihvaćanja                                    Područje odbacivanja

α

1 - 

α

Z ~ N

 (0 , 1)

  

background image

133

σ

=2,6661

Standardna greška procjene aritmetičke sredine:

σ

x

=0,0666

Da bi se zaštitili da ne napravimo grekšku tipa II, povećaćemo rizik da se učini greška tipa 
I.odlučili smo se da testiramo na nivo 5%signifikantnosti.

Možemo   prvo   testom   mjeriti   udaljenost   aritmetičke   sredine,   izračunate   u   uzorku,   od 
pretpostavljene aritmetičke sredine u standardnim greškama:

Z=

x

X

0

σ

x

 =8,82

σ

x

Prema prvom testu

  nul hipotezu , da je prosječna starost djece školskog tipa u gradu B 

11godina,odbacujemo kao lažnu na nivou 5% značajnosti, jerje razlika između izračunate 
aritmetičke   sredine   iz   uzorka   i   pretpostavljene   vrijednosti   velika.Pošto   je   na   nivo 
5%signifikantnosti dozvoljena razlika 1,96

σ

x

Drugim testom formiramo interval prihvatanja nul hipoteze:

X

0

± z σ

x

11

±

1,96

0,0666

11-0,1305..............11+0,1305

10,8695.................11,1305

Aritmetička sredina , izračunata iz uzorka je 11,5875.ne uklapa se u interval prihvatanja nul 
hipoteze, jer je veća od gornje granice tog intervala.To je razlog odbacivanja nul hipoteze, kao 
lažne po drugom testu.Tvrdimo da uzorak koji ima aritmetičku sredinu 11,5875, nije mogao 
biti   izabran   iz   osnovnog   skupa   koji   ima   aritmetičku   sredinu   11   i   standardnu   devijaciju 
0,0666.da smo iz osnovnog skupa školske djece izabrali neki drugi uzorak veličine 1600 i 
dobili aritmetičku sredinu u tom uzorku veću od 10,8695 i manju od 11,1305 zaključili bismo 
na nivou 5%signifikantnosti da se nul hipoteza može prihvatiti kao mogućnost.u tom slučaju 
bi vjerovatnost da smo prihvatili istiniti hipoteuu bila 95%.

Uzorak s aritmetičkom sredinom većom od  10,8695 i manjom od 11,1305 može se izabrati i 
iz serije osnovnih skupova koji imaju aritmetičke sredine blizu 11.Ako smo prihvatili nul 
hipotezu, a istina je da je uzorak izabran iz nekog drugog osnovnog skupa , učinili smo grešku 
tipa II.Vjerovatnoća sa smo učinili grešku tipa II je različita od jednog do drugog osnovnog 
skupa.

Granica intrvala prihvatanja nul hipoteze su 10,8695 i 11,1305 , ako je izabran uzorak dao 
aritmetičku sredinu, koja se uklapa u tako formirani interval, prihatićemo nul hipotezu kao 
moguću.Uzimamo   za   primjer   da   uzorak   ima   graničnu   vrijednost   -10,8695.   Taj   uzorak   je 

134

mogao biti izabran iz osnovnog skupa s aritmetičkom sredinom 10,9 ili 10,8 ili 10,7.Možemo 
posmatrati   položaj   aritmetičke   sredine   10,8695   u   svakoj   od   njih   ,   u   odnosu   na   interval 
prihvatanja nul hipoteze.

Površina ispod normalne krive, obuhvaćenu intervalom prihvatanja nul hipoteze za sampling 
distribuciju   s   očekivanom   vjerovatnoćom   10,9   izračunaćemo   poslije   izračunavanja   z 
vrijednosti:

z=

10,8695

10,9

0,0666

 =

0,0305

0,0666

 =-0,455

proporcija površine s lijeve strane distribucije je 0,1722.proporcija površine s desne strane 
distribucije omogućiće izračunavanje pozitivne vrijednosti „z“:

Svih 0,5 desne strane površine obuhvaćeno je intervalom prihvatanja nul hipoteze.Ukupna 
površina   u   sampling   distribuciji   aritmetičkih   sredina   s   očekivanom   vrijednošću   10,9   je 
0,5+0,1772=0,6772.

Vjerovatnoća da se iz osnovnog skupa s aritmetičkom sredinom 10,9 izabere uzorak koji će 
dati aritmetičku sredinu, koja će pasti u interval prihvatanja nul hipoteze 

X

=11, i prema tome 

dovesti do prihvatanja nul hipotezeje 0,6772.To je vjerovatnoća da ćemo učiniti grešku tipa II 
a obzirom na osnovni skup s aritmetičkom sredinom 10,9.

Možemo prihvatiti lažnu nul hipotezu i tako ućiniti grešku tipa II.Vjerovatnoća sa de učini 
greška   tipa   II   ,   označava   se  

β

  .Vjerovatnoća  

β

  da   se   učini   greška   tipa   II   jednaka   je 

vjerovatnoći da aritmetička sredina uzorka pada u područje prihvatanja nul hipoteze, iako je 
uzorak izabran iz osnovnog skupa koji ima različitu aritmetičku sredinu od one koju smo 
predpostavili., što znači da je naša nul hipoteza lažna.

Iz našeg primjera , pogledajmo kolika je vjerovatnoća da ćemo učiniti grešku tipa II s obzirom 
na osnovni skup s aritmetičkom sredinom 10,8.

z=

10,8695

10,8

0,0666

 = 

0,0695

0,0666

 =1,044

Iuzračunatoj vrijednosti „z“ odgovara površina ispod normalne krive 0,3508, što znači da 
ćemo učiniti grešku tipa II s obzirom na osnovni skup s aritmetičkom sredinom 10,8 je 0,5-
0,3508=0,1492.

Tako   se   računa   greška   tipa   II   za   sve   osnovne   skupove   koji   imaju   susjedne   vrijednosti 
aritmetičkih sredina pretpostavljenoj aritmetičkoj sredini.

β

 je vjerovatnoća da se prihvati nul hipoteza.Suprotna je vjerovatnoća(1-

β

) da se odbaci lažna 

nul hipoteza tj. vjerovatnoća da ćemo izbjeći pogrešnu odluku.Razlika (1-

β

) naziva se snaga 

testa.

background image

136

Postupak   testiranja   uključuje   izbor   uzorka   iz   osnovnog   skupa,   te   računanje   aritmetičke 
sredine, varijanse i standardne devijacije u tom uzorku.Zatim moramo izračunati standardnu 
gešku procjene aritmetičke sredine osnovnog skupa .

Ako iz osnovnog skupa na koji se odnosi ta hipoteza izaberemo uzorak i ako se izračuna 
aritmetička sredina uzorka , u donošenju odluke razlikujemo tri slučaja:

1.ako je aritmetička sredina uzorka jednaka ili veća od pretpostavljene atitmetičke sredine 
osnovnog skupa, u tom slučaju je uzorak mogao biti izabran iz osnovnog skupa koji ima 
aritmetičku sredinu jednaku ili veću od pretpostavljene, to je u skladu sa nul hipotezom

μ ≥ μ

0

.Nije potrebno nastaviti testiranje , i prihvatiti nul hipotezu.

2.ako je aritmetička sredina uzorka manja od pretpostavljene aritmetičke sredine uzorka 

μ

<

μ

0

 

, ali i veća od vrijednosti  granice 

μ

0

-3

σ

x

, u tom slučaju taj uzorak je mogao biti izabran iz 

osnovnog skupa koji ima aritmetičku sredinu jednaku 

μ

0

 ili čak veću od 

μ

0

 i odlučiti da se nul 

hipoteza može prihvatiti.

3.   ako   je   aritmetička   sredina   uzorka   manja   od   vrijednosti   granice  

μ

0

-3

σ

x

,onda   je   gotovo 

pouzdano   da   uzorak   sa   tako   malom   aritmetičkom   sredinom   nije   mogao   biti   izabran   iz 
osnovnog skupa koji ima aritmetičku sredinu jednaku ili čak veću od pretpostavljene.Nul 
hipoteza se odbacuje i prihvata alternativna.u ovom slučaju testiranja hipoteze , granica što 
odvaja područje prihvatanja hipoteze od područja odbacivanja hipoteze određena je jednom 
vrijednošću   ,   a   to   je  

μ

0

-3

σ

x

.pri   čemu   ne   možemo   učiniti   grešku   tipa   I.Postoji   velika 

vjerovatnoća da učinimo grešku tipa II.Da bi smanjili vjerovatnoću da se učini greška tipa II , 
treba se izložiti riziku da se napravi greška tipa I tj. da se granica područja prihvatanja nul 
hipoteze pomakne udesno prema većim vrijednostima.

Ako izaberemo testiranje na nivou 5%signifikantnosti ili drugim rječima , vjerovatnoća da 
učinimo   grešku   tipa   I   povećat   ćemo   za   5%.U   tabili   vrijednostz=1,65   i   omeđuje   45% 
površine(normalne   raspodjele)   od   sredine   prema   kraju.Granica   koja   odvaja   područje 
prihvatanja od područja odbacivanja nul hipoteze ima vrijednost:

μ

0

-1,65

σ

x

Ta vrsta testa zove 

se test na donju granicu

 ili na lijevi krak distribucije.Opšti izraz granice 

koja razdvaja područje prihvatanja  od područja odbacivanja nul hipoteze može se napisati:

μ

0

-z

σ

x

,

137

Na isti način , samo na suprotnom kraku sampling distribucije, testira se nul hipoteza:

H

0

....

μ ≤ μ

0

I alternativnu da je:

H

1

....

μ

>

μ

0

Primjer1:

stanovnici grada C dožive više od 70 godina.izabrali smo uzorak 256 podataka o 

godinama starosti.prosječna starost u uzorku je 71,268 godina, s prosječnim odstupanjem od 
tog prosjeka za 15,312 godina.Provjeričemo rezultatima uzorka navedenu tvrdnju na nivou 
od1%signifikantnosti.

Prvo moramo postaviti nul i alternativnu hipotezu:

H

0

....

μ ≤

70

I alternativnu da je:

H

1

....

μ

>

70

; u alternativnoj hipotezi je   radna hipoteza.Koeficijent pouzdanosti u testu na 

jednu   granicu   iznosi   2,33.standardna   greška   procjene   aritmetičke   sredine:

σ

x

=

s

n

=

15.312

265

=0,957

Gornja granica prihvatanja nul hipoteze.

μ

0

+z

σ

x

,

70+2,33x0,957 

70+2,2298

Aritmetička sredina izračunata iz uzorka je 71,268.Ona je manja od 72,2298.To znači da se 
nalazi u području prihvatanja nul hipoteze.Na nivou od 1%signifikantnosti se ne možemo 
složiti sa tvrdnjom da stanovnici grada C u prosjeku dožive više od 70 godina.da smo umjesto 
gore navedene tvrdnje čuli tvrdnju kako stanovnici grada C dožive manje od 70 godina, 
hipoteze bi postavili :

H

0

....

μ ≥

70

I alternativnu da je:

H

1

....

μ

<

70

 bio bi to test prihvatanja nul hipoteze na donju granicu.tu granicu bi odredili na 

sljedeći način:

μ

0

-z

σ

x

,

5.0.3.Testiranje hipoteze o razlici između aritmetičkih sredina dvaju osnovnih skupova

background image

139

dva osnovna skupa različita.Ukoliko se razlika nalazi u području prihvatanja nul hipoteze, 
tada se nul hipoteza prihvata kao moguća.

Primjer 1:

Prosječna ocjena studenata iz predmeta Statistika jednaka je prosječnoj ocjeni iz 

predmeta Matematikaod studenata koji su polagali Statistiku izabrali smo njih 45 za uzorak i 
izračunali prosječnu ocjenu , koja iznosi 3,225 i varijansu koja iznosi 0,81.Drugi uzorak čine 
studenti koji su polagali Matematiku.Uzeli smo uzorak od 35 studenata, čija je prosječna 
ocjena 2,962 a varijansa 0,84.

Tvrdnju ćemo ispitati na nivou 5% signifikantnosti.Hipoteze glase

H

0

......

μ

1

-

μ

2

=0

H

1

......

μ

1

-

μ

2

0

Prema nul hipotezi razlike između aritmeičkih sredina prvog i drugog osnovnog skupa je 
jednaka nuli, dok je po alternativnoj hipotezi razlika između aritmetičkih sredina različita od 
nule.

Standardna greška:

σ

x

1

¿

x

2

¿

=

^

σ

1

2

n

1

+

^

σ

2

2

n

2

 =

0,18

+

0,024

 =0,205

Koeficijent pouzdanosti za 5% signifikantnosti iznosi 1,96

0

± z σ

x

1

¿

x

2

¿

0

±

1,96 x 0,205

0

±

0,4018

-0,4018.......+0,4018

Razlika   između   aritmetičkih   sredina   uzoraka   je   0,263.Ta   razlika   se   uklapa   u   interval 
prihvatanja   nul   hipoteze.Na   nivou   5%signifikantnosti   možemo   prihvatiti   kao   moguću 
hipotezu da je prosječna ocjena iz predmeta Statistika jednaka prosječnoj ocjeni iz predmeta 
Matematika.

5.0.4. Testiranje hipoteze o jednakosti aritmetičkih sredina više osnovnih skupova.Analiza 
varijanse

Hipoteza   da   su   aritmetičke   sredine   dva   ili   više   osnovnih   skupova   među   sobom   jednake 
testiraćemo metodom poznatom kao 

analiza varijanse.

Metoda se zasniva na rasčlanjivanju ukupnog zbira kvadrata odstupanja mjerenih vrijednosti 
od njegove aritmetičke sredine, u komponente prema određenim izvorima varijacije.Zbog 

140

jasnoće, uzet ćemo da je iz svakog od 

k

 normalno distribuiranih osnovnih skupova s jednakom 

varijansama   izabran   po   jedan   uzorak   veličine  

n

  elemenata.Vrijednost   obilježja   svakog 

elementa   izabranog   za   uzorak   označena   je   sa  

x

ij

,   gdje   je  

i  

broj   elemenata   u   uzorku 

(

i=1,2,3....n)

, a 

j

 je uzorak kome pripadaju elementi

 (j=1,2,3...k)

.Aritmetička sredina uzorka 

označena sa 

x

j

   je 

x

j

=

i

=

1

n

x

ij

n

j=1,2,3....k

A zajednička aritmetička sredina sa

x .

.

x .

.=

i

=

1

k

j

=

1

n

x

ij

n ∙ k

Zbir kavdrata odstupanja vrijednosti za svaki od  

k

  uzoraka, dobit će se rasčlanjenjem zbira 

kvadrata odstupanja za svaki 

 k

∙ n

elemenata.

i

=

1

k

j

=

1

n

(

x

ij

x

..)²= 

i

=

1

k

j

=

1

n

(

x

ij

-

x

.

j

)² + 

n

j

=

1

k

(

x

. j

-

x

. j

)², 

izraz predstavlja analizu varijanse.

Metoda analiza varijanse primjenjuje se za testiranje nul hipoteze da su aritmetičke sredine 

osnovnih skupova međusobno jednake:

H

0

....

μ

1

=

μ

2

.....=

μ

k

=

μ

Varijansa osnovnog skupa je:

σ

2

=

n

σ

x

2

Pošro je 

σ

x

2

varijansa distribucije aritmetičkih sredina uzoraka veličine

n

 izabranih slučajno iz 

osnovnog skupa koji ima aritmetičku sredinu  

μ

  i varijansu  

σ

2

, te kako smo nul hipotezu 

pretpostavili da su aritmetičke sredina svih osnovnih skupova jednake, možemo uzeti kao da 
svi   uzorci   izabrani   iz   osnovnog   uzorka   koji   ima   aritmetičku   sredinu  

μ

  i   varijansu  

σ

2

,pa 

možemo napisati da je :

σ

x

2

=

i

=

1

k

(

x

. j

x

..

)

²

k

1

Uvrštavanjem izreza za varijansu distribucije aritmetičkih sredina uzoraka u izraz za varijansu 
osnovnog skupa, dobijemo izraz za jednačinu 

procjene varijanse osnovnog skupa , 

koju ćemo 

označiti sa

background image

142

Odluku o tome da li je razlika između dvije procjene varijanse osnovnog skupa slučajna ili 
signifikantna donosimo na osnovu odnosa dviju procjena varijanse osnovnog skupa:

F=

^

σ

2

2

^

σ

1

2

je teorija F –distribucije, pa ćemo u testiranju hipoteze u tablici distribucije pročitati 

tabličnu vrijednost za F pod određenim stepenima slobode i za izabrani nivo signifikantnosti 
testiranja.U zaglavlju tabele je broj stepena slobode koji odgovara brojniku, a u predkoloni 
tabele broj stepena slobode koji odgovara nazivniku, i na tom mjestu se pročita tablična 
vrijednost F.Ako je izračunata vrijednost manja od tablične, znači da se razlike između dviju 
procjena varijanse osnovnog skupa slučajna, i pri tom se nul hipoteza može prihvatiti.A ako je 
izračunata vrijednost F jednaka ili veća od tablične vrijednosti F , tada je razlika između dvije 
procjene varijanse između dvije procjene varijanse osnovnog skupa značajna.

Rezultati analize varijanse prikazani su u tabeli:

Izvor
varijacije

1

Zbir kvadrata odstupanja

Stepeni slobode

Ocjene var.

Uzorci različitih
veličina

Uzorci   jednakih 
veličina

Uzorci
Razl.
Vel.

Uzorci
Jed.vel.

1

2

3

4

5

6

Između
skupova

U skupovima

i

=

1

k

n

j

(

x

. j

x

..

)

²

i

=

1

k

j

=

1

n

(

x

ij

x . j

)

²

n

i

=

1

k

(

x

. j

x

..

)

²

i

=

1

k

j

=

1

n

(

x

ij

x . j

)

²

k-1

n-1

k-1

k(n-1)

^

σ

2

2

^

σ

1

2

UKUPNO

i

=

1

k

j

=

1

n

(

x

ij

x . j

)

²

i

=

1

k

j

=

1

n

(

x

ij

x . .

)

²

n-1

nk-1

Odnos varijansi F izračunava se tako da se u brojnik stavlja veća procjena varijanse.

143

Ukoliko je vrijednost F veća od jedan nul hipotezu odbacujemo.Testiranje pomoću analize 
varijanse polazi od toga da se varijanse uzoraka međusobno ne razlikuju signifikantno.zato se 
primjenjuje poseban test o homogenosti varijansi.Za to nam može poslužiti-

Bartlettov test.

Zbir kavdrata odstupanja vrijednosti elemnata u jednom uzorku od aritmetičke sredine uzorka 
treba podijeliti odgovarajućim brojem stepena slobode(n-1), i to za svaki uzorak.I pri tome se 
dobiju   procjenevarijanse   osnovnog   skupa   iz   kojeg   je   uzorak   izabran.najveću   dobivenu 
vrijednost tih procjena treba staviti u odnos s najmanjom.U zaglavlju tabele za vrijednosti F 
distribucije treba pročitati broj stepena slobode za najveću varijansu, dok se broj stepena 
slobode za najmanju varijansu nalaze u predkoloni.

Ako je izračunati odnos najveće i najmanje varijanse manji od nađene tablične vrijednosti F, 
možemo reći da su razlike između varijansi uzorka slučajne, a rezultat testa analize varijanse 
možemo smatrati valjanim.

Primjer 1:

 Studente za vježbe iz statistike podjelili smo u tri grupe.U svakoj grupi primjenili 

smo drugu nastavnu metodu vježbi.Na kraju vježbi željeli smo utvrditi da li postoji razlika u 
efikasnosti   između   primjenjenih   metoda.iz   svake   grupe   izabrali   smo   uzorak   po   10 
studenata.Svima smo dali iste zadatke da ih riješe.Broj poena koje su studenti osvojili na 
ispitu prikazali smo u tabeli.

Postavljamo nul hipotezu, da je efikasnost svake od tri predstavljene metode jednaka, tj.da je 
aritmetička sredina postignutih poena u svakoj grupi studenata jednaka.nul-hipotezu ćemo 
testirati metodom analize varijanse.

Prvo ćemo izračunati varijansu između uzoraka: 

j

=

1

k

(

i

=

1

n

x

ij

)

²

n

 - 

(

i

=

1

n

j

=

1

k

x

ij

)

²

n ∙ k

=

(

710

2

10

+

830

2

10

+

690

2

10

)

-

(

710

+

830

+

690

)

²

3

(

10

)

 = 1146,6

Zatim ćemo izračunati varijansu u uzorku prema formuli:

j

=

1

k

i

=

1

n

x

ij

2

j

=

1

k

[

(

i

=

1

n

x

ij

)

²

n

]

=170865-166910=3955

Elementi
(student) i

Broj poena 

x

ij

Uzorak 1

Uzorak 2

Uzorak 3

1
2
3
4
5
6
7
8

67
51
89
72
80
55
74
92

83
94
95
61
79
86
99
73

70
81
74
63
51
72
85
67

background image

145

Za devet(10-1) stepena slobode u zaglavlju i pretkoloni naći ćemo tabličnu vrijednost  

F

.0,5

=3,18.Izračunata   vrijednost   F   je   manja   od   tablične,   možemo   zaključiti   da   prihvatamo 
pretpostavku da su varijanse osnovnih skupova jednake. 

5.0.5.Testiranje hipoteze da je proporcija osnovnog skupa jednaka nekoj pretpostavljenoj 
vrijednosti

Ukoliko   se   mogu   elememti   osnovnog   skupa   grupisati   prema   alternativnom   obilježju, 
primjenjujemo test hipoteze da je proporcija osnovnog skupa jednaka nekoj pretpostavljenoj 
vrijednosti(proporciji)

p=

p

0

Testiranje   hipoteze   da   jeproporcija   osnovnog   skupa   jednaka   nekoj   pretpostavljenoj 
vrijednosti,   bazira   se   na   istim   teoretskim   postavkama     kao   već   protumačemo   testiranje 
hipoteze o nepoznatoj aritmetičkoj sredini osnovnog skupa.

Postupak testiranja:

1.Postavljanje nul i alternativne hipoteze.

Nul   hipoteza   polazi   od   toga   da   nema   razlike   između   proporcije   osnovnog   skupa   i 
pretpostavljene vrijednosti proporcije

H

0

......p -

p

0

=0

Alternativna hipoteza polazi od stava da postoji razlika između proporcije osnovnog skupa i 
pretpostavljene vrijednosti te proporcije

H

1

......p -

p

0

0

2.Iz osnovnog skupa , na koji se odnosi pretpostavka , izaberemo na slučajan način određen 
broj elemenata za uzorak.U uzorku izračunamo proporciju i suprotnu proporciju

p=

m

n

 ;  p+q=1  ;  q=1-p

3.Izračunamo standardnu grešku procjene proporcije osnovnog skupa:

σ

^

p

=

pq

n

1

ako je f

¿

0,05

σ

^

p

=

pq

n

1

N

n

N

1

ako je 

¿

0,05

4.Određujemo   koeficijent   pouzdanosti   za   željeni   nivo   signifikantnosti   iz   tablica   površina 
ispod normalne krive za sve uzorke koji su veći od 25 elemenata

146

5.Razliku   između   izračunate   proporcije   iz   uzorka   i   pretpostavljene   vrijednosti   proporcije 
osnovnog skupa izmjerimo jedinicama standardnih grešaka procjene proporcije:

z=

p

p

0

σ

^

p

ako   je   izračunati   „z“   manji   od   koeficijenta   pouzdanosti   za   željeni   nivo   signifikantnosti, 
možemo prihvatiti nul hipotezu kao moguću.razliku između izračunate proporcije iz uzorka i 
pretpostavljene proporcije u tom slučaju pripisujemo sampling varijacijama.Kada je razlika 
između   proporcije   uzorka   i   pretpostavljene   proporcije   izmjerena   standardnim   greškama 
procjene proporcije:

p

0

± z σ

^

p

Nul hipotezu ćemo prihvatiti kao moguću ako se proporcija uzorka uklapa u područje nul 
hipoteze.Ako proporcija uzorka pada u područje ispod donje granice ili u područje iznad 
gornje granice područja prihvatanja nul hipoteze, odbacićemo je kao lažnu.

Primjer 1:

  U želji da provjerimo istinitost podatka da je proporcija turista u jednoj regiji 

mlađih   od   30   godina   jednaka   0,48,   izabrali   smo   uzorak   na   slučajan   način   300   turista   i 
ustanovili da u uzorku ima 135 osoba mlađih od 30 godina.provjeru tvrdnje ćemo izvršiti na 
nivou 4,04% signifikantnosti.

Prvo moramo postaviti nul i alternativnu hipotezu.

H

0

......p =0,48

H

1

......p 

0,48

U  uzorku   smo   izabrali   300   elemenata(n=300),   od   300   izabranih   turista  135   je   mlađe  od 
30godina.što znači da je m=135.proporcija turista mlađih od 30 godina u uzorku je:

p=

m

n

 =

135
300

 =0,45

Proporcije turista koji nisu mlađi od 30 godina:

q=1-p=1-0,45=0,55

Standardnu grešku računamo na sljedeći način:

σ

^

p

=

pq

n

1

  =

0,2475

299

=

0,000828

Koeficijent pouzdanosti „z“ za 4,040% signifikantnosti iznosi 2,05.

Prvi test: 

z=

p

p

0

σ

^

p

 =-

1,035

σ

^

p

background image

148

Primjer 1:

 Postoji tvrdnja da je više od ¾ mladih regiona zainteresovano za izgradnju jednog 

rekreativnog   objekta.Izabran   je   uzorak   od   300   mladih,   od   ukupnog   broja   njih   je   240 
zainteresovano za izgradnju tog centra.Provjerićemo tvrdnju na nivou 2,5% signifikantnosti.

Hipoteza glasi:

H

0

    p

0,75

H

1

    p

¿

0,75

Broj elemenata u uzorku n=300

Broj zainteresovanih u uzorku m=240

Proporcija zainteresovanih u uzorku: p=

m

n

 =

240
300

=0,8

Proporcija nezainteresovanih u uzorku :

Q=1-p = 1-0,8=0,2

Standardna greška procjene proporcije osnovnog skupa:

σ

^

p

=

pq

n

1

=

0,8

x

0,2

300

1

=

0,000535

Koeficijent pouzdanosti za 2,5%signifikantnosti u testu na jednu granicu iznosi 1,96

Gornja granica prihvatanja nul hipoteze:

p

0

+

¿

z

σ

^

p

0,75+1,96x0,023

0,75+0,045

0,795

Proporcija izračunata u uzorku, veća je od gornje granice prihvatanja nul hipoteze, pa nul 
hipotezu odbacujemo kao lažnu.Prema tome je više od ¾ mladih zainteresovano za izgradnju 
tog centra.

5.0.7.Testiranje hipoteza o jednakosti proporcija dvaju osnovnih skupova

.

Testiranje hipoteze o jednakosti proporcija dva osnovna skupa sprovodi se na isti način kao i 
testiranje hipoteze o jednakosti aritmetičkih sredina dva osnovna skupa.

Hipoteze za test su:

149

H

0

......

p

1

 -

p

2

=0

H

1

...... 

p

1

-

p

2

0

Donja i gornja granica prihvatanja nul hipoteze je:

0

± z σ

p

1

¿

p

2

¿

Standardna greška razlike proporcija data je izrazom:

σ

p

1

¿

p

2

¿

=

^

p

^

q

(

1

n

1

+

1

n

2

)

 ; 

^

p

=

m

1

+

m

2

n

1

+

n

2

 =

n

1

^

p

1

+

n

2

^

p

2

n

1

+

n

2

^

q

=1-

^

p

Iz prvog osnovnog skupa izabraćemo uzorak veličine 

n

1

.Prebojimo koliko ima od izabranih 

elemenata obilježje koje nas zanima.Taj broj u prvom uzorku označavamo sa  

m

1.

Stavimo u 

odnos  

m

1

prema  

n

1

i izračunati proporciju  

^

p

1

  u prvom uzorku.I sve ćemo to ponoviti i na 

drugom   odnovnoms   skupu.te   ćemo   vrijednosti   uvrstiti   u   formulu   za   standardnu   grešku 

proporcija

σ

p

1

¿

p

2

¿

.

Vrijednost standardne greške množimo sa vrijednosti  z =

p

1

p

2

σ

p

1

¿

p

2

¿

 i izračunatu 

gornju i donju granicu intervala prihvatanja nul hipoteze.Ako se razlika među proporcijama 
uzoraka   uklapa   u   područje   prihvatanja   nul   hipoteze,   prihvatićemo   je   kao   moguću,   u 
suprotnom ćemo je odbaciti kao lažnu.

Primjer 1:Možemo ustanoviti da su proporcije muških studenata na Pravnom i Ekonomskom 
fakultetu   jednake.na   Pravnom   smo   izabrali   za   uzorak   150   studenata.U   tom   uzorku   smo 
izabrali   69   muškaraca.na   Ekonomskom   fakultetu   izabrali   smo   uzorak   184   studenta.među 
njima je bilo 97 muškaraca.

Provjeićemo trvrdnju na nivou 3,4%signifikantnosti.Nul i alternativna hipoteza glasi:

H

0

......

p

1

 -

p

2

=0

H

1

...... 

p

1

-

p

2

0

Po   nul   hipotezi   su   proporcije  muških   studenata  na   dva   fakulteta  jednake.po   alternativnoj 
hipotezi su ove proporcije različite:

Proporcija muškaraca na Pravnom fakultetu:

p

1

=

m

1

n

1

 =

69

150

=0,46

Proporcija muškaraca na Ekonomskom fakultetu:

p

2

=

m

2

n

2

=

97

184

=0527

background image

151

p

1

=

m

1

n

1

 ; 

p

2

=

m

1

n

1

.............

p

k

=

m

k

n

k

Procjenjenu proporciju osnovnog skupa za primjenu  

χ

2

  testa označavamo sa  

^

p

.Ona nam je 

potrebna za računanje očekivanih (teoretskih izračunatih) vrijednosti.

^

p

=

n

1

p

1

.

⋯ ⋯

+

n

k

p

k

n

1

+

⋯ ⋯

n

k

 =

m

1

⋯ ⋯

m

k

n

1

+

⋯ ⋯

n

k

Procjenjena   prosječna   proporcija   osnovnog   skupa   izračunava   se   kao   vagana   aritmetička 
sredina proporcija uzorka.

Kada   znamo   prosječnu   proporciju   uzoraka   ili   procjenjenu   proporciju   osnovnog   skupa   , 
možemo izračunati koliki broj elemenata možemo očekivati u uzorku za slučaj da je nul 
hipoteza moguća.Očekivane ili izračunate frekvencije označavamo sa 

e

i .

e

1

=

n

1

^

p

 ; 

⋯ ⋯

e

k

=

e

k

^

p

Testom   se   ispituje   razlike   između   opaženih(originalnih)   i   očekivanih   (izračunati) 
frekvencija.Ako su razlike male , smatramo ih slučajnim., ako su razlike velike , smatramo ih 
značajnim.

Da li su razlike male ili velike odgovara nam izračunata vrijednost 

χ

2

.

χ

2

=

i

=

1

k

¿¿¿

gdje je:

m

i

-originalne , opažene frekvencije

e

i

-izračunate, očekivane frekvencije

k-

 broj osnovnih skupova

S obzirom da   suma originalnih vrijednosti mora biti jednaka sumi očekivanih vrijednosti, 
gubi se jedan stepen slobode pa se test provodi sa k-1 stepeni slobode.

Akoje izračunata vrijednost 

χ

2

   testa veća od tablične vrijednosti , nul hipoteza se odbacuje 

kao lažna i obrnuto, ako je izračunata vrijednost 

χ

2

manja od tablične vrijednosti, nul hipotezu 

prihvatamo kao moguću.

Primjer 1:

 Treba da provjerimo da li se proporcija neispravnih proizvoda kreće ravnomjerno 

kroz sve dane u sedmici.svakog radnog dana izabrali smo za uzorak određen broj proizvoda, 
kontrolisali kvalitet i dobili sljedeće.

152

Dani 
sedm.

Broj 
kontro.
proizvoda

Neisp.
proizvoda

Proporcija u 
uzorku

Očekivana 
propor

n

i

m

i

^

p

i

e

i

m

1

¿

e

i

¿

¿

¿ ¿

Poned
Utora
Srijed
Četvrt
Petak
Subot

156
173
188
166
178
195

12
15
14
16
19
22

0,0769
0,0867
0,0745
0,0964
0,1067
0,1128

14,48
16,05
17,45
15,40
16,52
18,10

-2,58
-1,08
-3,45
0,60
2,48
3,90

6,1504
1,1025
11,9025
0,3600
6,1504
15,2100

0,425
0,069
0,682
0,023
0,375
0,840

1056

98

98

0

-

2,411

Prosječna proporcija neispravnih proizvoda u svim danima u sedmici je:

^

p

i

=

m

1

⋯ ⋯

m

k

n

1

+

⋯ ⋯

n

k

=

2293
3134

=

0,732

Izračunata   vrijednost  

χ

2

  iznosi   2,411.U   tablicama  

χ

2

  za   5   stepena   slobode   i   2,5% 

signifikantnosti nalazimo broj 12,832.izračunata vrijednost se uklapa u tabličnu(ne prelazi), 
nul hipoteza da je proporcija škart proizvodnje jednaka u svim danima sedmice prihvatamo 
kao moguću na nivou 2,5% signifikantnosti.pri upoterebi 

χ

2

 ni jedna očekivana frekvencija ne 

smije biti manja od 5, ako ima 1 stepen slobode.

5.0.9. Testiranje hipoteze da distribucija osnovnog skupa ima određeni oblik

Pretpostavimo   određen   oblik   distribucije   osnovnog   skupa..Pri   procjeni   karakteristika 
osnovnog skupa pomoću uzorka moramo ponekad pretpostaviti da osnovni skup ima oblik 
normalne distribucije.U tom slučaju tu hipotezu i testiramo.

Iz osnovnog skupa izaberemo uzorak sa „

n“

elemenata, Distribucij afrekvencija uzoraka daje 

opažene   vrijednosti  

m

i

Moramo   izračunati   kakve   bi   bile   frekvencije   uzoraka   kada   bi 

distribucija   uzorka   imala   oblik   pretpostavljene   distribucije   u   osnovnom   skupu.To   su 
očekivane vrijednosti(

e

i

).Iz opaženih i očekivanih vrijednosti frekvencija možemo izračunati 

χ

2

.

  Pomoću tabele F odredimo tabličnu vrijednost  

χ

2

  za broj stepena slobode koji pripada 

određenoj pretpostavljenoj distribuciji.

Primjer 1:

 Kvalifikaciona struktura zaposlenih u regiji je jednaka strukturi navedenoj u tabeli.

Kvalif

Struktura
Zaposlen

Struktura
u uzorku

Očekivana
proporcija

n

i

m

i

e

i

m

1

¿

e

i

¿

¿

¿ ¿

VSS
SSS

16%
18%

30
50

40
45

-10
5

100
25

2,50
0,56

background image

154

Te vrijednosti računamo pomoću izraza:

e

ij

=

m

i ∙

m

j

n

tako izračunate vrijednosti „očekivane „su frekvencije 

e

ij

.Izračunati 

χ

2

 možemo: 

χ

2

=

i

=

1

r

j

=

1

c

¿¿¿¿

Da bi mogli odrediti tablični 

χ

2

, moramo odrediti nivo signifikantnosti na kojoj ćemo testirati 

i odrediti broj stepena slobode.U tabeli koja ima 

r

 redova i 

c

 kolona , pa je broj polja 

r

∙ c

to 

znači toliko je očekivanih frekvencija.

Ukoliko od ukupnog broja 

r

∙ c

polja odbijemo jedan stepen slobode za datu veličinu uzorka, jer 

zbir očekivanih frekvencija mora biti jednak zbiru originalnih frekvencija, dobićemo traženi 
broj stepena slobode:

(r-1)(c-1).

Primjer 1:

 Možemo istražiti da li postoji zavisnost između starosti i kvalifikacione strukture 

zaposlenih u nekoj radnoj organizaciji.Izabrali smo uzorak od 400 zaposlenih, grupisali ih 
prema obilježju kvalifikacija i dobi, i dobili sljedeće:

Godine

života

Kvalifikacije

Ukupno

NKV i PKV

KV

VKV

Ostali

20-30
30-40
40-60

10
20
10

20
30
30

45
90
25

45
60
15

120
200
80

Ukupno

40

80

160

120

400

Očekivane frekvencije

e

ij

 prve kolone:

40

x

120

400

=

12

40

x

200

400

=

20

40

x

80

400

=8

Očekivane frekvencije druge kolone:

80

x

120

400

=24

80

x

200

400

=40

80

x

80

400

=16

Kada   smo   izračunali   očekivane   vrijednosti   računamo   razliku   između   odgovarajućih 
originalnih i očekivanih frekvencija 

m

ij

¿

e

ij

¿

155

Godine

života

Kvalifikacije

Ukupno

NKV i PKV

KV

VKV

Ostali

20-30
30-40
40-60

-2

0

-2

-4

-10

14

-3

10

-7

9
0

-9

0
0
0

Ukupno

0

0

0

0

0

Kvadriramo izračunate razlike

¿

.

Godine

života

Kvalifikacije

NKV i PKV

KV

VKV

Ostali

20-30
30-40
40-60

4
0
4

16

100
196

9

100

49

81

0

81

I konačno računamo

χ

2

=

i

=

1

r

j

=

1

c

¿¿¿¿

Godine

života

Kvalifikacije

Ukupno

NKV i PKV

KV

VKV

Ostali

20-30
30-40
40-60

0,33

0

0,5

0,67
2,50

12,25

0,19
1,25
1,53

2,25
0,00
3,38

3,44
3,75

17,66

Ukupno

0,83

15,42

2,97

5,63

24,85

Broj stepena slobode za 3 reda i 4 kolone:

(r-1)(c-1)=(3-1)(4-1)=2x3=6

Tablična   vrijednost   za  

χ

2

za   6   stepena   slobode   i   5%   signifikantnosti   je   12,6,   pošto   je 

izračunata vrijednost veća od tablične, nul hipotezu odbacujemo kao lažnu.postoji zavisnost 
između obilježja, kvalifikacija je zavisna od starosti i obrnuto.Kolika je jaka ta zavisnost.Na 
to pitanje će nam odgovoriti 

koeficijent kontigense

 i računa se po sljedećoj formuli:

C=

χ

2

χ

2

+

n

Ako   nema   zavisnosti   među   obilježjima,   koeficijent   kontigense   je   nula.Najveća   vrijednost 
ovog   koeficijenta   zavisi   od   broja   kolona   u   tabeli   kontingense,   ali   nikada   nije   veća   od 

background image

157

158

Želiš da pročitaš svih 1 strana?

Prijavi se i preuzmi ceo dokument.

Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.

Slični dokumenti