1

Statistika – teorija (za usmeni ispit)

Statistički skup – skup svih pojedinačnih slučajeva na kojima se statistička ojava posmatra.
Veličina osnovnog skupa – može biti vrlo velika ili čak beskonačna.
Uzorak – je posmatrani podskup osnovnog skupa, čije veličina je označena sa n. 
Pojava je sve ono što neko želi da posmatra.
Statistika  je analiza masovnih pojava koje su varijabilne. Analiza se uglavnom izvodi na osnovu 
uzorka. Jedinice (elementi) stat. skupa su pojedinačni slučajevi iz koji se stat. skup sastoji. Moraju 
biti istovrsne ali ne i istovetne. Svrha posmatranja jedinica stat. skupa je ispitivanje diferenciranosti 
njihovih karakteristika i kvantitativno izražavanje uočenih različitosti. 
Obeležja stat. jedinica – su osobine po kojima se jedinice nekog skupa razlikuju.
Parametar – specifično obeležje osnovnog skupa.
Parametar uzorka – specifično obeležje uzorka.
Obeležja jedinica stat. skupa se dele na numerička i atributivna.
Numerička obeležja – osobine koje se uočavaju, mogu se meriti i brojčano iskazati.
Atributivna obeležja – osobine koje se uočavaju, ne mogu se meriti već se opisno iskazuju.
Numerička obeležja dele se na:
- prekidna (diskretna, diskontinuirana);
- neprekdina (kontinuirana).
Prekidna obeležja su numerička obeležja koja uzimaju samo određene vrednosti sa brojne prave i 
rezultat su prebrojavanja („broj nečega“) – iskazuje se u apsolutnom iznosu.
Neprekidna obeležja  su numerička obeležja koja mogu uzeti bilo koju vrednost sa brojne prave i 
rezultat su merenja – iskazuju se i celim i decimalnim brojem.

Stat. serije – Negrupisani podaci su podaci zapisani redosledom kojim su prikupljeni pa se moraju u 
I koraku srediti i takav skup je onda stat. serija. Skupovi podataka sređuju se i prikazuju u vidu 
tabela i grafikona. Grupisanje može bizi geografsko, vremensko, atributivno i numeričko. 

Uređivanje podataka – Xi – vrednost obeležja. Radi bolje preglednosti, podaci se grupišu u klase ili 
grupe i određuje se broj podataka u svakoj klasi odnosno grupi. Grupisani num. podaci se nazivaju 
distribucije   frekvencija.   Dist.   frek.   predstavlja   tabelarno   prikazivanje   podataka,   gde   podatke 
grupišemo u 2 kolone tako da su u prvoj koloni navedene uočene vrednosti obeležja, a u drugoj 
koloni broj jedinica navedene vrednosti i obeležja. Postoje 2 vrste distribucije frek.: 1. intervalne – 
vrednost obeležja je interval koji sadrži 2 ili više pojedinačne vrednosti; 2. neintervalne – vrednost 
obeležja je tačno navedena pojedinačna vrednost. Razlika je u načinu prikazivanja obeležja Xi. Broj 
podataka svake navedene vrednosti obeležja ili grupe (intervala) naziva se apsolutna frekvencija 
(fi). Apso. frek. pokazuje koliko jedinica posmatranog skupa ima određene modalitete vrednosti 
obeležja. Na ovaj način se dobija distribucija ili raspodela frekvencija. 

Na osnovu apso. frek. mogu se izračunati: 
- relativna frekvencija (struktura) se dobija kao količnik apso. frek. svake vrednosti obeležja i 
ukupnog broja jedinica posmatranja (pi). Na osnovu izračunatih relativnih frek. može se iskazati 
učešće pojedinih vrednosti obeležja u ukupnom broju jedinica posmatranja. 
- kumulativna frek. određene vrednosti obeležja dobija se sabiranjem apso. frek. svih prethodnih 
obeležja   i   apso.   frek.   tog   obeležja.   Kumulativna   frek.   predstavlja   zastupljenost   ispod   ili   iznad 
određene vrednosti. 

2

Neophodni elementi tabele su: 
- naslov i podnaslov
- izvor podataka
- prostor za sve rubrike
- dopunska objašnjenja pojedinih podataka
Stat. tabele se dele na proste, složene i kombinovane.
Grafički način prikazivanja podataka omogućava bolje uočavanje bitnih karakteristika neke serije 
podataka. Manje su precizni od tabela. Neprikladni su za prikazivanje dugih serija. 

Sređivanje i graf. prikazivanje

Stubičasti dijagram – grafikon koji se sastoji od stubića čija visina predstavlja frek. posmatranih 
kategorija.
Kružni dijagram – krug podeljen na delove od kojih svaki deo predstavlja relativnu frek. ili učešće 
odgovarajuće kategorije u posmatranom skupu. (3,6o * X%). Na X osu obeležje posmatranja a na X 
skalu za frekvencije. 

Sređivanje i grafičko prikazivanje kvantitativnih podataka

Koriste se poligon i histogram.

Poligon je linija koja spaja tačke čije su koordinate vrednosti obeležja u odgovarajuće frekvencije.
Histogram čine pravougaonici čija je osnovica jednaka veličini grupnog intervala, a visinu određuje 
vrednst frekvencije. 
Za negrupisane podatke kao grafički prikaz koristimo dijagram stablo – list.

Grafičko prikazivanje vremenskih serija

Koristi se linijski dijagram. Na x – osu se nanosi podela za vremenski period a na y – osu podela 
(skala)   za   posmatranu   pojavu.   Mesečne   vremenske   serije   možemo   grafički   prikazati   pomoću 
polarnog dijagrama.

Pokazatelji centralne tendencije

Srednje vrednosti su:
- aritmetička sredina
- geometrijska sredina
- harmonijska sredina
- medijana
- modus

Pokazatelji se dele na:
1. izračunate sr. vrednosti (aritmetička, geometrijska i harmonijska sredina)
2. položajne – pozicione sr. vrednosti (modus i medijana)

Svi pokazatelji centralne tendencije su apsolutne vrednosti. x>G>H

Arit. sredina  – je najčešće upotrebljivani pokazatelj srednje vrednosti. Razlikuje se izražunavanje 
proste i ponderisane arit. sredine. Prosta se koristi kod negrupisanih a ponderisana kod grupisanih 
podataka. 

background image

4

Harmonijska sredina (HS)

-   je   recipročna   vrednost   ar.   sred.   iz   recipročne   vrednosti   obeležja.   Za   negrupisane   podatke 
izračunavamo prostu HS. Ar. sred > Geo. sred > Harm. sred.
Ako   su   vrednosti   obeležja   grupisane   u   „n“   grupa,   izračunavamo   ponderisanu   HS.   HS   se   ne 
izračunava ako je neka od vrednosti obeležja jednaka nuli.

Pokazatelji varijabiliteta

Spadaju:
- razmak (interval) varijacije – I
- srednje apsolutno odstupanje – SO
- standardna devijacija – σ
- varijansa – σ2
- koeficijent varijacije – V
- standardizovano (normalizovano) odstupanje – Z

I, SO,  σ, σ2 – apsolutni pokazatelji (zavise od jedinice mere)
I, SO, σ, σ2 + V – varijabilitet cele serije (N)
V, Z – relativni pokazatelji
Z – varijabilitet pojedinačne vrednosti obeležja (Xi)

Interval (razmak) varijacije – I

Predstavlja razliku ekstremnih vrednosti obeležja u nekoj seriji. Kod negrupisanih podataka interval 
varijacije je razlika maks. i min. vrednosti obeležja. 

I = Xmax – Xmin

Kod   intervalne   distribucije   frekvencija   interval   varijacije   predstavlja   razliku   gornje   granice 
poslednjeg i donje granice prvog grupnog intervala. 

Srednje apsolutno odstupanje – SO

SO je količnik zbira odstupanja individualnih vrednosti obeležja od njihovog proseka i njihovog 
broja. Srednje apsolutno ostupanje se utvrđuje bez obzira na predznak odstupanja. 

Standardna devijacija – σ

- je kvadratni koren iz sredine kvadrata odstupanja vrednosti obeležja od ar. sred. σ je najviše 
upotrebljivan pokazatelj disperzije. Za negrupisane podatke, devijacija se može izračunati na bazi 
odstupanja vrednosti obeležja od proseka ili izračunavanjem direktno iz podataka. Za grupisane 
podatke   (kod   distribucije   frekvencija)   stad.   devijacija   se   može   izračunati   na   bazi   odstupanja 
vrednosti obeležja od proseka, izračunavanjem direktno iz podataka ili skraćenom izračunavanjem. 

Varijacija (disperzija) – σ2

-   kvadrat   standardne   devijacije   i   može   da   se   izračuna   na   više   načina.   Načini   su   isti   kao   kod 
standardne devijacije. 

5

Koeficijent varijacije – V

- je relativni pokazatelj disperzije. V pokazuje koliko procentualno iznosi standardna devijacija u 
odnosu na ar. sred. 

Standardizovano (normalizovano) odstupanje – Z

- je relativni pokazatelj disperzije obeležja. 
- je mera udaljenosti pojedinih vrednosti obeležja od ar. sred. iskazana u odnosu na standardnu 
devijaciju. Standardizovano odstupanje može biti izračunato kao pozitivna ili negativna vrednost. 
Za   razliku   od   otalih   pokazatelja   varijacije,   standardizovano   odstupanje   pokazuje   varijabilitet 
pojedinačnih vrednosti obeležja. 

Osobine varijanse

- varijansa je pokazatelj varijacije izražen istim jedinicama ali se uz izračunate vrednosti nikada ne 
stavljaju mere;
- ako su vrednosti jednake, varijabilitet je jednak nuli;
-   ako   svim   vrednostima   obeležja   dodamo   ili   oduzmemo   konstantu,   varijansa   novih   vrednosti 
obeležja se ne menja;
-   ako   sve   vrednosti   obeležja   u   nekoj   seriji   pomnožimo   konstantom,   varijansa   novih   vrednosti 
obeležja biće jednaka proizvodu kvadrata konstante i prethodno izračunate varijanse. 

Kvantili  – su vrednosna obeležja koja uređenu seriju podataka dele na jednake brojne delove. U 
kvantile spadaju:
- kvartili – seriju dele na 4 jednaka dela;
- decili – dele na 10 jednakih delova;
- percentili – dele na 100 jednakih delova.

Broj kvantila je uvek za jedan manje od njihovog reda. Izračunavamo 3 kvartila, 9 decila i 99 
percentila. Za neku seriju podataka izračunavano prvi – Q1, drugi Q2 i treći Q3 kvartil:
- prvi kvartil je vrednost u seriji od koje 25% jedinica ima manju, a 75% veću vrednost;
- drugi je medijana, seriju deli na dva jednaka dela;
- treći je vrednost u seriji od koje 75% jedinica ima manju, a 25% ima veću vrednost.

Postupak utvrđivanja kvartila je isti kao i postupak uzvrđivanja medijane. Najpre se podaci srede u 
rastući niz, odnosno serija se sistematizuje. U zavisnosti od toga da li je broj podataka deljiv sa 4, 
postoje 2 načina za izračunavanje kvartila. Nakon izračunavanja vrednosti I i III kvartila, utvrđuje 
se interkvartilna razlika kao pokazatelj varijabiliteta (IQR = Q3 – Q1). IGR predstavlja interval u 
kojem se nalazi 50% podataka. Na IQR je manji uticaj ekstremnih vrednosti. Takođe, IGR se može 
izračunati i procentualno preko formule za koeficijent interkvartilne razlike.

Pokazatelji oblika distribucije

Za sagledavanje oblika distribucije izračunavaju se dva koeficijenta:
1. koef. asimetričnosti – I Pirsonov koef. – β1
2. koef. spljoštenosti – II Pirsonov koef. – β2

Za izračunavanje koef. potrebno je prvo izračunati centralne momente. Pod centralnim momentom 
n – tog reda – podrazumeva se sredina sume odstupanja vrednosti obeležja od ar. sred. dignuta na n  
– ti stepen. U praktičnom radu izračunavanje centralnih momenata izvodi se primenom metode 

background image

7

Binomna distribucija

BD je jedna od najvažnijih prekidnih teorijskih distribucija. U osnovi BD su sukcesivni događaji. 
BD je definisana preko Bernulijevog eksperimenta. 

Karakteristike Bernulijevog eksperimenta:
1. eksperiment ima dva ishoda, uspeh i neuspeh;
2.   u   svakom   ponavljanju   eksperimenta,   verovatnoća   ishoda   uspeh   je  p  i   ne   menja   se   od 
eksperimenta do eksperimenta. Verovatnoća ishoda neuspeh jednaka je q = 1 – p;
3. eksperimenti su nezavisni;
4. ishod svakog eksperimenta ili procesa zavisi od slučaja.

Relativna frek. (verovatnoća) za svaku x = i data je izrazom:

P

(

i

)=

(

n

i

)

p

i

q

n

i

n je broj modaliteta obeležja i, pri čemu je n = i – 1. 
i je vrednost obeležja. 
p – verovatnoća uspeha
q – verovatnoća neuspeha

BD zavisi od dva parametra, n i p. 
0 < p > 1 0 < q > 1
p + q = 1 q = 1 – p

Pokazatelji BD
- ar. sred - XBD = np
- varijansa - σ2BD = npq
- standardna devijacija – σBD = 

npq

- modus – np – q < k > np + q
- Pirsonovi koeficijenti 

β

1

=

(

n

p

)

2

npg

   

β

2

=

3

+

1

6

pq

npq

β2 > 3 – raspodela je izdužena u odnosu na normalnu raspodelu
β2 = 3 – raspodela je iste spljoštenosti kao i normalna raspodela
β2 < 3 – raspodela je spljoštena u odnosu na normalnu raspodelu. 

Pomoću BD se ispituje saglasnost emp. podataka sa teorijskim verovatnoćama binomne distribucije. 
BD ima primenu u kontroli kvaliteta robe i kontroli proizvodnog procesa. 

Ispitivanje saglasnosti ED sa TD

I način: preko centralnih momenata ili preko Pirsonovih koeficijenata
II način: upoređivanjem apsolutnih frek. TD (f(i)) sa apsolutnim frek. ED (fi).

Želiš da pročitaš svih 26 strana?

Prijavi se i preuzmi ceo dokument.

Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.

Slični dokumenti