Statistika – usmeni
1
Statistika – teorija (za usmeni ispit)
Statistički skup – skup svih pojedinačnih slučajeva na kojima se statistička ojava posmatra.
Veličina osnovnog skupa – može biti vrlo velika ili čak beskonačna.
Uzorak – je posmatrani podskup osnovnog skupa, čije veličina je označena sa n.
Pojava je sve ono što neko želi da posmatra.
Statistika je analiza masovnih pojava koje su varijabilne. Analiza se uglavnom izvodi na osnovu
uzorka. Jedinice (elementi) stat. skupa su pojedinačni slučajevi iz koji se stat. skup sastoji. Moraju
biti istovrsne ali ne i istovetne. Svrha posmatranja jedinica stat. skupa je ispitivanje diferenciranosti
njihovih karakteristika i kvantitativno izražavanje uočenih različitosti.
Obeležja stat. jedinica – su osobine po kojima se jedinice nekog skupa razlikuju.
Parametar – specifično obeležje osnovnog skupa.
Parametar uzorka – specifično obeležje uzorka.
Obeležja jedinica stat. skupa se dele na numerička i atributivna.
Numerička obeležja – osobine koje se uočavaju, mogu se meriti i brojčano iskazati.
Atributivna obeležja – osobine koje se uočavaju, ne mogu se meriti već se opisno iskazuju.
Numerička obeležja dele se na:
- prekidna (diskretna, diskontinuirana);
- neprekdina (kontinuirana).
Prekidna obeležja su numerička obeležja koja uzimaju samo određene vrednosti sa brojne prave i
rezultat su prebrojavanja („broj nečega“) – iskazuje se u apsolutnom iznosu.
Neprekidna obeležja su numerička obeležja koja mogu uzeti bilo koju vrednost sa brojne prave i
rezultat su merenja – iskazuju se i celim i decimalnim brojem.
Stat. serije – Negrupisani podaci su podaci zapisani redosledom kojim su prikupljeni pa se moraju u
I koraku srediti i takav skup je onda stat. serija. Skupovi podataka sređuju se i prikazuju u vidu
tabela i grafikona. Grupisanje može bizi geografsko, vremensko, atributivno i numeričko.
Uređivanje podataka – Xi – vrednost obeležja. Radi bolje preglednosti, podaci se grupišu u klase ili
grupe i određuje se broj podataka u svakoj klasi odnosno grupi. Grupisani num. podaci se nazivaju
distribucije frekvencija. Dist. frek. predstavlja tabelarno prikazivanje podataka, gde podatke
grupišemo u 2 kolone tako da su u prvoj koloni navedene uočene vrednosti obeležja, a u drugoj
koloni broj jedinica navedene vrednosti i obeležja. Postoje 2 vrste distribucije frek.: 1. intervalne –
vrednost obeležja je interval koji sadrži 2 ili više pojedinačne vrednosti; 2. neintervalne – vrednost
obeležja je tačno navedena pojedinačna vrednost. Razlika je u načinu prikazivanja obeležja Xi. Broj
podataka svake navedene vrednosti obeležja ili grupe (intervala) naziva se apsolutna frekvencija
(fi). Apso. frek. pokazuje koliko jedinica posmatranog skupa ima određene modalitete vrednosti
obeležja. Na ovaj način se dobija distribucija ili raspodela frekvencija.
Na osnovu apso. frek. mogu se izračunati:
- relativna frekvencija (struktura) se dobija kao količnik apso. frek. svake vrednosti obeležja i
ukupnog broja jedinica posmatranja (pi). Na osnovu izračunatih relativnih frek. može se iskazati
učešće pojedinih vrednosti obeležja u ukupnom broju jedinica posmatranja.
- kumulativna frek. određene vrednosti obeležja dobija se sabiranjem apso. frek. svih prethodnih
obeležja i apso. frek. tog obeležja. Kumulativna frek. predstavlja zastupljenost ispod ili iznad
određene vrednosti.
2
Neophodni elementi tabele su:
- naslov i podnaslov
- izvor podataka
- prostor za sve rubrike
- dopunska objašnjenja pojedinih podataka
Stat. tabele se dele na proste, složene i kombinovane.
Grafički način prikazivanja podataka omogućava bolje uočavanje bitnih karakteristika neke serije
podataka. Manje su precizni od tabela. Neprikladni su za prikazivanje dugih serija.
Sređivanje i graf. prikazivanje
Stubičasti dijagram – grafikon koji se sastoji od stubića čija visina predstavlja frek. posmatranih
kategorija.
Kružni dijagram – krug podeljen na delove od kojih svaki deo predstavlja relativnu frek. ili učešće
odgovarajuće kategorije u posmatranom skupu. (3,6o * X%). Na X osu obeležje posmatranja a na X
skalu za frekvencije.
Sređivanje i grafičko prikazivanje kvantitativnih podataka
Koriste se poligon i histogram.
Poligon je linija koja spaja tačke čije su koordinate vrednosti obeležja u odgovarajuće frekvencije.
Histogram čine pravougaonici čija je osnovica jednaka veličini grupnog intervala, a visinu određuje
vrednst frekvencije.
Za negrupisane podatke kao grafički prikaz koristimo dijagram stablo – list.
Grafičko prikazivanje vremenskih serija
Koristi se linijski dijagram. Na x – osu se nanosi podela za vremenski period a na y – osu podela
(skala) za posmatranu pojavu. Mesečne vremenske serije možemo grafički prikazati pomoću
polarnog dijagrama.
Pokazatelji centralne tendencije
Srednje vrednosti su:
- aritmetička sredina
- geometrijska sredina
- harmonijska sredina
- medijana
- modus
Pokazatelji se dele na:
1. izračunate sr. vrednosti (aritmetička, geometrijska i harmonijska sredina)
2. položajne – pozicione sr. vrednosti (modus i medijana)
Svi pokazatelji centralne tendencije su apsolutne vrednosti. x>G>H
Arit. sredina – je najčešće upotrebljivani pokazatelj srednje vrednosti. Razlikuje se izražunavanje
proste i ponderisane arit. sredine. Prosta se koristi kod negrupisanih a ponderisana kod grupisanih
podataka.

4
Harmonijska sredina (HS)
- je recipročna vrednost ar. sred. iz recipročne vrednosti obeležja. Za negrupisane podatke
izračunavamo prostu HS. Ar. sred > Geo. sred > Harm. sred.
Ako su vrednosti obeležja grupisane u „n“ grupa, izračunavamo ponderisanu HS. HS se ne
izračunava ako je neka od vrednosti obeležja jednaka nuli.
Pokazatelji varijabiliteta
Spadaju:
- razmak (interval) varijacije – I
- srednje apsolutno odstupanje – SO
- standardna devijacija – σ
- varijansa – σ2
- koeficijent varijacije – V
- standardizovano (normalizovano) odstupanje – Z
I, SO, σ, σ2 – apsolutni pokazatelji (zavise od jedinice mere)
I, SO, σ, σ2 + V – varijabilitet cele serije (N)
V, Z – relativni pokazatelji
Z – varijabilitet pojedinačne vrednosti obeležja (Xi)
Interval (razmak) varijacije – I
Predstavlja razliku ekstremnih vrednosti obeležja u nekoj seriji. Kod negrupisanih podataka interval
varijacije je razlika maks. i min. vrednosti obeležja.
I = Xmax – Xmin
Kod intervalne distribucije frekvencija interval varijacije predstavlja razliku gornje granice
poslednjeg i donje granice prvog grupnog intervala.
Srednje apsolutno odstupanje – SO
SO je količnik zbira odstupanja individualnih vrednosti obeležja od njihovog proseka i njihovog
broja. Srednje apsolutno ostupanje se utvrđuje bez obzira na predznak odstupanja.
Standardna devijacija – σ
- je kvadratni koren iz sredine kvadrata odstupanja vrednosti obeležja od ar. sred. σ je najviše
upotrebljivan pokazatelj disperzije. Za negrupisane podatke, devijacija se može izračunati na bazi
odstupanja vrednosti obeležja od proseka ili izračunavanjem direktno iz podataka. Za grupisane
podatke (kod distribucije frekvencija) stad. devijacija se može izračunati na bazi odstupanja
vrednosti obeležja od proseka, izračunavanjem direktno iz podataka ili skraćenom izračunavanjem.
Varijacija (disperzija) – σ2
- kvadrat standardne devijacije i može da se izračuna na više načina. Načini su isti kao kod
standardne devijacije.
5
Koeficijent varijacije – V
- je relativni pokazatelj disperzije. V pokazuje koliko procentualno iznosi standardna devijacija u
odnosu na ar. sred.
Standardizovano (normalizovano) odstupanje – Z
- je relativni pokazatelj disperzije obeležja.
- je mera udaljenosti pojedinih vrednosti obeležja od ar. sred. iskazana u odnosu na standardnu
devijaciju. Standardizovano odstupanje može biti izračunato kao pozitivna ili negativna vrednost.
Za razliku od otalih pokazatelja varijacije, standardizovano odstupanje pokazuje varijabilitet
pojedinačnih vrednosti obeležja.
Osobine varijanse
- varijansa je pokazatelj varijacije izražen istim jedinicama ali se uz izračunate vrednosti nikada ne
stavljaju mere;
- ako su vrednosti jednake, varijabilitet je jednak nuli;
- ako svim vrednostima obeležja dodamo ili oduzmemo konstantu, varijansa novih vrednosti
obeležja se ne menja;
- ako sve vrednosti obeležja u nekoj seriji pomnožimo konstantom, varijansa novih vrednosti
obeležja biće jednaka proizvodu kvadrata konstante i prethodno izračunate varijanse.
Kvantili – su vrednosna obeležja koja uređenu seriju podataka dele na jednake brojne delove. U
kvantile spadaju:
- kvartili – seriju dele na 4 jednaka dela;
- decili – dele na 10 jednakih delova;
- percentili – dele na 100 jednakih delova.
Broj kvantila je uvek za jedan manje od njihovog reda. Izračunavamo 3 kvartila, 9 decila i 99
percentila. Za neku seriju podataka izračunavano prvi – Q1, drugi Q2 i treći Q3 kvartil:
- prvi kvartil je vrednost u seriji od koje 25% jedinica ima manju, a 75% veću vrednost;
- drugi je medijana, seriju deli na dva jednaka dela;
- treći je vrednost u seriji od koje 75% jedinica ima manju, a 25% ima veću vrednost.
Postupak utvrđivanja kvartila je isti kao i postupak uzvrđivanja medijane. Najpre se podaci srede u
rastući niz, odnosno serija se sistematizuje. U zavisnosti od toga da li je broj podataka deljiv sa 4,
postoje 2 načina za izračunavanje kvartila. Nakon izračunavanja vrednosti I i III kvartila, utvrđuje
se interkvartilna razlika kao pokazatelj varijabiliteta (IQR = Q3 – Q1). IGR predstavlja interval u
kojem se nalazi 50% podataka. Na IQR je manji uticaj ekstremnih vrednosti. Takođe, IGR se može
izračunati i procentualno preko formule za koeficijent interkvartilne razlike.
Pokazatelji oblika distribucije
Za sagledavanje oblika distribucije izračunavaju se dva koeficijenta:
1. koef. asimetričnosti – I Pirsonov koef. – β1
2. koef. spljoštenosti – II Pirsonov koef. – β2
Za izračunavanje koef. potrebno je prvo izračunati centralne momente. Pod centralnim momentom
n – tog reda – podrazumeva se sredina sume odstupanja vrednosti obeležja od ar. sred. dignuta na n
– ti stepen. U praktičnom radu izračunavanje centralnih momenata izvodi se primenom metode

7
Binomna distribucija
BD je jedna od najvažnijih prekidnih teorijskih distribucija. U osnovi BD su sukcesivni događaji.
BD je definisana preko Bernulijevog eksperimenta.
Karakteristike Bernulijevog eksperimenta:
1. eksperiment ima dva ishoda, uspeh i neuspeh;
2. u svakom ponavljanju eksperimenta, verovatnoća ishoda uspeh je p i ne menja se od
eksperimenta do eksperimenta. Verovatnoća ishoda neuspeh jednaka je q = 1 – p;
3. eksperimenti su nezavisni;
4. ishod svakog eksperimenta ili procesa zavisi od slučaja.
Relativna frek. (verovatnoća) za svaku x = i data je izrazom:
P
(
i
)=
(
n
i
)
∗
p
i
∗
q
n
−
i
n je broj modaliteta obeležja i, pri čemu je n = i – 1.
i je vrednost obeležja.
p – verovatnoća uspeha
q – verovatnoća neuspeha
BD zavisi od dva parametra, n i p.
0 < p > 1 0 < q > 1
p + q = 1 q = 1 – p
Pokazatelji BD
- ar. sred - XBD = np
- varijansa - σ2BD = npq
- standardna devijacija – σBD =
√
npq
- modus – np – q < k > np + q
- Pirsonovi koeficijenti
β
1
=
(
n
−
p
)
2
npg
β
2
=
3
+
1
−
6
pq
npq
β2 > 3 – raspodela je izdužena u odnosu na normalnu raspodelu
β2 = 3 – raspodela je iste spljoštenosti kao i normalna raspodela
β2 < 3 – raspodela je spljoštena u odnosu na normalnu raspodelu.
Pomoću BD se ispituje saglasnost emp. podataka sa teorijskim verovatnoćama binomne distribucije.
BD ima primenu u kontroli kvaliteta robe i kontroli proizvodnog procesa.
Ispitivanje saglasnosti ED sa TD
I način: preko centralnih momenata ili preko Pirsonovih koeficijenata
II način: upoređivanjem apsolutnih frek. TD (f(i)) sa apsolutnim frek. ED (fi).
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti