Verovatnoća i statistika
1
1. S tatistik a
5tatistika je m atem atička disciplina koja je počela svoj intenzivni ra
3
v
0
j tek u XX veku. N a p očetku
XX veka samo je zaneraarIjivi deo nauke i prakse koristio statistik u u svora ra d u , аИ je
2
a t
0
n a k ra ju
XX veka težko naći oblast nauke ili prakse koja se bar jednim deloin ne oslanja na teoriju verovatnoće i
matematičke statistike.
Statistika je m etod kvantitativnog istraživanja pojava. Ona istražuje pojave ne n a pojedi
11
im nego na
mnoštvu slučajeva. Individualni slučajevi pojave mogu pokazati m anja ili veća o d stu p an ja od prosečnog
ili tipičnog pa je zato neophodno da se p osm atraju u velikom broju, u masi, da bi se otkrilo šta je u njim a
opšte i zakonito.
1.1 O snovni p o jm o v i s ta tis tik e
Predm et ispitivanja m atem atičke statistike je p o p u la c ija . Populaciju čine elem enti ili pojave. Na pop-
ulac.iji ispitujemo neku karakteristiku koju nazivamo o b e le ž je . Možemo n a je d n o j populaciji p o sm atrati
i više obeležja.
P r im e r 1.1
I Posmatramo broj izostanaka u toku jednog polugodiSta učenika osnovne Skole u Jugoslamji.
U ovom slučaju populaciju čine svi uCenici osnovnih Skola u Jugoslaviji., a obeležje koje posmatramo
je broj izostanaka. Ovo obeležje m ože uzeti vrednosti
0 ,1 ,2 ,. , . .
N .
I I Posmatramo uspešnost novog Ieka na pacijentima sa povišenim krvnim pritiskom..
Sada populaciji čins svi ljudi sa pomSemm krvnim pritiskorn, a obeležje je uspešnosi leka. Realizo-
vane vrednosti obeležja mogu se opisati rečima: uspešan, delimično usve$an i neuspešan.
III Posmatramo prinos pSenice po hektaru u Vojvodini u toku 2000. godine.
Poyulaciju Cine sve obradive površine u Vojvodini zasejane pšenicom, a obeležje je prinos pSenice
po hektaru. Prinos pšenice, odnosno posmairano obeležje, nalazi se u intervalau [0,800 t]
I V Posmatramo dnevni unos vitam ina A i vitamina C kod. de
cs
predškobkog uzrasta.
U ovom slučaju posmatramo dva obeležja. Prvo obeležje je anos vitam ina A i njegove vrednosti
: . -
pripadaju intervalu [0,100 mgJ. a drugo posmatrano obeležje je unos C vitam ina čije ~ Љ ш ваш
vrednosti pripadaju intervalu [0.1-500 mgJ.
Iz prethodnog prim era uočavamo da posm atrana obeležja mogu biti numerička (prim eri I I I U
alributivna (prim er II). Numerička obeležja izražavaju se brojem , a atrib u tiv n a opisno.
Očigledno je gotovo nemoguće da posm atrano obeležje registrujemo kod svakog elem enta p o p -ia e ^ J
Fizičkije neizvodljivo izmeriti količinu A vitam ina koje svako dete unese. T ako đeje ne moguće prim ez^i
riovi Iek na svakog pacijenta sa 'povišenim pritiskom. Najčešće populacije sadrže veliki broj elem ena:^
Prva etapa u statističkom proučavanju predstavlja izbor uzorka nad kojim će biti izvršeno posm atran;t.
To znači da iz populacije izvojimo
n
elemenata (jedinki) koji čine uzorak. Broj n nazivamo obim uzorki
O vo jejedan od najtežih i najkomleksnijih problem ajer na osnovu dobijenih rezu ltata n a uzorku donosimo
zaključak o celoj populaciji.
Druga etapa sastoji se u statističk o m posm atranju izabranog uzorka.
U trećoj etapi grupišem o i sređujemo podatke dobijene pri statističkom posm atranju.
O etvrta etapa se sastoji iz dva dela. Prvi deo je obrada sređenih podataka, a u drugom delu dajem o
naučnu analizu rezulatata. R ezultati dobijeni na osnovu obrade uzorka pridružuju se celoj populaciji.
Na sliei 1 je Sernatski prikazano statističko proučavanje.
Slika I.
f c b o r u zo rk a. Ocena populacije na osnovu podataka iz uzorka p re d sta v lja je d an oblik induktivnog uopš-
tav an ja je r se osobine ispitanog dela (uzorka) pripisuju celini (populaciji) iz k o je je uzet. Zaključci doneti
o populaciji na osnovu ispitivanja njenih delova mogu d a budu pogrešni ili tačni. Znači d a je zaključak
o populaciji slučajna prom enljiva kojoj odgovara neka verovatnoća. Verovatnoća tačn o sti zaključka o

:iK A
1.2
G ru p is a n je i sre đ iv a n je p o d a ta k a
Posle izbora uzorka i statističkog posm atranja pristupam o III etapi statističkog p roučava'ja i :; ;e
sređivanje prikupljenog materijala. Kao rezultat dobijaju se statističke tabele. Apsolutne brojke '-;:;e
proizilaze kao re zu ltat sređivanja im aju sam e po sebi veliki praktičan značaj. U nekim istra
2
:vaz;^sa
pogodna klasifikacija i tabeliranje podataka mogu da d a ju tako jasnu sliku o posm atranom obeiežju ća
dalja analiza nije ni potrebna. U drugim slučajevima sređivanje podataka nije dovoljno, ali je neophcćro
za naredne etape statističkog proučavanja.
Pod
klasifikacijom podataka
podrazumevamo grupisanje p odataka po grupam a ili klasama prema
odgovarajućoj vrednosti numeričkog ili atributivnog obeležja.
Sređivanje sirovog m atrijala prikupljenog pri statističkom posm atranju im a za cilj da olakša upoređi-
vanje, da istakne najznačajnije karakteristike tako da Iako b u d u uočljive i da omogući statističku analizu.
Statistička tabela mora biti jasna i pregledna.
Neka obeležje
X
može uzeti s različitih vrednosti
x 1, x 2,
obima
n
dobijamo niz
b i , h , h , - ■
■, bn
u k o j e m j e
6
j
6
{ x u x 2, . . . , x s} ,i — l , . . . , n .
Ovako navedeni podaci su nepregledni. Zato ih treba
grupisati, U uzorku ( l .l) prebrajam o koliko puta se p ojavila realizovana vrednost
X 1.
Dobijeni broj
označavamo sa
f
i nazivamo ga frekvencija ili učestalost pojavljivanja vrednost
Х
u uzorku. Slično
postupam o i pri dobijanju brojeva /
2
, /
3
, . . . ,
f s■
Veličine
f
, /
2
, . . . ,
f s
zadovoljavaju uslov
/1
+
/2
+ • • • +
.fs — п
i nazivaju se frekvencijama ili učestalostima. Realizovane vrednosti obeležja
X
i odgovarajuće frekvencije
f
0
r
1
niraju statističku tabelu
, x s.
Pri izvršenom merenju na uzorku
(1.1)
X
U
X 1
/ l
Z
2
/2
Xs
f s
Tabela I
P r i m e r 1.4
Ispitivanjem je obuhvaćeno 50 bračnih parova ko ji su u braku izm eđu 5 i 10 godina i zabeležen
je broj dece u braku. Dobijeni su podaci:
L 2., 3,2,1,2,2,0,3,2,1,1,3,2,2,0, Jh, 1,1,2,2, 2,2,1,0,
3,1,1,1,1,2,3,2,0,2,2,4,2,2,1,1,0,3,2,1,1,2,2,2,1.
Ako pogledamo prethodni niz brojeva teSko je uočiti koji broj dece je dominantan, da Ii ima više brakova
sa jednim deteom ili dvoje dece i sliCno. Iz tih razloga grupisaćemo podatke. U ovom slučaju posmatrano
obeležje X je broj dece, a njegove realizovane vrednosti su
0 ,1 ,2 ,3
i
4.
Prvo ćemo izvršiti prebrajanje,
odnosno određivanje frekvencija za svaku realizovanu vrednost:
O:+Hf
1 : » Ш Н
2 : « Ш
Ш
3:|||||
4:||
Sada pristupamo form iranju statističke tabele
broj dece u braku (x{)
_
broj brakova {fi)
5
1
16
2
21
3
6
__________
4
__________ ________
2
_______
1.2. G R U P ISA N JE I SR E Đ IV A N JE P O D A T A K A
5
Tabela: Broj dece u brakovima
Ukoliko je broi realizovanih vrednosti obeležja
X
velik ta d a se podaci grupišu u intervale iIi klase.
Ako sa
х т{п
označimo najm anju vrednost u uzorku, a sa
Xmax
najveću vrednost u uzorku veličina
^ — ^m ai
%min
se naziva r a n g posm atranog uzorka. Neka je
s
broj inrvala u koje želimo d a grupišemo podatke. Tada
je r/ssidužina jednog intervala. Nekada se, iz praktičnih razloga, može umesto ranga
r
koristiti neki broj
r'
> гДако da broj
r '/ s
bude jednostavniji za primenu. Sada određujem o disjunktne intervale [m
1
,m
2
],
(m
2
,m
3
j, . .. . (m.s.m s+i] tako da je TO1 < x m{„ i
77¾+1
>
Xmax.
Kako je intervale nemoguće sabirati
i rnnožiti u daljoj analizi se interval i,- = (
777
^ ,
777
;+ ^ zam enjuje svojom sredinom. Iz tog razloga se u
statističku tabelu pored kolene u kojoj se nalzai interval uvodi i kolona koja sadrži sredinu intervala
Xi =
mj^ nifl ■
Prem a tome, na ovaj način dobijam o statističku tabelu oblika
klase (ii)
sredina klase (z;)
frekvencija (/;)
[TOilTO2I
X1 = 2^pi*
/1
(m2,m3]
X2 = lli^
/2
[
772
.;,
TTls
4-1 ]
„
_
m,+m
,+ 1
_^J_=__'2_1 1 ._
fs
Tabela 2
Uvođeajem kolone "sredina intervala" tabele 1 i 2 možemo istovetno tre tira ti u daljim statističkim
ispitivanjirna.
P r i m e r 1.5
Izm tre n a je visina 80 učenika prvog razreda. Dobijeni su sledeći podaci:
120
132
131
136
128
135
129
127
120
129
ЦО
138
132
ЦО
132
131
138
137
125
125
130
133
135
124
137
136
140
141
132
121
132
138
126
129
141
121
138
119
125
139
129
139
135
136
119
123
124
129
135
132
131
132
124
137
123
125
129
131
132
139
123
134
132
126
132
129
137
132
133
135
139
121
127
134
132
129
135
132
137
127
U datom prim eru velik je broj realizacija obeležja X , naim e X u datom uzorku uzim a 21 različitu
vrednosti. Ukoliko podatke ne grupišemo u klase dobi6emo da su odgovarajuće frekvencije veoma male.
Taj nedostatak sprečava dalja statistička ispitivanje. Iz tog razloga dobijene podatke grupisaćemo u klase.
Pri odredivanjiL broja klasa treba voditi računa da u svakoj klasi bude bar 5 realizacija. Za posmatrani
prim er mžemo uzeti 1
= 6.
Kako je x min —
119,
a Xmax
= 141
to je rang jednak 1^1-119-22 pa je dužina
klase
22/6 = 3.66
cm. Dobijeni broj nije pogodan za izraćunavanje pa biramo da dužina intervala bude Jt
cm. Konačno možemo form irati statističku tabelu

1.2. G RU P lSAN JE 1 S R E Đ IV A N J E P O D A T A K A
7
A
is--
13—
1 2
—
------------------------------------- ---------------- 1------------------------------------------------------------- т~
118
122
126
130
134
138
142
Poligon frekvencija
Histogram frekvencija
Cesto se iz poligona frekvencije ili iz histogram a frekvencije ne dobije slika o celoj populacije, Zato se
uvodimo ројаш relativne frekvencije, kao i odgovarajuće poligone i histograrne.
Veličiuu г /, definisanu izrazom
r f i = — ,
i = l , . . . , s ,
( 1 . 2 )
n
gde je
fi
frekvencija, a
n
obim a uzorka, nazivamo r e la t iv n a fre k v e n c ija . Sada u statističk u tabelu
dodajemo još jednu kolonu u koju unosimo odgovarajuće relativne frekvencije.
Ukoliko na poligonima i histogram im a na у —osu nanesemo relativnu frekvenciju dobijam o poligone i
hist,ograme relat.ivnih frekvencija.
P r im e r 1.8
Nacrtati poligon relativne frekvencije za prim er 1-4 i poligon i histogra za prim er 1.5.
Prvo ćemo' odrediti relativne frekvencije za date primere. Na taj način dobijamo nove statisii6ke tabele
broj dece u braku (xi)
broj brakova (fi)
rel. frek. (rfj)
_
5
0.1
1
16
0.32
2
21
O.42
3
6
0.12
__________
4
__________ ________
2
________
O.O4
Tabela: Broj dece u brakovima
v is m a
[cm]
s r e d in a in t e r v a l a
broj u č e n ik a
(fi)
rel. fr e k . ( r f i )
(118,122]
120
7
7_
_
80
0.0875
(122,126]
i 24
12
i l
8 0 "
= 0.15
(126,130]
128
13
M —
80 —
0.1625
(130,134]
132
21
21 _.
80
0.2625
(134,138]
136
18
Ш -
8 0 ~~
0.225
(138,142]
i 40
9
J L _
80 ~
0.1125
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti