1

1.  S tatistik a

5tatistika je  m atem atička  disciplina  koja je  počela  svoj  intenzivni  ra

3

v

0

j  tek  u  XX  veku.  N a  p očetku 

XX  veka  samo  je  zaneraarIjivi  deo  nauke  i  prakse  koristio  statistik u  u  svora  ra d u ,  аИ je  

2

a t

0

  n a  k ra ju  

XX  veka  težko  naći  oblast  nauke  ili  prakse  koja  se  bar jednim   deloin  ne  oslanja  na  teoriju  verovatnoće  i 
matematičke  statistike.

Statistika je  m etod  kvantitativnog  istraživanja  pojava.  Ona  istražuje pojave  ne  n a pojedi

11

im   nego  na 

mnoštvu slučajeva.  Individualni  slučajevi  pojave  mogu  pokazati  m anja  ili  veća  o d stu p an ja  od  prosečnog 

ili  tipičnog pa je  zato  neophodno  da se p osm atraju   u velikom broju,  u  masi,  da bi se  otkrilo šta je  u njim a 

opšte  i  zakonito.

1.1  O snovni  p o jm o v i  s ta tis tik e

Predm et  ispitivanja  m atem atičke  statistike je  p o p u la c ija .  Populaciju  čine  elem enti  ili  pojave.  Na  pop- 
ulac.iji  ispitujemo  neku  karakteristiku  koju  nazivamo  o b e le ž je .  Možemo  n a je d n o j  populaciji p o sm atrati 
i  više  obeležja.

P r im e r   1.1

I   Posmatramo  broj  izostanaka  u  toku jednog polugodiSta  učenika  osnovne  Skole  u  Jugoslamji.

U ovom  slučaju populaciju  čine  svi uCenici  osnovnih Skola  u  Jugoslaviji.,  a  obeležje  koje posmatramo

 

je  broj izostanaka.  Ovo  obeležje  m ože  uzeti  vrednosti

  0 ,1 ,2 ,. , . .  

N .

I I   Posmatramo  uspešnost  novog  Ieka  na  pacijentima  sa  povišenim  krvnim  pritiskom..

Sada  populaciji  čins  svi  ljudi  sa  pomSemm  krvnim   pritiskorn,  a  obeležje je   uspešnosi  leka.  Realizo-

 

vane  vrednosti  obeležja  mogu  se  opisati  rečima:  uspešan,  delimično  usve$an  i  neuspešan.

III  Posmatramo  prinos  pSenice  po  hektaru  u  Vojvodini  u  toku  2000.  godine.

Poyulaciju  Cine  sve  obradive  površine  u  Vojvodini  zasejane  pšenicom,  a  obeležje  je  prinos  pSenice

 

po  hektaru.  Prinos  pšenice,  odnosno  posmairano  obeležje,  nalazi  se  u  intervalau  [0,800  t]

I V   Posmatramo  dnevni  unos  vitam ina  A   i  vitamina  C kod.  de

cs 

predškobkog  uzrasta.

U  ovom  slučaju  posmatramo  dva  obeležja.  Prvo  obeležje  je  anos  vitam ina  A   i  njegove  vrednosti

:  .  -

pripadaju  intervalu  [0,100  mgJ.  a  drugo  posmatrano  obeležje  je  unos  C   vitam ina  čije  ~  Љ ш ваш

 

vrednosti pripadaju  intervalu  [0.1-500  mgJ.

Iz  prethodnog  prim era  uočavamo  da  posm atrana  obeležja  mogu  biti  numerička  (prim eri  I  I I U  

alributivna  (prim er  II).  Numerička  obeležja  izražavaju  se  brojem ,  a  atrib u tiv n a  opisno.

Očigledno je  gotovo  nemoguće  da  posm atrano  obeležje  registrujemo  kod  svakog  elem enta  p o p -ia e ^ J  

Fizičkije  neizvodljivo  izmeriti  količinu  A  vitam ina  koje  svako  dete  unese.  T ako đeje  ne  moguće  prim ez^i 
riovi  Iek  na  svakog  pacijenta  sa  'povišenim  pritiskom.  Najčešće  populacije  sadrže  veliki  broj  elem ena:^

Prva etapa u statističkom  proučavanju predstavlja izbor uzorka nad kojim će biti izvršeno posm atran;t. 

To  znači  da  iz  populacije  izvojimo 

n

  elemenata  (jedinki)  koji  čine  uzorak.  Broj  n  nazivamo  obim  uzorki 

O vo jejedan od najtežih  i najkomleksnijih problem ajer  na osnovu dobijenih rezu ltata n a uzorku donosimo 

zaključak  o  celoj  populaciji.

Druga  etapa  sastoji  se  u statističk o m   posm atranju  izabranog  uzorka.
U  trećoj  etapi  grupišem o  i  sređujemo  podatke  dobijene  pri  statističkom   posm atranju.

O etvrta  etapa  se  sastoji  iz  dva  dela.  Prvi  deo je  obrada  sređenih  podataka,  a  u  drugom   delu  dajem o 

naučnu  analizu  rezulatata.  R ezultati  dobijeni  na  osnovu  obrade  uzorka  pridružuju  se  celoj  populaciji.

Na  sliei  1  je  Sernatski  prikazano  statističko  proučavanje.

Slika  I.

f c b o r   u zo rk a.  Ocena populacije  na osnovu podataka iz uzorka p re d sta v lja je d an  oblik induktivnog uopš- 
tav an ja je r se  osobine  ispitanog dela  (uzorka)  pripisuju celini  (populaciji)  iz k o je je   uzet.  Zaključci doneti
o  populaciji  na  osnovu  ispitivanja  njenih  delova  mogu  d a  budu  pogrešni  ili  tačni.  Znači  d a je  zaključak

o  populaciji  slučajna  prom enljiva  kojoj  odgovara  neka  verovatnoća.  Verovatnoća  tačn o sti  zaključka  o

background image

:iK A

1.2 

G ru p is a n je   i  sre đ iv a n je   p o d a ta k a

Posle  izbora  uzorka  i  statističkog  posm atranja  pristupam o  III  etapi  statističkog  p roučava'ja  i  :;  ;e 

sređivanje  prikupljenog  materijala.  Kao  rezultat  dobijaju  se  statističke  tabele.  Apsolutne  brojke  '-;:;e 
proizilaze  kao  re zu ltat  sređivanja  im aju  sam e  po  sebi  veliki  praktičan  značaj.  U  nekim  istra

2

:vaz;^sa 

pogodna  klasifikacija  i  tabeliranje  podataka  mogu  da  d a ju   tako  jasnu  sliku  o  posm atranom   obeiežju  ća 

dalja  analiza  nije  ni  potrebna.  U  drugim slučajevima sređivanje podataka  nije  dovoljno,  ali je  neophcćro 
za  naredne  etape  statističkog  proučavanja.

Pod 

klasifikacijom  podataka

  podrazumevamo  grupisanje  p odataka  po  grupam a  ili  klasama  prema 

odgovarajućoj  vrednosti  numeričkog  ili  atributivnog  obeležja.

Sređivanje sirovog m atrijala prikupljenog pri  statističkom   posm atranju  im a  za  cilj  da  olakša  upoređi- 

vanje,  da  istakne  najznačajnije karakteristike tako da  Iako  b u d u  uočljive  i  da omogući statističku  analizu. 

Statistička  tabela  mora  biti jasna  i  pregledna.

Neka  obeležje 

X

  može  uzeti  s  različitih  vrednosti 

x 1, x 2,

 

obima 

n

  dobijamo  niz

b i , h , h , -  ■

 ■, bn

u  k o j e m j e

6

6

 

{ x u x 2, . . . , x s} ,i  —  l , . . . , n .

  Ovako  navedeni  podaci  su  nepregledni.  Zato  ih  treba 

grupisati,  U  uzorku  ( l .l)   prebrajam o  koliko  puta  se  p ojavila  realizovana  vrednost 

X 1.

  Dobijeni  broj 

označavamo  sa 

  i  nazivamo  ga  frekvencija  ili  učestalost  pojavljivanja  vrednost 

Х

  u  uzorku.  Slično 

postupam o  i  pri  dobijanju  brojeva  /

2

, /

3

, . . . ,  

f s■

  Veličine 

f

 , /

2

, . . . ,  

f s

  zadovoljavaju  uslov

/1

  +  

/2

  +   •  •  •  +  

.fs  —   п

i  nazivaju se  frekvencijama  ili učestalostima.  Realizovane  vrednosti obeležja 

X

  i  odgovarajuće  frekvencije 

f

0

r

1

niraju  statističku  tabelu

, x s.

  Pri  izvršenom  merenju  na  uzorku

(1.1)

X

U

X 1

/ l

Z

2

/2

Xs

f s

Tabela  I

P r i m e r   1.4 

Ispitivanjem je  obuhvaćeno  50 bračnih parova ko ji su u  braku izm eđu  5 i 10 godina i zabeležen

 

je   broj  dece  u  braku.  Dobijeni  su  podaci:

L 2., 3,2,1,2,2,0,3,2,1,1,3,2,2,0, Jh, 1,1,2,2, 2,2,1,0,

3,1,1,1,1,2,3,2,0,2,2,4,2,2,1,1,0,3,2,1,1,2,2,2,1.

Ako  pogledamo  prethodni  niz  brojeva  teSko  je   uočiti  koji  broj  dece je  dominantan,  da  Ii  ima  više  brakova

 

sa jednim   deteom  ili  dvoje  dece  i  sliCno.  Iz  tih  razloga  grupisaćemo  podatke.  U  ovom  slučaju posmatrano

 

obeležje  X   je  broj  dece,  a  njegove  realizovane  vrednosti  su

  0 ,1 ,2 ,3  

i

  4. 

Prvo  ćemo  izvršiti  prebrajanje,

 

odnosno  određivanje frekvencija  za  svaku  realizovanu  vrednost:

O:+Hf 

1 : » Ш Н  

2 : « Ш

Ш

 

3:||||| 

4:||

Sada  pristupamo  form iranju  statističke  tabele

broj dece  u  braku  (x{)

 

_

broj  brakova  {fi)

5

1

16

2

21

3

6

__________

4

__________ ________

2

_______

1.2.  G R U P ISA N JE  I SR E Đ IV A N JE  P O D A T A K A

5

Tabela:  Broj  dece  u  brakovima

Ukoliko  je  broi  realizovanih  vrednosti  obeležja 

X

  velik  ta d a   se  podaci  grupišu  u  intervale  iIi  klase. 

Ako  sa 

х т{п

  označimo  najm anju  vrednost  u  uzorku,  a  sa 

Xmax

  najveću  vrednost  u  uzorku  veličina

^  — ^m ai 

%min

se  naziva  r a n g   posm atranog  uzorka.  Neka je  

s

  broj  inrvala  u  koje  želimo  d a  grupišemo  podatke.  Tada 

je  r/ssidužina  jednog  intervala.  Nekada  se,  iz  praktičnih  razloga,  može  umesto  ranga 

r

  koristiti  neki  broj 

r'

  >  гДако  da  broj 

r '/ s

  bude jednostavniji  za  primenu.  Sada  određujem o  disjunktne  intervale  [m

1

,m

2

], 

(m

2

,m

3

j,  . .. .   (m.s.m s+i]  tako  da  je  TO1  <   x m{„  i 

77¾+1

  >  

Xmax.

  Kako  je  intervale  nemoguće  sabirati 

i  rnnožiti  u  daljoj  analizi  se  interval  i,-  =   (

777

^ ,

777

;+ ^  zam enjuje  svojom   sredinom.  Iz  tog  razloga  se  u 

statističku  tabelu  pored  kolene  u  kojoj  se  nalzai  interval  uvodi  i  kolona  koja  sadrži  sredinu  intervala 

Xi  =

  mj^ nifl  ■

  Prem a  tome,  na  ovaj  način  dobijam o  statističku  tabelu  oblika

klase  (ii)

sredina  klase  (z;)

frekvencija  (/;)

[TOilTO2I

X1  =  2^pi*

/1

(m2,m3]

X2  =  lli^

/2

[

772

.;, 

TTls

 

4-1 ]

  _ 

m,+m

,+ 1

_^J_=__'2_1 1 ._

fs

Tabela  2

Uvođeajem  kolone  "sredina  intervala"  tabele  1  i  2  možemo  istovetno  tre tira ti  u  daljim   statističkim  

ispitivanjirna.

P r i m e r   1.5 

Izm tre n a je   visina  80  učenika  prvog  razreda.  Dobijeni  su  sledeći  podaci:

120

132

131

136

128

135

129

127

120

129

ЦО

138

132

ЦО

132

131

138

137

125

125

130

133

135

124

137

136

140

141

132

121

132

138

126

129

141

121

138

119

125

139

129

139

135

136

119

123

124

129

135

132

131

132

124

137

123

125

129

131

132

139

123

134

132

126

132

129

137

132

133

135

139

121

127

134

132

129

135

132

137

127

U  datom  prim eru  velik je   broj  realizacija  obeležja  X ,  naim e  X   u  datom   uzorku  uzim a  21  različitu

 

vrednosti.  Ukoliko  podatke  ne  grupišemo  u  klase  dobi6emo  da  su  odgovarajuće  frekvencije  veoma  male.

 

Taj  nedostatak  sprečava  dalja  statistička  ispitivanje.  Iz  tog  razloga  dobijene  podatke  grupisaćemo  u  klase.

 

Pri  odredivanjiL  broja  klasa  treba  voditi  računa  da  u  svakoj  klasi  bude  bar  5  realizacija.  Za  posmatrani

 

prim er mžemo  uzeti 1

  =   6. 

Kako je x min  —

  119, 

a Xmax

  =   141 

to je   rang jednak  1^1-119-22 pa je   dužina

 

klase

  22/6  =  3.66 

cm.  Dobijeni  broj nije  pogodan  za  izraćunavanje  pa  biramo  da  dužina  intervala  bude  Jt

 

cm.  Konačno  možemo  form irati  statističku  tabelu

background image

1.2.  G RU P lSAN JE  1 S R E Đ IV A N J E   P O D A T A K A

7

A

is--

13—

1 2

------------------------------------- ---------------- 1------------------------------------------------------------- т~

118 

122 

126 

130 

134 

138 

142

Poligon  frekvencija 

Histogram  frekvencija

Cesto  se  iz  poligona  frekvencije  ili  iz  histogram a  frekvencije  ne  dobije  slika  o  celoj  populacije,  Zato  se 

uvodimo  ројаш  relativne  frekvencije,  kao  i  odgovarajuće  poligone  i  histograrne.

Veličiuu  г /,  definisanu  izrazom

r f i   =   — , 

i = l , . . . , s ,

 

( 1 . 2 )

n

gde  je 

fi

  frekvencija,  a 

n

  obim a  uzorka,  nazivamo  r e la t iv n a   fre k v e n c ija .  Sada  u  statističk u  tabelu 

dodajemo još jednu  kolonu  u  koju  unosimo  odgovarajuće  relativne  frekvencije.

Ukoliko  na  poligonima  i  histogram im a  na у —osu  nanesemo  relativnu  frekvenciju  dobijam o  poligone  i 

hist,ograme  relat.ivnih  frekvencija.

P r im e r   1.8 

Nacrtati  poligon  relativne frekvencije  za prim er  1-4  i poligon  i  histogra  za  prim er  1.5.

Prvo  ćemo'  odrediti  relativne frekvencije  za  date  primere.  Na  taj  način  dobijamo  nove  statisii6ke  tabele

broj  dece  u  braku  (xi)

broj  brakova  (fi)

rel.  frek.  (rfj)

_

5

0.1

1

16

0.32

2

21

O.42

3

6

0.12

__________

4

__________ ________

2

________

O.O4

Tabela:  Broj  dece  u  brakovima

v is m a  

[cm]

s r e d in a   in t e r v a l a

broj  u č e n ik a  

(fi)

rel.  fr e k .  ( r f i )

(118,122]

120

7

7_

  _

80

0.0875

(122,126]

i 24

12

i l  

8 0   "

=  0.15

(126,130]

128

13

M  — 

80  —

0.1625

(130,134]

132

21

21  _. 

80

0.2625

(134,138]

136

18

Ш  -

 

8 0   ~~

0.225

(138,142]

i 40

9

J L   _  

80  ~

0.1125

Želiš da pročitaš svih 30 strana?

Prijavi se i preuzmi ceo dokument.

Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.

Slični dokumenti