Analiza podataka
27
У в о д
Испитивање структуре скупа, односно појаве у једном одређеном
моменту или временском периоду, назива се статистичка анализа. Величина и
структура скупа мењају се временом. Испитивање промена у једном скупу,
насталих током времена, изводи се динамичком анализом.
Као основа за статистичку анализу служе нумеричке, атрибутивне и
географске серије структуре. Математичка обрада атрибутивних и географских
серија је ограничена, док се нумеричке серије много више обрађују. Због тога се
статистичка анализа најчешће заснива на распоредима фреквенција (нумеричким
серијама) и зато ћемо, промењујући методе статистичке анализе, најчешће
сусретати ове серије.
Од статистичких метода који се могу примењивати у статистичкој
анализи, овде су обрађене средње вредности, мере дисперзије и релативни бројеви.
27
1. Средње вредности
1.1. Појам, значај и врсте средњих вредности
Средња вредност је репрезентативна вредност, која, по датим мерилима,
замењује све вредности обележја у датој серији. У статистичкој литетарури добила
је назив репрезентативна вредност зато што представља и замењује све вредности
серије, јер из њих проистиче и носи њихове заједничке карактеристике. Као
репрезентативни показатељ серије средња вредност карактерише статистички скуп.
Ако се посматра један статистички скуп по једном нумеричком обележју и пође се
од индивидуалних вредности тог обележја, тешко ће се уочити битна и заједничка
карактеристика чак и кад су појединачни подаци, груписањем у серије, сведени на
мањи број. Зато се настоји да се та серија замени једним бројем који омогућава да
се уочи карактеристика посматраног скупа.
Значај средње вредности састоји се у томе што као информација може да
замени низ вредности серије; полазећи од посебних и појединачних одлика појаве,
доводи до опште и заједничке одлике као правилности појаве. Средња вредност на
уопштен и једноставан начин омогућава да се из променљивих вредности
(варијабилности) појаве открије у њима оно што је битно и типично. Она се
употребљава како за сажимање података у скупу, тако и за карактерисање његове
динамике. То је вредност која омогућава упоређење карактеристика разних
скупова. Средња вредност, као синтетички и репрезентативни показатељ, налази
примену у свим областима статистичке анализе.
Да би средња вредност имала значај репрезентативне и типиче вредности,
неопходно је да се одређује из хомогеног статистичког скупа. Под хомогеним
скупом подразумева се скуп истоврсних јединица посматрања. У случају да је скуп
хетероген (састављен од различитих јединица), потребно је најпре извршити
поделу скупа у хомогене делове, а затим ће се посебно одредити средње вредности
за сваки од тих делова. Рачунски и формално могуће је наћи средњу вредност и у
хетерогеном скупу, али таква вредност нема значај статистичке средње вредности
као репрезентативног показатеља. Узмимо, као пример, одређивање просечне плате
у једном предузећу на основу плате директора, производног квалификованог
радника, психолога и спремачице. Рачунски, то је једноставан поступак јер су све
плате у динарима, па их можемо сабрати и поделити са четири. Међутим, шта такав

27
практичном животу често се говори о просечној производњи, просечној заради,
просечној потрошњи млека, просечној тежини и тако даље. Аритметичку средину
добијамо кад збир свих вредности обележја поделимо њиховим бројевима.
Аритметичка средина може се израчунати из груписаних и негруписаних података.
1.2.1. Аритметичка средина из негруписаних података
Кад су подаци негруписани, то јест сваки податак се јавља само једанпут (са
фреквенцијим 1), аритметичка средина се израчунава тако што се збир вредности
обележја подели њиховим бројем. Ако се поједине вредности обележја означе са
x
1
,
x
2
, x
3
,..., x
n
, њихов број са
n
(који представља број јединица посматрања), а
аритметичка средина са x (икс са цртом чита се: иск бар), израчунавање
аритметичке средине из негруписаних података може се изразити следећим
обрасцем:
x = x
1
+x
2
+x
3
+...+x
n
n
или ако збир означимо са ∑ (сигма)
x =
∑x
n
1.2.2 . Аритметичка средина из груписаних података
У статистичким истраживањима често се појављује већи број података и
њихових различитих фреквенција, наиме груписани подаци у виду распореда
фреквенција. У таквим случајевима вредности обележја се најпре множе
одговарајућим фреквенцијама, затим се тако добијени производи саберу и тај збир
се, најзад, подели збиром фреквенција, односно укупним бројем свих јединица
посматрања.
За израчунавање аритметичке средине може се, према томе, написати
следећи образац:
x =
x
1
f
1
+x
2
f
2
+...+x
i
f
i
+...+x
n
f
n
f
1
+f
2
+...+f
i
+...+f
n
27
или, упрошћено:
x =
Σxf
Σf
Ова аритметичка средина добила је назив пондерисана аритметичка
средина према самом поступку израчунавања, који се састоји у пондерисању
вредности датог обележја. Множење појединачних вредности одговарајућим
фреквенцијама (x
1
*f
1
; x
2
*f
2
; и тако даље) назива се пондерисање вредности, што у
ствари значи давање одговарајућег значаја свакој вредности или одмеравање
важности сваке вредности обележја. Мерило значаја, или важности, назива се
пондер, у овом случају то су фреквенције. Уколико нека вредност има већу
фреквенцију, утолико јој је и значај већи, јер јаче утиче на величину аритметичке
средине. Пондерисањем вредности обележја обухватају се све вредности датог
обележја, јер множење појединачних вредности њиховом фреквенцијом
представља узимање те вредности толико пута колико се јавља. Код аритметичке
средине за негруписане податке узимају се све вредности обележја, али
пондерисања нема, зато што се свака вредност једном јавља и према томе све
вредности су подједнако значајне или важне.
У статистичком истраживањима често се оперише са континуираним
вредностима груписаним у виду интервалних серија. Због тога се јавља потреба да
се при израчунавању аритметичке средине води рачуна о томе да су вредности
дате у виду групних интервала. Правило је да се за сваки интервал одреди једна
вредност која ће представљати или замењивати све вредности у оквиру групног
интервала. Обично се узима средина групног интервала, која се одређује као просек
доње и горње границе сваког интервала.
Кад је интервал отворен (на доњој или горњој граници, у нашем примеру
у табели 3 на доњој – до 20), узима се за дужину интервела дужина који имају
остали интервали (у нашем примеру 10). Зато смо код одређивања средине
интервала узели за доњу границу првог (отвореног) интервал 10. Исто би се
поступило да је отворена горња граница последњег интервала.
Интервалне средине представњају вредности обележја (x) у датој серији
и на основу њих и одговарајућих фреквенција израчунава се аритметичка средина
за груписане податке.

27
Геометријска средина је, такође, израчуната средња вредност, али се
разликује од аритметичке средине и по својим карактеристикама и по начину
израчунавања.
Геометријска средина добија се када се из производа појединих
вредности обележја дате серије извади корен чији је изложилац раван броју свих
чланова серије. Геометријска средина је N-ти корен производа свих вредности
негруписаног нумеричког обележја једног низа.
Ако поједине вредности обележја означимо са x
1
,x
2
,...,x
n
, а њихов број
са n, образац за израчунавање геометријске средине биће
Пошто се овде јављају корени са великим изложиоцима, за израчунавање
геометријске средине морају се користити и логаритми, тј. логаритмоваће се најпре
лева а затим и десна страна обрасца:
Користећи
∑
као знак за збир, образац за израчунавање геометријске
средине може се написати у облику:
На овај начин добија се логаритам геометријске средине. Пошто нам
треба геометријска средина, а не њен логаритам, морамо извршити
антилогаритмовање, па ће упрошћен образац за израчунавање геометријске
средине бити:
Њена употреба у статистичким истраживањима је знатно мања.
Геометријска средина се најчешће примењује за истраживање, тј. израчунавање
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti