Regresija i koleracija
VISOKA EKONOMSKA
ŠKOLA PEĆ, LEPOSAVIĆ
SEMINARSKI RAD
Regresija i Koleracija
Smer
: Finansijski menadzment
Predmet:
Poslovna Statistika
Mentor:
Učenik:
prof. mr. Vesna Simović
Nemanja Jovanović
Leposavić, Septembar 2014. god.
Sadržaj:
1. Uvod
...........................................................................................................
3
2. Odnos između varijabli
.............................................................................
4
3. Koeficijent koleracije
..............................................................................
5
3.1. Pearsonov koeficijent korelacije …………………….....5
3
.
2.
Spearmanov koeficijent korelacije ........................6
4. Matrica korelacije
.....................................................................
7
5. Višestruka koleracija
................................................................
8
6. Računanje korelacije ................................................................9
6.1.
Outlieri
..................................................................9
7. Primena koleracije
..................................................................
10
8.
Regresiona Analiza
………………………………………….
11
8.1.
Odnos promenljive (y) prema promenljivoj (x)
......
11
8.2. Regresiona linija
..........................................................
12
8.3. Regresiona konstanta
.................................................
13
8.4
.
Interpolacija
(
određivanje vrednosti Y za bilo koju vrednost X
)
......
14
9. Zaključak
.................................................................................
15
10. Literatura
...............................................................................
16

3.
2. Odnos između varijabli
Međusoban odnos između dve varijable, grafički možemo prikazati
pomoću dvodimenzionalnog grafa, tzv. scatter dijagram (dijagrama
raspršenja). Vrednosti jedne varijable prikazane su na x osi, a
druge na y osi dijagrama. Tačke preseka kreću se oko određenog
pravca koji se naziva linija regresije. Što su tačke bliže pravcu,
korelacija je veća. Što su tačke raspršenije korelacija je manja. U
praksi je vizualno vrlo teško, osim u slučaju savršene korelacije
odrediti stupanj povezanosti između varijabli. Zavisno o
međusobnom odnosu dveju varijabli među kojima postoji
korelacija, ona može biti linearna ili nelinearna. Kod
linearne
korelacije
, tačke su grupirane oko pravca. Kod
nelinearne
korelacije
, tačke su grupisane oko neke druge krivulje.
Dve varijable koje posmatramo sa ciljem utvrđivanja njihove
korelacijske povezanosti mogu biti u 4 različita odnosa:
1. kada mala vrednost jedne varijable odgovara maloj vrednosti
druge varijable, kao i kada velika vrednost jedne varijable
odgovara velikoj vrednosti druge varijable, radi se o
pozitivnoj korelaciji.
2. kada mala vrednost jedne varijable odgovara velikoj
vrednosti druge varijable i obrnuto, radi se o negativnoj
korelaciji.
3. kada vrjednost jedne varijable u nekim intervalima odgovara
maloj vrednosti druge varijable, a u drugim intervalima
velikoj vrednosti, radi se o nemonotonoj korelaciji. Ako se
korelacija više nego jednom menja od pozitivne prema
negativnoj, takva korelacija naziva se ciklička korelacija.
4. kada se na osnovu vrednosti jedne varijable ne može
zaključiti ništa o vrednosti druge varijable, tada korelacija ne
postoji. Tačke u takvom grafitu su raspršene.
4
.
3. Koeficijent koleracije
Koeficijenti
korelacije izražavaju meru povezanosti između
dve varijable u jedinicama nezavisnim i jedinicama mere u
kojima su iskazane vrednosti varijabli. Postoji više
koeficijenata korelacije koji se koriste u različitim
slučajevima. U praksi se prilikom rada s linearnim
modelima najčešće koristi
Pearsonov koeficijent korelacije
(produkt moment koeficijent korelacije). Prilikom rada s
modelima koji nisu linearni najčešće se koristi
Spearmanov
koeficijent korelacije
(produkt rang koeficijent korelacije).
3.1. Pearsonov koeficijent korelacije
Pearsonov koeficijent korelacije koristi se u slučajevima kada
između varijabli posmatranog modela postoji linearna povezanost I
neprekidna normalna distribucija.Vrednost Pearsonovog
koeficijenta korelacije kreće se od +1 (savršena pozitivna
korelacija) do –1 (savršena negativna korelacija). Predznak
koeficijenta nas upućuje na smer korelacije – da li je pozitivna ili
negativna, ali nas ne upućuje na snagu korelacije. Pearsonov
koeficijent korelacije bazira se na usporedbi stvarnog uticaja
posatranih varijabli jedne na drugu u odnosu na maksimalni
mogući utjecaj dviju varijabli. Označava se malim latiničkim
slovom
r
. Za izračun koeficijenta korelacije potrebna su tri različite
sume kvadrata
(SS)
: suma kvadrata varijable
X
, suma kvadrata
varijable
Y
i suma umnožaka varijabli
X
i
Y
.
5.

5.
3.2. Spearmanov koeficijent korelacije
Spearmanov koeficijent korelacije (produkt rang korelacije) koristi
se za merenje povezanosti između varijabli u slučajevima kada nije
moguće primjeniti Pearsonov koeficijent korelacije. Bazira se na
tome da se izmeri doslednost povezanosti između poređanih
varijabli, a oblik povezanosti (npr. linearni oblik koji je preduslov
za korišćenje Pearsonovog koeficijenta) nije bitan. Slučajevi u
kojima se koristi Spearmanov koficijent su npr. kada među
varijablama ne postoji linearna povezanost, a nije moguće
primeniti odgovarajuću transformaciju kojom bi se povezanost
prevela u linearnu (npr. veza između seizmičkog atributa i
bušotinskog podataka u naftnoj geologiji). Spearmanov koeficijent
korelacije kao rezultat daje približnu vrednost koeficijenta
korelacije koji se tretira kao njegova dovoljno dobra
aproksimacija. Prilikom korišćenja Spearmanovog koeficijenta,
vrednosti varijabli potrebno je rangirati i na takav način svesti na
zajedničku meru. Najjednostavniji način rangiranja je da se
najmanjoj vrednosti svake varijable nametne rang 1, sledećoj po
veličini rang 2 i tako sve do poslednje kojoj se prideljuje
maksimalan rang. Izračunavanje koeficijenta radi se korišćenjem
vrednosti prideljenih rangova. Spearmanov koeficijent označava se
sa
r
S
.
Formula za izračun Spearmanovog koeficijenta korelacije je:
gdje je
d
razlika vrednosti rangova dve posmatrane varijable, a
n
je
broj različitih serija.
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti