Jednostavna regresija
Školska 2018./2019. godina
Završni rad
JEDNOSTAVNA REGRESIJA
Mentor:
Učenik:
Mostar, ožujak 2019.
2
Sadržaj
Uvod...............................................................................................3
1. Korelacijska analiza..................................................................................4
1.1 Testiranje hipoteza o korelaciji............................................................5
2. Linearni regresijski model.........................................................................5
2.1 Povijest regresije.................................................................................6
2.2Jednostavna linearna regresija..................................................................6
3. Metoda najmanjih kvadrata.......................................................................9
4. Snaga tumačenja linearne regresijske jednadžbe………………………10
4.1 Koeficijent determinacije, R
2
............................................................12
4.2 Korelacija i R
2
………………………………………………………13
4.3 Procjena varijance pogreške modela………………………………..13
5. Zaključak.................................................................................................14
6. Literatura ................................................................................................15

4
1. Korelacijska analiza
Ovdje ćemo koeficijente korelacije koristiti za proučavanje odnosa između varijabli.
Izvesti ćemo dvije procedure koje koeficijent korelacije koriste za proučavanje linearnih
odnosa između varijabli.
Iako postoji neograničen broj načina na koje par slučajnih varijabli može biti u
međusobnom odnosu, mi ćemo u našoj analizi postulirati neki funkcionalni oblik tog
odnosa. Obično je razumna pretpostavka da je linearni odnos dobra aproksimacija
stvarnog odnosa između varijabli.
U slučaju da razmatramo par linearno povezanih varijabli X i Y dijagram raspršenosti
opažanja parova njihovih vrijednosti će se nakupljati oko ravne linije. U suprotnom, u
slučaju da ne postoji linearni odnos dijagram raspršenosti neće slijediti ravnu liniju. Svi
odnosi koje ćemo uzeti u razmatranje neće biti blisko raspoređeni ravnoj liniji, mnogi
od važnih odnosa će imati dijagrame raspršenosti koji će naginjati linearnom odnosu
međutim imati će zamjetan otklon od ravne linije.
U mnogim praktičkim ekonomskim problemima ono što mi tvrdimo jeste da postoji
nezavisna ili egzogena varijabla X čije su vrijednosti određene aktivnostima izvan
ekonomskog sustava koji modeliramo, te da postoji zavisna ili endogena varijabla Y, a
njene vrijednosti su zavisne od vrijednosti varijable X.
Ako pretpostavimo da su obje varijable istodobno uvjetovane faktorima koji leže izvan
ekonomskog sustava koji se modelira. U tom slučaju model gdje su obje pomenute
varijable slučajne je često realističniji.
U situacijama gdje imamo jednu varijablu logički zavisnu o drugoj, nakon provođenja
korelacijske analize mi možemo koristiti regresijsku analizu da bismo razvili linearni
model procesa.
Upravo o tome govori sljedeći odjeljak u kome razvijamo procedure statističkog
zaključivanja koje za utvrđivanje svog stava korelacije između populacija koristi
korelaciju mežu uzorcima.
5
1.1 Testiranje hipoteza o korelaciji
slika 1.1-koeficijent korelacije uzoraka
Koeficijent korelacije uzoraka je koristan kao opisna mjera snage linearne veze između
uzoraka. Korelaciju također možemo koristiti za testiranje hipoteze o tome da ne postoji
linearni odnos između populacija koje su pripadnice dvaju slučajnih varijabli.
To jeste:
H
0
:ρ=0
Ova specifilčna nulta hipoteza, o tome kako između para slučajnih varijabli ne postoji
linearni odnos, od velike je važnosti u mnoštvu primjena. Ako bismo korelaciju između
uzoraka računali iz podataka izgledno je da će rezultat biti različit od 0, čak i u slučaju
da je korelacija između populacija točno 0.
Ono što mi želimo znati je koliko korelacija između uzoraka mora odstupati od
vrijednosti 0 kako bismo iz toga mogli čvrsto zaključiti da je i korelacija između
pripadajućih populacija također različita od vrijednosti 0.
2. Linearni regresijski model
Kako bismo uistinu razumjeli Jednostavnu regresiju moramo znati šta je regresija, i
kakva je zapravo njena povijest. Regresijska analiza je statistički postupak za procjenu
odnosa među varijablama. Ona uključuje mnoge tehnike za modeliranje i analizu
varijabli, gdje se fokus stavlja na odnosu između zavisne varijable i jedne ili više
nezavisnih varijabli.
Ova analiza često se koristi za predviđanje i prognoziranje. Također koristi se za
razumijevanje odnosa nezavisnih o zavisnim varijablama i istraživanje oblika tih
odnosa. U određenim okolnostima, regresijska analiza se može koristiti za zaključivanje
uzročnih odnosa između nezavisnih i zavisnih varijabli. Međutim to može dovesti do
pogrešnih ili lažnih odnosa iz razloga što korelacija ne podrazumijeva uzročnost tako da
je poželjan oprez.
Razvijene su mnoge tehnike regresijske analize kao što su jednostavna, višestruka,
linearna i nelinearna.
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti