AOR-zadaci sa resenjima Pregled

ELEKTRONSKI FAKULTET U NIŠU

Predmet: ARHITEKTURE RAČUNARA

Katedra za računarstvo

ZADACI SA REŠENJIMA

Zadatak AOR 1.

Vaša kompanija koristi benčmark program koji se smatra reprezentativnim za vaše

tipične aplikacije. Jedan od starijih modela računara nema jedinicu za aritmetiku sa pokretnom zapetom i
mora emulirati svaku instrukciju sa pokretnom zapetom nizom celobrojnih instrukcija. Stari model
računara je pri izvršenju benčmark programa procenjem na 120 MIPS-a. Nezavisni isporučilac opreme
nudi numerički koprocesor koji bi ovom računaru mogao produžiti život. Ovaj numerički koprocesor
izvršava instrukcije sa pokretnom zapetom, tako da emulacija nije potrebna. Pri izvršenju benčmark
programa računar sa pridruženim numeričkim koprocesorom procenjuje se na 80 MIPS-a. Koristiti
sledeće oznake za odgovore na pitanja a. do e.
I - broj celobrojnih instrukcija izvršenih u benmark programu,
F - broj instrukcija sa pokretnom zapetom izvršenih u benmark programu,
Y - broj celobrojnih instrukcija izvršenih radi emulacije jedne instrukcije sa pokretnom zapetom,
W - vreme za izvršenje benmark programa na računaru bez koprocesora,
B - vreme za izvršenje benmark programa na računaru sa numeričkim koprocesorom.
a.

Izvesti izraze za procenu MIPS-ova za obe konfiguracije koristeći date oznake.

Za konfiguraciju bez koprocesora izmereno je F=8*10

, Y=50 i W=4s. Naći I.

Kolika je vrednost B?

Koliki je iznos MFLOPS-a sistema sa koprocesorom?

Vaš kolega želi da kupi numerički koprocesor čak iako je procenjena MIPS vrednost za

konfiguraciju sa koprocesorom manja nego bez njega. Da li je procena vašeg kolege dobra? Obrazložite
svoj odgovor.

Rešenje:

MIPS

=120, MIPS

=80, F=8



, Y=50, W=4s.

a. MIPS

= (I+F



Y)/(W



) ; MIPS

= (I+F)/(B



)

b. Iz (I+F



Y)/(W



) =120,

I = 120







Y = 120







50 = 80



c. Iz (I+F)/(B



) = 80 je

B = (I+F)/(80



) = (80 + 8)



/(80



) = 1,1 sec.

d. MFLOPS = F/ (T

FPOP



) , gde je T

FPOP

vreme potrebno za izvršenje F operacija sa pokretnom

zapetom. Vreme T

FPOP

možemo naći ako od vremena B oduzemo vreme T

potrebno za izvršenje I

integer instrukcija. To vreme možemo dobiti iz

= I/ (MIPS



) = 80



/ (120



) = 2/3 = 0,67 sec.

FPOP

= B



= 1,1



0.67 = 0,43 sec.

MFLOPS = F/ (T

FPOP



) = 8



/(0,43



) = 18,6

Procena kolege je dobra jer računar sa numeričkim koprocesorom izvršava programe za kraće
vreme nego računar bez numeričkog koprocesora.

Zadatak AOR 2.

Za novu arhitekturu računara predložena su dva poboljšanja koja daju povećanja

brzine PB1 = 20 i PB2 = 10. Ova poboljšanja odnose se na delove koji se pri radu računara ne preklapaju.
a) Izvesti izraz za Amdahl-ov zakon koji definiše ukupno poboljšanje za dati slučaj, tj. u situaciji kad

postoje dva poboljšana dela. Korišćenjem ovog izraza rešiti delove zadatka pod b i c.

b) Ako su poboljšanja 1 i 2 primenljiva svako u po 30% vremena rada, izračunati njihov uticaj na ukupno

povećanje brzine?

c) Neka je poboljšanje 1 primenljivo na 40% vremena rada. Na koji deo vremena rada treba primeniti i

poboljšanje 2, da bi uz istovremenu primenu oba poboljšanja ukupno povećanje brzine bilo 4?

Rešenje:

=20, PB

=10,

a) T

= T

[(1- PD

- PD

)+ PD

/ PB

+ PD

/ PB

]

= T

/ T

= 1/[(1- PD

- PD

)+ PD

/ PB

+ PD

/ PB

]

b) Za PD

= PD

= 0,3

= 1/[(1- 0,3- 0,3)+ 0,3/ 20+ 0,3/ 10] = 2,247

c) Za PD

= 0,4 PB

= 4 PD

= ?

1- PD

- PD

+ PD

/ PB

+ PD

/ PB

= 1/ PB

(1-1/ PB

) = 1- PD

+ PD

/ PB

- 1/ PB

= [1- PD

+ PD

/ PB

- 1/ PB

]/ (1-1/ PB

) = 0,411= 41,1%

Zadatak AOR 3.

Razmotriti 2 različite implementacije

procesora, P1 i P2, istog skupa instrukcija, u kome
postoje 4 klase instrukcija (A, B, C i D). U tablici je
prikazano koliko ciklusa traje svaka od klasa za oba
procesora. Procesor P1 radi na učestanosti od 2 GHz, dok
procesor P2 radi na učestanosti od 3 GHz. Kolike su
maksimalne vrednost MIPS-eva za P1 i P2? Ako su
instrukcije u nekom benchmark programu podjednako
raspoređene po klasama, koji procesor brže izvršava dati program? Kolike su vrednosti MIPS-
eva u ovom slučaju? Ako se pomenuti benchmark program smatra reprezentativnim za programe
koje ćete koristiti, za koji biste se procesor odlučili? Zašto?

Rešenje:

P1: f

= 2 GHz , P2: f

= 3 GHz

MIPS= N/(T·10

) = N/(N·CPI·T

·10

) = f

/(CPI·10

)

Maksimalne vrednosti MIPS-eva dobijaju se ako se uzmu programi koji sadrže samo instrukcije
sa najmanjom vrednošću CPI-a:
MIPS

1max

= f

/(CPI

·10

) = 2·10

/(1·10

) = 2·10

[miliona instr./sec]

MIPS

2max

= f

/(CPI

·10

) = 3·10

/(2·10

) = 1,5·10

[miliona instr./sec]

Kada su instrukcije u nekom benchmark programu podjednako raspoređene po klasama:
CPI

1sr

= (CPI

+ CPI

)/4 = (1+2+3+4)/4 = 2,5

CPI

2sr

= (CPI

+ CPI

)/4 = (2+2+4+4)/4 = 3,0

MIPS

1sr

= f

/(CPI

1sr

·10

) = 2·10

/(2,5·10

) = 0,8·10

[miliona instr./sec]

MIPS

2sr

= f

/(CPI

2sr

·10

) = 3·10

/(3,0·10

) = 1,0·10

[miliona instr./sec]

Odlučili bi se za procesor P2 jer on brže izvršava programe ovog tipa.

Zadatak AOR 4.

Program P izvršava se na računaru M, koji radi na 1 GHz, za 10 sec. Izvršena

je optimizacija programa P tako što je svaka instrukcija množenja neke vrednosti X sa 4 (MUL
X,X,4) zamenjena sa dve instrukcije sabiranja te iste vrednosti (ADD X,X,X ; ADD X,X,X).
Nazovimo ovaj optimizovani program P’. CPI za instrukciju množenja je 4, a za instrukciju
sabiranja je 1. Sa ovom optimizacijom, program P’ se na računaru M izvršava za 9 sec. Koliko
instrukcija množenja je u programu P zamenjeno parovima instrukcija sabiranja u programu P’ ?

Rešenje

Za program P imamo T

= 10 s, f

=1 GHz, CPI

MUL

= 4 TC.

Za program P’ imamo
T

P’

= 9 s, MUL X,X,4



ADD X,X,X; ADD X,X,X; CPI

ADD

= 1 TC.

U programu P možemo izdvojiti operacije množenja sa množiocem 4, kojih ima k, i ostale
operacije sa vremenom izvršenja T

ost

= T

ost

+ k



CPI

MUL



= 10 s

= T

ost

+ k



CPI

ADD



= 9 s



T = T

-T

= k



(CPI

MUL

-2



CPI

ADD

)



odakle je

k =



T /



(CPI

MUL

-2



CPI

ADD

)









/( CPI

MUL

-2



CPI

ADD

)

k = 1



/(4-2



1) =10



/2 = 5



operacija množenja.

Klasa

instrukcija

Ciklusa

za P1

Ciklusa

za P2

c. LDI R5, #0

Pon LW R6, (R3+R5)
ADD R6,R6,R2
SW R6, (R4+R5)
ADDI R5,R5, #4
DEC R1
BNEZ R1, Pon

d. Neka u ovom delu zadatka umesto računara sa Load/Store arhitekturom imamo računar

sa registarsko+memorijkom arhitekturom. Neka se adrese komponenata vektora B i A
čuvaju u memorijskim lokacijama sa adresama PB i PA respektivno. Aritmetičko-logičke
instrukcije dopuštaju da izvorišni i odredišni operandi budu u memoriji.

LDI R1, #100
LW R2, (C)
MOV (PB), #VB

M[PB]



adresa VB

MOV (PA), #VA

M[PA]



adresa VA

Pon ADD @(PA),@(PB),R2

M[M[PA]]



M[M[PB]] + R2

INC (PB), 4

M[PB]



M[PB] + 4

INC (PA), 4

M[PA]



M[PA] + 4

DEC R1
BNEZ R1, Pon

Zadatak AOR 7.

Dat je zapis sa sledećim elementima:

short (*0x 2122 polureč*);

array [1..7 ] of char (*ABCDEFG

bajt*);

doubleint (*0x 4142434445464748

dvostruka reč*);

array [1..3 ] of char (*AKS

bajt*);

integer (*0x 11121314 reč*);

Prikazati smeštanje ovog zapisa u memoriji počev od adrese 0x00 u mašinama sa adresiranjem repa i
adresiranjem glave. Memorijske lokacije su dužine 8 B (dvostruka reč). Pristupi memoriji su poravnati.
Navesti podatke koji se dobijaju pri obraćanju podacima dužine jednog bajta sa adresama 0x03, 0x05,
0x1E i podacima dužine dva bajta (polureči) sa adresama 0x12 i 0x1C pri adresiranju glave i adresiranju
repa.

Rešenje:

Adrese

Podatak(adresiranje repa)

Podatak (adresiranje glave)

0x03

0x05

0x1E

0x12

45 46

43 44

0x1C

13 14

11 12

(adresa)

F E D C B A

21 22

41 42 43 44 45 46 47 48

11 12 13 14

Prikaz za adresiranje repa

(adresa)

21 22 A B C D

41 42 43 44 45 46 47 48

A K S

11 12 13 14

Prikaz za adresiranje glave

Zadatak AOR 8.

Promene stanja bloka upravljanja nekog

digitalnog sistema prikazane su tablicom 1, a aktivirani
upravljački signali (ima ih 8) tablicom 2. S0 je početno, a S6 je
krajnje stanje bloka upravljanja. Ovako opisani blok upravljanja
realizovati elementima
za kašnjenje i
potrebnim logičkim
elementima

Rešenje

Dijagram promene stanja (graf stanja) bloka upravljanja dobija se direktno prema tablici 1. Sekvencijana
mreža bloka upravljanja formira se na osnovu pravila izloženih u odeljku 3.6.2 knjige. Upravljački signali

dobijaju se direktno sa izlaza D flip-flopova koji daju odgovarajuća stanja. Upravljački

signali

koji se aktiviraju iz više stanja, dobijaju se sa izlaza ILI logičkih elemenata čiji su ulazi

izlazi D flip-flopova koji daju odgovarajuća stanja.

Stanje

Aktivirani
upravlj. sign.

, y

Tablica 2

Tablica 1

odgovarajućih upravljačkih signala i taktne cikluse u kojima upravljačke signale treba aktivirati,
tako da oni mogu da realizuju i instrukciju JM (Jump Memory) kojom se skače na instrukciju
određenu sadržajem adresirane memorijske lokacije. Iskoristiti format instrukcije LW, s tim da
se rt polje ne koristi jer se podatkom iz memorije puni PC umesto odredišnog registra.
JM rs, pom sa dejstvom PC



M[R[rs] + zp(pom)]

Rešenje

JM rs, pom sa dejstvom PC ← M[R[rs] + zp(pom)]
Fetch MAR, A ← PC :

(T0) RegSel=100, RegRd, MARWr, Ō/J=0, AWr;

B ← 4 :

(T0) Ē/F=1, BWr;

IR ← M[MAR ] :

(T1) MemRd, IRWr;

PC ← A+B :

(T2) ALUCont=”+”, IzALU, RegSel=100, RegWr;

Dekodirati instrukciju: (T2);

A ← R[rs] :

(T3) RegSel=000, RegRd, Ō/J=0, AWr;

B ← zp(pomer) :

(T4) ExtOp=1, IzPro{, Ē/F=0, BWr;

MAR ← A+B :

(T5) ALUCont=”+”, IzALU, MARWr;

PC ← M[MAR ] :

(T6) MemRd, RegSel=100, RegWr;

go to Fetch:

(T6) ASM=ap(Fetch);

Zadatak AOR 10.

Kombinaciona logika prikazana na slici sastoji se od šest blokova

kombinacionih mreža A, B, C, D, E i F sa vremenima prostiranja signala kroz njih od 80 ps, 30
ps, 60 ps, 50 ps, 70 ps i 10 ps respektivno. Izlazni signali iz poslednjeg bloka F upisuju se u
registar sa vremenom prostiranja 20 ps. Možemo projektovati protočnu verziju ove mreže
umetanjem protočnih registara sa vremenom prostiranja 20 ps između parova ovih blokova, čime
ovih šest blokova delimo u stepene.

a) Između kojih blokova treba umetnuti jedan protočni registar da formiramo protočnu

verziju mreže sa dva stepena koja će imati maksimalnu propusnost za toliki broj stepena?
Kolika će biti latencija i propusnost takve mreže?

b) Između kojih blokova treba umetnuti dva protočna registra da formiramo protočnu

verziju mreže sa tri stepena koja će imati maksimalnu propusnost za toliki broj stepena?
Kolika će biti latencija i propusnost takve mreže?

c) Između kojih blokova treba umetnuti tri protočna registra da formiramo protočnu verziju

mreže sa četiri stepena koja će imati maksimalnu propusnost za toliki broj stepena?
Kolika će biti latencija i propusnost takve mreže?





  



A L U

Polje