《嵌入式系統(tǒng)原理與應(yīng)用》-嵌入式課程第2章_第1頁(yè)
《嵌入式系統(tǒng)原理與應(yīng)用》-嵌入式課程第2章_第2頁(yè)
《嵌入式系統(tǒng)原理與應(yīng)用》-嵌入式課程第2章_第3頁(yè)
《嵌入式系統(tǒng)原理與應(yīng)用》-嵌入式課程第2章_第4頁(yè)
《嵌入式系統(tǒng)原理與應(yīng)用》-嵌入式課程第2章_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

01CPU組成02CPU性能量化03流水線技術(shù)05ARM流水線舉例04流水線相關(guān)及解決方案第2章CP

U組成/01CPU

包含控制器和運(yùn)算器控制器是命令發(fā)布的決策機(jī)構(gòu)和源頭,協(xié)調(diào)和指揮

整個(gè)計(jì)算機(jī)系統(tǒng)的操作運(yùn)算器是數(shù)據(jù)處理部件,接受控制器的命令而進(jìn)行

算數(shù)運(yùn)算和邏輯運(yùn)算數(shù)存cache地址數(shù)據(jù)5

7061001077數(shù)據(jù)

地址總線AR

地址寄存器控制信號(hào)時(shí)序發(fā)生器操作控制器CPU的基本結(jié)構(gòu)數(shù)據(jù)總線BUS

指令總線BUSALUR?R?R?R?DR數(shù)據(jù)緩沖

寄存器PSW狀態(tài)寄存器指存

cache地址

OP碼

地址碼101

MOV

R0,R1102

LAD

R1,6103ADD

R1,R2指令地址總線程序計(jì)數(shù)器指令譯碼器IR

OP

地址碼指令寄存器通

器通往I/O接口PCCPU

的主要寄存器●程序計(jì)數(shù)器PC:

指向要執(zhí)行的下一條指令的地址●指令寄存器IR:用來(lái)保存當(dāng)前正在執(zhí)行的指令編碼●數(shù)據(jù)緩沖寄存器DR:

用來(lái)暫時(shí)存放數(shù)據(jù)●數(shù)據(jù)地址寄存器AR:

用來(lái)保存當(dāng)前CPU

所訪問的數(shù)據(jù)存儲(chǔ)器單元的地址●通用寄存器GR:

暫存運(yùn)算器需要的源操作數(shù)和結(jié)果操作數(shù)●狀態(tài)字寄存器PSW:

用來(lái)保存處理器的運(yùn)行狀態(tài)CPU

的基本功能●指令控制:指令控制是指指令執(zhí)行的次序●操作控制:指令執(zhí)行時(shí)確保執(zhí)行部件按照指令的要求完成指令執(zhí)行?!駮r(shí)間控制:指令執(zhí)行時(shí)確保指令各個(gè)操作及整個(gè)執(zhí)行過程在規(guī)定時(shí)限內(nèi)完

?!?/p>

數(shù)據(jù)處理:

CPU

完成數(shù)據(jù)的算術(shù)或邏輯運(yùn)算,有時(shí)也稱為數(shù)據(jù)加工。CPU性能量化/02CPU

性能公式CPU時(shí)間=程序的CPU時(shí)鐘周期數(shù)×?xí)r鐘周期=CPU時(shí)間=IC×CPI×CCT時(shí)鐘周期時(shí)間(Clock

Cycle

Time,CCT)程序執(zhí)行所需要的指令數(shù)(Instruction

Count,IC)程序的CPU

時(shí)鐘周期數(shù)時(shí)鐘頻率每條指令執(zhí)行需要的時(shí)鐘周期數(shù)(CPI,Cycles

Per

Instruction)CPU

性能公式【例2-1】比較下面兩種CPU

執(zhí)行某程序的性能優(yōu)劣。假設(shè)CPU

1執(zhí)行該程序需要5百萬(wàn)條指令,指令的平均CPI為1.2,時(shí)鐘頻率為1GHz;CPU2執(zhí)行該程序需要3百萬(wàn)條指令,指令的平均CPI

為3.0,時(shí)鐘頻率為0.5

GHz。根據(jù)CPU性能公式2-1,可以知道兩種CPU的程序執(zhí)行時(shí)間如下:CPU

1的時(shí)間T1=5×106×1.2×10-9=6

ms;CPU

2的時(shí)間T2=3×106×3.0×2×10-9=18ms;因?yàn)門2>T1,

故CPU1的性能更好。CPU

性能公式【例2-2】比較下面兩種浮動(dòng)指令優(yōu)化方案的性能優(yōu)劣。假設(shè)某CPU

的浮點(diǎn)指令的使用頻率為0.2,浮點(diǎn)指令的平均CPI為10;其它指令的使用頻率為0.8,其它指令的平均CPI

為1.2。方案1:把所有浮點(diǎn)指令的平均CPI

降到8;方案2:把浮點(diǎn)指令FSQRT

的CPI

降到2,其中FSQRT

占浮點(diǎn)指

令使用頻率的0.2。CPU

性能公式在知道每類指令的使用頻率和CPI后,式2-1可以改寫為:CPU時(shí)間=根據(jù)題意,兩種方案在改進(jìn)過程中,指令集未發(fā)生變化,則完成任務(wù)所需要的指令數(shù)IC不會(huì)發(fā)生變化;同時(shí),也沒有提到時(shí)鐘頻率發(fā)生變化,即CCT

也不會(huì)

變化。因此,根據(jù)CPU

性能公式2-2,可以計(jì)算兩種改進(jìn)方案的CPU

時(shí)間,如下:方案1的時(shí)間T1=(0.2×1C×8+0.8×1C×1.2)×CCT=11.2×IC×CCT;方案2的時(shí)間T2=(0.2×0.2×IC×2+0.8×0.2×IC×10+0.8×IC×1.2)×CCT=11.28×IC×CCT。因

為T2>T1,

故方案1的性能更好。CPU

性能公式的暗示CCT

主要取決于芯片加工工藝及CPU

硬件結(jié)構(gòu),CPI主要取決于CPU硬件結(jié)構(gòu)及指令集架構(gòu)(ISA),IC

則主要取決于ISA

和編譯技術(shù)【例2-3】比較表2-1所示的基于RISC和CISC的CPU性能優(yōu)劣。表2-1

RISC

和CISC

的運(yùn)算速度C

P

U

型指令數(shù)IC平均CPI時(shí)

C

C

TCISC12~155~33

nsRISC1.3~1.41.1~1.42~10

nsCPU

性能公式的暗示取表2-1數(shù)據(jù)的均值,根據(jù)公式2-1,可以計(jì)算得到RISC

和CISC

CPU

性能如下(設(shè)完成相同任務(wù)需要CISC

CPU需要的指令數(shù)為IC):CISC的CPU性能=IC×8.5×19=161.5×IC

nsRISC的CPU性能=1.35×IC×1.25*6=10.125×IC

nsRISC相對(duì)CISC的性能加速比=161.5×1C/(10.125×1C)≈16倍??梢姡琑ISCCPU的性能遠(yuǎn)高于CISCCPU的性能。實(shí)際上,由表2-1數(shù)據(jù)可以看出,完成相同的任務(wù),CISC

需要的IC少于RISC,

這是CISC的優(yōu)勢(shì),但在CPI和CCT上,CISC都處于劣勢(shì)。尤其是平均CPI,如果都

取均值,CISC的CPI為8.5,RISC的CPI為1.25,RISC領(lǐng)先6.8倍。流水線技術(shù)103流水線概念【例2-4】假設(shè)某產(chǎn)品的生產(chǎn)需要4道工序,該產(chǎn)品生產(chǎn)車間以前只有1個(gè)工人,只有1套生產(chǎn)該產(chǎn)品的機(jī)器。該工人工作8小時(shí),可以生產(chǎn)120件產(chǎn)

品(即每4分鐘生產(chǎn)1件)。現(xiàn)車間主任希望將該產(chǎn)品的日產(chǎn)量提高到480

件,那么他如何能夠?qū)崿F(xiàn)其目標(biāo)呢?方案一:再聘請(qǐng)3名工人,同時(shí)再購(gòu)買3套生產(chǎn)該產(chǎn)品的機(jī)器。讓4名工人同時(shí)工作8小時(shí),可以達(dá)到期望的日產(chǎn)量目標(biāo)。可以看到,這種方

案簡(jiǎn)單直接,但需要付出購(gòu)買3套機(jī)器和聘請(qǐng)3名工人的成本。流水線概念工序1工序2工序3

工序4成品方案二:產(chǎn)品生產(chǎn)采用流水線生產(chǎn)方式,將原來(lái)的機(jī)器按照4道工序重新進(jìn)行改造組合,將4道生產(chǎn)工序分離開來(lái),使得每道工序的生產(chǎn)時(shí)間一樣,均為1分鐘。同時(shí)車間再聘請(qǐng)3名工人,讓每個(gè)工人負(fù)責(zé)該產(chǎn)品生產(chǎn)的一道工序,

每完成一道工序,就將半成品傳給下一道工序的工人,直至生產(chǎn)出完整的產(chǎn)品。采用此種方案后,在不需要購(gòu)買新設(shè)備,僅聘請(qǐng)3名工人,也能達(dá)到將日產(chǎn)量提高到480件的目標(biāo)。流水線概念【例2-5】假設(shè)指令流水執(zhí)行時(shí)需要3個(gè)階段,第1個(gè)階段是取指令I(lǐng)F,第2個(gè)階段是解析指令I(lǐng)D,第3階段是執(zhí)行指令EX,

這三個(gè)階段分別需要的時(shí)間是

t1,t2和t3秒;如果不采用流水,則需要的時(shí)間是t1+t2+t3秒。求采用流水線

技術(shù)和不采用流水線技術(shù)的指令吞吐率。方案1:不采用流水。由于每執(zhí)行一條指令需要t1+t2+t3秒,則指令吞吐率為1/(t1+t2+t3)。方案2:流水執(zhí)行。完成快的部件必須等完成慢的部件,因此,時(shí)鐘周期應(yīng)該為t1,t2

和t3中最大的一個(gè),則指令

吞吐率為1/max(t1,t2,t3)??紤]一種理想情況,這三個(gè)時(shí)間相等,此時(shí)的吞吐率為3/(t1+t2+t3),為方案1的3倍。功能部件第1個(gè)時(shí)鐘周期第2個(gè)時(shí)鐘周期第3個(gè)時(shí)鐘周期第4個(gè)時(shí)鐘周期流水線概念I(lǐng)Dl1l2i?EXl1i?IFi?i?l3i4流水線分類1、單功能流水線和多功能流水線A

BA

B

A

B輸入輸入

輸入2

求階差

求階差

求階差3

對(duì)階對(duì)階對(duì)階4

尾數(shù)加

尾數(shù)加

尾數(shù)加5

規(guī)格化

規(guī)格化

規(guī)格化6

尾數(shù)乘

尾數(shù)乘

尾數(shù)乘7

累加

累加

累加8

輸出

輸出

輸出(a)分段

(b)浮點(diǎn)加法

(c)定點(diǎn)加法空間浮點(diǎn)加法2

3..二二

三1

2

3

..

n2

3n1

2

31

3

n工

2

3

n空間定點(diǎn)乘法

四二

五三

六2

3

..3nn四五

七→流水線分類2、靜態(tài)流水線和動(dòng)態(tài)流水線輸出累加尾數(shù)乘

規(guī)格化

尾數(shù)加

對(duì)階

求階差

輸入輸出

累加

尾數(shù)乘

規(guī)格化

尾數(shù)加

對(duì)階

求階差

輸入(a)

靜態(tài)流水線時(shí)空?qǐng)D

時(shí)

/

△t浮點(diǎn)加法工

2

3(b)

動(dòng)態(tài)流水線時(shí)空?qǐng)D定點(diǎn)乘法二

四時(shí)

/

△t工23123工2三二二工nn.流水線性能分析1.吞吐率吞吐率是衡量流水線性能的重要指標(biāo),它是指單位時(shí)間內(nèi)流水線所完成的任務(wù)數(shù),即流水線單位時(shí)間內(nèi)能輸出的結(jié)果。式

,n表示任務(wù)數(shù),Tp

表示流水執(zhí)行n個(gè)任務(wù)所用的時(shí)間。當(dāng)流水線在連續(xù)流動(dòng)達(dá)到穩(wěn)定以后所得到的吞吐率稱為最大吞吐率。假設(shè)流水線各功能段執(zhí)行時(shí)間△都相等,總共有k個(gè)功能段(這里取k=4)T,=k×△t+(n-1)×△t=(k+n-1)△t4.

nn空間工k△tTk流水線性能分析1234234(n-1)△t..n時(shí)

間233412n流水線性能分析輸入一

S?S?S?S?輸出(a)

流水線空間如圖(a)

所示的4段流水線中,△t?=3△t?=3△t?=3△t?=3△t

其時(shí)空?qǐng)D如圖(b)

所示。2233(b)

時(shí)空?qǐng)Dn...n時(shí)間33nn112211S?S?S?S?流水線性能分析如圖(a)所示的4段流水線中,△t?=3△t?=3△t?=3△t?=3△t

其時(shí)空?qǐng)D如圖(b)

所示。流水線性能分析從式中可以看出,最大吞吐率與實(shí)際吞吐率是由執(zhí)行時(shí)間最長(zhǎng)的那個(gè)流水決定。因此,最長(zhǎng)流水段就成了整個(gè)流水線的瓶頸。圖中除了流水線中的瓶頸功能段

一直處于忙碌狀態(tài)外,其他功能段有2/3的時(shí)間是空閑的,造成資源浪費(fèi)。(1)將瓶頸功能段繼續(xù)細(xì)分輸入

S1

S2-1S2-2

S2-3

S3S4輸出(a)瓶頸段細(xì)分方法S4

1

2

3

4

5

6

7

8

9S3

3

4

5

6

7

8

9S2-3

3

6

9S2-22

5

8S2-1

1

4

7S12

3

4

5

6

7

8

9

時(shí)間/△t3

9

10

11

12

13

14(c)瓶頸段重復(fù)設(shè)置時(shí)空?qǐng)DS2-1S2-2S3S4S2-3(b)

瓶頸段重復(fù)設(shè)置方法流水線性能分析(2)將瓶頸功能段資源重復(fù)輸入

S1空間輸出流水線性能分析2.加速比流水線的加速比是指完成一批任務(wù),不使用流水線所用的時(shí)間與使用流水線的時(shí)間之比。若不使用流水線,即順序執(zhí)行所用的時(shí)間為Ts,

使用流水線的

執(zhí)行時(shí)間為Tp,則流水線的加速比為:流水線性能分析如果流水線各段執(zhí)行時(shí)間都相等,則一條k

段流水線,連續(xù)完成n個(gè)任務(wù)所需的時(shí)間為T=(k+n-1)×△t當(dāng)n>>k時(shí),,即當(dāng)流水線的各功能段時(shí)間相等時(shí),其最大加速比等于流水線的段數(shù)。等效的非流水線上所需的時(shí)間為流水線性能分析3.效率流水線效率是指流水線的各功能段部件的利用率。如果各段執(zhí)行時(shí)間相等,則流水線性能分析【例2-6】一個(gè)單功能流水線,每段執(zhí)行時(shí)間都相等為△t,輸入任務(wù)不連續(xù)的情況下,計(jì)算一條4段浮點(diǎn)加法器求8個(gè)浮點(diǎn)數(shù)和率、加速比和效率。解:改寫式子為:sum=[(A?+A?)+(A?+A?)]+[(A?+A?)+(A?+A?)]的流水線的吞吐1234567123456712345671234567流水線性能分析空間S4S3S2S1時(shí)間/△t101112141513489657231流水線相關(guān)及解決方案/04流水線相關(guān)及解決方案◆結(jié)構(gòu)相關(guān)當(dāng)硬件資源滿足不了同時(shí)重疊執(zhí)行的指令的要求,而發(fā)生資源沖突時(shí),就發(fā)生了結(jié)構(gòu)相關(guān)?!魯?shù)據(jù)相關(guān)當(dāng)一條指令需要用到前面某條指令的結(jié)果,從而不能重疊執(zhí)行時(shí),就發(fā)生了數(shù)據(jù)相關(guān)?!艨刂葡嚓P(guān)當(dāng)流水線遇到分支指令和其他能夠改變PC

值的指令時(shí),就會(huì)發(fā)生控制相關(guān)。結(jié)構(gòu)相關(guān)采用5級(jí)指令流水線,IM、Reg、ALU

和DM

分別表示流水段中的功能部件

取指階段IF(Instruction

Fetch),此階段訪問IM,

讀取存儲(chǔ)在IM

中的指令;

譯碼階段ID(Instruction

Decode),此階段對(duì)取得的指令進(jìn)行譯碼,并根據(jù)

譯碼結(jié)果讀取Reg

數(shù)據(jù);

執(zhí)行階段EX(Execute),此階段利用ALU

執(zhí)行指令或計(jì)算地址;

訪存階段MEM(Memory),

此階段訪問DM,讀取存儲(chǔ)在DM

中的數(shù)據(jù)或?qū)?/p>

數(shù)據(jù)寫入到DM

;

寫回階段WB(Write

Back),此階段將將計(jì)算結(jié)果寫回Reg。時(shí)間(時(shí)鐘周期)

CC1

CC2CC3CC4CC5CC6CC7CC8CC9

CC10Load

IM

Reg同DMReg指令1IMRegDMReg指令2IMRegDMReg指令3IMRegDMReg指令4IMRegDM

Reg結(jié)構(gòu)相關(guān)CC3CC4CC5CC6CC7CC8CC9CC10DM

RegReg

DM

RegIM

Reg

DM

Reg結(jié)構(gòu)相關(guān)插入暫停,解決結(jié)構(gòu)相關(guān)時(shí)間(時(shí)鐘周期)CC1氣泡氣泡氣泡DMLoad指令1指令2暫停暫停暫停指令3氣泡氣泡

氣泡Reg氣泡氣泡氣泡IM氣泡

氣泡氣泡氣泡3氣泡

氣泡RegIMRegIM時(shí)間(時(shí)鐘周期)CC1CC2SUB

R1,R2,R6

IM

RegADD

R4,R1,R3

IMOR

R5,R7,R1ANDR6,R1,R9XOR

R7,R1,R8CC6RegDMRegCC5RegDMRegIMCC4DM國(guó)RegIMCC3RegIM數(shù)據(jù)相關(guān)數(shù)據(jù)相關(guān)①寫后讀相關(guān)(Read

After

Write,RAW)。j的執(zhí)行要用到i的計(jì)算結(jié)果,j可能在i

寫入其計(jì)算結(jié)果之前就先行對(duì)保存該結(jié)果的寄存器進(jìn)行讀操作②寫后寫相關(guān)(WriteAfterWrite,WAW)。j和i的目的寄存器一樣,但是當(dāng)其在

流水線中采用亂序執(zhí)行時(shí),j可能在i寫入其計(jì)算結(jié)果之前就先行對(duì)目的寄存器進(jìn)

行寫操作③讀后寫相關(guān)(Write

AfterRead,WAR)。j可能在i讀取某個(gè)寄存器的內(nèi)容之前就對(duì)該寄存器進(jìn)行寫操作數(shù)據(jù)相關(guān)定向技術(shù)(旁路)解決數(shù)據(jù)相關(guān)時(shí)間(時(shí)鐘周期)CC1

CC2SUB

R1,R2,R6

IM

RegADD

R4,R1,R3

IMOR

R5,R7,R1AND

R6,R1,R9XOR

R7,R1,R8CC6RegDMRegCC5RegDM-RegIMCC4DMRegIMCC3RegIMLW

R1,0(R2)ADD

R3,R1,R4SUB

R5,R1,R6CC1IMCC2RegIMCC3RegIMCC4CC5DM

Reg氣泡氣泡

Reg暫停解決數(shù)據(jù)相關(guān)時(shí)間(時(shí)鐘周期)CC3CC4DMRegIM

RegCC6RegDMLW

R1,0(R2)ADDR3,R1,R4CC5RegDM數(shù)據(jù)相關(guān)時(shí)間(時(shí)鐘周期)CC1CC2CC6SUB

R5,R1,R6RegIMDMIM分支指令I(lǐng)F

ID

EX

DM

WB分支后繼指令1IF

stall

ID

EX

DM

WB分支后繼指令2IF

ID

EX

DM

WB分支指令I(lǐng)F

IDEX

DM

WB分支后繼指令I(lǐng)F

Stall

Flush分支目標(biāo)指令I(lǐng)F

ID

EX

DM

WB控制相關(guān)基于暫停的控制相關(guān)解決方案分支轉(zhuǎn)移失敗分支轉(zhuǎn)移成功控制相關(guān)【例2-9】假設(shè)分支指令在目標(biāo)代碼中出現(xiàn)的概率是0.3,轉(zhuǎn)移成功概率為0.8,流水線執(zhí)行其它指令的CPI為1,按照上圖給出的分支指令處理規(guī)則,求此時(shí)的指令執(zhí)行的平均CPI。指令的平均CPI=

分支指令CPI*分支指令比重+其它指令CPI*(1-分支指令比重)分支指令CPI=

轉(zhuǎn)移成功指令比重*(1+轉(zhuǎn)移成功的開銷)+(1-轉(zhuǎn)移成功指令比重)*(1+轉(zhuǎn)移失敗的開銷)根據(jù)圖中所示的規(guī)則,分支指令轉(zhuǎn)移成功后的開銷=2,分支指令轉(zhuǎn)移失敗的開銷=1;根據(jù)題目給出的已知條件,分支指令比重=0.3,其它指令CPI=1。此時(shí)指令執(zhí)行的平均CPI應(yīng)為:平均CPI=(1-0.3)*1+0.3*0.8*3+0.3*(1-0.8)*2=1.54分支指令iIFIDEXDMWB后繼指令i+1IFIDFlush目標(biāo)指令jIFIDEXDMWB分支指令iIFIDEXDMWB后繼指令i+1IFIDEXDMWB后繼指令i+2IFIDEXDMWB控制相關(guān)基于預(yù)測(cè)失敗的控制相關(guān)解決方案分支轉(zhuǎn)移失敗分支轉(zhuǎn)移成功分支指令iIFIDEXDMWB后繼指令i+1IFIDEXDMWB后繼指令i+2IFIDEXDMWB目標(biāo)指令jIFIDEXDMWB分支指令iIFIDEXDMWB后繼指令i+1IFIDEXDMWB后繼指令i+2IFIDEXDMWB后繼指令i+3IFIDEXDMWB控制相關(guān)基于延遲分支的控制相關(guān)解決方案分支轉(zhuǎn)移成功分支轉(zhuǎn)移失敗控制相關(guān)(動(dòng)態(tài)解決方案)分支目標(biāo)緩沖區(qū)(Branch-Target

Buffer,BTB)當(dāng)前PC查找、比較地址標(biāo)識(shí)↓

分支目標(biāo)PC命中,則認(rèn)為本指令是分支,且分支成功,以分支目

標(biāo)緩沖中分支目標(biāo)PC作為下一條指令地址沒有命中,則認(rèn)為本指令不

是分支,按普通指令執(zhí)行命中否分支目標(biāo)緩沖是控制相關(guān)分支目標(biāo)緩沖處理的步驟當(dāng)前PC值送存儲(chǔ)器和BTB是成功分支指令?將當(dāng)前指令PC

值和分支目標(biāo)

PC送入BTB中

作為一個(gè)新項(xiàng)否普通指令指令譯碼指令執(zhí)行預(yù)測(cè)錯(cuò)誤,清楚取來(lái)的指令并從分支的另外一個(gè)目標(biāo)取指令,刪除BTB中對(duì)應(yīng)項(xiàng)否BTB中存在?否當(dāng)前分支成功?預(yù)測(cè)成功,后續(xù)

指令無(wú)延遲執(zhí)行以分支目標(biāo)PC

送存儲(chǔ)器取指令是是控制相關(guān)【例2-10】設(shè)一個(gè)核心循環(huán)共循環(huán)100次,每次循環(huán)執(zhí)行10條指令,除最后一條

用于循環(huán)控制的分支指令外,其它指令的CPI為1。方案1,采用靜態(tài)控制相關(guān)解決方案,始終預(yù)測(cè)分支指令不跳轉(zhuǎn),預(yù)測(cè)成功開銷為零,預(yù)測(cè)不成功開銷為2個(gè)時(shí)鐘周期;方案2,采用基于BTB

的動(dòng)態(tài)控制相關(guān)解決方案,預(yù)測(cè)成功開銷為零,預(yù)測(cè)不成功或不命中的真分支的開銷都為4個(gè)時(shí)鐘周期。求兩種方案下執(zhí)行此核心循環(huán)需要

的時(shí)鐘周期數(shù)以及方案2相對(duì)方案1的性能加速比??刂葡嚓P(guān)方案1執(zhí)行時(shí),由于僅最后1次分支指令能夠預(yù)測(cè)成功,因此需要的時(shí)鐘周期數(shù)是

99

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論