第5章 重疊、 流水和向量處理機.ppt_第1頁
第5章 重疊、 流水和向量處理機.ppt_第2頁
第5章 重疊、 流水和向量處理機.ppt_第3頁
第5章 重疊、 流水和向量處理機.ppt_第4頁
第5章 重疊、 流水和向量處理機.ppt_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第5章溢流說唱樂、流水和矢量處理器、5.1溢流說唱樂解釋方式5.2流水方式5.3矢量流水處理和矢量流水處理器5.4指令水平高度并行的超級處理器、5.1溢流說唱樂解釋方式、5.1.1基本思想和一次溢流說唱樂、圖5.1一個機器指令的解釋圖5.2指令的順序解釋和過說唱樂解釋圖5.3主過說唱樂運作模式,其中圖5.4第k條指令為條件轉(zhuǎn)變,并且如果通過在Von Neumann型裝置上執(zhí)行第k條指令來以可修改的方式形成第k 1條指令,則例如,存在k :通用暫存器; (通用暫存器)這是錯誤的,因為k 1 k 1:在“執(zhí)行k”的末尾形成第k-1個指令,因此在一次重疊的時間關(guān)系中“分析k 1”已經(jīng)捕獲了較晚的第k

2、-1個指令的舊內(nèi)容。 為了避免錯誤,第k、k 1個指令不能解釋為云同步,這時在這些個的2個指令之間發(fā)生了“指令關(guān)聯(lián)”。 具體地,在n個指令可以被緩沖技術(shù)地存儲在指令緩沖器中的情況下,如果執(zhí)行到第k個指令,則可能與先前讀取的指位的第k-1至k-n個指令一起發(fā)生指令相關(guān)性。 緩容量越大,或者指令的預(yù)處理能力越強,表示指令相關(guān)的概率越高。5.1.2相關(guān)處理、1 .指令相關(guān)處理、“執(zhí)行”指令是IBM 370機器為此而設(shè)定的指令,在執(zhí)行到“執(zhí)行”指令時,以推一推形式顯示第2指令(X2) (B2) D2地址的圖5.5 IBM 370“執(zhí)行”指令圖5.6關(guān)于主存儲數(shù)的處理、3 .關(guān)于通用暫存器組的處理設(shè)備的

3、基本指令格式或圖5.7指令解釋過程中的關(guān)于通用暫存器內(nèi)容的微操作時間關(guān)系、在圖5.8“”通用暫存器定徑套中網(wǎng)站數(shù)據(jù)庫的時間關(guān)系在圖5.9中通過相關(guān)專用路徑解決通用暫存器的數(shù)相關(guān),操作通常,“分析”周期與主存儲器周期相等,因此在時間關(guān)系上要求在“分析”周期的前半部分,從通用暫存器輸出男低音取得(B2 ),傳送給地址加法器。 由于運算結(jié)果在“執(zhí)行”循環(huán)的最后被發(fā)送到通用暫存器定徑套,因此不能立即出現(xiàn)在通用暫存器輸出男低音中。 也就是說,毋庸贅言了發(fā)送到通過“執(zhí)行k”得到的通用暫存器的運算結(jié)果不能作為“分析k 2”的基礎(chǔ)地址值使用,不能作為“分析k 1”的基礎(chǔ)地址值使用。 因此,基值相關(guān)器(b相關(guān)器

4、)不僅出現(xiàn)一次相關(guān)而且出現(xiàn)二次相關(guān)器,盡管它們是一次重疊。 即,如果B(k 1)=L3(k )出現(xiàn),則可以稱為發(fā)生b一次相關(guān)。 另一方面,當B(k 2)=L3(k )出現(xiàn)時,如圖5.10中所示,可能發(fā)生b二次相關(guān)。圖5.10 B一次相關(guān)和二次相關(guān)、圖5.11 B一次、二次相關(guān)的后推處理、圖5.12 B相關(guān)專用通路法、5.2流水方式、5.2.1基本概念、1 .流水是重疊的補充,圖5.13指令分解為“分析”,圖5.15處理器間的流水處理、圖5.16 a 圖5.17靜態(tài)動態(tài)多功能輸油管道時-空圖例,圖5.18非線性輸油管道例,5.2.2輸油管道處理器的主要性能,吞吐量是輸油管道單位時間內(nèi)能夠流出的塔

5、斯克數(shù)或結(jié)果數(shù)。 另外,在圖5.14的流水線例中,各子路徑的經(jīng)過時間為t2,全負荷后,流水線每t2解釋一個指令,其最大吞吐量TPmax為1/t2。 實際上,由于每個子進程的操作不同,經(jīng)過時間不一定相同,因而如上所述,在每個子進程之間設(shè)置接口鎖存器,使得各鎖存器利用相同的時鐘脈沖來同步。 時鐘脈沖的周期直接影響輸油管道的最大吞吐量,優(yōu)選總是越小越好。 如果各個子過程需要的時間分別是t1、t2、t3、t4,則時鐘周期是maxt1、t2、t3、t4,即輸油管道的最大吞吐量,被限制為輸油管道中最慢的子過程需要的時間。將輸油管道中經(jīng)過時間最長的子進程稱為瓶頸子進程。 此外,圖5.19的最大吞吐量取決于瓶

6、頸階段的時間,而圖5.20的瓶頸子過程進一步細分,其中圖5.21的瓶頸子過程是并行的,并且如果m級輸油管道的每一級的經(jīng)過時間都為t0,則第一指令從流入到流出的T0=mt0的流水建立時間這樣,需要時間T=mt0 (n-1)t0來完成n個任意塔斯克的解釋。 從這其間、輸油管道的實際吞吐量(圖5.22點空間圖)對實際吞吐量進行分析,發(fā)現(xiàn)實際的吞吐量不僅總是小于最大吞吐量,而且僅在nm時能夠使實際吞吐量接近理想的最大吞吐量。 當以加速比(Speedup Ratio,Sp )來表示輸油管道方式相對于非輸油管道序列方式的提高速度之比時,非輸油管道序列方式進行動作,因為連續(xù)完成n個塔斯克需要nmt0的時間,

7、所以輸油管道方式動作的加速比在、 如果線性輸油管道的各段所經(jīng)過的時間ti不同,則其瓶頸段的時間為tj,完成n個塔斯克而可實現(xiàn)的實際吞吐量是指該加速比。2 .效率線的效率是指線中的設(shè)備的實際使用時間占運行時間整體的比,也稱作線設(shè)備的時間利用率。 由于輸油管道存在確立時間和排氣時間(到最后的塔斯克流入流出的時間),所以在連續(xù)完成n個塔斯克的時間,各段不一定完全運轉(zhuǎn)。 如果是線性輸油管道,各段經(jīng)過時間相同,則如圖5.22所示,在t時間,輸油管道的各段的效率全部相同,即輸油管道整體的效率,式中,分母mT是時空圖中的m個段和流水的總時間t包圍的總面積, 分子mnt0是時空圖中n個塔斯克實際占有的總面積,

8、因此,從時空圖來看,效率是實際上n個塔斯克占有的時空間域面積與m個區(qū)段的總時空間域面積的比。 顯然與吞吐量類似,僅nm時接近1。 在云同步中,對于線性流水,各級的經(jīng)過時間相等的情況下,輸油管道的效率與吞沒率成比例,即,如果輸油管道各級所經(jīng)過的時間不同,則各級的效率不同,但參照圖5.22,在容易得到輸油管道整體的效率時,對于復(fù)雜的非線性輸油管道, 實際吞吐量TP和效率需要通過描繪實際工作時的時空圖,分別用以下2個公式求出:圖5.23輸油管道工作例、3 .輸油管道工作例、5.2.3流水設(shè)備的相關(guān)處理和控制機構(gòu)、1 .局部相關(guān)處理圖5.25 IBM 360/91的浮點執(zhí)行零配件構(gòu)成分塊圖浮點操作站F

9、los (浮動點操作棧)所緩沖技術(shù)的浮點操作指令的格式為操作源1 (目標),并且源2操作可以進行浮點加法、減法、乘法和除法。 源1表示存儲信源命令的浮點寄存器FLR的編號,也用作存儲中間結(jié)果的目的地暫存器的編號。 源2指示緩沖器FLB的編號,其存儲通過存儲器男低音發(fā)送來的浮點命令。 這些個分別通過FLR男低音和FLB男低音向浮點加法線或浮點乘法/除法線的輸入端存儲站發(fā)送數(shù)據(jù)。 在浮點加法器輸油管道的輸入端具有3個存儲站a-1至a-3,在浮點乘法器輸油管道的輸入端具有2個存儲站m-1和m-2,分別由預(yù)定的站號來標記。 保存站由控制部控制,如果任一保存站的兩個源指令齊備,在流水段空閑時可以進入輸油

10、管道并向前流動,因此以異步流動方式進行工作。 由于在操作指令中源1兼作目的,因此進入2條輸油管道的操作指令間發(fā)生歌舞劇相關(guān)的概率高。 如果k 1表示在k之后在云同步中流動兩條輸油管道的第I個命令,則如果k 1的源1與k的目的相同,則產(chǎn)生“先寫后讀”相關(guān)性,如果k i的目的與k的目的相同,則產(chǎn)生“寫入”相關(guān)性,如果k i的目的與k的源1相同,則產(chǎn)生“先讀后寫”相關(guān)性也就是說,進入云同步的各操作命令與使用相同浮點寄存器FLR的編號相關(guān)。 現(xiàn)在,在FLOS中添加f 2、FLB1; f 2、f2MD f 2、FLB2。 以(F2)*(FLB2)F2的兩個操作指令為例,說明如何判斷相關(guān)發(fā)生、如何控制后推

11、與相關(guān)直接通路的連接。 很明顯,這兩個命令異步流動時,會產(chǎn)生“先寫后讀”、“寫”、“先讀后寫”這三個關(guān)系。 FLOS為添加f 2, 若發(fā)送FLB1并操作指令,則在FLR中取得(F2 ),在FLB中取得(FLB1 )并發(fā)送到加法器的存儲站例如A1,并且將F2的“忙二進制位”立即定徑套為“”,指定該暫存器的F2已經(jīng)成為“目的”暫存器, 由于準備接收來自加法器的運算結(jié)果,因此進行控制,以將F2的“站號”字段設(shè)定為A1的站號“1010”,站號1010的存儲站A1將在相加線流出的運算結(jié)果經(jīng)由CDB男低音返回F2。 返回結(jié)果后,立即將F2的“忙二進制位”和“站號”設(shè)為“”,釋放F2作為其他的操作指令使用。

12、 問題是,在F2的“忙二進制位”為“”、相加結(jié)果沒有從相加線流出的情況下,F(xiàn)LOS又送出操作指令MD F2,F(xiàn)LB2通過解查詢密碼控制網(wǎng)站數(shù)據(jù)庫到F2的源1命令時,“忙二進制位”為“”,表示出現(xiàn)了F2相關(guān)性。 指定F2內(nèi)容的來源,發(fā)送至M1的“來源1站號”,將F2內(nèi)的站號從A1(1010 )變更為M1(1000 ),指定應(yīng)從M1接收運算結(jié)果。 2、全局有關(guān)的處理,1 )推測法,圖5.26用推測法處理條件轉(zhuǎn)移,2 )提前形成條件查詢密碼,3 )取得延遲轉(zhuǎn)移,4 )加快短周期計程儀報的處理,3 .若流水設(shè)備的中斷處理中斷,則輸油管道中斷。 但其出現(xiàn)概率遠低于條件轉(zhuǎn)變的概率,隨機發(fā)生。 因此,流水設(shè)

13、備的處理中斷不是如何縮短輸油管道的切斷時間,而是主要如何處理程序斷點現(xiàn)場的保存和恢復(fù)。 當執(zhí)行指令I(lǐng)時是中斷的,并且程序斷點應(yīng)該處于指令I(lǐng)的執(zhí)行已經(jīng)終止并且指令i 1還未開始執(zhí)行的表兄弟中,然而流水設(shè)備可以將多個指令解釋為云同步,并且指令i 1、i 2已經(jīng)進入輸油管道并且部分地被解釋。 在異步流輸油管道中,某些這些個指令可能在指令I(lǐng)之前流動。 4 .輸油管道調(diào)度,圖5.27輸油管道預(yù)留表和狀態(tài)圖的例子,表5.1每個調(diào)度方案中的平均間隔拍數(shù)的例子,圖5.28多功能輸油管道預(yù)留表和狀態(tài)圖的例子,以及使用交叉沖突矢量(Crosscollision Vector ),a, 由于反映了b兩種功能的動態(tài)輸

14、油管道的各后續(xù)塔斯克流向輸油管道,所以在本例中需要4個交叉沖突向量,即VAB=(1011 )、VBA=(1010 )、VAA=(0110 )、VBB=(0110 )。 其中,VAA和VBB分別表示用a功能和b功能進行流水作業(yè)時,后續(xù)塔斯克流入流水線上的碰撞矢量,另一方面,VAB表示按在先b功能進行流水作業(yè)的塔斯克與按后續(xù)a功能進行流水作業(yè)的塔斯克的碰撞矢量,VBA表示按在先a功能進行流水作業(yè)的塔斯克與按后續(xù)b功能進行流水作業(yè)的塔斯克的碰撞矢量。 通常,具有p個函數(shù)的輸油管道將具有p-2個交叉沖突向量,其每一者被分類為p個沖突矩陣Mp且其中p每一者為1到p。 在本示例中,存在兩個初始碰撞矩陣,每

15、個初始碰撞矩陣例如通過VAA的(0110 )在針對每個p功能輸油管道進入一個塔斯克之后立即針對每個功能輸油管道流入后續(xù)塔斯克而產(chǎn)生將MA初始沖突矩陣的每一行向右移位一個二進制位,且逐二進制位地“或”對應(yīng)于a功能的初始沖突矩陣MA的行,從而形成新的沖突矩陣。根據(jù)此時的VAA的(0111 )可知,每隔4拍流入一個a功能的新塔斯克不會發(fā)生沖突,基于此形成新的沖突矩陣。 另外,例如,由于初始沖突矩陣中的VBA是(1010 ),所以可以理解,b功能的新塔斯克的重正化可以在第1拍或第3拍不沖突的情況下進行。 然后,將MA的所有初始沖突矩陣向右移位一個二進制位或三個二進制位,并且對每一二進制位“或”對應(yīng)于M

16、A的初始沖突矩陣的行,以形成新的沖突矩陣,它們正好為。 由此可知,在每隔3拍流入a功能的新的塔斯克,或者每隔4拍流入b功能的新的塔斯克中,分別產(chǎn)生不同的新的沖突矩陣。 5.3向量的流水處理和向量流水處理、5.3.1向量的流水處理,例如,修正D=A*(B C )。 在此,a、b、c、d都是具有n個要素的向量,采用什么樣的處理方式能夠最大限度地發(fā)揮輸油管道而一個一個地求出d向量要素的方法、即與ai、bi、ci要素網(wǎng)站數(shù)據(jù)庫,通過上述的算術(shù)式求出di,將ai 1、bi 1、ci 1除以2 的雙曲馀弦值。 如果向量的長度n過長,超過了向量暫存器組內(nèi)的暫存器個數(shù),則可以將該向量分割為多個組,使各組進入向

17、量暫存器組,這樣,各組內(nèi)進行縱向處理,組與組之間軟這種處理方式稱為組縱橫處理方式。 如果存在這種報文分組縱橫處理方式,則也可以不對向量長度n的大小施加限制。 CRAY1以這種方式進行向量的流水處理。 5.3.2向量流水處理機1 .向量處理機的指令系向量處理機的指令系中,應(yīng)包含向量型和標量型兩種指令。 向量型運算系的指令一般是向量V1運算向量V2,例如V2=SIN(V1),向量V1運算向量V2,向量v如下運算標量s,向量V1和向量V2運算向量V3,例如v3=v 3 向量V1和標量s計算向量V2,并且例如設(shè)V2=S*V1。 2、矢量流水處理機的結(jié)構(gòu),CRAY1是由中央處理機、診斷維護控制處理機、大容量盤片存儲子系統(tǒng)、前道工序處理機組成的功能分布異種型多處理機系統(tǒng)。 中央處理機的控制部,有總?cè)萘?56個16二進制位的指令緩沖器,被分成4個組,各組為64個。 在中央處理機的運算部中有12條可以并行工作的單功能輸油管道,可以分別用流水進行地址、矢量、標量的各種運算。 此外,還可以從輸油管道功能零配件直接網(wǎng)站數(shù)據(jù)庫矢量暫存器組V0V7、標量暫存器S0S7和地址暫存器A0A7。 另外,圖5.29 CRAY1的向量流水

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論