版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2023/11/211一、并行算法相關(guān)的基本概念及表示基本概念并行算法的表示并行算法的復(fù)雜性度量并行算法的同步與通信2023/11/2121.基本概念定義1:算法:在有限步驟內(nèi)求解某一特定問(wèn)題的一組無(wú)二義性的規(guī)則。定義2:并行算法是由一些獨(dú)立的、可以并行運(yùn)行的計(jì)算模塊(進(jìn)程)構(gòu)成,模塊(進(jìn)程)之間能相互作用和協(xié)調(diào),以完成對(duì)一個(gè)給定問(wèn)題的求解。2023/11/213根據(jù)算法的不同特征,可以對(duì)并行算法進(jìn)行不同的分類:SIMD算法和MIMD算法同步算法和異步算法數(shù)值計(jì)算算法和非數(shù)值計(jì)算算法共享存儲(chǔ)算法和分布存儲(chǔ)算法2023/11/214定義3:同步算法(synchronizedalgorithm):是指算法的諸進(jìn)程的執(zhí)行必須相互等待的一類并行算法。SIMD算法是同步算法中的一種特例。定義4:異步算法(asynchronousalgorithm):是指算法的諸進(jìn)程的執(zhí)行不必相互等待的一類并行算法。定義5:分布并行算法(distributedalgorithm):將同一任務(wù)分解為若干個(gè)子任務(wù),使之分布在由通信鏈路連接的多個(gè)節(jié)點(diǎn)上協(xié)同完成運(yùn)算的算法。分布式算法的執(zhí)行時(shí)間,在很大程度上受通信開(kāi)銷的影響。2023/11/215定義6:確定算法
(deterministicalgorithm):每個(gè)運(yùn)算步驟上均確定唯一操作的算法。如線性方程組求解的算法。
不確定算法
(non-deterministicalgorithm):在問(wèn)題求解的搜索過(guò)程中,提出多種可供選擇的操作,它們中的任一種都有希望獲得問(wèn)題的解答,但都不能肯定解出,有時(shí)甚至不能確定這些操作中哪一種求解的可能性更大些。對(duì)此,只能選擇其中任意一種搜索下去。這種搜索方法稱為不確定算法。2023/11/216定義7:隨機(jī)算法(randomizedalgorithm,probabilisticalgorithm)計(jì)算步驟具有隨機(jī)性的算法。在算法的某一步或某些步上,可以在指定范圍內(nèi)隨機(jī)地選擇下一個(gè)演算步的走向。如果方法得當(dāng),可比一般算法更快地得出結(jié)果,并且能以較高的概率提供正確的結(jié)果。2023/11/217表示算法的要求無(wú)二義性力圖直觀、易懂不苛求嚴(yán)格的語(yǔ)法格式一般的串行算法常用類Pascal、類Algol表示2.并行算法的表示2023/11/2181.par-do語(yǔ)句
fori=1tonpar-do::endfor表示其間的n(i=1ton)次語(yǔ)句序列的執(zhí)行可以并行完成表示k個(gè)處理器同時(shí)執(zhí)行其間的語(yǔ)句序列2.forall語(yǔ)句
forallPiwhere0i
k-1do::endfor并行算法常引入以下兩條并行語(yǔ)句:2023/11/2193.并行算法的復(fù)雜性度量令f(n)和g(n)是定義在自然數(shù)集合N上的兩個(gè)函數(shù),定義8:如果存在兩個(gè)正數(shù)c和n0,使得對(duì)于所有的
n
n0均有f(n)
cg(n),則標(biāo)記為:
f(n)=
(g(n))
我們稱g(n)為f(n)的上界。定義9:如果存在兩個(gè)正數(shù)c和n0,使得對(duì)于所有的n
n0均有f(n)
cg(n),則標(biāo)記為:
f(n)=
(g(n))
我們稱g(n)為f(n)的下界。2023/11/2110定義10:如果存在正數(shù)c1、c2
和n0,使得對(duì)于所有的n
n0均有c1g(n)
f(n)
c2g(n),則標(biāo)記為
f(n)=
(g(n))
我們稱g(n)為f(n)的緊致界。即:如果f(n)=
(g(n))且
f(n)=
(g(n))
則f(n)=
(g(n))2023/11/2111
比較兩個(gè)算法的時(shí)間復(fù)雜性函數(shù)g(n)和f(n)的階的方法:用定義判斷用求極限的方法來(lái)加以判斷。若
則(1)當(dāng)c≠0時(shí),說(shuō)明f(n)和g(n)同階,記為f(n)=Θ(g(n))(2)當(dāng)c=0時(shí),說(shuō)明f(n)比g(n)低階,記為f(n)=O(g(n))(3)當(dāng)c=∞時(shí),說(shuō)明f(n)比g(n)高階,記為f(n)=Ω(g(n))2023/11/2112并行算法的運(yùn)行時(shí)間t(n)
:對(duì)于輸入規(guī)模為n的問(wèn)題,在給定的并行計(jì)算模型之下求解問(wèn)題所需的時(shí)間,也稱為時(shí)間復(fù)雜性
(timecomplexity)。運(yùn)行時(shí)間=計(jì)算時(shí)間+通信時(shí)間處理器數(shù)p(n):表示對(duì)給定的問(wèn)題規(guī)模n,并行算法所用的處理器的個(gè)數(shù)。并行算法的成本c(n):并行算法的運(yùn)行時(shí)間t(n)與所需的處理器數(shù)p(n)之積,即c(n)=t(n)*p(n)2023/11/2113例:(1)設(shè)f(n)=n2/2,g(n)=307n2,則因此,f(n)=n2/2與g(n)=307n2是同階的。
(2)設(shè)f(n)=lgn,g(n)=n,則所以,f(n)=lgn比g(n)=n低階。2023/11/2114定義11:一個(gè)并行算法最壞情況下的時(shí)間復(fù)雜性(worst-casetime-complexity):對(duì)于所有輸入規(guī)模為n的問(wèn)題,在給定的并行計(jì)算模型之下求解問(wèn)題所需的時(shí)間的最大值。定義12:一個(gè)并行算法的期望時(shí)間復(fù)雜性(expectedtime-complexity):對(duì)于所有輸入規(guī)模為n的問(wèn)題,在給定的計(jì)算模型之下求解問(wèn)題所需的時(shí)間的平均值。2023/11/2115定義13:一個(gè)并行算法最壞情況下的空間復(fù)雜性(worst-casespace-complexity):對(duì)于所有輸入規(guī)模為n的問(wèn)題,在給定的并行計(jì)算模型之下求解問(wèn)題所需的內(nèi)存空間的最大值。定義14:一個(gè)并行算法的期望空間復(fù)雜性(expectedspace-complexity):對(duì)于所有輸入規(guī)模為n的問(wèn)題,在給定的計(jì)算模型之下求解問(wèn)題所需的內(nèi)存空間的平均值。2023/11/2116定義15:如果一個(gè)并行算法的成本與其對(duì)應(yīng)的最佳串行算法的最壞情況下時(shí)間復(fù)雜性在同一個(gè)數(shù)量級(jí)上,則稱該并行算法為成本最佳的(cost-optimal)或最佳并行算法(optimalparallelalgorithm)??傔\(yùn)算量W(n):(并行)算法中所要完成的總的操作數(shù)量(thenumberofcomputationaloperations)2023/11/21174.并行算法中的同步與通信同步(synchronization):使多個(gè)相關(guān)事件的發(fā)生保持相同的節(jié)奏,彼此之間能良好地配合。在并行算法的各進(jìn)程異步執(zhí)行過(guò)程中,為了確保各處理器的正確工作順序和對(duì)共享存儲(chǔ)器的訪問(wèn),程序員需要在算法的適當(dāng)位置設(shè)置同步點(diǎn)。下面給出一個(gè)利用lock和unlock構(gòu)造的臨界區(qū)完成數(shù)組求和的算法2023/11/2118beginS=0forallPiwhere0
i
p-1doL=0forj=iton-1steppdoL=L
+ajendforlock(u)S=S+Lunlock(u)endforend[算法4.1.3]共享存儲(chǔ)多處理機(jī)上求和算法輸入:A=(a0,a1,…,an-1),處理器數(shù)p;輸出:a0+a1+…+an-1存放在全局變量S
中。2023/11/2119通信(communication):把信息用一定手段通過(guò)某種介質(zhì)或傳輸線路從一個(gè)點(diǎn)傳送至另一點(diǎn)的過(guò)程。通信是在空間上對(duì)并發(fā)執(zhí)行的進(jìn)程實(shí)現(xiàn)數(shù)據(jù)交換。原語(yǔ)
(primitive):它由若干條機(jī)器指令構(gòu)成的,用來(lái)完成特定功能的一段程序。原語(yǔ)有以下特點(diǎn):不可中斷性:一旦原語(yǔ)被開(kāi)始執(zhí)行,就應(yīng)不間斷地執(zhí)行到結(jié)束;不可侵犯性:原語(yǔ)一旦被執(zhí)行,中間不許插入任何其他操作。2023/11/2120通信可使用通信原語(yǔ)來(lái)表示:1.在共享存儲(chǔ)的多處理機(jī)中,可使用1)globalread(X,Y)將全局存儲(chǔ)器中數(shù)據(jù)X讀入局部變量Y;2)globalwrite(U,V)將局部數(shù)據(jù)U寫(xiě)入共享存儲(chǔ)變量V中。2.在分布存儲(chǔ)的多計(jì)算機(jī)中,可使用1)send(X,i)或send(X,Pi)當(dāng)前處理器發(fā)送數(shù)據(jù)X到Pi
;2)receive(Y,j)或receive(Y,Pj)當(dāng)前處理器從Pj
接收數(shù)據(jù)Y。2023/11/2121[算法4.1.4]分布存儲(chǔ)多計(jì)算機(jī)上矩陣向量相乘算法給定:一個(gè)n*n的矩陣A和一個(gè)向量
X
a11a12a13……a1n-1a1na21a22a23……a2n-1a2n
A=a31a32a33……a3n-1a3n……..an1an2an3……ann-1annx1x2X=x3…xn計(jì)算:A*X,得到一個(gè)向量。假設(shè)r=n/p為一整數(shù)因?yàn)槲覀兇蛩阍诜植即鎯?chǔ)的多計(jì)算機(jī)系統(tǒng)上運(yùn)行該算法,被計(jì)算的數(shù)據(jù)只能分布在各個(gè)處理器的局部存儲(chǔ)器上。2023/11/2122我們把A按列分為p個(gè)n*r的小矩陣A1,A2,…,Ap
把X按行分為p個(gè)r*1的小向量X1,X2,…,Xp計(jì)算A*X就轉(zhuǎn)化為計(jì)算:
A1X1+A2X2+…ApXp所以處理器Pi(其中1
i
p)將Ai和Xi存放在自己的局部存儲(chǔ)器中,各處理器首先計(jì)算AiXi
,然后利用通信實(shí)現(xiàn)數(shù)據(jù)求和。X1(r*1)X2(r*1)…Xp(r*1)A=A1A2
…ApX=
(n*r)(n*r)(n*r)2023/11/2123我們假設(shè)處理器是以環(huán)結(jié)構(gòu)組織的PiP2PpP12023/11/2124[算法4.1.4]分布存儲(chǔ)多計(jì)算機(jī)上矩陣向量相乘算法輸入:處理器數(shù)p,第i個(gè)A矩陣分量Ai
于B中,第i個(gè)X向量分量Xi于w中;輸出:A*X于P1變量y中。begincomputez=Bwifi=1theny=0elsereceive(y,left)endify=y+zsend(y,right)ifi=1thenreceive(y,left)end2023/11/2125p1p3p2p4計(jì)算z=Bw計(jì)算z=Bw計(jì)算z=Bw計(jì)算z=Bwy=0rec(y,p1)rec(y,p2)rec(y,p3)y=y+zsend(y,p2)send(y,p3)send(y,p4)rec(y,p4)send(y,p1)y=y+zy(1)y=y+zy(2)y=y+zy(3)y(4)結(jié)束2023/11/2126第四章并行算法的設(shè)計(jì)基礎(chǔ)一、并行算法相關(guān)的基本概念及表示二、介紹幾種并行計(jì)算模型二、介紹幾種并行計(jì)算模型2023/11/2127二、并行計(jì)算模型并行計(jì)算模型:從并行算法的設(shè)計(jì)和分析出發(fā),將各種并行計(jì)算機(jī)(至少是某一類并行計(jì)算機(jī))的基本特征抽象出來(lái),形成一個(gè)抽象的計(jì)算模型。并行計(jì)算模型為并行計(jì)算提供了硬件和軟件的界面,使硬件設(shè)計(jì)者和軟件設(shè)計(jì)者可以開(kāi)發(fā)并行性的支持機(jī)制,從而提高系統(tǒng)的性能。對(duì)并行算法的研制者,不會(huì)局限于某種具體的并行計(jì)算機(jī)來(lái)研究并行算法,而需借助于抽象的計(jì)算模型,它是設(shè)計(jì)和分析并行算法的基礎(chǔ)。2023/11/2128為了能對(duì)計(jì)算機(jī)系統(tǒng)進(jìn)行簡(jiǎn)單、明確的描述,發(fā)現(xiàn)一般規(guī)律,通常在不同層次上進(jìn)行抽象來(lái)定義模型。不同層次模型的關(guān)系圖:編程模型計(jì)算模型體系結(jié)構(gòu)模型機(jī)器模型用戶系統(tǒng)硬件和操作系統(tǒng)互連網(wǎng)絡(luò)的作用和執(zhí)行通信的形式等計(jì)算機(jī)的費(fèi)用和資源編程語(yǔ)言的語(yǔ)義2023/11/2129并行計(jì)算模型的主要作用:它是并行算法實(shí)現(xiàn)的基礎(chǔ)對(duì)同一問(wèn)題在不同的模型上的不同解決辦法,來(lái)比較該問(wèn)題究竟更合理在哪一種模型上實(shí)現(xiàn)它給并行算法設(shè)計(jì)和分析提供了一個(gè)簡(jiǎn)單、方便的框架撇開(kāi)了硬件的繁雜的細(xì)節(jié)它使并行算法設(shè)計(jì)具有一定的生命力集中精力開(kāi)發(fā)應(yīng)用問(wèn)題自身的并行性和算法的性能,并使算法具有一定的通用性2023/11/2130串行算法的研究已經(jīng)相當(dāng)成熟,它們基本上都是基于馮.諾依曼(vonNeumann)體系結(jié)構(gòu)控制器運(yùn)算器主存儲(chǔ)器輸出設(shè)備輸入設(shè)備CPU高速緩存2023/11/2131程序指令計(jì)數(shù)器r0r1r2r3:存儲(chǔ)器累加器xn……x2x1只讀輸入磁帶……y2y1只寫(xiě)輸出磁帶串行計(jì)算模型RAM(RandomAccessMachine)2023/11/2132RAM機(jī)器模型的指令系統(tǒng)與實(shí)際計(jì)算機(jī)的指令系統(tǒng)類似,有四類指令:
1.控制流向指令,如jump;2.輸入/輸出指令,如read,write;
3.累加器與存儲(chǔ)器之間的傳送數(shù)據(jù)指令,如load;
4.算術(shù)運(yùn)算指令,如
add。2023/11/2133PRAM模型
(ParallelRandomAccessMachineModel)1978年S.Fortune和J.Wyllie總結(jié)了陣列式結(jié)構(gòu)的并行機(jī)和流水線結(jié)構(gòu)的向量機(jī)的特點(diǎn),將其抽象為具有如下特征的PRAM模型:1)有一個(gè)控制器2)有p(可有限或無(wú)限)臺(tái)功能相同的處理器3)有一個(gè)容量無(wú)限的共享存儲(chǔ)器4)每臺(tái)處理器有自己的局部存儲(chǔ)器5)處于激活狀態(tài)的處理器必須執(zhí)行相同的指令6)允許任何時(shí)刻各處理器均可通過(guò)共享存儲(chǔ)器與其它處理器交換數(shù)據(jù)。2023/11/2134PRAM模型----SIMD計(jì)算模型控制器互聯(lián)網(wǎng)絡(luò)全局共享存儲(chǔ)器P1LM1P2LM2PpLMp……2023/11/2135PRAM模型允許任何時(shí)刻各處理器均可通過(guò)共享存儲(chǔ)器的共享單元與其它處理器交換數(shù)據(jù)。根據(jù)處理器對(duì)共享單元的存、取訪問(wèn)的不同約束條件進(jìn)一步對(duì)PRAM模型分類:PRAM-EREW(ExclusiveRead,ExclusiveWrite):不允許有讀沖突和寫(xiě)沖突PRAM-CREW(ConcurrentRead,ExclusiveWrite):每次允許多臺(tái)處理器同時(shí)讀同一共享單元內(nèi)容,但不允許同時(shí)寫(xiě)。PRAM-CRCW(ConcurrentRead,ConcurrentWrite):允許多臺(tái)處理器同時(shí)讀、寫(xiě)同一共享單元內(nèi)容。2023/11/2136PRAM-CRCW
模型中允許同時(shí)寫(xiě)同一共享單元顯然是不現(xiàn)實(shí)的,所以對(duì)PRAM-CRCW
模型作了更進(jìn)一步的約定:共用的
(Common)PRAM-CRCW:同時(shí)寫(xiě)同一共享單元的所有處理器必須寫(xiě)相同的值;優(yōu)先的
(Priority)PRAM-CRCW:從同時(shí)要寫(xiě)同一共享單元的所有處理器中找出標(biāo)號(hào)最小的處理器,將它的值寫(xiě)入共享地址中;任意的
(Arbitrary)PRAM-CRCW:從同時(shí)要寫(xiě)同一共享單元的所有處理器中任選一個(gè)處理器的值寫(xiě)入共享地址中。2023/11/2137PRAM模型上的算法的執(zhí)行:1)輸入數(shù)據(jù)存放在全局共享存儲(chǔ)器中,并只有一個(gè)處理器處于激活狀態(tài);2)在每個(gè)計(jì)算步中,一個(gè)激活的處理器可做:從局部或全局存儲(chǔ)器中讀一個(gè)值完成一個(gè)RAM操作寫(xiě)值到局部或全局存儲(chǔ)器中激活另一個(gè)處理器2023/11/2138[算法4.2.1]在PRAM-EREW模型上求和算法輸入:n個(gè)待求和的數(shù)A[0..(n-1)]輸出:最終的n個(gè)數(shù)的和在A[0]中全局變量:n,A[0..(n-1)],jbegin*spawn(P0,P1,…,Pn/2-1)forallPiwhere0in/2-1doforj=0tologn-1doifimod2j=0and2i+2j<nthenA[2i]=A[2i]+A[2i+2j]endifendforendforend2023/11/2139spawn():激活n
個(gè)處理機(jī)例:n=12spawn():激活n
個(gè)處理機(jī)的時(shí)間為logn
。時(shí)間2023/11/21402.APRAM模型(AsynchronousPRAM)80年代初,人們總結(jié)了共享存儲(chǔ)型多處理機(jī)結(jié)構(gòu)的向量機(jī)的特點(diǎn),將其抽象為具有如下特征的APRAM模型:1)有p(可有限或無(wú)限)個(gè)處理器;2)每個(gè)處理器有自己的控制器(局部時(shí)鐘);3)有一個(gè)容量無(wú)限的共享存儲(chǔ)器;4)每臺(tái)處理器有自己的局部存儲(chǔ)器和局部程序;5)各處理器異步地、獨(dú)立地執(zhí)行各自的指令,處理器間的同步需明確地在各處理器的程序中加入障礙(路障)同步(barriersynchronization)
指令;6)利用共享存儲(chǔ)器實(shí)現(xiàn)處理器間的通信。2023/11/2141APRAM模型----MIMD計(jì)算模型控制器1互聯(lián)網(wǎng)絡(luò)全局共享存儲(chǔ)器P1LM1P2LM2PpLMp……控制器2控制器p……2023/11/2142PRAM模型----SIMD計(jì)算模型(對(duì)比)控制器互聯(lián)網(wǎng)絡(luò)全局共享存儲(chǔ)器P1LM1P2LM2PpLMp……2023/11/2143APRAM模型同樣利用共享存儲(chǔ)器實(shí)現(xiàn)處理器間的通信障礙(路障)同步
(barriersynchronization):它在程序中設(shè)置一些障礙點(diǎn),當(dāng)處理器執(zhí)行到障礙點(diǎn)時(shí)暫停,等待所有進(jìn)程都執(zhí)行到這個(gè)障礙點(diǎn)上,以此方法取得同步。2023/11/2144APRAM模型中的計(jì)算:計(jì)算是由一系列用同步障礙點(diǎn)分開(kāi)的全局相(globalphase)組成的。在各全局相內(nèi)每個(gè)處理器異步地運(yùn)行其局部程序每個(gè)局部程序中的最后一條指令是一條障礙同步指令各處理器均可異步地讀取和寫(xiě)入全局存儲(chǔ)器,但在同一相(phase)內(nèi)不允許兩個(gè)處理器訪問(wèn)同一共享單元2023/11/2145處理器1處理器2處理器3
Phase1同步障礙readx1readx3readxnreadx2:::writetoB:writetoAwritetoCwritetoDreadBreadAreadC:::writetoBwritetoD
:writetoCwritetoBreadD:readA::writetoBPhase2同步障礙Phase3同步障礙2023/11/2146在APRAM模型上設(shè)計(jì)的算法的時(shí)間復(fù)雜性包括以下幾個(gè)方面:假設(shè)一個(gè)局部操作取為1個(gè)單位時(shí)間全局讀/寫(xiě)時(shí)間為d,它表示全局讀/寫(xiě)的平均時(shí)間。該值應(yīng)隨著處理器的個(gè)數(shù)增加而增加。同步障礙的時(shí)間為B,B是處理器個(gè)數(shù)p的非遞減函數(shù)B(p)。在APRAM中常假設(shè):2dBp設(shè)tph
為全局相內(nèi)各處理器指令執(zhí)行時(shí)間中最長(zhǎng)者,則整個(gè)程序運(yùn)行時(shí)間T應(yīng)為:T=tph+B*同步障礙次數(shù)2023/11/21473.LogP模型
(Latency,overhead,gap,Processor)1993年D.Culler等人在分析了分布式存儲(chǔ)計(jì)算機(jī)特點(diǎn)的基礎(chǔ)上,提出了基于點(diǎn)到點(diǎn)通信的多計(jì)算機(jī)模型----LogP模型。該模型雖未涉及到網(wǎng)絡(luò)的具體結(jié)構(gòu),但充分說(shuō)明了互聯(lián)網(wǎng)絡(luò)的性能特性:互連網(wǎng)絡(luò)帶寬的限制通信中可觀的延遲它是MPP
系統(tǒng)的模型2023/11/2148LogP模型主要由以下4個(gè)參數(shù)來(lái)描述:1)L(Latency)最大延遲:在通信時(shí)包含一個(gè)或幾個(gè)字的一個(gè)消息從源節(jié)點(diǎn)傳到目標(biāo)節(jié)點(diǎn)的時(shí)間的上限值。2)o(overhead)開(kāi)銷:處理器準(zhǔn)備發(fā)送或接收一個(gè)消息的時(shí)間開(kāi)銷,在這段時(shí)間里處理器不能執(zhí)行其它操作。3)g(gap)間隔:一臺(tái)處理器發(fā)送或接收一組消息時(shí),兩個(gè)消息之間的最小時(shí)間間隔,其倒數(shù)即為處理器的通信帶寬。4)P(Processor)節(jié)點(diǎn)數(shù):處理器/存儲(chǔ)器個(gè)數(shù),假定每個(gè)局部操作需要1個(gè)單位時(shí)間(即一個(gè)處理器周期)。2023/11/2149LogP的參數(shù)示意圖PiPkPj處理器ogLo消息下一個(gè)消息時(shí)間發(fā)送并接收一個(gè)消息共需2o+L個(gè)單位時(shí)間;處理器Pi在向處理器Pj
發(fā)送消息后,在發(fā)送下一個(gè)消息之前必須等待
g個(gè)時(shí)間單位。2023/11/2150LogP模型的特點(diǎn)處理機(jī)之間異步地工作,通過(guò)消息傳遞實(shí)現(xiàn)同步;消息延遲不確定,但延遲不會(huì)大于L,即任何消息經(jīng)歷的等待時(shí)間是不可預(yù)測(cè)的,但不會(huì)超過(guò)L;LogP模型支持了計(jì)算和通信的重疊;能夠預(yù)測(cè)算法的實(shí)際運(yùn)行時(shí)間。LogP模型抓住了網(wǎng)絡(luò)與處理機(jī)之間的性能瓶頸。消息間隔參數(shù)g反映了通信帶寬,當(dāng)一臺(tái)處理機(jī)發(fā)送的消息已到達(dá)這個(gè)容量限度時(shí),再發(fā)送的消息將被阻塞。2023/11/2151例2:在通信模式是一棵樹(shù)的情況下求和算法
假設(shè)P=8、L=5、g=4、o=2,我們考慮在時(shí)間為28個(gè)單位時(shí)間內(nèi)最多可能求和的個(gè)數(shù)。P0P4P6P7P2P3P5P12023/11/21524.BSP模型(BulkSynchronousParallel)BSP模型是一個(gè)分布存儲(chǔ)的MIMD
計(jì)算模型BSP模型的組成主要包括如下部分:1)若干個(gè)能進(jìn)行處理和內(nèi)存操作的處理器,2)一個(gè)用于在處理器之間傳遞消息的路由器,3)在定義的時(shí)間間隔內(nèi),對(duì)所有處理器進(jìn)行同步的機(jī)制。一般情況下,假設(shè)這個(gè)全局同步機(jī)制是用特殊的硬件支持的。一個(gè)BSP程序是由一系列超步
(superstep)組成的。2023/11/2153BSP模型有以下三個(gè)重要參數(shù):1)處理器數(shù)p2)路由器吞吐量g,(也稱為帶寬因子)3)全局同步之間的時(shí)間間隔
L在一個(gè)超步中,一個(gè)處理機(jī)最多發(fā)送h
個(gè)消息或接收h
個(gè)消息。若有h個(gè)消息,則稱此通信有一個(gè)
h
關(guān)系(h-relation)。g值的定義方式:每秒處理機(jī)所能完成的局部計(jì)算數(shù)與每秒路由器所能傳輸?shù)臄?shù)據(jù)量之比;或在一個(gè)h
關(guān)系中,傳遞h個(gè)消息所需的時(shí)間為g.h。2023/11/2154BSP模型與APRAM模型類似,使用障礙同步使整個(gè)計(jì)算任務(wù)以緊同步方式進(jìn)行各處理器局部計(jì)算全局通信障礙同步一個(gè)超步的執(zhí)行時(shí)間:計(jì)算時(shí)間max+gh
max+l2023/11/2155BSP模型的主要特點(diǎn):將處理器和路由器分開(kāi),即把計(jì)算任務(wù)和通信任務(wù)分開(kāi)。路由器僅進(jìn)行點(diǎn)到點(diǎn)的消息傳遞,不考慮互連網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu);利用硬件實(shí)現(xiàn)全局障礙同步使并行粒度增大(相對(duì)APRAM而言),并能夠?qū)崿F(xiàn)緊耦合同步并行算法;兼顧了計(jì)算和通信的平衡問(wèn)題;硬件可將L設(shè)置盡量小----這表示通信帶寬會(huì)更寬些,在設(shè)計(jì)并行算法時(shí)應(yīng)使L盡量大從而提高并行粒度。2023/11/21565.C3
模型(Computing,Communication,Congestion)1994年S.E.Hambrush
等人在分析高性能可擴(kuò)展的網(wǎng)絡(luò)計(jì)算機(jī)系統(tǒng)特點(diǎn)的基礎(chǔ)上提出了C3模型,它適用于粗粒度的并行系統(tǒng)。和BPS與LogP模型相似,C3計(jì)算模型也將計(jì)算劃分為一系列超級(jí)步,同步出現(xiàn)在兩個(gè)超級(jí)步之間,這個(gè)同步也是利用障礙同步機(jī)制來(lái)實(shí)現(xiàn)。擁塞(Congestion):在通信網(wǎng)絡(luò)中,當(dāng)各輸入站的呼叫數(shù)量超過(guò)網(wǎng)絡(luò)的容量,或超過(guò)了網(wǎng)絡(luò)處理的能力時(shí),則稱網(wǎng)絡(luò)中發(fā)生了擁塞。2023/11/2157C3模型主要由以下幾個(gè)參數(shù)來(lái)描述:1)處理器的個(gè)數(shù)
p;2)網(wǎng)絡(luò)延遲h:網(wǎng)絡(luò)中任意兩節(jié)點(diǎn)間的距離的平均值;3)網(wǎng)絡(luò)的對(duì)分寬度b:表示網(wǎng)絡(luò)的帶寬;4)啟動(dòng)時(shí)間s,即建立一個(gè)消息時(shí)的開(kāi)銷;5)消息包的長(zhǎng)度
l,即消息包所含字節(jié)數(shù)。消息包是處理機(jī)間通信的基本單位。2023/11/2158C3模型中用到的一些概念C3模型中考慮了兩種路由方式:存儲(chǔ)轉(zhuǎn)發(fā)路由方式(store-and-forwardmode):它是網(wǎng)絡(luò)中信息交換的一種方式。轉(zhuǎn)發(fā)中心不是將終端發(fā)出的信息立即傳送到接收終端,而是先存儲(chǔ)起來(lái),等待適當(dāng)?shù)臅r(shí)機(jī),選擇空閑的信道,并按信息的優(yōu)先級(jí)別轉(zhuǎn)發(fā)到下一個(gè)轉(zhuǎn)發(fā)中心或接收終端。蟲(chóng)孔(蟲(chóng)蝕)路由方式(wormholeroutingmode):在平面網(wǎng)絡(luò)結(jié)構(gòu)的多處理機(jī)系統(tǒng)中進(jìn)行路徑選擇的一種方法。它把消息分成若干個(gè)包,包又分成若干個(gè)稱為遷移塊(flit)的基本信息單元。每個(gè)包中的遷移塊以流水線方式向前依次傳送。只有包的頭幾個(gè)遷移塊含有路徑信息,因而一個(gè)包的所有遷移塊必須一個(gè)跟著一個(gè),而不能被別的消息包打斷。2023/11/2159C3模型中用到的一些概念C3
模型中考慮了兩種發(fā)送/接收原語(yǔ):1)阻塞發(fā)送和接收原語(yǔ)2)非阻塞發(fā)送和接收原語(yǔ)阻塞發(fā)送(blockingsend):指一個(gè)源處理器從開(kāi)始發(fā)送一條消息,直到它被目標(biāo)處理器收到消息,源處理器的發(fā)送操作才結(jié)束。非阻塞的發(fā)送(non-blockingsend):源處理器只需將要發(fā)送的消息放在發(fā)送緩沖器。非阻塞的發(fā)送不需考慮目標(biāo)處理器什么時(shí)候接收到信息。2023/11/2160各種并行計(jì)算模型的比較
模型屬性PRAMAPRAMLogPBSPC3體系結(jié)構(gòu)SIMD-SMMIMD-SMMIMD-DMMIMD-DMMIMD-DM計(jì)算模式同步計(jì)算異步計(jì)算異步計(jì)算異步計(jì)算異步計(jì)算同步方式自動(dòng)同步障礙同步隱式同步障礙同步障礙同步計(jì)算粒度細(xì)/中粒度中/大粒度中/大粒度中/大粒度粗粒度通信方式共享變量共享變量發(fā)/收消息發(fā)/收消息發(fā)/收消息模型參數(shù)1(單位時(shí)間步)d:全局讀
/寫(xiě)時(shí)間B:同步時(shí)間L:通信延遲o:通信開(kāi)銷g:消息間隔P:處理器數(shù)p:處理器數(shù)g:帶寬因子L:同步間隔l:消息包長(zhǎng)度s:發(fā)送開(kāi)銷h:通信延遲2023/11/2161由于并行計(jì)算機(jī)正在處于飛速發(fā)展中,但尚未定型,因此到現(xiàn)在為止,還沒(méi)有一個(gè)通用的并行計(jì)算模型。人們只能將某一類并行機(jī)的基本特征抽象出來(lái),形成各種特定的并行計(jì)算模型,以便并行算法的設(shè)計(jì)與理論分析。2023/11/2162PRAM模型是對(duì)一類共享的并行機(jī)特征抽取,它拋開(kāi)了通信的干擾,可用于開(kāi)發(fā)細(xì)粒度并行算法;LogP模型是對(duì)一類分布式并行計(jì)算機(jī)特征抽取,基于點(diǎn)對(duì)點(diǎn)通信的計(jì)算模型,集中分析處理機(jī)與網(wǎng)絡(luò)之間的瓶頸問(wèn)題;C3
模型是對(duì)一類基于消息傳遞的分布式粗粒度系統(tǒng)特征抽取,集中反映的是網(wǎng)絡(luò)擁擠和路由影響。2023/11/2163例1_1:在PRAM-EREW計(jì)算機(jī)上對(duì)兩個(gè)N維向量A和B求內(nèi)積s。假設(shè)用p個(gè)處理機(jī)完成該任務(wù),并設(shè)N/p是整數(shù),內(nèi)積的值在
LocalVal[0]中。VECTORMUL(PRAM-EREW):GlobalN,i,A[0..N-1],B[0..N-1],LocalVal[0..p-1]Localjbeginspawn(P0,P1,P2,…,Pp-1)forallPi,其中0
i
p-1dobeginLocalVal[i]=0;forj=i;j<NsteppdoLocalVal[i]=LocalVal[i]+A[j]*B[j];for
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 職業(yè)健康促進(jìn)的長(zhǎng)期效益追蹤
- 禁毒社工工作培訓(xùn)課件
- 職業(yè)健康促進(jìn)與職業(yè)健康文化建設(shè)
- 職業(yè)健康與心理健康的整合干預(yù)策略-1
- 欽州2025年廣西欽州市兒童福利院招聘筆試歷年參考題庫(kù)附帶答案詳解
- 邢臺(tái)2025年河北邢臺(tái)平鄉(xiāng)縣招聘人事代理教師200人筆試歷年參考題庫(kù)附帶答案詳解
- 茂名2025年廣東茂名濱海新區(qū)招聘事業(yè)單位工作人員17人筆試歷年參考題庫(kù)附帶答案詳解
- 秦皇島北京中醫(yī)藥大學(xué)東方醫(yī)院秦皇島醫(yī)院(秦皇島市中醫(yī)醫(yī)院)招聘17人筆試歷年參考題庫(kù)附帶答案詳解
- 湖北2025年湖北體育職業(yè)學(xué)院招聘43人筆試歷年參考題庫(kù)附帶答案詳解
- 成都四川成都市郫都區(qū)友愛(ài)鎮(zhèn)衛(wèi)生院招聘編外人員2人筆試歷年參考題庫(kù)附帶答案詳解
- 醫(yī)院電梯設(shè)備安全培訓(xùn)課件
- 排水系統(tǒng)運(yùn)維人員培訓(xùn)方案
- (2025年標(biāo)準(zhǔn))sm調(diào)教協(xié)議書(shū)
- 蘇教版(2025)八年級(jí)上冊(cè)生物期末復(fù)習(xí)全冊(cè)知識(shí)點(diǎn)提綱(搶先版)
- 2025年應(yīng)急局在線考試題庫(kù)
- 曼娜回憶手抄本在線閱讀
- 檢察官禮儀規(guī)范
- 汽車吊、隨車吊起重吊裝施工方案
- 2024年10月自考03291人際關(guān)系學(xué)試題及答案
- 外呼服務(wù)合同
- 漢聲數(shù)學(xué)繪本《數(shù)是怎么來(lái)的》
評(píng)論
0/150
提交評(píng)論