多核處理器的方興未艾_第1頁
多核處理器的方興未艾_第2頁
多核處理器的方興未艾_第3頁
多核處理器的方興未艾_第4頁
多核處理器的方興未艾_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、多核處多核處理器理器曇花曇花一現(xiàn)?一現(xiàn)?方興方興未艾?未艾?僅僅提高單核芯片的速僅僅提高單核芯片的速度會(huì)產(chǎn)生過多熱量度會(huì)產(chǎn)生過多熱量,處處理器產(chǎn)生的熱量很快會(huì)理器產(chǎn)生的熱量很快會(huì)超過太陽表面。超過太陽表面。隨著處理器速度的隨著處理器速度的急驟加快,所面臨的內(nèi)急驟加快,所面臨的內(nèi)存瓶頸及日益增加的電存瓶頸及日益增加的電力消耗、芯片高溫等問力消耗、芯片高溫等問題驟然擺在科技人員面題驟然擺在科技人員面前?,F(xiàn)有的冷卻系統(tǒng)不前?,F(xiàn)有的冷卻系統(tǒng)不僅需要高昂的代價(jià),且僅需要高昂的代價(jià),且冷卻性能已經(jīng)達(dá)到飽和。冷卻性能已經(jīng)達(dá)到飽和。多核處理器的橫空出世,多核處理器的橫空出世,及時(shí)地緩解了現(xiàn)時(shí)存在的危及時(shí)地緩解

2、了現(xiàn)時(shí)存在的危機(jī),且整體上又進(jìn)一步提高機(jī),且整體上又進(jìn)一步提高了計(jì)算機(jī)系統(tǒng)的綜合性能。了計(jì)算機(jī)系統(tǒng)的綜合性能。CMP(chip multiprocessor)片上片上多核處理器多核處理器同構(gòu)異構(gòu)多核,即在一個(gè)單芯片上面集成兩個(gè)多核,即在一個(gè)單芯片上面集成兩個(gè)甚至更多個(gè)處理器內(nèi)核,其中每個(gè)內(nèi)甚至更多個(gè)處理器內(nèi)核,其中每個(gè)內(nèi)核都有自己的邏輯單元、控制單元、核都有自己的邏輯單元、控制單元、中斷處理器、運(yùn)算單元,一級(jí)中斷處理器、運(yùn)算單元,一級(jí)cache、二級(jí)二級(jí)cache共享或獨(dú)有,其部件的完整共享或獨(dú)有,其部件的完整性和單核處理器內(nèi)核相比完全一致。性和單核處理器內(nèi)核相比完全一致。早在早在1975年,

3、戈登年,戈登摩爾提出了計(jì)算機(jī)處摩爾提出了計(jì)算機(jī)處理器的發(fā)展規(guī)律,即:理器的發(fā)展規(guī)律,即:“10年內(nèi),半導(dǎo)體芯片年內(nèi),半導(dǎo)體芯片上集成的晶體管和電阻數(shù)量將會(huì)以每上集成的晶體管和電阻數(shù)量將會(huì)以每18個(gè)月翻個(gè)月翻一倍的速度增長一倍的速度增長”。這個(gè)規(guī)律雖然被摩爾先生。這個(gè)規(guī)律雖然被摩爾先生限定在限定在10年以內(nèi),也曾提出警告,認(rèn)為年以內(nèi),也曾提出警告,認(rèn)為“摩爾摩爾法則法則”無法繼續(xù)有效,但是計(jì)算機(jī)硬件領(lǐng)域卻無法繼續(xù)有效,但是計(jì)算機(jī)硬件領(lǐng)域卻始終致力于履行這一定律。時(shí)至今日,始終致力于履行這一定律。時(shí)至今日,CPU上上集成的晶體管數(shù)量應(yīng)該達(dá)到數(shù)十億之多。顯然,集成的晶體管數(shù)量應(yīng)該達(dá)到數(shù)十億之多。顯然

4、,今天的現(xiàn)實(shí)讓人們無法不清醒,目前再繼續(xù)通今天的現(xiàn)實(shí)讓人們無法不清醒,目前再繼續(xù)通過增加晶體管的數(shù)量來提高計(jì)算性能已經(jīng)遇到過增加晶體管的數(shù)量來提高計(jì)算性能已經(jīng)遇到了瓶頸。了瓶頸。在整體結(jié)構(gòu)設(shè)計(jì)上,在整體結(jié)構(gòu)設(shè)計(jì)上,CMP與傳統(tǒng)的單處與傳統(tǒng)的單處理器相比,多核內(nèi)部結(jié)構(gòu)沒有固定的組織形理器相比,多核內(nèi)部結(jié)構(gòu)沒有固定的組織形式,可以有很多種實(shí)現(xiàn)方式。通常,人們把式,可以有很多種實(shí)現(xiàn)方式。通常,人們把多核處理器分為兩大類:同構(gòu)多核和異構(gòu)多多核處理器分為兩大類:同構(gòu)多核和異構(gòu)多核。核。計(jì)算內(nèi)核相同,地位對(duì)等的稱為同構(gòu)多計(jì)算內(nèi)核相同,地位對(duì)等的稱為同構(gòu)多核,現(xiàn)在核,現(xiàn)在Intel和和AMD的雙核處理器就是

5、同構(gòu)的雙核處理器就是同構(gòu)雙核處理器。計(jì)算內(nèi)核不同,地位不對(duì)等的雙核處理器。計(jì)算內(nèi)核不同,地位不對(duì)等的則稱為異構(gòu)多核,異構(gòu)多核多采用則稱為異構(gòu)多核,異構(gòu)多核多采用“主處理主處理核核+協(xié)處理核協(xié)處理核”的設(shè)計(jì),的設(shè)計(jì),IBM和和Sony聯(lián)合研制聯(lián)合研制的的Cell就是典型代表。就是典型代表。Hydra處理器結(jié)構(gòu)處理器結(jié)構(gòu)Hydra是由美國斯坦福大學(xué)于是由美國斯坦福大學(xué)于1996年研制的四年研制的四核處理器結(jié)構(gòu),在當(dāng)時(shí)是一項(xiàng)極具前瞻性的研究。核處理器結(jié)構(gòu),在當(dāng)時(shí)是一項(xiàng)極具前瞻性的研究。它的每個(gè)核心通過總線結(jié)構(gòu)實(shí)現(xiàn)共享二級(jí)緩存、它的每個(gè)核心通過總線結(jié)構(gòu)實(shí)現(xiàn)共享二級(jí)緩存、存儲(chǔ)器接口和存儲(chǔ)器接口和I/O接

6、口?,F(xiàn)今被認(rèn)為是同構(gòu)多核的接口。現(xiàn)今被認(rèn)為是同構(gòu)多核的典型代表。由于最初的多核處理器集成的處理器典型代表。由于最初的多核處理器集成的處理器核數(shù)量較小,所以,最大的特點(diǎn)就是應(yīng)用總線和核數(shù)量較小,所以,最大的特點(diǎn)就是應(yīng)用總線和交換開關(guān)的方式進(jìn)行互連,并且各個(gè)核的結(jié)構(gòu)相交換開關(guān)的方式進(jìn)行互連,并且各個(gè)核的結(jié)構(gòu)相似、功能也較為強(qiáng)大。多核發(fā)展至今,我們不妨似、功能也較為強(qiáng)大。多核發(fā)展至今,我們不妨把把Hydra的這種設(shè)計(jì)看作是同構(gòu)多核的始祖。的這種設(shè)計(jì)看作是同構(gòu)多核的始祖。Cell處理器結(jié)構(gòu)處理器結(jié)構(gòu)Cell是由是由IBM與與Sony合作研發(fā)的多核處理器,也是第合作研發(fā)的多核處理器,也是第一款投入實(shí)際商

7、用的多核處理器。它主要由一款投入實(shí)際商用的多核處理器。它主要由PowerPC通用通用處理器處理器(power processing element,PPE)和和8個(gè)協(xié)處理器個(gè)協(xié)處理器(synergistic processing element,SPE)組成,通過一條高速組成,通過一條高速總線(總線(EIB)進(jìn)行連接。)進(jìn)行連接。PPE是一個(gè)有二級(jí)緩存結(jié)構(gòu)的是一個(gè)有二級(jí)緩存結(jié)構(gòu)的64位位PowerPC處理核心,可以同時(shí)提取處理核心,可以同時(shí)提取4條指令和兩種結(jié)果,條指令和兩種結(jié)果,負(fù)責(zé)運(yùn)行基本程序和協(xié)調(diào)負(fù)責(zé)運(yùn)行基本程序和協(xié)調(diào)SPE間任務(wù)的運(yùn)行;間任務(wù)的運(yùn)行;SPE是一個(gè)使是一個(gè)使用本地存儲(chǔ)器的

8、用本地存儲(chǔ)器的32位微處理器,無緩存結(jié)構(gòu),負(fù)責(zé)從事浮位微處理器,無緩存結(jié)構(gòu),負(fù)責(zé)從事浮點(diǎn)運(yùn)算;點(diǎn)運(yùn)算;EIB連接連接PPE、SPE和外部和外部I/O。Cell的這種不對(duì)稱的這種不對(duì)稱結(jié)構(gòu)被認(rèn)為是一種典型的異構(gòu)多核結(jié)構(gòu),也正是這種架構(gòu)結(jié)構(gòu)被認(rèn)為是一種典型的異構(gòu)多核結(jié)構(gòu),也正是這種架構(gòu)為為EIB和高速內(nèi)存提供了足夠的數(shù)據(jù)通路,和高速內(nèi)存提供了足夠的數(shù)據(jù)通路,3.2GHz處理器處理器的單精度浮點(diǎn)運(yùn)算的峰值就可以達(dá)到的單精度浮點(diǎn)運(yùn)算的峰值就可以達(dá)到200GFs,而同時(shí)期英,而同時(shí)期英特爾同頻率的特爾同頻率的Pentium4處理器的峰值僅處理器的峰值僅25.6GFs。目前,主流的雙核和四核處理器基本目前

9、,主流的雙核和四核處理器基本上都采用同構(gòu)結(jié)構(gòu)。隨著集成核心數(shù)量的上都采用同構(gòu)結(jié)構(gòu)。隨著集成核心數(shù)量的不斷增加,同構(gòu)多核設(shè)計(jì)面臨的主要問題不斷增加,同構(gòu)多核設(shè)計(jì)面臨的主要問題就是如何保持各個(gè)核心的數(shù)據(jù)一致性以及就是如何保持各個(gè)核心的數(shù)據(jù)一致性以及滿足核心的存儲(chǔ)訪問與滿足核心的存儲(chǔ)訪問與I/O訪問需求。與同訪問需求。與同構(gòu)相比,異構(gòu)的優(yōu)勢(shì)是可以通過組織不同構(gòu)相比,異構(gòu)的優(yōu)勢(shì)是可以通過組織不同特點(diǎn)的核心來優(yōu)化處理器的內(nèi)部結(jié)構(gòu),從特點(diǎn)的核心來優(yōu)化處理器的內(nèi)部結(jié)構(gòu),從而實(shí)現(xiàn)處理器性能的最佳化和功耗最小化。而實(shí)現(xiàn)處理器性能的最佳化和功耗最小化。當(dāng)然,異構(gòu)多核設(shè)計(jì)也面臨著一些難點(diǎn),當(dāng)然,異構(gòu)多核設(shè)計(jì)也面臨著

10、一些難點(diǎn),比如不同的核心如何搭配,核心間任務(wù)如比如不同的核心如何搭配,核心間任務(wù)如何分配等。何分配等。Harbin Engineering University多多核處理器的關(guān)鍵技術(shù)分析核處理器的關(guān)鍵技術(shù)分析 核結(jié)構(gòu)研究核結(jié)構(gòu)研究:同構(gòu)或異構(gòu)同構(gòu)或異構(gòu) 程序執(zhí)行模型程序執(zhí)行模型 Cache設(shè)計(jì)設(shè)計(jì):多級(jí)多級(jí)Cache設(shè)計(jì)與一致性問題設(shè)計(jì)與一致性問題 核間通信技術(shù)核間通信技術(shù) 總線設(shè)計(jì)總線設(shè)計(jì) 操作系統(tǒng)設(shè)計(jì)操作系統(tǒng)設(shè)計(jì):任務(wù)調(diào)度、中斷處理、同步互斥任務(wù)調(diào)度、中斷處理、同步互斥 低功耗設(shè)計(jì)低功耗設(shè)計(jì) 存儲(chǔ)器墻存儲(chǔ)器墻 可靠性及安全性設(shè)計(jì)可靠性及安全性設(shè)計(jì) 多核編程比單個(gè)編程更講究程序的架構(gòu)、多核編

11、程比單個(gè)編程更講究程序的架構(gòu)、任務(wù)的分配以及每個(gè)處理機(jī)的負(fù)載?,F(xiàn)在使用任務(wù)的分配以及每個(gè)處理機(jī)的負(fù)載?,F(xiàn)在使用比較廣泛的多核編程工具是面向共享存儲(chǔ)機(jī)制比較廣泛的多核編程工具是面向共享存儲(chǔ)機(jī)制的的openMP。他是一種工業(yè)標(biāo)準(zhǔn)的。他是一種工業(yè)標(biāo)準(zhǔn)的API設(shè)計(jì)規(guī)范,設(shè)計(jì)規(guī)范,可以很方便的設(shè)計(jì)新的并行應(yīng)用程序或并行化可以很方便的設(shè)計(jì)新的并行應(yīng)用程序或并行化現(xiàn)有串行應(yīng)用程序?,F(xiàn)有串行應(yīng)用程序。OpenMP支持支持C語言、語言、C+和和Fortran,同時(shí),同時(shí)OpenMp提供了對(duì)并行算法的提供了對(duì)并行算法的高層的抽象描述,程序員可以通過在高層的抽象描述,程序員可以通過在源代碼源代碼中中加入專用的加入專

12、用的pragma來指明自己的意圖,由此來指明自己的意圖,由此編譯器可以自動(dòng)將程序進(jìn)行并行化,并在必要編譯器可以自動(dòng)將程序進(jìn)行并行化,并在必要之處加入同步互斥以及通信。之處加入同步互斥以及通信。舉一個(gè)簡單的小程序,例如我們想把下面的程序并行化:舉一個(gè)簡單的小程序,例如我們想把下面的程序并行化:#include#includeVoid Test( int n)for( int i=0;i=10; +i)printf(“%d”,n);int main( int argc, char*argv)for( int i=0;i10;i+)Test(i);system(“pause”);利用利用openMP

13、,將,將main()函數(shù)并行化處理。修改如下:()函數(shù)并行化處理。修改如下:#include #include #include Void Test (int n) for ( int i = 0; i 10; +i) printf(%d, , n); int main(int argc, char* argv) #pragma omp parallel for for(int i = 0; i10; +i) Test( i ); system(pause);第一個(gè)程序的執(zhí)行結(jié)果是:第一個(gè)程序的執(zhí)行結(jié)果是:0, 1, 2, 3, 4, 5, 6, 7, 8, 9。第二個(gè)程序的執(zhí)行結(jié)果是:。第二

14、個(gè)程序的執(zhí)行結(jié)果是:0, 5, 1, 6, 2, 7, 3, 8, 4, 9。造成兩個(gè)程序的輸出結(jié)果不。造成兩個(gè)程序的輸出結(jié)果不同的原因是:同的原因是:openMP是將是將0-9十個(gè)步驟,拆十個(gè)步驟,拆成成0-4,5-9兩部份分別執(zhí)行的。兩部份分別執(zhí)行的。OpenMP的一個(gè)缺點(diǎn)是不能在非共享內(nèi)的一個(gè)缺點(diǎn)是不能在非共享內(nèi)存系統(tǒng)存系統(tǒng)(如計(jì)算機(jī)集群如計(jì)算機(jī)集群)上使用。在這樣的系上使用。在這樣的系統(tǒng)上,統(tǒng)上,MPI使用較多。使用較多。MPI是一個(gè)消息傳遞接是一個(gè)消息傳遞接口,如今已經(jīng)成為消息傳遞的并行編程標(biāo)準(zhǔn)。口,如今已經(jīng)成為消息傳遞的并行編程標(biāo)準(zhǔn)??删幊绦允嵌嗪颂幚砥髅媾R可編程性是多核處理器面臨

15、的一大問題。一旦核心不只一個(gè),的一大問題。一旦核心不只一個(gè),就需要執(zhí)行程序能夠并行處理。就需要執(zhí)行程序能夠并行處理。盡管在并行計(jì)算上,人類已經(jīng)探盡管在并行計(jì)算上,人類已經(jīng)探索了超過索了超過40多年的時(shí)間,但編寫、多年的時(shí)間,但編寫、調(diào)試、優(yōu)化并行處理程序的能力調(diào)試、優(yōu)化并行處理程序的能力還非常弱。還非常弱。另外一方面,多數(shù)應(yīng)用的并行加速潛力另外一方面,多數(shù)應(yīng)用的并行加速潛力有限是因?yàn)楫?dāng)前在實(shí)際應(yīng)用中,可供程序員有限是因?yàn)楫?dāng)前在實(shí)際應(yīng)用中,可供程序員迅速開發(fā)出來的程序還是單線程的,同時(shí)多迅速開發(fā)出來的程序還是單線程的,同時(shí)多數(shù)應(yīng)用也是用數(shù)應(yīng)用也是用C或或c+編寫的,它們一直被設(shè)編寫的,它們一直被

16、設(shè)計(jì)為單線程,而單線程程序中所能開發(fā)和利計(jì)為單線程,而單線程程序中所能開發(fā)和利用的并行性始終是有限的。所以對(duì)于這些應(yīng)用的并行性始終是有限的。所以對(duì)于這些應(yīng)用,要么重新編寫并行代碼,要么研發(fā)面向用,要么重新編寫并行代碼,要么研發(fā)面向多核結(jié)構(gòu)的自動(dòng)并行化工具,使得這些應(yīng)用多核結(jié)構(gòu)的自動(dòng)并行化工具,使得這些應(yīng)用能在多核處理器系統(tǒng)中高效應(yīng)用。能在多核處理器系統(tǒng)中高效應(yīng)用。多核處理器產(chǎn)生的直接原因是多核處理器產(chǎn)生的直接原因是替代單處理器、解決微處理器的發(fā)替代單處理器、解決微處理器的發(fā)展瓶頸,但發(fā)展多核的深層次原因展瓶頸,但發(fā)展多核的深層次原因還是為了滿足人類社會(huì)對(duì)計(jì)算性能還是為了滿足人類社會(huì)對(duì)計(jì)算性能的無止境需求,即便是現(xiàn)在已經(jīng)有的無止境需求,即便是現(xiàn)在已經(jīng)有效地將多核性能提高到了一個(gè)新的效地將多核性能提高到了一個(gè)新的水平,可是人們對(duì)性能的渴望并未水平,可是人們對(duì)性能的渴望并未就此泯滅。就此泯滅??傊?,微處理器的發(fā)展正處在歷總之,微處理器的發(fā)展正處在歷史的轉(zhuǎn)折點(diǎn)?;ヂ?lián)網(wǎng)的普

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論