高性能計(jì)算機(jī)與曙光集群系統(tǒng)方案課件_第1頁
高性能計(jì)算機(jī)與曙光集群系統(tǒng)方案課件_第2頁
高性能計(jì)算機(jī)與曙光集群系統(tǒng)方案課件_第3頁
高性能計(jì)算機(jī)與曙光集群系統(tǒng)方案課件_第4頁
高性能計(jì)算機(jī)與曙光集群系統(tǒng)方案課件_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、高性能計(jì)算機(jī)和曙光機(jī)群系統(tǒng)提綱什么是高性能計(jì)算什么是高性能計(jì)算機(jī)集群系統(tǒng)什么是高性能計(jì)算?高性能計(jì)算HPC:High Performance Compute高性能計(jì)算-并行計(jì)算并行計(jì)算(Parallel Computing)高端計(jì)算(High-end Parallel Computing)高性能計(jì)算(High Performance Computing)超級計(jì)算(Super Computing)什么是高性能計(jì)算?計(jì)算科學(xué)與傳統(tǒng)的兩種科學(xué),即理論科學(xué)和實(shí)驗(yàn)科學(xué),并立被認(rèn)為是人類認(rèn)識自然的三大支柱,他們彼此相輔相成地推動科學(xué)發(fā)展與社會進(jìn)步。在許多情況下,或者是理論模型復(fù)雜甚至理論尚未建立,或者實(shí)驗(yàn)

2、費(fèi)用昂貴甚至無法進(jìn)行時(shí),計(jì)算就成了求解問題的唯一或主要的手段。為什么要做高性能計(jì)算 應(yīng)用需求為什么要做高性能計(jì)算人類對計(jì)算及性能的要求是無止境的從系統(tǒng)的角度:集成系統(tǒng)資源,以滿足不斷增長的對性能和功能的要求從應(yīng)用的角度:適當(dāng)分解應(yīng)用,以實(shí)現(xiàn)更大規(guī)?;蚋?xì)致的計(jì)算問題: 科學(xué)和工程問題的數(shù)值模擬與仿真計(jì)算密集數(shù)據(jù)密集網(wǎng)絡(luò)密集三種混合提綱高性能市場概要曙光和高性能計(jì)算機(jī)什么是高性能計(jì)算什么是高性能計(jì)算機(jī)集群系統(tǒng)什么是高性能計(jì)算機(jī)?由多個(gè)計(jì)算單元組成,運(yùn)算速度快、存儲容量大、可靠性高的計(jì)算機(jī)系統(tǒng)。也稱為:巨型計(jì)算機(jī)、超級計(jì)算機(jī)目前任何高性能計(jì)算和超級計(jì)算都離不開使用并行技術(shù),所以高性能計(jì)算機(jī)肯定是并

3、行計(jì)算機(jī)。其發(fā)展歷程可以簡單的分為兩個(gè)時(shí)代專用時(shí)代包括向量機(jī),MPP系統(tǒng),SGI NUMA 系統(tǒng),SUN大型SMP系統(tǒng),也包括我國的神威,銀河,曙光1000等。之所以稱為“專用”,并不是說它們只能運(yùn)行某種應(yīng)用,是指它們的組成部件是專門設(shè)計(jì)的,它們的CPU板,內(nèi)存板,I/O板,操作系統(tǒng),甚至I/O系統(tǒng),都是不能在其它系統(tǒng)中使用的。由于技術(shù)上桌面系統(tǒng)與高端系統(tǒng)的巨大差異,和用戶群窄小。普及時(shí)代高性能計(jì)算機(jī)價(jià)格下降,應(yīng)用門檻降低,應(yīng)用開始普及。兩個(gè)技術(shù)趨勢起到重要作用。商品化趨勢使得大量生產(chǎn)的商品部件接近了高性能計(jì)算機(jī)專有部件標(biāo)準(zhǔn)化趨勢使得這些部件之間能夠集成一個(gè)系統(tǒng)中,其中X86處理器、以太網(wǎng)、內(nèi)

4、存部件、Linux都起到?jīng)Q定性作用。機(jī)群系統(tǒng)是高性能計(jì)算機(jī)的一種,它的技術(shù)基礎(chǔ)和工業(yè)基礎(chǔ)都是商品化和標(biāo)準(zhǔn)化。高性能計(jì)算機(jī)系統(tǒng)架構(gòu)并行向量機(jī)SMPDSM(NUMA)MPP,節(jié)點(diǎn)可以是單處理器的節(jié)點(diǎn),也可以是SMP,DSMClusterConstellation 高性能計(jì)算機(jī)的制造廠商CraySGIIBM曙光銀河神威并行計(jì)算機(jī)系統(tǒng)類型Flynn分類:SISD, SIMD, MIMD, MISD結(jié)構(gòu)模型:PVP, SMP, MPP, DSM, COW訪存模型:UMA, NUMA, COMA, CC-NUMA, NORMA并行計(jì)算機(jī)分類Flynn分類Flynn(1972)提出指令流、數(shù)據(jù)流和多倍性概念

5、,把不同的計(jì)算機(jī)分為四大類:SISD(Single-Instruction Single-Data)SIMD(Single-Instruction Multi-Data)MISD(Multi-Instruction Single-Data)MIMD(Multi-Instruction Multi-Data)現(xiàn)代高性能計(jì)算機(jī)都屬于MIMD。MIMD從結(jié)構(gòu)上和訪存方式上,又可以分為:結(jié)構(gòu)模型:PVP, SMP, MPP, DSM, COW訪存模型:UMA, NUMA, COMA, CC-NUMA, NORMA結(jié)構(gòu)模型對稱多處理機(jī)系統(tǒng)(SMP)SMP對稱式共享存儲:任意處理器可直接訪問任意內(nèi)存地址,

6、且訪問延遲、帶寬、機(jī)率都是等價(jià)的; 系統(tǒng)是對稱的;微處理器: 一般少于64個(gè);處理器不能太多, 總線和交叉開關(guān)的一旦作成難于擴(kuò)展;例子: IBM R50, SGI Power Challenge, SUN Enterprise, 曙光一號;分布式共享存儲系統(tǒng)(DSM)DSM分布共享存儲: 內(nèi)存模塊物理上局部于各個(gè)處理器內(nèi)部,但邏輯上(用戶)是共享存儲的; 這種結(jié)構(gòu)也稱為基于Cache目錄的非一致內(nèi)存訪問(CC-NUMA)結(jié)構(gòu);局部與遠(yuǎn)程內(nèi)存訪問的延遲和帶寬不一致,3-10倍高性能并行程序設(shè)計(jì)注意;與SMP的主要區(qū)別:DSM在物理上有分布在各個(gè)節(jié)點(diǎn)的局部內(nèi)存從而形成一個(gè)共享的存儲器;微處理器:

7、16-128個(gè),幾百到千億次;代表: SGI Origin 2000, Cray T3D;大規(guī)模并行計(jì)算機(jī)系統(tǒng)(MPP)MPP物理和邏輯上均是分布內(nèi)存能擴(kuò)展至成百上千個(gè)處理器(微處理器或向量處理器)采用高通信帶寬和低延遲的互聯(lián)網(wǎng)絡(luò) (專門設(shè)計(jì)和定制的)一種異步的MIMD機(jī)器;程序系由多個(gè)進(jìn)程組成,每個(gè)都有其私有地址空間,進(jìn)程間采用傳遞消息相互作用;代表:CRAY T3E(2048), ASCI Red(3072), IBM SP2, 曙光1000機(jī)群系統(tǒng)(Cluster)Cluster每個(gè)節(jié)點(diǎn)都是一個(gè)完整的計(jì)算機(jī)各個(gè)節(jié)點(diǎn)通過高性能網(wǎng)絡(luò)相互連接網(wǎng)絡(luò)接口和I/O總線松耦合連接每個(gè)節(jié)點(diǎn)有完整的操作系

8、統(tǒng)曙光2000、 3000、4000, ASCI Blue Mountain訪存模型UMA:NORMA:NUMA:多處理機(jī)(單地址空間共享存儲器) UMA: Uniform Memory Access NUMA: Nonuniform Memory Access多計(jì)算機(jī)(多地址空間非共享存儲器) NORMA: No-Remote Memory Access結(jié)構(gòu)模型訪存模型UMA:NUMA:NORMA:多處理機(jī) & 多計(jì)算機(jī)UMA:NUMA:NORMA:多處理機(jī)(共享存儲) 多計(jì)算機(jī)(分布式存儲)并行計(jì)算機(jī)的性能指標(biāo)名 稱符 號含 意單 位機(jī)器規(guī)模n處理器的數(shù)目無量綱時(shí)鐘速率f時(shí)鐘周期長度的倒數(shù)

9、MHZ工作負(fù)載W計(jì)算操作的數(shù)目Mflop順序執(zhí)行時(shí)間T1程序在單處理機(jī)上的運(yùn)行時(shí)間s(秒)并行執(zhí)行時(shí)間T n程序在并行機(jī)上的運(yùn)行時(shí)間s(秒)速度R n = W/T n每秒百萬次浮點(diǎn)運(yùn)算Mflop/s加速Sn=T1/Tn衡量并行機(jī)有多快無量綱效率En = S n/n衡量處理器的利用率無量綱峰值速度R peak = n R peak所有處理器峰值速度之積, Rpeak為一個(gè)處理器的峰值速度Mflop/s利用率U =R n/R peak可達(dá)速度與峰值速度之比無量綱通信延遲to傳送0-字節(jié)或單字的時(shí)間s漸近帶寬r傳送長消息通信速率MB/s衡量系統(tǒng)性能的主要指標(biāo)(1)MIPS(百萬條指令每秒)理論計(jì)算:

10、處理器的時(shí)鐘頻率與平均每條指令所需的時(shí)鐘周期(Cycles Per Instruction)的比值 MIPS clock rate / CPI = (number of Instructions) / (CPU time)實(shí)際數(shù)值:對于一個(gè)應(yīng)用(程序),指令數(shù)目與運(yùn)行時(shí)間的比值 MIPS (number of Instructions) / (execution time) 衡量系統(tǒng)性能的主要指標(biāo)(2)MFLOPS(百萬次浮點(diǎn)運(yùn)算每秒)理論計(jì)算:系統(tǒng)的浮點(diǎn)計(jì)算部件每秒可以做的浮點(diǎn)計(jì)算次數(shù); MFLOPS = (number of Floating Point compute Unit)NN為每

11、個(gè)浮點(diǎn)計(jì)算部件一個(gè)周期內(nèi)可以做的最多浮點(diǎn)操作數(shù),對于目前常見的微處理器,一般為14;實(shí)際數(shù)值:對于一個(gè)應(yīng)用,浮點(diǎn)運(yùn)算數(shù)目與運(yùn)行時(shí)間的比值; MFLOPS = (number of floating operations) / (execution time) 兩個(gè)指標(biāo)的缺點(diǎn)都不能全面表征系統(tǒng)的性能MIPS指標(biāo)比較適用于事務(wù)處理領(lǐng)域;不同系統(tǒng)的指令不同,一條指令的功能和復(fù)雜度差別很大, 如IBM的大型主機(jī)(Mainframe),價(jià)格達(dá)到千萬元的大型機(jī)(含配套軟件),其MIPS值一般為510,不及價(jià)值數(shù)千元的Pentium4 PC;非計(jì)算密集型的應(yīng)用(事務(wù)處理)對I/O要求高,計(jì)算密集型的應(yīng)用(圖

12、形程序)對主頻要求高。用戶對可靠性等特殊要求;應(yīng)用的需求不同,高性能計(jì)算領(lǐng)域也是“通才”難求,各有所長;某些特殊類型計(jì)算機(jī)適合特定的應(yīng)用。 兩個(gè)指標(biāo)的缺點(diǎn)理論計(jì)算和實(shí)際測試的差別對于一個(gè)具體的應(yīng)用,可獲得的實(shí)際性能與理論峰值有相當(dāng)大的差距,即效率低的問題;應(yīng)用效率成為高性能計(jì)算的核心問題之一,受到普遍關(guān)注。 加速比定律在并行計(jì)算系統(tǒng),并行算法(并行程序)的執(zhí)行速度相對于串行算法(串行程序)加快的倍數(shù),就是該并行算法(并行程序)的加速比;加速比是衡量“并行收益”的重要指標(biāo);Amdahl定律適用于固定計(jì)算規(guī)模的加速比性能描述,Gustafson定律適用于可擴(kuò)展問題。 Amdahl定律S = (WS

13、+WP)/(WS+WP/p) = 1/(1/p+f(1-1/p)顯然,當(dāng)p時(shí),S=1/f,即對于固定規(guī)模的問題,并行系統(tǒng)所能達(dá)到的加速上限為1/f一度引發(fā)了并行界部分人士的悲觀情緒Gustafson定律S=(WS+pwp)/(WS+WP) =p-f(p-1)=f+p(1-f)并行計(jì)算是為了解決大規(guī)模并行問題,可并行部分的比例是可擴(kuò)大的加速比與處理器數(shù)成斜率為(1-f)的線性關(guān)系這樣串行比例f就不再是程序擴(kuò)展性的瓶頸,當(dāng)然,f越低,斜率會越大,加速性能越好。Linpack采用主元高斯消去法求解雙精度稠密線性代數(shù)方 程組,結(jié)果按每秒浮點(diǎn)運(yùn)算次數(shù)(flops)表示。包含三類測試,問題規(guī)模與優(yōu)化選擇各

14、不相同: 100100測試 ,在該測試中,不允許對Linpack測試程序進(jìn)行任何修改(包括注釋行)10001000測試,在該測試中,允許對算法和軟件進(jìn)行修改或替換,并盡量利用系統(tǒng)的硬件特點(diǎn),以達(dá)到盡可能高的性能。但是所有的優(yōu)化都必須保持和標(biāo)準(zhǔn)算法如高斯消去法相同的相對精度,而且必須使用Linpack的主程序進(jìn)行調(diào)用。Linpack(續(xù))HPL測試 針對大規(guī)模并行計(jì)算系統(tǒng)的測試,其名稱為High Performance Linpack (HPL),是第一個(gè)標(biāo)準(zhǔn)的公開版本并行Linpack測試軟件包,用于TOP500與國內(nèi)TOP100排名依據(jù)。使用者可以改變問題規(guī)模。有相當(dāng)大的優(yōu)化空間。NAS P

15、arallel BenchmarkNPB套件由八個(gè)程序組成每個(gè)基準(zhǔn)測試有五類:A、B、C、D、W (工作站)。A最小,D最大NPB套件以每秒百萬次運(yùn)算為單位輸出結(jié)果。整數(shù)排序(IS)快速Fourier變換(FT)多柵格基準(zhǔn)測試(MG) 共軛梯度(CG) 基準(zhǔn)測試 稀疏矩陣分解(LU) 五對角方程(SP)和塊狀三角(BT)求解 密集并行(EP)高性能計(jì)算機(jī)的最新發(fā)展?fàn)顩r頂天立地高端:低端:從單純關(guān)注性能到綜合評價(jià)高性能 vs 高效能性能 vs 使用硬件建設(shè) vs 綜合建設(shè)提綱高性能市場概要曙光和高性能計(jì)算機(jī)什么是高性能計(jì)算什么是高性能計(jì)算機(jī)集群系統(tǒng)什么是機(jī)群系統(tǒng)機(jī)群系統(tǒng)(Cluster)利用標(biāo)準(zhǔn)網(wǎng)絡(luò)將一臺臺普通服務(wù)器或者PC機(jī)連接起來,為使用者提供更高的計(jì)算能力和存儲能力并為使用者提供單一系統(tǒng)映象的系統(tǒng)。單一系統(tǒng)映象使用者在使用機(jī)群系統(tǒng)的時(shí)候感覺上就象使用一個(gè)單獨(dú)的計(jì)算機(jī)系統(tǒng)一樣。單一系統(tǒng)映象實(shí)現(xiàn)方法:硬件層、操作系統(tǒng)層、軟件層機(jī)群系統(tǒng)的優(yōu)勢極高的性價(jià)比大型機(jī)的主流良好的可擴(kuò)展性更高的可管理性更低的使用維護(hù)成本更好的可使用性更改的系統(tǒng)魯棒性更多的應(yīng)用支持機(jī)群使用越來越

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論