高性能計(jì)算機(jī)與曙光集群系統(tǒng)方案課件

上傳人：H*** IP屬地：貴州上傳時(shí)間：2022-07-27 格式：PPT 頁數(shù)：42 大?。?.79MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩37頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、高性能計(jì)算機(jī)和曙光機(jī)群系統(tǒng)提綱什么是高性能計(jì)算什么是高性能計(jì)算機(jī)集群系統(tǒng)什么是高性能計(jì)算？高性能計(jì)算HPC：High Performance Compute高性能計(jì)算-并行計(jì)算并行計(jì)算(Parallel Computing）高端計(jì)算(High-end Parallel Computing)高性能計(jì)算(High Performance Computing)超級計(jì)算(Super Computing)什么是高性能計(jì)算？計(jì)算科學(xué)與傳統(tǒng)的兩種科學(xué)，即理論科學(xué)和實(shí)驗(yàn)科學(xué)，并立被認(rèn)為是人類認(rèn)識自然的三大支柱，他們彼此相輔相成地推動科學(xué)發(fā)展與社會進(jìn)步。在許多情況下，或者是理論模型復(fù)雜甚至理論尚未建立，或者實(shí)驗(yàn)

2、費(fèi)用昂貴甚至無法進(jìn)行時(shí)，計(jì)算就成了求解問題的唯一或主要的手段。為什么要做高性能計(jì)算應(yīng)用需求為什么要做高性能計(jì)算人類對計(jì)算及性能的要求是無止境的從系統(tǒng)的角度：集成系統(tǒng)資源，以滿足不斷增長的對性能和功能的要求從應(yīng)用的角度：適當(dāng)分解應(yīng)用，以實(shí)現(xiàn)更大規(guī)?；蚋?xì)致的計(jì)算問題: 科學(xué)和工程問題的數(shù)值模擬與仿真計(jì)算密集數(shù)據(jù)密集網(wǎng)絡(luò)密集三種混合提綱高性能市場概要曙光和高性能計(jì)算機(jī)什么是高性能計(jì)算什么是高性能計(jì)算機(jī)集群系統(tǒng)什么是高性能計(jì)算機(jī)？由多個(gè)計(jì)算單元組成，運(yùn)算速度快、存儲容量大、可靠性高的計(jì)算機(jī)系統(tǒng)。也稱為：巨型計(jì)算機(jī)、超級計(jì)算機(jī)目前任何高性能計(jì)算和超級計(jì)算都離不開使用并行技術(shù)，所以高性能計(jì)算機(jī)肯定是并

3、行計(jì)算機(jī)。其發(fā)展歷程可以簡單的分為兩個(gè)時(shí)代專用時(shí)代包括向量機(jī)，MPP系統(tǒng)，SGI NUMA 系統(tǒng)，SUN大型SMP系統(tǒng)，也包括我國的神威，銀河，曙光1000等。之所以稱為“專用”，并不是說它們只能運(yùn)行某種應(yīng)用，是指它們的組成部件是專門設(shè)計(jì)的，它們的CPU板，內(nèi)存板，I/O板，操作系統(tǒng)，甚至I/O系統(tǒng)，都是不能在其它系統(tǒng)中使用的。由于技術(shù)上桌面系統(tǒng)與高端系統(tǒng)的巨大差異，和用戶群窄小。普及時(shí)代高性能計(jì)算機(jī)價(jià)格下降，應(yīng)用門檻降低，應(yīng)用開始普及。兩個(gè)技術(shù)趨勢起到重要作用。商品化趨勢使得大量生產(chǎn)的商品部件接近了高性能計(jì)算機(jī)專有部件標(biāo)準(zhǔn)化趨勢使得這些部件之間能夠集成一個(gè)系統(tǒng)中，其中X86處理器、以太網(wǎng)、內(nèi)

4、存部件、Linux都起到?jīng)Q定性作用。機(jī)群系統(tǒng)是高性能計(jì)算機(jī)的一種，它的技術(shù)基礎(chǔ)和工業(yè)基礎(chǔ)都是商品化和標(biāo)準(zhǔn)化。高性能計(jì)算機(jī)系統(tǒng)架構(gòu)并行向量機(jī)SMPDSM（NUMA）MPP，節(jié)點(diǎn)可以是單處理器的節(jié)點(diǎn)，也可以是SMP，DSMClusterConstellation 高性能計(jì)算機(jī)的制造廠商CraySGIIBM曙光銀河神威并行計(jì)算機(jī)系統(tǒng)類型Flynn分類：SISD, SIMD, MIMD, MISD結(jié)構(gòu)模型：PVP, SMP, MPP, DSM, COW訪存模型：UMA, NUMA, COMA, CC-NUMA, NORMA并行計(jì)算機(jī)分類Flynn分類Flynn(1972)提出指令流、數(shù)據(jù)流和多倍性概念

5、，把不同的計(jì)算機(jī)分為四大類：SISD（Single-Instruction Single-Data）SIMD（Single-Instruction Multi-Data）MISD（Multi-Instruction Single-Data）MIMD（Multi-Instruction Multi-Data）現(xiàn)代高性能計(jì)算機(jī)都屬于MIMD。MIMD從結(jié)構(gòu)上和訪存方式上，又可以分為：結(jié)構(gòu)模型：PVP, SMP, MPP, DSM, COW訪存模型：UMA, NUMA, COMA, CC-NUMA, NORMA結(jié)構(gòu)模型對稱多處理機(jī)系統(tǒng)(SMP)SMP對稱式共享存儲:任意處理器可直接訪問任意內(nèi)存地址,

6、且訪問延遲、帶寬、機(jī)率都是等價(jià)的; 系統(tǒng)是對稱的；微處理器: 一般少于64個(gè);處理器不能太多, 總線和交叉開關(guān)的一旦作成難于擴(kuò)展；例子: IBM R50, SGI Power Challenge, SUN Enterprise, 曙光一號;分布式共享存儲系統(tǒng)(DSM)DSM分布共享存儲: 內(nèi)存模塊物理上局部于各個(gè)處理器內(nèi)部,但邏輯上(用戶)是共享存儲的; 這種結(jié)構(gòu)也稱為基于Cache目錄的非一致內(nèi)存訪問(CC-NUMA)結(jié)構(gòu);局部與遠(yuǎn)程內(nèi)存訪問的延遲和帶寬不一致,3-10倍高性能并行程序設(shè)計(jì)注意;與SMP的主要區(qū)別：DSM在物理上有分布在各個(gè)節(jié)點(diǎn)的局部內(nèi)存從而形成一個(gè)共享的存儲器；微處理器:

7、16-128個(gè),幾百到千億次;代表: SGI Origin 2000, Cray T3D;大規(guī)模并行計(jì)算機(jī)系統(tǒng)(MPP)MPP物理和邏輯上均是分布內(nèi)存能擴(kuò)展至成百上千個(gè)處理器(微處理器或向量處理器)采用高通信帶寬和低延遲的互聯(lián)網(wǎng)絡(luò) (專門設(shè)計(jì)和定制的)一種異步的MIMD機(jī)器；程序系由多個(gè)進(jìn)程組成，每個(gè)都有其私有地址空間，進(jìn)程間采用傳遞消息相互作用；代表:CRAY T3E(2048), ASCI Red(3072), IBM SP2, 曙光1000機(jī)群系統(tǒng)(Cluster)Cluster每個(gè)節(jié)點(diǎn)都是一個(gè)完整的計(jì)算機(jī)各個(gè)節(jié)點(diǎn)通過高性能網(wǎng)絡(luò)相互連接網(wǎng)絡(luò)接口和I/O總線松耦合連接每個(gè)節(jié)點(diǎn)有完整的操作系

8、統(tǒng)曙光2000、 3000、4000, ASCI Blue Mountain訪存模型UMA:NORMA:NUMA:多處理機(jī)（單地址空間共享存儲器） UMA: Uniform Memory Access NUMA: Nonuniform Memory Access多計(jì)算機(jī)（多地址空間非共享存儲器） NORMA: No-Remote Memory Access結(jié)構(gòu)模型訪存模型UMA:NUMA:NORMA:多處理機(jī) & 多計(jì)算機(jī)UMA:NUMA:NORMA:多處理機(jī)(共享存儲) 多計(jì)算機(jī)(分布式存儲)并行計(jì)算機(jī)的性能指標(biāo)名稱符號含意單位機(jī)器規(guī)模n處理器的數(shù)目無量綱時(shí)鐘速率f時(shí)鐘周期長度的倒數(shù)

9、MHZ工作負(fù)載W計(jì)算操作的數(shù)目Mflop順序執(zhí)行時(shí)間T1程序在單處理機(jī)上的運(yùn)行時(shí)間s（秒）并行執(zhí)行時(shí)間T n程序在并行機(jī)上的運(yùn)行時(shí)間s（秒）速度R n = W/T n每秒百萬次浮點(diǎn)運(yùn)算Mflop/s加速Sn=T1/Tn衡量并行機(jī)有多快無量綱效率En = S n/n衡量處理器的利用率無量綱峰值速度R peak = n R peak所有處理器峰值速度之積， Rpeak為一個(gè)處理器的峰值速度Mflop/s利用率U =R n/R peak可達(dá)速度與峰值速度之比無量綱通信延遲to傳送0-字節(jié)或單字的時(shí)間s漸近帶寬r傳送長消息通信速率MB/s衡量系統(tǒng)性能的主要指標(biāo)(1)MIPS（百萬條指令每秒）理論計(jì)算：

10、處理器的時(shí)鐘頻率與平均每條指令所需的時(shí)鐘周期（Cycles Per Instruction）的比值 MIPS clock rate / CPI = (number of Instructions) / (CPU time)實(shí)際數(shù)值：對于一個(gè)應(yīng)用（程序），指令數(shù)目與運(yùn)行時(shí)間的比值 MIPS (number of Instructions) / (execution time) 衡量系統(tǒng)性能的主要指標(biāo)(2)MFLOPS（百萬次浮點(diǎn)運(yùn)算每秒）理論計(jì)算：系統(tǒng)的浮點(diǎn)計(jì)算部件每秒可以做的浮點(diǎn)計(jì)算次數(shù)； MFLOPS = (number of Floating Point compute Unit)NN為每

11、個(gè)浮點(diǎn)計(jì)算部件一個(gè)周期內(nèi)可以做的最多浮點(diǎn)操作數(shù)，對于目前常見的微處理器，一般為14；實(shí)際數(shù)值：對于一個(gè)應(yīng)用，浮點(diǎn)運(yùn)算數(shù)目與運(yùn)行時(shí)間的比值； MFLOPS = (number of floating operations) / (execution time) 兩個(gè)指標(biāo)的缺點(diǎn)都不能全面表征系統(tǒng)的性能MIPS指標(biāo)比較適用于事務(wù)處理領(lǐng)域；不同系統(tǒng)的指令不同，一條指令的功能和復(fù)雜度差別很大，如IBM的大型主機(jī)（Mainframe），價(jià)格達(dá)到千萬元的大型機(jī)（含配套軟件），其MIPS值一般為510，不及價(jià)值數(shù)千元的Pentium4 PC；非計(jì)算密集型的應(yīng)用（事務(wù)處理）對I/O要求高，計(jì)算密集型的應(yīng)用（圖

12、形程序）對主頻要求高。用戶對可靠性等特殊要求；應(yīng)用的需求不同，高性能計(jì)算領(lǐng)域也是“通才”難求，各有所長；某些特殊類型計(jì)算機(jī)適合特定的應(yīng)用。兩個(gè)指標(biāo)的缺點(diǎn)理論計(jì)算和實(shí)際測試的差別對于一個(gè)具體的應(yīng)用，可獲得的實(shí)際性能與理論峰值有相當(dāng)大的差距，即效率低的問題；應(yīng)用效率成為高性能計(jì)算的核心問題之一，受到普遍關(guān)注。加速比定律在并行計(jì)算系統(tǒng)，并行算法（并行程序）的執(zhí)行速度相對于串行算法（串行程序）加快的倍數(shù)，就是該并行算法（并行程序）的加速比；加速比是衡量“并行收益”的重要指標(biāo)；Amdahl定律適用于固定計(jì)算規(guī)模的加速比性能描述，Gustafson定律適用于可擴(kuò)展問題。 Amdahl定律S = (WS

13、+WP)/(WS+WP/p) = 1/(1/p+f(1-1/p)顯然，當(dāng)p時(shí)，S=1/f，即對于固定規(guī)模的問題，并行系統(tǒng)所能達(dá)到的加速上限為1/f一度引發(fā)了并行界部分人士的悲觀情緒Gustafson定律S=（WS+pwp）/（WS+WP） =p-f（p-1）=f+p（1-f）并行計(jì)算是為了解決大規(guī)模并行問題，可并行部分的比例是可擴(kuò)大的加速比與處理器數(shù)成斜率為（1-f）的線性關(guān)系這樣串行比例f就不再是程序擴(kuò)展性的瓶頸，當(dāng)然，f越低，斜率會越大，加速性能越好。Linpack采用主元高斯消去法求解雙精度稠密線性代數(shù)方程組，結(jié)果按每秒浮點(diǎn)運(yùn)算次數(shù)（flops）表示。包含三類測試，問題規(guī)模與優(yōu)化選擇各

14、不相同： 100100測試，在該測試中，不允許對Linpack測試程序進(jìn)行任何修改（包括注釋行）10001000測試，在該測試中，允許對算法和軟件進(jìn)行修改或替換，并盡量利用系統(tǒng)的硬件特點(diǎn)，以達(dá)到盡可能高的性能。但是所有的優(yōu)化都必須保持和標(biāo)準(zhǔn)算法如高斯消去法相同的相對精度，而且必須使用Linpack的主程序進(jìn)行調(diào)用。Linpack（續(xù)）HPL測試針對大規(guī)模并行計(jì)算系統(tǒng)的測試，其名稱為High Performance Linpack (HPL)，是第一個(gè)標(biāo)準(zhǔn)的公開版本并行Linpack測試軟件包，用于TOP500與國內(nèi)TOP100排名依據(jù)。使用者可以改變問題規(guī)模。有相當(dāng)大的優(yōu)化空間。NAS P

15、arallel BenchmarkNPB套件由八個(gè)程序組成每個(gè)基準(zhǔn)測試有五類：A、B、C、D、W (工作站)。A最小，D最大NPB套件以每秒百萬次運(yùn)算為單位輸出結(jié)果。整數(shù)排序(IS)快速Fourier變換（FT）多柵格基準(zhǔn)測試（MG）共軛梯度(CG) 基準(zhǔn)測試稀疏矩陣分解（LU）五對角方程（SP）和塊狀三角(BT)求解密集并行(EP)高性能計(jì)算機(jī)的最新發(fā)展?fàn)顩r頂天立地高端：低端：從單純關(guān)注性能到綜合評價(jià)高性能 vs 高效能性能 vs 使用硬件建設(shè) vs 綜合建設(shè)提綱高性能市場概要曙光和高性能計(jì)算機(jī)什么是高性能計(jì)算什么是高性能計(jì)算機(jī)集群系統(tǒng)什么是機(jī)群系統(tǒng)機(jī)群系統(tǒng)（Cluster）利用標(biāo)準(zhǔn)網(wǎng)絡(luò)將一臺臺普通服務(wù)器或者PC機(jī)連接起來，為使用者提供更高的計(jì)算能力和存儲能力并為使用者提供單一系統(tǒng)映象的系統(tǒng)。單一系統(tǒng)映象使用者在使用機(jī)群系統(tǒng)的時(shí)候感覺上就象使用一個(gè)單獨(dú)的計(jì)算機(jī)系統(tǒng)一樣。單一系統(tǒng)映象實(shí)現(xiàn)方法：硬件層、操作系統(tǒng)層、軟件層機(jī)群系統(tǒng)的優(yōu)勢極高的性價(jià)比大型機(jī)的主流良好的可擴(kuò)展性更高的可管理性更低的使用維護(hù)成本更好的可使用性更改的系統(tǒng)魯棒性更多的應(yīng)用支持機(jī)群使用越來越

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

高性能計(jì)算機(jī)與曙光集群系統(tǒng)方案課件

文檔簡介

溫馨提示

最新文檔

評論

高性能計(jì)算機(jī)與曙光集群系統(tǒng)方案課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔