版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、1,A,多核處理器體系結(jié)構(gòu)及并行程序設(shè)計,天津大學(xué) 于策 yuce_air,A,2,Outline,多核處理器簡介 并行程序設(shè)計方法學(xué)(PCAM) 科研及技術(shù)(天津大學(xué)SRDC及IBM技術(shù)中心),A,3,Outline,多核處理器簡介 并行程序設(shè)計方法學(xué)(PCAM) 科研及技術(shù)(天津大學(xué)SRDC及IBM技術(shù)中心),A,4,什么是多核處理器?,兩個或多個獨立運行的內(nèi)核集成于同一個處理器上面 雙核處理器 =一個處理器上包含2個內(nèi)核 多核處理器 = 一個處理器上包含2個或多個內(nèi)核,A,5,為什么要采用多核技術(shù)?,A,6,最終目標(biāo): 提升用戶的體驗,摩爾定律 不斷發(fā)展和改進處理器的性能 最大限度地利用
2、越來越多的晶體管 實現(xiàn)最優(yōu)的價值 縮減處理時間,提高計算能力 開發(fā)平臺的新特性和新功能,A,7,通過并行方式改進處理器的性能,A,8,多核技術(shù)的發(fā)展,Pentium 4 with HT,Dual Xeon Processors,Dual Core,2 Threads 1 Package,2 Threads 2 Packages,2 Threads 1 Package,Two independent execution cores in the same processor,A,9,幾種不同的技術(shù),HT Hyper Threading: 2 threads running on the same
3、 processor core 處理器上的某些資源會被共享 使用相同的緩存和運算器 DC Dual Core: 2 execution cores in the same processor package 共享系統(tǒng)總線 與雙處理器的性能相同 DP/MP Dual/Multi-Processing: 2 or more processors in the same system 只共享系統(tǒng)總線,獨立緩存 高性能,資源沖突少,A,10,雙核技術(shù) VS. 超線程技術(shù),雙核是真正意義上的雙處理器 不會發(fā)生資源沖突 每個線程擁有自己的緩存、寄存器和運算器 一個3.2GHz Smithfiled在性能上
4、并非等同于3.2GHz P4 with HT 的2倍 HT 使處理器的性能至少提升了1/3 雙核的性能相當(dāng)于2塊 non-HT 處理器 雙核技術(shù)與HT技術(shù)在性能上的對比 Ex 1: 兩個floating point線程 (Smithfield client) 每個線程擁有自己的FPU, 沒有資源沖突 盡管性能上沒有提升太多,但仍然優(yōu)于HT Ex 2: 一個integer線程與一個floating point線程 性能大幅度提升 沒有資源沖突,A,11,Single core , With HT ( Eg. Pentium 4 Processor With HT ) Integer and Fl
5、oating Point Threads,L2 Cache and Control,L2 Cache and Control,L1 D-Cache and D-TLB,Schedulers,Integer,Trace Cache,Rename/Alloc,uop Queues,BTB,uCode ROM,3,3,Decoder,BTB & I-TLB,Floating Point,2 threads can be executed at the same time (per processor) if theyre not competing for the same execution re
6、source,A,12,Single core , With HT ( Eg. Pentium 4 Processor with HT ) Two Floating Point Threads,2 threads CANNOT be executed at the same time (per processor) if theyre competing for the same execution resource (eg. 2 floating point threads in a P4P architecture),A,13,Dual core , Without HT ( Eg. Pe
7、ntium D Processor ) Two Floating Point Threads,Even 2 floating point threads can be executed at the same time now (per processor) as there are multiple floating point execution units,A,14,Dual core , With HT ( Eg. Dual Core Pentium Processor Extreme Edition ) Supports HT Multiple Integer and Floatin
8、g Point Threads,With dual core & HT together, maximum # of threads that can be executed at a time is 4 per processor,A,15,多核技術(shù)與超線程技術(shù)的結(jié)合,產(chǎn) 量 多功能 功 效,Dual Core with Hyper-Threading 4 threads/socket,Dual Core 2 threads/socket,A,16,AMD與Intel雙核架構(gòu)的對比,AMD Opteron雙核架構(gòu)示意圖,Intel 奔騰至尊版雙核架構(gòu)示意圖,A,17,多核面臨的困難,如何計算
9、軟件授權(quán)? 按CPU個數(shù)收取軟件授權(quán)費用 按芯片個數(shù)收取軟件授權(quán)費用 應(yīng)用軟件是否支持? 如果應(yīng)用程序是基于多處理器編寫的 如果應(yīng)用程序是基于單處理器編寫的 雙核發(fā)熱大,散熱是難題,A,18,DualCore、SMP、Cluster,A,19,Outline,多核處理器簡介 并行程序設(shè)計方法學(xué)(PCAM) 科研及技術(shù)(天津大學(xué)SRDC及IBM技術(shù)中心),A,20,PCAM設(shè)計方法學(xué),劃分(Partitioning) 通訊(Communication) 組合(Agglomeration) 映射(Mapping),A,21,PCAM設(shè)計方法學(xué),設(shè)計并行算法的四個階段 劃分(Partitioning
10、) 通訊(Communication) 組合(Agglomeration) 映射(Mapping) 劃分:分解成小的任務(wù),開拓并發(fā)性; 通訊:確定諸任務(wù)間的數(shù)據(jù)交換,監(jiān)測劃分的合理性; 組合:依據(jù)任務(wù)的局部性,組合成更大的任務(wù); 映射:將每個任務(wù)分配到處理器上,提高算法的性能。,A,22,PCAM設(shè)計過程,A,23,域分解,劃分的對象是數(shù)據(jù),可以是算法的輸入數(shù)據(jù)、中間處理數(shù)據(jù)和輸出數(shù)據(jù); 將數(shù)據(jù)分解成大致相等的小數(shù)據(jù)片; 劃分時考慮數(shù)據(jù)上的相應(yīng)操作; 如果一個任務(wù)需要別的任務(wù)中的數(shù)據(jù),則會產(chǎn)生任務(wù)間的通訊;,A,24,域分解,示例:三維網(wǎng)格的域分解,各格點上計算都是重復(fù)的。下圖是三種分解方法:
11、,A,25,功能分解,劃分的對象是計算,將計算劃分為不同的任務(wù),其出發(fā)點不同于域分解; 劃分后,研究不同任務(wù)所需的數(shù)據(jù)。如果這些數(shù)據(jù)不相交的,則劃分是成功的;如果數(shù)據(jù)有相當(dāng)?shù)闹丿B, 意味著要重新進行域分解和功能分解; 功能分解是一種更深層次的分解。,A,26,劃分判據(jù),劃分是否具有靈活性? 劃分是否避免了冗余計算和存儲? 劃分任務(wù)尺寸是否大致相當(dāng)? 任務(wù)數(shù)與問題尺寸是否成比例? 功能分解是一種更深層次的分解,是否合理?,A,27,通訊,通訊是PCAM設(shè)計過程的重要階段; 劃分產(chǎn)生的諸任務(wù),一般不能完全獨立執(zhí)行,需要在任務(wù)間進行數(shù)據(jù)交流;從而產(chǎn)生了通訊; 功能分解確定了諸任務(wù)之間的數(shù)據(jù)流; 諸任
12、務(wù)是并發(fā)執(zhí)行的,通訊則限制了這種并發(fā)性;,A,28,通訊判據(jù),所有任務(wù)是否執(zhí)行大致相當(dāng)?shù)耐ㄓ? 是否盡可能的局部通訊? 通訊操作是否能并行執(zhí)行? 同步任務(wù)的計算能否并行執(zhí)行?,A,29,組合,組合是由抽象到具體的過程,是將組合的任務(wù)能在一類并行機上有效的執(zhí)行; 合并小尺寸任務(wù),減少任務(wù)數(shù)。如果任務(wù)數(shù)恰好等于處理器數(shù),則也完成了映射過程; 通過增加任務(wù)的粒度和重復(fù)計算,可以減少通訊成本; 保持映射和擴展的靈活性,降低軟件工程成本;,A,30,組合判據(jù),增加粒度是否減少了通訊成本? 重復(fù)計算是否已權(quán)衡了其得益? 是否保持了靈活性和可擴放性? 組合的任務(wù)數(shù)是否與問題尺寸成比例? 是否保持了類似的計算
13、和通訊? 有沒有減少并行執(zhí)行的機會?,A,31,映射,每個任務(wù)要映射到具體的處理器,定位到運行機器上; 任務(wù)數(shù)大于處理器數(shù)時,存在負(fù)載平衡和任務(wù)調(diào)度問題; 映射的目標(biāo):減少算法的執(zhí)行時間 并發(fā)的任務(wù) 不同的處理器 任務(wù)之間存在高通訊的 同一處理器 映射實際是一種權(quán)衡,屬于NP完全問題,A,32,映射判據(jù),采用集中式負(fù)載平衡方案,是否存在通訊瓶頸? 采用動態(tài)負(fù)載平衡方案,調(diào)度策略的成本如何?,A,33,Outline,多核處理器簡介 并行程序設(shè)計方法學(xué)(PCAM) 科研及技術(shù)(天津大學(xué)SRDC及IBM技術(shù)中心),A,34,技術(shù)力量,天津大學(xué)IBM新技術(shù)中心 () 共享大學(xué)研究(SUR) 軟件技術(shù)培訓(xùn) Lotus(協(xié)同工作) WebSphere(J2EE) Rational(應(yīng)用程序設(shè)計與開發(fā)) DB2(數(shù)據(jù)庫與商務(wù)智能) AIX/Linux(操作系統(tǒng)管理) Eclipse(程序開發(fā),IDE設(shè)計) 全球?qū)I(yè)認(rèn)證,A,35,科研情況,天津大學(xué)軟件研究與開發(fā)中心 ( 網(wǎng)格計算,分布式與并行計算 可視化與圖像處理 虛擬現(xiàn)實 數(shù)字藝術(shù)與動畫 真實感圖形 網(wǎng)絡(luò)與信息安全 智能Agent,語義網(wǎng) 嵌入式系統(tǒng),A,36,Lotus Workplace 產(chǎn)品家族,Lotus Domino(服務(wù)器,郵件及應(yīng)用程
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于物聯(lián)網(wǎng)的校園AI志愿者服務(wù)現(xiàn)場實時數(shù)據(jù)采集系統(tǒng)設(shè)計課題報告教學(xué)研究課題報告
- 2026年智能眼鏡生活應(yīng)用報告及未來五至十年交互體驗報告
- 山西大地環(huán)境投資控股有限公司2025年社會招聘備考題庫及1套參考答案詳解
- 2026年安陽市單招試題附答案
- 2026年朝陽師范高等專科學(xué)校單招職業(yè)適應(yīng)性測試題庫及答案1套
- 2026年湖南網(wǎng)絡(luò)工程職業(yè)學(xué)院單招職業(yè)傾向性考試模擬測試卷必考題
- 2026年武漢海事職業(yè)學(xué)院單招職業(yè)技能測試模擬測試卷及答案1套
- 2026年濰坊食品科技職業(yè)學(xué)院單招職業(yè)技能測試題庫及答案1套
- 巴彥淖爾市能源(集團)有限公司2025年第三批招聘備考題庫完整參考答案詳解
- 常州市計劃生育協(xié)會2026年公開招聘社會化用工備考題庫及答案詳解1套
- 2025課堂懲罰 主題班會:馬達加斯加企鵝課堂懲罰 課件
- GB/T 30475.3-2017壓縮空氣過濾器試驗方法第3部分:顆粒
- GB/T 27818-2011化學(xué)品皮膚吸收體外試驗方法
- GB/T 22512.2-2008石油天然氣工業(yè)旋轉(zhuǎn)鉆井設(shè)備第2部分:旋轉(zhuǎn)臺肩式螺紋連接的加工與測量
- FZ/T 80004-2014服裝成品出廠檢驗規(guī)則
- 信息技術(shù)與學(xué)科深度融合課件
- 內(nèi)毒素和其去除
- 光伏電站運維培訓(xùn)-課件
- HDI流程簡介(教材)課件
- 成都市建筑消防設(shè)施及電氣防火檢測規(guī)范DB510100T
- 企業(yè)內(nèi)部控制規(guī)范解讀-有案例分析財政部會計司
評論
0/150
提交評論