版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
計算機系統(tǒng)結構包仲賢蘭州理工大學計算機與通信學院1/13/20231計算機系統(tǒng)結構第一章基本概念中國宮廷式2計算機系統(tǒng)結構第一章基本概念歐洲哥特式3計算機系統(tǒng)結構第一章基本概念阿拉伯風格4計算機系統(tǒng)結構第一章基本概念5計算機系統(tǒng)結構第一章基本概念印度泰姬陵6計算機系統(tǒng)結構第一章基本概念7計算機系統(tǒng)結構第一章基本概念8計算機系統(tǒng)結構第一章基本概念1.課程名稱
ComputerArchitecture
計算機系統(tǒng)結構計算機體系結構
建筑物的設計或式樣,通常指一個系統(tǒng)的外貌2.研究內(nèi)容從外部來研究計算機系統(tǒng)使用者所看到的物理計算機的抽象編寫出能夠在機器上正確運行的程序所必須了解到的計算機屬性9計算機科學與技術系我們有沒有必要學習計算機設計技術?答案:肯定有必要,并且非常必要。放棄微處理器的設計與OS的研究和開發(fā)曾是我們的國策。后來已開始反省這一國策,提出開發(fā)自己的微處理器和OS。在今天后PC時代更有必要。因為在后PC時代,計算機的主要作用不再是獨立使用的機器,而是一個應用系統(tǒng)或設備的組件(如馬達一樣)?10計算機系統(tǒng)結構第一章基本概念◆體系結構非常重要◆從系統(tǒng)這一級來看計算機◆建立計算機系統(tǒng)概念◆總體設計(設計策略,注重原理和方法)◆站得高,看得遠,講得透總體結構總工程師3.本課程的意義11計算機系統(tǒng)結構第一章基本概念4.學習目的學習體系結構的目的是什么?學習設計計算機的技術建立計算機系統(tǒng)的完整概念學習計算機系統(tǒng)的分析方法和設計方法了解計算機系統(tǒng)的最新研究成果設計有我國自主知識產(chǎn)權的計算機12計算機系統(tǒng)結構課程介紹5.與其他學科的交叉學科交叉:計算機組成、操作系統(tǒng)、匯編語言、數(shù)據(jù)結構、微計算機技術、計算機網(wǎng)絡、……新內(nèi)容:超標量處理機、超流水線處理機、VLIW處理機、向量處理機、并行處理機、多處理機、互連網(wǎng)絡、……計算機系統(tǒng)結構正處于變革時期軟件-系統(tǒng)結構-實現(xiàn)技術,兩頭發(fā)展快中間慢
非馮計算機正興起
13計算機系統(tǒng)結構課程介紹6.
課程安排課內(nèi):32學時,課內(nèi)外比例:課內(nèi)1:課外>1除完成作業(yè)之外,還要多看參考書了解國內(nèi)外最新研究成果7.教材和參考書教材:鄭偉民湯志忠計算機系統(tǒng)結構(第二版),清華大學出版社14計算機系統(tǒng)結構課程介紹參考書:(1)DavidA.PattersonandJohnL.Hennessy,ComputerArchitecture:AQuantitativeApproach3Ed.SanFrancisco:MorganKaufmannPublishers
中文:計算機系統(tǒng)結構:一種定量的方法(2)KaiHwang,AdvancedComputerAcrchitectureParallelismScalabilityProgrammability
中文:高等計算機系統(tǒng)結構:并行性可擴展性可編程性,清華大學出版社、廣西科學技術出版社15計算機系統(tǒng)結構課程介紹
第1章基本概念1.1計算機系統(tǒng)結構簡介1.2計算機系統(tǒng)的評價標準1.3計算機系統(tǒng)的設計技術1.4計算機系統(tǒng)結構的發(fā)展1.5計算機系統(tǒng)的分類16計算機系統(tǒng)結構第一章基本概念1.1計算機系統(tǒng)結構簡介1.1.1為什么要研究系統(tǒng)結構1.1.2如何認識計算機系統(tǒng)1.1.3計算機系統(tǒng)結構的定義1.1.4計算機組成技術1.1.5計算機實現(xiàn)技術17計算機系統(tǒng)結構第一章基本概念為什么要研究系統(tǒng)結構
1.提高處理機運算速度:MIPS=Fz
IPC
其中:Fz為處理機的工作主頻
IPC(InstructionPerCycle)為
每個時鐘周期平均執(zhí)行的指令條數(shù)提高IPC:依靠先進系統(tǒng)結構過去,幾個或幾十個周期完成一條指令
現(xiàn)在,一個周期完成幾條指令提高Fz:縮短門電路延遲,依靠技術進步流水線技術等,依靠先進系統(tǒng)結構從指令串行執(zhí)行,到P4的20級流水線18計算機系統(tǒng)結構第一章基本概念19計算機系統(tǒng)結構第一章基本概念2.計算機性能提高的幾個階段20世紀70年代末之前,大型機和小型機計算機性能每年提高25%~30%。20世紀80年代初,出現(xiàn)微處理機,依靠集成電路技術,性能每年提高35%20世紀80年中期,出現(xiàn)RISC技術、高級語言和操作系統(tǒng)等,性能每年提高50%1995年,先進系統(tǒng)結構對微處理器性能的貢獻是單純技術進步的5倍。3.計算機性能按摩爾定理發(fā)展,但摩爾定律正在走向死角。4.計算機系統(tǒng)的設計者們要不斷創(chuàng)新。20計算機系統(tǒng)結構第一章基本概念如何認識計算機系統(tǒng)1.虛擬計算機定義:從不同角度所看到的計算機系統(tǒng)的屬性是不同的。主要觀察角度包括:
應用程序員系統(tǒng)程序員硬件設計人員對計算機系統(tǒng)的認識通常只需要在某一個層次上21計算機系統(tǒng)結構第一章基本概念虛擬計算機系統(tǒng)22計算機系統(tǒng)結構第一章基本概念2.計算機系統(tǒng)的層次結構計算機系統(tǒng)可分為7個層次
第3級至第6級由軟件實現(xiàn),稱為虛擬機從學科領域來劃分:第0級和第1級屬于計算機組成原理
第2級屬于計算機系統(tǒng)結構
第3至第5級屬于系統(tǒng)軟件
第6級屬于應用軟件它們之間有交叉例如:第3級必須依賴第4級和第5級來實現(xiàn)23計算機系統(tǒng)結構第一章基本概念計算機系統(tǒng)的層次結構24計算機系統(tǒng)結構第一章基本概念2526計算機系統(tǒng)結構第一章基本概念3.透明性概念定義:本來存在的事物或?qū)傩裕瑥哪撤N角度看似乎不存在例如:CPU類型、型號、主存儲器容量等對應用程序員
透明對系統(tǒng)程序員、硬件設計人員等不透明例如:浮點數(shù)表示、乘法指令 對高級語言程序員、應用程序員透明 對匯編語言程序員、機器語言程序員
不透明例如:數(shù)據(jù)總線寬度、微程序 對匯編語言程序員、機器語言程序員
透明 對硬件設計人員、計算機維修人員
不透明27計算機系統(tǒng)結構第一章基本概念計算機系統(tǒng)結構的定義
計算機系統(tǒng)結構定義一
Amdahl于1964年在推出IBM360系列計算機時提出:程序員所看到的計算機系統(tǒng)的屬性,即概念性結構和功能特性程序員:系統(tǒng)程序員(包括:匯編語言、機器語言、編譯程序、操作系統(tǒng))看到的:編寫出能在機器上正確運行的程序所必須了解到的28計算機系統(tǒng)結構第一章基本概念概念性結構
IBM360系列計算機的概念性結構29計算機系統(tǒng)結構第一章基本概念
數(shù)據(jù)表示:硬件能夠直接認別和處理的數(shù)據(jù)類型;尋址技術:編址方式、尋址方式和定位方式等;寄存器組織:操作數(shù)寄存器、變址寄存器、控制寄存器及專用寄存器的定義、數(shù)量和使用規(guī)則等;指令系統(tǒng):操作類型、格式,指令間的排序控制等;中斷系統(tǒng):中斷類型、中斷級別和中斷響應方式等;存儲系統(tǒng):尋址空間、虛擬存儲器、Cache存儲器等;處理機工作狀態(tài):定義和切換方式,如管態(tài)和目態(tài)等;輸入輸出系統(tǒng):數(shù)據(jù)交換方式、交換過程的控制等;信息保護:信息保護方式和硬件對信息保護的支持等。功能特性
指令系統(tǒng)及其執(zhí)行模式30計算機系統(tǒng)結構第一章基本概念2.計算機系統(tǒng)結構定義二研究軟硬件功能分配和對軟硬件界面的確定計算機系統(tǒng)由軟件、硬件和固件組成,它們在功能上是同等的。同一種功能可以用硬件實現(xiàn),也可以用軟件或固件實現(xiàn)。不同的組成只是性能和價格不同,他們的系統(tǒng)結構是相同的。系列計算機概念:相同系統(tǒng)結構,不同組成和實現(xiàn)的一系列計算機系統(tǒng)。31計算機系統(tǒng)結構第一章基本概念計算機組成技術
1.課程名稱
ComputerOrganization
計算機組成,計算機組織,計算機原理,計算機組成原理2.研究方法從內(nèi)部研究計算機系統(tǒng)計算機組成是指計算機系統(tǒng)結構的邏輯實現(xiàn)。32計算機系統(tǒng)結構第一章基本概念
3.主要研究內(nèi)容確定數(shù)據(jù)通路的寬度;確定各種操作對功能部件的共享程度;確定專用的功能部件;確定功能部件的并行度;設計緩沖和排隊策略;設計控制機構;確定采用何種可靠性技術。33計算機系統(tǒng)結構第一章基本概念計算機實現(xiàn)技術
計算機實現(xiàn)是指計算機組成的物理實現(xiàn)主要包括:
處理機、主存儲器等部件的物理結構;
器件的集成度和速度;
專用器件的設計;
器件、模塊、插件、底版的劃分與連接;
信號傳輸技術;
電源、冷卻及裝配技術,制造工藝及技術等。隨著技術、器件和應用的發(fā)展,三者之間的界限越來越模糊。34計算機系統(tǒng)結構第一章基本概念運算速度存儲器系統(tǒng)其他性能價格標準計算機系統(tǒng)的評價標準35計算機系統(tǒng)結構第一章基本概念運算速度
運算速度是表示處理機性能的主要指標。有多種表示處理機運算速度的方法。
哪一種表示方法合理?1.時鐘頻率(處理機主頻)只能用于同一公司、同一類型、同一配置的處理機
如:Pentium4
2.0G比Pentium4
1.6G快25%?
Pentium4
2.4G比Pentium4
1.6G快50%?
只表示CPU的指令處理能力實際運算速度還與Cache、內(nèi)存、I/O、被執(zhí)行程序等均有關。36計算機系統(tǒng)結構第一章基本概念2.指令執(zhí)行速度一種經(jīng)典的表示運算速度的方法
MIPS(MillionInstructionsPerSecond),GIPS,TIPS
其中:Fz為處理機的工作主頻
CPI(CyclesPerInstruction)為
每條指令所需的平均時鐘周期數(shù)
IPC(InstructionPerCycle)為
每個時鐘周期平均執(zhí)行的指令條數(shù)例1:計算PentiumIV2GHz處理機的指令執(zhí)行速度。37計算機系統(tǒng)結構第一章基本概念解:由于PentiumIV2GHz處理機的
IPC=4(或CPI=0.25),Fz=2000MHz
因此,MIPSPentiumIV2G=FzIPC=20004
=8000MIPS=8GIPS
即每秒鐘80億次(平均每秒鐘執(zhí)行80億條指令)
主要優(yōu)點:直觀、方便。目前還經(jīng)常使用主要缺點:
(1)不同指令的執(zhí)行速度差別很大
(2)指令使用頻度差別很大
(3)有相當多的非功能性指令38計算機系統(tǒng)結構第一章基本概念3.等效指令速度:
吉普森(Gibson)法:加減法50%,乘法15%,除法5%,程序控制15%,其他15%
靜態(tài)指令使用頻度:在程序中直接統(tǒng)計動態(tài)指令使用頻度:在程序執(zhí)行過程中統(tǒng)計39計算機系統(tǒng)結構第一章基本概念例2:我國早期研制的一種小型計算機DJS-130定點16位,加法指令每秒50萬次,但沒有硬件乘除法指令。用軟件實現(xiàn)乘除法,速度低100倍左右。求等效指令速度。解:等效指令速度為:
即每秒2萬次,由于用軟件實現(xiàn)乘除法,等效指令速度降低了25倍。
40計算機系統(tǒng)結構第一章基本概念例3:假設在一般程序中浮點開平方操作FPSQR所占的比例為2%,它的CPI為100;其他浮點操作
FP所占的比例為23%,它的CPI=4.0;其余
75%指令的CPI=1.33,計算該處理機的等效
CPI。如果FPSQR操作的CPI也為4.0,重新計算等效CPI。解:等效CPI1=1002%+423%+1.3375%=3.92等效CPI2=425%+1.3375%=2.00
改進了在用戶程序中僅占2%的開平方操作,整個機器的等效運算速度提高了近一倍。41計算機系統(tǒng)結構第一章基本概念4.指令執(zhí)行速度的4種平均方法
算術平均:調(diào)和平均(用速率來度量):加權平均加權算術平均:加權調(diào)和平均:42計算機系統(tǒng)結構第一章基本概念幾何平均:其中:n指不同的程序,ETR(executiontimeratio)i是第i個程序相對于參考機器正交化后的執(zhí)行時間幾何平均速度與所參考的機器無關,有如下性質(zhì):幾何平均值的比率等于比率的幾何平均值43計算機系統(tǒng)結構第一章基本概念5.核心程序法把應用程序中使用最頻繁的那部分程序作為評價計算機性能的標準程序。稱為基準測試程序(benchmark)
整數(shù)測試程序:Dhrystone
用C語言編寫,100條語句。包括:各種賦值語句,數(shù)據(jù)類型和數(shù)據(jù)區(qū),控制語句,過程調(diào)用和參數(shù)傳送,整數(shù)運算和邏輯操作等。
VAX-11/780的測試結果為每秒1757個Dhrystones,即:1VAXMIPS=1757Dhrystones/Second
浮點測試程序:Linpack
用FORTRAN編寫,主要是浮點加法和浮點乘法操作用MFLOPS(MillionFloatingPointOperationsPerSecond)表示,GFLOPS、TFLOPS
linpack是一個可以分解和解答線性方程和線性最小平方問題的Fortran子程序集.這個包解決的線性系統(tǒng)是:矩陣是普通的,帶狀的,均衡模糊的,均衡確定的,三角形,tridiagonalsquare.另外在包計算QR和單值矩形矩陣分解并用它們解決最小平方根問題.
linpack于20世紀70年代到80年代初為超級計算機而設計,linpack主要是為替代lapack.它(linpack)被設計高效運行于共享存儲器,向量的超級計算機.44計算機系統(tǒng)結構第一章基本概念
SPEC基準程序
SystemPerformanceEvaluationCooperative
由30個左右世界知名計算機大廠商所支持的非盈利性國際合作組織,包括:IBM、AT&T、BULL、Compaq、CDC、DG、DEC、Fujitsu、HP、Intel、MIPS、Motolola、SGI、SUN、Unisys等;
1989年10月宣布SPEC1.0,程序量超過15萬行,包含4個定點程序和6個浮點程序,測試結果用SPECint’89和SPECfp’89表示。
1992年增加到有6個定點程序和14個浮點程序,測試結果用SPECint’92和SPECfp’92表示。
1995年推出SPECint’95和SPECfp’95SPEC2000,12個定點程序、14個浮點程序45計算機系統(tǒng)結構第一章基本概念
SPEC基準測試程序舉例
處理機SPECint’95SPECfp’95
PentiumII45018.5 13.3
PentiumIII45018.7
13.7
PentiumIII50020.614.7
PientiumIII55022.315.6
Celeron300A12.09.66
Celeron33313.110.20
Celeron36614.110.70
Celeron40015.111.20
Celeron43316.111.60
Celeron46617.012.0046計算機系統(tǒng)結構第一章基本概念Pentium4性能評測數(shù)據(jù)
(數(shù)據(jù)全部來源于Intel網(wǎng)站)47計算機系統(tǒng)結構第一章基本概念
48計算機系統(tǒng)結構第一章基本概念
49計算機系統(tǒng)結構第一章基本概念
50計算機系統(tǒng)結構第一章基本概念
51計算機系統(tǒng)結構第一章基本概念52計算機系統(tǒng)結構第一章基本概念53計算機系統(tǒng)結構第一章基本概念54計算機系統(tǒng)結構第一章基本概念55計算機系統(tǒng)結構第一章基本概念
56計算機系統(tǒng)結構第一章基本概念
57計算機系統(tǒng)結構第一章基本概念6.峰值速度
蜂值指令速度:MIPS、GIPS、TIPS
浮點蜂值速度:MFLOPS、GFLOPS、TFLOPS例5:一個由36臺計算機組成的Cluster系統(tǒng),每臺計算機內(nèi)部由4個PentiumIII700,計算這個Cluster系統(tǒng)的指令峰值速度。解:PentiumIII700MHz,有3條指令流水線,峰值指令速度為:7003
=2100MIPS
Cluster的峰值指令速度=7003364=302400MIPS
即每秒3千億次58計算機系統(tǒng)結構第一章基本概念存儲系統(tǒng)1.存儲層次第1層:RegisterFiles(寄存器堆)
第2層:Lookahead(先行緩沖站)
第3層:Cache(高速緩沖存儲器)
第4層:MainMemory(主存儲器)
第5層:OnlineStorage(聯(lián)機存儲器)
第6層:Off-lineStorage(脫機存儲器)第1~3層在CPU芯片內(nèi)部,第4層在主板上,第5層在機箱內(nèi)(硬盤),第6層依靠手工加載(VCD/DVD/磁帶/刻錄機等)59計算機系統(tǒng)結構第一章基本概念60計算機系統(tǒng)結構第一章基本概念2.尋址空間程序員可以使用的存儲器容量,即每個程序的大小
通常有216、224、232、264、…
Pentium處理機的尋址空間為4GB
與實際配置的存儲器容量無關3.存儲容量實際物理存儲器的大小通常用KB、MB、GB等表示
61計算機系統(tǒng)結構第一章基本概念4.主存儲器的種類
SDRAM(SynchronousDynamicRandomAccessMemory)
RDRAM(RAMBUSDRAM)DDR(DualDateRateDRAM)5.速度主存度與CPU系統(tǒng)總線速度相匹配
P4系統(tǒng)總線速度400MHz(3200MB/S)或533DDR:
64bits×333MHz/8=2700MB/SRDRAM:16bits×800MHz/8×2=3200MB/S6.存儲系統(tǒng)
采用軟件和硬件相結合的方法,獲得速度高、容量大、價格便宜的存儲器62計算機系統(tǒng)結構第一章基本概念其他性能
1.字長1~幾百位,16位、32位、64位由數(shù)據(jù)字長決定,8的倍數(shù),32位、64位等可變字長:任意組合2.數(shù)據(jù)表示
定點、浮點、邏輯、向量、串、棧、樹、…
發(fā)展方向之一:自定義數(shù)據(jù)表示4.指令系統(tǒng)
CISC(ComplexInstructionSetComputer)復雜指令集計算機
RISC(ReducedInstructionSetComputer)精簡指令集計算機
VLIW(VeryLongInstructionWord)超長指令字63計算機系統(tǒng)結構第一章基本概念4.輸入輸出系統(tǒng)
輸入輸出系統(tǒng)的組織方式中斷系統(tǒng)通道處理機輸入輸出處理機5.保護和診斷能力
程序與數(shù)據(jù)的保護診斷能力:檢錯,糾錯,冗余,自診斷能力可靠性:RAS技術,可靠性R,可用性A,可維護性S64計算機系統(tǒng)結構第一章基本概念價格標準
1.價格與性能的關系:
摩爾定理:速度每10年左右提高100倍,但價格基本維持不變用當前同樣的價格,在5年之后能買到性能高出10倍的計算機2.硬件與軟件的價格比例:
硬件在整個計算機系統(tǒng)價格中所占的比例在下降,軟件所占的比例在上升目前軟件價格已經(jīng)超過硬件價格65計算機系統(tǒng)結構第一章基本概念軟件所占的成本越來越高66計算機系統(tǒng)結構第一章基本概念計算機系統(tǒng)的設計技術
計算機設計者的任務軟硬件取舍軟件兼容性計算機系統(tǒng)設計方法
67計算機系統(tǒng)結構第一章基本概念計算機設計者的任務系統(tǒng)結構設計:包括指令集、存儲系統(tǒng)、總線結構、處理器設計等,是軟硬件的分界面硬件實現(xiàn)技術:相當重要,不同指令集對系統(tǒng)性能的影響在縮小應用或市場需求性能優(yōu)化:可靠性、容錯性、價格與性能實現(xiàn)的復雜性:硬件實現(xiàn)方案、軟件復雜性、投放市場時間性能價格比:必須考慮實現(xiàn)的成本,包括軟件成本68計算機系統(tǒng)結構第一章基本概念功能要求應具備或支持的典型特性應用領域通用科學計算商用決定對計算機系統(tǒng)的性能要求對一系列任務有較好的性能具有較好的浮點運算功能支持COBOL、數(shù)據(jù)庫、和事物處理等功能軟件兼容級別編程語言級目標代碼級決定機器可以運行哪些軟件設計者的自由度較大,但需要新的編譯器系統(tǒng)結構已經(jīng)確定,無須投資軟件操作系統(tǒng)要求地址空間大小內(nèi)存管理安全保護為支持選定的操作系統(tǒng)所需要的特性非常重要的特性,可能限制程序的運行頁式或段式等管理方式,現(xiàn)代操作系統(tǒng)需要操作系統(tǒng)和應用程序需要標準浮點I/O總線編程語言網(wǎng)絡市場上已有的,某種需要滿足的標準格式和算法:IEEE、DEC、IBM等I/O設備:VME、SCSI、PCI、光纖等影響指令集:C、FORTAN、COBOL等對不同網(wǎng)絡的支持:內(nèi)部互連網(wǎng)、Ethernet等69計算機系統(tǒng)結構第一章基本概念軟硬件取舍1.軟硬件的關系理論上:有兩種極端實現(xiàn)方法:全硬件機器:操作系統(tǒng)、高級語言、應用等硬件只有1位加法和分支操作,其他都用軟件關鍵問題:性能與價格的關系軟件與硬件實現(xiàn)的特點
硬件實現(xiàn):速度快、成本高;靈活性差、占用內(nèi)存少軟件實現(xiàn):速度低、復制費用低;靈活性好、占用內(nèi)存多70計算機系統(tǒng)結構第一章基本概念硬件實現(xiàn)的比例越來越高71計算機系統(tǒng)結構第一章基本概念2.從價格因素考慮的軟硬件取舍
假設:硬件設計費為Dh、軟件設計費為Ds、硬件拷貝費為Ch、軟件拷貝費為Cs,R為軟件重復出現(xiàn)次數(shù)(占用內(nèi)存、占用介質(zhì)),當臺數(shù)為V時,每臺的硬件費用和軟件費用之比為:由于:Dh>>Ds,Ch>>Cs,當R很大時,經(jīng)常使用的基本功能適宜用硬件實現(xiàn)由于:Ds>>Cs,當V很大時,生產(chǎn)臺數(shù)很多時適宜用硬件實現(xiàn)72計算機系統(tǒng)結構第一章基本概念3.從改進性能考慮的軟硬件取舍基本方法:加快經(jīng)常性事件的執(zhí)行速度Amdahl定律:系統(tǒng)中某一部件由于采用更快的執(zhí)行方式后,整個系統(tǒng)性能的提高與這種執(zhí)行方式的使用頻率或占總執(zhí)行時間的比例有關。在Amdahl定律中,加速比與兩個因素有關:73計算機系統(tǒng)結構第一章基本概念改進后整個任務的執(zhí)行時間為:其中:T0為改進前的整個任務的執(zhí)行時間。
改進后整個系統(tǒng)的加速比達到:其中:Fe表示可改進部分所占的百分比,
(1-Fe)表示不可改進部分所占的百分比,
Se表示改進后,可改進部分的加速比。1/13/202374計算機系統(tǒng)結構第一章基本概念例5:某部件的處理時間僅為整個運行時間的
40%,如果將該部件的處理速度加快到10
倍,則采用加快措施后能使整個系統(tǒng)的性能提高多少?解:由題意可知:Fe=0.4,Se=10,根據(jù)Amdahl定律,加速比為:1/13/202375計算機系統(tǒng)結構第一章基本概念4.改進性能的主要途徑
(1)
面向目標代碼改進
方法:用一條指令代替一串指令根據(jù)計算結果改進:例如,增加硬件乘法和硬件除法指令能夠,使等效指令速度提高25倍,
據(jù)統(tǒng)計數(shù)據(jù)改進指令功能:如數(shù)據(jù)傳送指令、快速保存與恢復現(xiàn)場指令等
增加運算型指令的功能:如函數(shù)運算指令等1/13/202376計算機系統(tǒng)結構第一章基本概念(2)面向高級語言和編譯程序改進:
方法:增強對高級語言和編譯程序支持的指令的功能
例如:在do循環(huán)中,循環(huán)體只有一二條的占60%左右,增加循環(huán)控制指令。例如:條件碼對高級語言幾乎無用,在并行計算機中已經(jīng)取消條件碼。I=m1循環(huán)體I=I+m3I>m21/13/202377計算機系統(tǒng)結構第一章基本概念(3)面向操作系統(tǒng)改進:
系統(tǒng)結構設計要規(guī)整,消除例外情況。寄存器定義要統(tǒng)一(如A寄存器等)
操作要均勻(如A-B與B-A)
所有的存儲部件都要對稱進程的管理和切換存儲管理和信息保護進程的同步與互斥,信號燈管理處理機工作狀態(tài)和訪問方式的轉換
這類指令的使用頻度往往很低,但必須設置1/13/202378計算機系統(tǒng)結構第一章基本概念軟件兼容性設計方法
原因:軟件相對于硬件的成本越來越貴,已積累了大量成熟的系統(tǒng)軟件和應用軟件。1.兼容種類
(1)向后兼容:在某一時間生產(chǎn)的機器上運行的目標軟件能夠直接運行于更晚生產(chǎn)的機器上。
(2)向前兼容:
(3)向上兼容:在低檔機器上運行的目標軟件能夠直接運行于高檔機器上。
(4)向下兼容:
向后兼容必須做到,向上兼容盡量做到向前兼容和向下兼容,可以不考慮79計算機系統(tǒng)結構第一章基本概念方法一:系列機方法系列機定義:
具有相同的系統(tǒng)結構,但組成和實現(xiàn)技術不同的一系列計算機系統(tǒng)實現(xiàn)方法:在系統(tǒng)結構基本不變的基礎上,根據(jù)不同的性能和不同的器件,研制出多種性能和價格不同的計算機系統(tǒng)。一種系統(tǒng)結構可以有多種組成,一種組成也可以有多種物理實現(xiàn)如IBM370系列機:115,125,135,145,158,168等1/13/202380計算機系統(tǒng)結構第一章基本概念相同的指令系統(tǒng),采用順序執(zhí)行、重迭、流水和并行處理方式相同的32位字長,數(shù)據(jù)通路寬度為8位、16位、32位、64位。如PC系列機有:
不同主頻:4.7MHz,500MHz,1GHz,2.4GHz,3GHz,…
不同擴展:Pentium、PentiumPro、PentiumMMX、PentiumSSE、PentiumSSE2
不同Cache:Pentium、Celeron、Xeon
不同字長:8位、16位、32位、64位1/13/202381計算機系統(tǒng)結構第一章基本概念采用系列機方法的主要優(yōu)點:
(1)系列機之間軟件兼容,可移植性好
(2)插件、接口等相互兼容
(3)便于實現(xiàn)機間通信
(4)便于維修、培訓
(5)有利于提高產(chǎn)量、降低成本
采用系列機方法的主要缺點:
限制了計算機系統(tǒng)結構的發(fā)展如PC系列機,其系統(tǒng)結構非常落后,使用也最普及82計算機系統(tǒng)結構第一章基本概念方法二:模擬與仿真
SimulationEmulation定義:在一臺現(xiàn)有的計算機上實現(xiàn)另一臺計算機的指令系統(tǒng)。全部用軟件實現(xiàn)的叫模擬,用軟件、硬件、固件混合實現(xiàn)的叫仿真模擬的實現(xiàn)方法在A計算機上通過解釋或編譯實現(xiàn)B計算機的指令系統(tǒng)。A機器稱為宿主機,B機器稱為虛擬機。仿真的實現(xiàn)方法直接用A機器的一段微程序解釋執(zhí)行B機器的指令。A機器稱為宿主機,B機稱為目標機。83計算機系統(tǒng)結構第一章基本概念優(yōu)缺點比較模擬方法速度低,仿真方法速度高仿真需要較多的硬件(包括控制存儲器)系統(tǒng)結構差別大的機器難于用仿真方法實現(xiàn)除了指令系統(tǒng)之外,還有存儲系統(tǒng)、I/O系統(tǒng)、中斷系統(tǒng)、控制臺的操作等模擬方法用于計算機系統(tǒng)的設計過程在一臺已有的機器上用模擬方法實現(xiàn)正在設計中的機器的指令系統(tǒng)等。具體過程如下:設計方案模擬性能評價修改設計投產(chǎn)
84計算機系統(tǒng)結構第一章基本概念方法三:統(tǒng)一高級語言實現(xiàn)方法:采用同一種不依賴于任何具體機器的高級語言編寫系統(tǒng)軟件和應用軟件。困難:至今還沒有這樣一種高級語言,短期內(nèi)很難實現(xiàn)。C、Ada、Java、……
三種方法比較:
采用統(tǒng)一高級語言最好,是努力的目標系列機是暫時性方法,也是目前最好的方法仿真的速度低,芯片設計的負擔重,目前用于同一系列機內(nèi)的兼容,1/10~1/2的芯片面積用于仿真85計算機系統(tǒng)結構第一章基本概念方法四:目標代碼的并行編譯技術一個新的研究課題
一種機器的目標代碼重新編譯到另一種機器的并行目標代碼兩種方法:
(1)動態(tài)代碼轉換例1:IBM公司研制DAISY(DynamicallyArchitectedInstructionSetfromYorktown)處理機例2:Transmeta公司研制Crusoe處理機已經(jīng)大量應用于筆記本計算機,其功耗很低。
(2)靜態(tài)重編譯:正在研究過程中,難度很大1/13/202386計算機系統(tǒng)結構第一章基本概念動態(tài)代碼轉換技術采用動態(tài)二進制轉換技術實現(xiàn)與X86等處理機兼容,把X86等通用處理機的程序直接映射到VLIW處理機中執(zhí)行。IBM公司推出了開放源代碼DAISY,它不僅可以實現(xiàn)IBM的VLIW處理器與X86處理機之間的二進制兼容,還可以實現(xiàn)PowerPC、S/390、IBM的Java虛擬機與VLIW處理器之間的二進制兼容Transmeta公司推出了“CodeMorphingSoftware”,這種軟件可以保證Transmeta公司的VLIW處理機Crusoe能夠與X86處理機之間實現(xiàn)二進制代碼兼容87計算機系統(tǒng)結構第一章基本概念計算機系統(tǒng)設計過程方法1:由上向下(Top-Down)設計過程:由上向下面向應用的數(shù)學模型→面向應用的高級語言→面向這種應用的操作系統(tǒng)→面向操作系統(tǒng)和高級語言的機器語言→面向機器語言的微指令系統(tǒng)和硬件實現(xiàn)應用場合:專用計算機的設計特點:對于所面向的應用領域,性能和性能價格比很高。隨著通用計算機價格降低,目前已經(jīng)很少采用88計算機系統(tǒng)結構第一章基本概念方法2:由下向上(Bottom-Up)設計過程:根據(jù)當時的器件水平,設計微程序機器級和傳統(tǒng)機器級→根據(jù)不同的應用領域設計多種操作系統(tǒng)、匯編語言、高級語言編譯器等→最后設計面向應用的用戶級應用場合:通用計算機的一種設計方法,在計算機早期設計中(60~70年代)廣為采用特點:容易使軟件和硬件脫節(jié),整個計算機系統(tǒng)的效率降低。89計算機系統(tǒng)結構第一章基本概念方法3:中間開始(Middle-Out)
用于系列計算機的設計過程中90計算機系統(tǒng)結構第一章基本概念方法3:中間開始(Middle-Out)設計過程:
首先定義軟硬件的分界面(指令系統(tǒng)、存儲系統(tǒng)、輸入輸出系統(tǒng)、中斷系統(tǒng)、硬件對操作系統(tǒng)和編譯系統(tǒng)的支持等)
然后各個層次分別進行設計(軟件設計人員設計操作系統(tǒng)、高級語言、匯編語言、應用程序等,硬件設計人員設計傳統(tǒng)機器、微程序、硬聯(lián)邏輯等)
應用場合:用于系列機的設計
特點:軟硬件人員結合、同時設計,軟硬件功能分配合理。
91計算機系統(tǒng)結構第一章基本概念計算機系統(tǒng)的發(fā)展馮·諾依曼結構器件發(fā)展的影響應用發(fā)展的影響改進算法的影響92計算機系統(tǒng)結構第一章基本概念馮·諾依曼結構VanNenmann基本思想于1936年~1946年期間形成,由馮·諾依曼等人于1946年提出93計算機系統(tǒng)結構第一章基本概念1.特點:存儲程序、運算器為中心、集中控制存儲器是字長固定的、順序線性編址的一維結構,每個地址是唯一定義的。
4096個字、40位。由指令形式的低級機器語言驅(qū)動。指令順序執(zhí)行,即一般按照指令在存儲器中存放的順序執(zhí)行,程序分支由轉移指令實現(xiàn)。運算器為中心,輸入輸出設備與存儲器之間的數(shù)據(jù)傳送都途經(jīng)運算器。運算器、存儲器、輸入輸出設備的操作以及它們之間的聯(lián)系都由控制器集中控制。94計算機系統(tǒng)結構第一章基本概念2.現(xiàn)代處理機對馮·諾依曼結構的改進不變的:存儲程序改變的:存儲器為中心,總線結構,分散控制從基于串行算法變?yōu)檫m應并行算法,出現(xiàn)了向量計算機,并行計算機、多處理機等流水線處理機,超標量處理機,超流水線處理機,超標量超流水線處理機數(shù)據(jù)庫計算機和知識庫計算機專用計算機,如過程控制計算機為獲得高可靠性而研制容錯計算機功能分散化、專業(yè)化,出現(xiàn)了各種分布計算機、外圍處理機、通信處理機等95計算機系統(tǒng)結構第一章基本概念存儲器為中心、分散控制96計算機系統(tǒng)結構第一章基本概念
總線結構,分散控制總線:連接計算機各功能部件的連線和管理信息傳輸規(guī)則的邏輯電路稱為總線。特點:在任何時刻,只能有一個部件向總線上發(fā)送信息,可以有多個部件同時接收信息。組成:數(shù)據(jù)總線、地址總線、控制總線。單總線結構CPU主存輸入設備輸出設備總線97計算機系統(tǒng)結構第一章基本概念
雙總線結構CPU主存擴展總線控制線路I/O設備I/O設備處理機總線32MHz32或64位ISA/EISA8.33MHz8、16、32位
.....98計算機系統(tǒng)結構第一章基本概念
三總線結構CPU主存PCI橋I/O設備I/O設備處理機總線100MHz32或64位ISA/EISA8.33MHz8、16、32位
.....PCIBUS
33MHz4B擴展總線控制線路I/O設備I/O設備接快速設備接慢速設備99計算機系統(tǒng)結構第一章基本概念3.非馮計算機的發(fā)展什么是非馮計算機?非指令驅(qū)動,…從傳統(tǒng)的指令驅(qū)動型改變?yōu)閿?shù)據(jù)驅(qū)動型,出現(xiàn)了數(shù)據(jù)流機計算機。從傳統(tǒng)的指令驅(qū)動型改變?yōu)樾枨篁?qū)動型,出現(xiàn)各種圖歸約計算機。處理非數(shù)值化信息的智能計算機,自然語言、聲音、圖形和圖象處理,虛擬現(xiàn)實處理等第五代計算機,由推理機和知識庫機等組成。歷經(jīng)10年,召開過多次專題國際會議。神經(jīng)網(wǎng)絡計算機,仿生計算機,…100計算機系統(tǒng)結構第一章基本概念器件發(fā)展的影響1.第1代至第4代計算機以器件來劃分第一代:電子管(Valve)
第二代:晶體管(Transistor)
第三代:集成電路(LSI)
第四代:大規(guī)模集成電路(VLSI)
第五代:智能計算機?第五代計算機以什么作為標志來劃分?第五代計算機什么時候誕生?101計算機系統(tǒng)結構第一章基本概念2.器件發(fā)展的特點(1)集成度迅速提高目前水平:每個芯片有1010個晶體管單芯片內(nèi)可以做大于1Gb存儲器,單芯片內(nèi)可以集成2個CPU+全部Cache
每4~5年提高一個數(shù)量級還遠沒有達到集成度的極限
問題?
如何利用器件集成度的提高,不斷改進計算機系統(tǒng)的性能:例如,有更多指令并行執(zhí)行,采用更深的流水線,集成更多的Cache等102計算機系統(tǒng)結構第一章基本概念(2)提高速度空間不大
目前CPU主頻已經(jīng)到達6GHz,
時鐘周期0.16ns,門延遲小于0.01ns
極限速度30萬公里/秒/2=1.5mm/0.01ns
信號在導體中傳遞速度小于光速的50%。
Pentium芯片面積500mm2,即23mm23mm
器件速度提高的余地已經(jīng)很小,將來提高處理機速度更多依靠系統(tǒng)結構的發(fā)展
可從系統(tǒng)結構的兩個方面提高處理機速度:提高IPC,從目前的2左右提高到8以上,采用更深度的流水線和并行處理技術103計算機系統(tǒng)結構第一章基本概念(3)價格直線下降
CPU芯片的價格每年要下降>80%(4)
可靠性越來越高芯片可靠性達到108小時,連續(xù)使用1萬年以上104計算機系統(tǒng)結構第一章基本概念3.器件種類
通用片:邏輯關系確定大批量生產(chǎn),如:CPU、存儲器、寄存器…
現(xiàn)場片:可以一次或多次改寫邏輯關系如:PLD、PAL、PROM、EPROM、FPGA…
用戶片:各種專用芯片需要單獨設計和生產(chǎn)。半用戶片:門陣列片等標準的門電路,前幾到工序已經(jīng)完成;根據(jù)用戶需要確定最終連線。105計算機系統(tǒng)結構第一章基本概念4.器件發(fā)展對計算機組成技術的影響
器件速度與處理機工作主頻
1955年第一臺大型機IBM704機,主頻12us,
1976年巨型向量計算機CRAY,主頻12.5ns,
目前,Pentium4的主頻已經(jīng)達到3GHz
器件速度與指令執(zhí)行時間
46年來器件速度提高104,指令速度快108以上
系統(tǒng)結構和組成技術的作用
器件速度提高減慢,處理機主頻提高速度減緩指令執(zhí)行速度的提高基本保持不變(摩爾定理)106計算機系統(tǒng)結構第一章基本概念應用發(fā)展的影響1.應用需求高結構化數(shù)值計算:氣象模型,流體流動,有限元分析。非結構化的數(shù)值計算:蒙特卡洛模擬,稀疏矩陣。實時多因素問題:語音識別,圖象處理,計算機視覺。海量存儲和輸入輸出密集問題:數(shù)據(jù)庫,事務處理。圖形學和設計系統(tǒng):計算機輔助設計。2.三個時期通用計算機:主要是通用科學計算專用計算機:科學計算、事務處理、實時控制高性能通用機:滿足多種需求目前又開始多種專用處理機的研制107計算機系統(tǒng)結構第一章基本概念3.兩個發(fā)展趨勢維持價格不變,利用VLSI技術等,提高性能性能基本不變,價格迅速下降一般先推出中間機型,然后再分別向高端和低端兩個方向發(fā)展4.三種設計思想最高性能價格比:商用機。主要發(fā)展方向最高性能:國家安全需要,科技發(fā)展需要例如:銀河計算機、神州計算機、…最低價格:家用學習機等108計算機系統(tǒng)結構第一章基本概念改進算法的影響
在多個層次上,算法影響著系統(tǒng)結構,例如:快速乘法、除法、開平方等的實現(xiàn):記分板算法、Tomasulo算法提高指令級并行性消除名字相關、數(shù)據(jù)相關、控制相關的算法有些問題,如果算法上有突破,不需要高性能的系統(tǒng)結構,而在普通系統(tǒng)上就能得到解決。許多算法還有改進的余地,通過算法的研究能夠大幅度提高系統(tǒng)的性能。系統(tǒng)結構設計者要研究算法,應該研究一系列算法,使所有同類問題都能很好解決。109計算機系統(tǒng)結構第一章基本概念計算機系統(tǒng)的分類按處理機性能分類佛林分類法庫克分類法馮澤云分類法漢德勒分類法110計算機系統(tǒng)結構第一章基本概念按處理機性能分類1.按大小劃分種類:巨型、大型、中型、小型、微型機劃分原則:以性能為特征,按價格來劃分存在問題:劃分的標準是隨時間而變化,每5年左右降低一個等級設計方法:最高性能特殊用途最佳性能價格比一般商用計算機最低價格家用計算機等
Smallisfast111計算機系統(tǒng)結構第一章基本概念
價最佳性能價格比
格最高性能巨型機大型機等性能線中型機小型機最低價格微型機(超微型機)
t-3t-2t-1
tt+1時期112計算機系統(tǒng)結構第一章基本概念2.按用途劃分種類:科學計算、事務處理、實時控制、工作站、服務器、家用計算機等。劃分原則:科學計算:浮點計算速度事務處理:字符處理、十進制運算實時控制:中斷響應速度、I/0能力工作站:圖形處理能力服務器:數(shù)據(jù)處理速度,數(shù)據(jù)存儲能力家用計算機:價格便宜,軟件豐富發(fā)展方向:具備上述所有功能的通用處理機各種專用處理機、協(xié)處理器、嵌入式處理機113計算機系統(tǒng)結構第一章基本概念3.按數(shù)據(jù)類型劃分定點計算機、浮點計算機、向量計算機、堆棧計算機等4.按處理機個數(shù)和種類劃分單處理機并行處理機、多處理機、分布處理機關聯(lián)處理機超標量處理機,超流水線處理機,VLIW處理機SMP(對稱多處理機)、MPP(大規(guī)模并行處理機)、機群(Cluster)系統(tǒng)等114計算機系統(tǒng)結構第一章基本概念5.按所使用的器件劃分
按使用的器件劃分計算機系統(tǒng)的時代
第一代:電子管(Valve)計算機
第二代:晶體管(Transistor)計算機
第三代:集成電路(LSI)計算機
第四代:大規(guī)模集成電路(VLSI)計算機
第五代:智能計算機?目前的絕大部分計算機系統(tǒng)是VLSI計算機公認的第五代計算機什么時候誕生?第五代計算機以什么作為標志來劃分?115計算機系統(tǒng)結構第一章基本概念佛林分類法
1966年由Michael.J.Flynn提出按照指令流和數(shù)據(jù)流的多倍性特征進行分類
指令流:機器執(zhí)行的指令序列
數(shù)據(jù)流:由指令流調(diào)用的數(shù)據(jù)序列
多倍性(multiplicity):在系統(tǒng)性能瓶頸部件上同時處于同一執(zhí)行階段的指令或數(shù)據(jù)的最大可能個數(shù)四種類型
(1)單指令流單數(shù)據(jù)流SISD(SingleInstructionSingleDatastream)
(2)單指令流多數(shù)據(jù)流SIMD(SingleInstructionMultipleDatastream)(3)多指令流單數(shù)據(jù)流MISD(MultipleInstructionSingleDatastream)
(4)多指令流多數(shù)據(jù)流MIMS(MultipleInstructionMultipleDatastream)116計算機系統(tǒng)結構第一章基本概念SISD典型單處理機,包括:單功能部件處理機:IBM1401,VAX-11多功能部件處理機:IBM360/91,370/168,CDC6600等流水線處理機,指標量流水線處理機117計算機系統(tǒng)結構第一章基本概念(2)SIMD:并行處理機、陣列處理機、向量處理機、相聯(lián)處理機、超標量處理機、超流水線處理機多個PU按一定方式互連,在同一個CU控制下,對各自的數(shù)據(jù)完成同一條指令規(guī)定的操作;從CU看指令順序執(zhí)行,從PU看數(shù)據(jù)并行執(zhí)行。118計算機系統(tǒng)結構第一章基本概念(3)MISD:幾條指令對同一個數(shù)據(jù)進行不同的處理,實際上不存在119計算機系統(tǒng)結構第一章基本概念(4)
MIMD多處理機系統(tǒng),包括:緊密偶合:IBM3081、IBM3084、
UNIVAC-1100/80
松散偶合:D-825,Cmmp,CRAY-2120計算機系統(tǒng)結構第一章基本概念
Flynn分類法得到廣泛應用
SIMD、MIMD、SPMD、XIMD、…
主要缺點:(1)分類太粗在SIMD中包括有多種處理機對流水線處理機的劃分不明確,標量流水線為SISD,向量流水線為SIMD(2)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建省泉州市石獅市錦峰實驗學校2025-2026學年上學期九年級1月質(zhì)量檢測數(shù)學試題(含答案)
- 五年級數(shù)學下冊期末考試卷及答案
- 文化宣傳題庫及答案
- 網(wǎng)絡題庫答案及
- 烏達事業(yè)編招聘2022年考試模擬試題及答案解析50
- 2022~2023安全生產(chǎn)主要負責人考試題庫及答案第504期
- 部編版六年級語文上冊期中考試卷及答案【下載】
- 電氣檢測技術要點
- (新版)全國茶業(yè)職業(yè)技能競賽(茶葉加工工賽項)理論考試題庫(答案及解析)
- 三菱PLC技術與應用實訓教程(FX3U)習題答案 模塊3 提高篇(技師)
- (一診)重慶市九龍坡區(qū)區(qū)2026屆高三學業(yè)質(zhì)量調(diào)研抽測(第一次)物理試題
- 2026年榆能集團陜西精益化工有限公司招聘備考題庫完整答案詳解
- 2026廣東省環(huán)境科學研究院招聘專業(yè)技術人員16人筆試參考題庫及答案解析
- 2026年保安員理論考試題庫
- 2025年人保保險業(yè)車險查勘定損人員崗位技能考試題及答案
- 被動關節(jié)活動訓練
- GB/T 5781-2025緊固件六角頭螺栓全螺紋C級
- 教師心理素養(yǎng)對學生心理健康的影響研究-洞察及研究
- DGTJ08-10-2022 城鎮(zhèn)天然氣管道工程技術標準
- 公路工程質(zhì)量管理制度范本
- 廣東省廣州市八區(qū)聯(lián)考2025-2026學年生物高二上期末調(diào)研試題含解析
評論
0/150
提交評論