分布式系統(tǒng)的可靠性課件_第1頁
分布式系統(tǒng)的可靠性課件_第2頁
分布式系統(tǒng)的可靠性課件_第3頁
分布式系統(tǒng)的可靠性課件_第4頁
分布式系統(tǒng)的可靠性課件_第5頁
已閱讀5頁,還剩99頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

基本模型分布式系統(tǒng)的一個重要目標(biāo)是獲取高度的可依賴性(Dependability)?!隹梢蕾囆缘母拍畎ㄒ韵氯齻€方面可靠性:在錯誤存在的情況下持續(xù)服務(wù)的能力。安全性:不出現(xiàn)災(zāi)難性錯誤的能力。保密性:指避免、或承受對系統(tǒng)進行的故意性攻擊的能力■本章重點關(guān)注可依賴性中的可靠性,即故障、錯誤或失效(faults,errors,orfailures,這些概念通用)的檢測和處理?!斗植际较到y(tǒng)》(八)2019基本模型1基本模型■分布式系統(tǒng)可靠性的目標(biāo)是當(dāng)故障發(fā)生時,確保系統(tǒng)的全局一致性。即確保系統(tǒng)具備容錯能力?!龉收蟻碓从谌缦?類:節(jié)點(硬件)故障:物理硬件故障;程序(軟件)故障:軟件設(shè)計或編碼錯誤;通訊故障:通信介質(zhì)故障時序故障:物理故障導(dǎo)致運行時序錯誤?!斗植际较到y(tǒng)》(八)2019基本模型2基本模型■要確保系統(tǒng)具備容錯能力,通常使用冗余技術(shù)■有四種冗余類型硬件冗余:如額外的PE、Ⅳ○系統(tǒng)等軟件冗余:如軟件模塊的額外版本。信息冗余:如使用了額外位數(shù)的錯誤檢測代碼。時間冗余:如用來完成系統(tǒng)功能的附加時間《分布式系統(tǒng)》(八)2019基本模型3基本模型有三種基本的處理故障的方法主動復(fù)制。所有的復(fù)制模塊協(xié)同進行,并且它們的狀態(tài)緊密同步。被動復(fù)制。由唯一的一個處于主動的模塊設(shè)定定期檢查點定期更新其它模塊的交互狀態(tài)。半主動復(fù)制。是主動復(fù)制和被動復(fù)制的混合。此種方法所需的恢復(fù)開銷相對較低?!鲋鲃訌?fù)制用到了錯誤屏蔽的概念,即隱藏出現(xiàn)的故障或防止故障造成錯誤結(jié)果。被動復(fù)制,又稱為動態(tài)方法,它通過從系統(tǒng)中檢測錯誤的存在,并采取一定措施轉(zhuǎn)移錯誤元件來獲得容錯?!斗植际较到y(tǒng)》(八)2019基本模型4基本模型■故障檢測可被分為兩類外部檢測:將檢測節(jié)點失效的職責(zé)賦予節(jié)點的外部附件(或其它節(jié)點但需防止檢測者本身故障、檢測者和被檢測者間通信故障時導(dǎo)致的誤檢(誤報)。內(nèi)部檢測將檢測機制置于一個節(jié)點內(nèi)部(自檢)。通常假定內(nèi)部有一個可以完全信賴的“硬核”(hardcore)檢測元件,“硬核”不受節(jié)點故障的沖擊。完全做到這一點其實是很難的?!鐾ǔ=Y(jié)合使用外部檢測方法和內(nèi)部檢測方法,以得到個有效的故障檢測方案?!龉收蠙z測的技術(shù)實施手段包括:通信應(yīng)答超時、編碼校驗、結(jié)果比較等《分布式系統(tǒng)》(八)2019基本模型5基本模型■處理軟件故障通常采用兩個軟件模型基于進程的模型:一個應(yīng)用程序由一連串協(xié)同作業(yè)的進程組成,如P1P2l.Pn]基于對象的模型:一個應(yīng)用程序由一連串對象組成,每一個對象都是一個獨立的原子操作。通過很好定義的界面訪問,就可以獲得對象的封裝?!鑫覀兊挠懻撝?以基于進程的模型為例?!斗植际较到y(tǒng)》(八)2019基本模型6容錯系統(tǒng)設(shè)計的構(gòu)件模塊■具備容錯能力的、可靠的分布式系統(tǒng)中涉及到三種邏輯實體,包括二種構(gòu)件模塊穩(wěn)定存儲器故障一停止處理器和一個用于構(gòu)件模塊的:原子操作《分布式系統(tǒng)》(八)2019容錯系統(tǒng)設(shè)計的構(gòu)件模塊7穩(wěn)定存儲器■穩(wěn)定存儲器是在系統(tǒng)失效的情況下,可以躲過系統(tǒng)錯誤的特定存儲空間的抽象概念。也就是說,穩(wěn)定存儲空間里的內(nèi)容不被一個失效所摧毀?!龃鎯ζ鞯膬蓚€基本操作是讀和寫,穩(wěn)定存儲器的目標(biāo)是在系統(tǒng)失效的情況下,屏蔽不希望的事件,正確地執(zhí)行讀、寫操作《分布式系統(tǒng)》(八)2019穩(wěn)定存儲器8穩(wěn)定存儲器對于讀read(address:a來說,返回(status:goodorbad,data:d),其不希望結(jié)果包括:是好的,但讀取返回bad同上,而且后來的讀也返回bad;a是壞的,但讀取返回good;或者a是good,但讀取返回不同的數(shù)據(jù)d■對于寫write(address:a,datad)來說,其不希望的結(jié)a保持不變,而d變?yōu)椴煌臄?shù)據(jù)d"a變?yōu)?bad,d)。理想的穩(wěn)定存儲器:讀總是返回正確的結(jié)果,寫總是成功。《分布式系統(tǒng)》(八)2019穩(wěn)定存儲器9穩(wěn)定存儲器一RAID■獲得適宜的穩(wěn)定存儲器的一個方法是使用RA|D技術(shù)(RedundantArraysofInexpensiveDisks,廉價磁盤冗余陣列)?!瞿壳俺S玫挠邢铝蠷AD技術(shù):數(shù)組種類英文簡述硬盤谷錯嗎?可用容量RAIDlevel0Stripe/span(分條/分跨)NRAIDlevel1Mirror(鏡像)YeN/2RAIDlevel3ParallelwithParity(分條奇偶校驗)YeN-1RAIDlevel4ParallelwithParity(分區(qū)奇偶校驗)YesN-1RAIDlevel5StripedwithRotatingParityRAIDlevel0+1MirrorStripe《分布式系統(tǒng)》(八)2019穩(wěn)定存儲器一RAID10分布式系統(tǒng)的可靠性課件11分布式系統(tǒng)的可靠性課件12分布式系統(tǒng)的可靠性課件13分布式系統(tǒng)的可靠性課件14分布式系統(tǒng)的可靠性課件15分布式系統(tǒng)的可靠性課件16分布式系統(tǒng)的可靠性課件17分布式系統(tǒng)的可靠性課件18分布式系統(tǒng)的可靠性課件19分布式系統(tǒng)的可靠性課件20分布式系統(tǒng)的可靠性課件21分布式系統(tǒng)的可靠性課件22分布式系統(tǒng)的可靠性課件23分布式系統(tǒng)的可靠性課件24分布式系統(tǒng)的可靠性課件25分布式系統(tǒng)的可靠性課件26分布式系統(tǒng)的可靠性課件27分布式系統(tǒng)的可靠性課件28分布式系統(tǒng)的可靠性課件29分布式系統(tǒng)的可靠性課件30分布式系統(tǒng)的可靠性課件31分布式系統(tǒng)的可靠性課件32分布式系統(tǒng)的可靠性課件33分布式系統(tǒng)的可靠性課件34分布式系統(tǒng)的可靠性課件35分布式系統(tǒng)的可靠性課件36分布式系統(tǒng)的可靠性課件37分布式系統(tǒng)的可靠性課件38分布式系統(tǒng)的可靠性課件39分布式系統(tǒng)的可靠性課件40分布式系統(tǒng)的可靠性課件41分布式系統(tǒng)的可靠性課件42分布式系統(tǒng)的可靠性課件43分布式系統(tǒng)的可靠性課件44分布式系統(tǒng)的可靠性課件45分布式系統(tǒng)的可靠性課件46分布式系統(tǒng)的可靠性課件47分布式系統(tǒng)的可靠性課件48分布式系統(tǒng)的可靠性課件49分布式系統(tǒng)的可靠性課件50分布式系統(tǒng)的可靠性課件51分布式系統(tǒng)的可靠性課件52基本模型分布式系統(tǒng)的一個重要目標(biāo)是獲取高度的可依賴性(Dependability)?!隹梢蕾囆缘母拍畎ㄒ韵氯齻€方面可靠性:在錯誤存在的情況下持續(xù)服務(wù)的能力。安全性:不出現(xiàn)災(zāi)難性錯誤的能力。保密性:指避免、或承受對系統(tǒng)進行的故意性攻擊的能力■本章重點關(guān)注可依賴性中的可靠性,即故障、錯誤或失效(faults,errors,orfailures,這些概念通用)的檢測和處理?!斗植际较到y(tǒng)》(八)2019基本模型53基本模型■分布式系統(tǒng)可靠性的目標(biāo)是當(dāng)故障發(fā)生時,確保系統(tǒng)的全局一致性。即確保系統(tǒng)具備容錯能力?!龉收蟻碓从谌缦?類:節(jié)點(硬件)故障:物理硬件故障;程序(軟件)故障:軟件設(shè)計或編碼錯誤;通訊故障:通信介質(zhì)故障時序故障:物理故障導(dǎo)致運行時序錯誤?!斗植际较到y(tǒng)》(八)2019基本模型54基本模型■要確保系統(tǒng)具備容錯能力,通常使用冗余技術(shù)■有四種冗余類型硬件冗余:如額外的PE、Ⅳ○系統(tǒng)等軟件冗余:如軟件模塊的額外版本。信息冗余:如使用了額外位數(shù)的錯誤檢測代碼。時間冗余:如用來完成系統(tǒng)功能的附加時間《分布式系統(tǒng)》(八)2019基本模型55基本模型有三種基本的處理故障的方法主動復(fù)制。所有的復(fù)制模塊協(xié)同進行,并且它們的狀態(tài)緊密同步。被動復(fù)制。由唯一的一個處于主動的模塊設(shè)定定期檢查點定期更新其它模塊的交互狀態(tài)。半主動復(fù)制。是主動復(fù)制和被動復(fù)制的混合。此種方法所需的恢復(fù)開銷相對較低。■主動復(fù)制用到了錯誤屏蔽的概念,即隱藏出現(xiàn)的故障或防止故障造成錯誤結(jié)果。被動復(fù)制,又稱為動態(tài)方法,它通過從系統(tǒng)中檢測錯誤的存在,并采取一定措施轉(zhuǎn)移錯誤元件來獲得容錯。《分布式系統(tǒng)》(八)2019基本模型56基本模型■故障檢測可被分為兩類外部檢測:將檢測節(jié)點失效的職責(zé)賦予節(jié)點的外部附件(或其它節(jié)點但需防止檢測者本身故障、檢測者和被檢測者間通信故障時導(dǎo)致的誤檢(誤報)。內(nèi)部檢測將檢測機制置于一個節(jié)點內(nèi)部(自檢)。通常假定內(nèi)部有一個可以完全信賴的“硬核”(hardcore)檢測元件,“硬核”不受節(jié)點故障的沖擊。完全做到這一點其實是很難的?!鐾ǔ=Y(jié)合使用外部檢測方法和內(nèi)部檢測方法,以得到個有效的故障檢測方案。■故障檢測的技術(shù)實施手段包括:通信應(yīng)答超時、編碼校驗、結(jié)果比較等《分布式系統(tǒng)》(八)2019基本模型57基本模型■處理軟件故障通常采用兩個軟件模型基于進程的模型:一個應(yīng)用程序由一連串協(xié)同作業(yè)的進程組成,如P1P2l.Pn]基于對象的模型:一個應(yīng)用程序由一連串對象組成,每一個對象都是一個獨立的原子操作。通過很好定義的界面訪問,就可以獲得對象的封裝?!鑫覀兊挠懻撝?以基于進程的模型為例?!斗植际较到y(tǒng)》(八)2019基本模型58容錯系統(tǒng)設(shè)計的構(gòu)件模塊■具備容錯能力的、可靠的分布式系統(tǒng)中涉及到三種邏輯實體,包括二種構(gòu)件模塊穩(wěn)定存儲器故障一停止處理器和一個用于構(gòu)件模塊的:原子操作《分布式系統(tǒng)》(八)2019容錯系統(tǒng)設(shè)計的構(gòu)件模塊59穩(wěn)定存儲器■穩(wěn)定存儲器是在系統(tǒng)失效的情況下,可以躲過系統(tǒng)錯誤的特定存儲空間的抽象概念。也就是說,穩(wěn)定存儲空間里的內(nèi)容不被一個失效所摧毀?!龃鎯ζ鞯膬蓚€基本操作是讀和寫,穩(wěn)定存儲器的目標(biāo)是在系統(tǒng)失效的情況下,屏蔽不希望的事件,正確地執(zhí)行讀、寫操作《分布式系統(tǒng)》(八)2019穩(wěn)定存儲器60穩(wěn)定存儲器對于讀read(address:a來說,返回(status:goodorbad,data:d),其不希望結(jié)果包括:是好的,但讀取返回bad同上,而且后來的讀也返回bad;a是壞的,但讀取返回good;或者a是good,但讀取返回不同的數(shù)據(jù)d■對于寫write(address:a,datad)來說,其不希望的結(jié)a保持不變,而d變?yōu)椴煌臄?shù)據(jù)d"a變?yōu)?bad,d)。理想的穩(wěn)定存儲器:讀總是返回正確的結(jié)果,寫總是成功?!斗植际较到y(tǒng)》(八)2019穩(wěn)定存儲器61穩(wěn)定存儲器一RAID■獲得適宜的穩(wěn)定存儲器的一個方法是使用RA|D技術(shù)(RedundantArraysofInexpensiveDisks,廉價磁盤冗余陣列)?!瞿壳俺S玫挠邢铝蠷AD技術(shù):數(shù)組種類英文簡述硬盤谷錯嗎?可用容量RAIDlevel0Stripe/span(分條/分跨)NRAIDlevel1Mirror(鏡像)YeN/2RAIDlevel3ParallelwithParity(分條奇偶校驗)YeN-1RAIDlevel4ParallelwithParity(分區(qū)奇偶校驗)YesN-1RAIDlevel5StripedwithRotatingParityRAIDlevel0+1MirrorStripe《分布式系統(tǒng)》(八)2019穩(wěn)定存儲器一RAID62分布式系統(tǒng)的可靠性課件63分布式系統(tǒng)的可靠性課件64分布式系統(tǒng)的可靠性課件65分布式系統(tǒng)的可靠性課件66分布式系統(tǒng)的可靠性課件67分布式系統(tǒng)的可靠性課件68分布式系統(tǒng)的可靠性課件69分布式系統(tǒng)的可靠性課件70分布式系統(tǒng)的可靠性課件71分布式系統(tǒng)的可靠性課件72分布式系統(tǒng)的可靠性課件73分布式系統(tǒng)的可靠性課件74分布式系統(tǒng)的可靠性課件75分布式系統(tǒng)的可靠性課件76分布式系統(tǒng)的可靠性課件77分布式系統(tǒng)的可靠性課件78分布式系統(tǒng)的可靠性課件79分布式系統(tǒng)的可靠性課件80分布式系統(tǒng)的可靠性課件81分布式系統(tǒng)的可靠性課件82分布式系統(tǒng)的可靠性課件83分布式系統(tǒng)的可靠性課件84分布式系統(tǒng)的可靠性課件85分布式系統(tǒng)的可靠性課件86分布式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論