已閱讀5頁(yè),還剩73頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
(計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)論文)VTS雙機(jī)熱備系統(tǒng)的可靠性研究與應(yīng)用.pdf.pdf 免費(fèi)下載
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
中文摘要摘要隨著我國(guó)海上交通、船舶運(yùn)輸?shù)刃袠I(yè)的迅速發(fā)展,海事局v t s 系統(tǒng)( v e s s e lt r a f f i cs e r v i c e s ) 得到了廣泛的應(yīng)用,從而也對(duì)v t s 系統(tǒng)服務(wù)器的可靠性提出了越來(lái)越高的要求,使之成為了研究熱點(diǎn)。本文的重點(diǎn)就是通過(guò)對(duì)v t s 雙機(jī)熱備系統(tǒng)建模分析,提出了改進(jìn)系統(tǒng)檢測(cè)率的相關(guān)方法,實(shí)現(xiàn)了具有較高可靠性的v t s系統(tǒng)服務(wù)器平臺(tái)。本文以海事局v t s 項(xiàng)目為背景,首先在研究雙機(jī)熱備系統(tǒng)相關(guān)理論和關(guān)鍵技術(shù)的基礎(chǔ)上,對(duì)v t s 雙機(jī)熱備系統(tǒng)進(jìn)行了分析設(shè)計(jì)。本文采用主從式的工作模式,根據(jù)v t s 系統(tǒng)的特點(diǎn)將每臺(tái)服務(wù)器的結(jié)構(gòu)層次分為操作系統(tǒng)層、雙機(jī)管理層、應(yīng)用服務(wù)層;并設(shè)計(jì)和闡述了v t s 雙機(jī)熱備系統(tǒng)的工作流程及其雙機(jī)軟件的模塊功能。其次用基于m a r k o v 鏈的馬爾柯夫預(yù)測(cè)法對(duì)雙機(jī)熱備系統(tǒng)的可靠性進(jìn)行研究。在分析和預(yù)測(cè)雙機(jī)熱備系統(tǒng)工作狀態(tài)的基礎(chǔ)上,建立了相應(yīng)的系統(tǒng)數(shù)學(xué)模型,并對(duì)模型的微分方程求解,通過(guò)m a t l a b 分析可靠度數(shù)據(jù)和曲線,來(lái)說(shuō)明相關(guān)參數(shù)對(duì)系統(tǒng)可靠性的影響,然后分析了影響v t s 雙機(jī)熱備系統(tǒng)可靠性的因素,通過(guò)加入監(jiān)控應(yīng)用進(jìn)程狀態(tài)的功能和增加一條心跳鏈路來(lái)改善雙機(jī)熱備系統(tǒng)的檢測(cè)率。最后針對(duì)v t s 系統(tǒng),闡述了雙機(jī)熱備系統(tǒng)的具體部署和實(shí)現(xiàn),給出了相關(guān)配置文件和腳本,并采用故障注入法對(duì)系統(tǒng)進(jìn)行功能測(cè)試。通過(guò)改進(jìn)前后可靠度的比較,驗(yàn)證了系統(tǒng)可靠性的提高。本文研究實(shí)現(xiàn)的雙機(jī)熱備系統(tǒng)已經(jīng)成功的在秦皇島、重慶等海事局的v t s 系統(tǒng)中得到應(yīng)用。目前,該雙機(jī)熱備系統(tǒng)性能穩(wěn)定,用戶反應(yīng)良好,保障了v t s 系統(tǒng)持續(xù)運(yùn)行的同時(shí),滿足了其服務(wù)器的可靠性要求。關(guān)鍵詞:v t s ;雙機(jī)熱備;可靠性;m a r k o v 模型英文摘要a st h er a p i dd e v e l o p m e n to ft h et r a n s p o r t t h em a r i t i m eb u r e a uv t sa b s t r a c tc h i n a si n d u s t r y ,s u c ha sm a r i t i m et r a n s p o r t ,s h i p( v e s s e lt r a f f i cs e r v i c e ) s y s t e mh a sb e e nw i d e l yu s e d t h u sr e q u i r e m e n t so ft h er e l i a b i l i t yo ft h ev t ss e r v e ra l s op r o p o s e di n c r e a s i n ga n dt h er e l i a b i l i t yo fs e r v e rs y s t e m sh a sg r a d u a l l yb e c o m ear e s e a r c hh o t s p o t t h ef o c u so ft h i sp a p e ri st op r o p o s et oi m p r o v et h ed e t e c t i o nr a t eo ft h es y s t e ma n di m p l e m e n tt h es e r v e rp l a t f o r mo ft h ev t ss y s t e mb yr e s e a r c ho nt h er e l i a b i l i t yo ft h ed u a l - m a c h i n eh o ts t a n d b ys y s t e m t h er e s e a r c hi sb a s e do nt h ev t sp r o j e c to fm s a f i r s t l y ,t h ep a p e rp r o p o s e dt oa c h i e v et h eo v e r a l ld e s i g nb a s e do nt h ed u a l - m a c h i n eh o ts t a n d b ys y s t e mt h e o r ya n dk e yt e c h n o l o g i e s t h ew o r km o d eo fh o ts t a r t d b ys y s t e mi sm a s t e r - s l a v e i na c c o r d a n c ew i t ht h ec h a r a c t e r i s t i c so fv t ss y s t e mw h i c hc o n s i s t so ft h r e el a y e r so ft h eo p e r a t i n gs y s t e ml a y e r ,t h ed u a l m a c h i n em a n a g el a y e ra n dt h ea p p l i c a t i o ns e r v i c el a y e r a n dt h ed e s i g no ft h ew o r k i n gp r o c e s sa n dt h ef u n c t i o na n a l y s i so fd u a l m a c h i n es o f t w a r em o d u l e sa r ed e s c r i b e d s e c o n d l y ,u s i n gt h em a r k o vf o r e c a s t i n gm e t h o db a s e do nm a r k o vc h a i n ,r e s e a r c ho nt h er e l i a b i l i t yo ft h ev t sd u a l m a c h i n eh o ts t a n d b ys y s t e m t oe s t a b l i s ht h es y s t e mo ft h ec o r r e s p o n d i n gm a t h e m a t i c a lm o d e lb a s e do na n a l y s i sa n dp r e d i c t i o ni nt h es y s t e ms t a t eo ft h ew o r k ,a n ds o l v et h ed i f f e r e n t i a le q u a t i o n s ,t h r o u g ht h em a t l a ba n a l y s i so fr e l i a b i l i t yd a t aa n dc u r v e s ,t oi l l u s t r a t et h er e l e v a n tp a r a m e t e r so nt h ei m p a c to fs y s t e mr e l i a b i l i t y ,a n dt h e na n a l y z e dt h ei m p a c to nt h er e l i a b i l i t yo ft h ed u a l m a c h i n eh o ts t a n d b ys y s t e mf a c t o r s ,b ya c c e d i n gt ot h ep r o c e s so fm o n i t o r i n gt h ea p p l i c a t i o no fs t a t ef u n c t i o n sa n dt oa d dah e a r t b e a tl i n kt oi m p r o v et h ed e t e c t i o nr a t eo ft h ed u a l m a c h i n es y s t e m t h u se n h a n c et h er e l i a b i l i t y f i n a l l y ,i na c c o r d a n c ew i t ht h ev t ss y s t e m ,d e p l o ya n da c h i e v et h ed u a l m a c h i n eh o ts t a n d b ys y s t e m ,a n dg i v et h es p e c i f i cd e s c r i p t i o no ft h es e t t i n gp r o f i l ea n dr e l a t e ds c r i p t s f a u l ti n je c t i o nm e t h o di su s e dt oc a r r yo u tf u n c t i o n a lt e s t so nt h es y s t e m b yr e l i a b i l i t yc o m p a r i s o nb e f o r ea n da f t e rt h ei m p r o v e m e n t ,v e r i f yt h ei n c r e a s eo ft h er e l i a b i l i t y i nt h i sp a p e r ,t h ed u a l - m a c h i n eh o ts t a n d b ys y s t e mh a sb e e ns u c c e s s f u la p p l i e di nt h ev t ss y s t e mo ft h eq i n h u a n g d a o c h o n g q i n ga n do t h e rm a r i t i m eb u r e a u a t英文摘要p r e s e n t ,t h es y s t e mp e r f o r m a n c ea n ds t a b i l i t y ,t h eu s e rr e s p o n s ei sg o o d ,t h ep r o t e c t i o no ft h ev t ss y s t e ma tt h es a m et i m ec o n t i n u i n gt or u nt om e e tt h er e l i a b i l i t yr e q u i r e m e n t so ft h es e r v e r k e yw o r d s :v t s ;d u a l m a c h i n eh o ts t a n d b y ;r e l i a b i l i t y ;m a r k o vm o d e l大連海事大學(xué)學(xué)位論文原創(chuàng)性聲明和使用授權(quán)說(shuō)明原創(chuàng)性聲明本人鄭重聲明:本論文是在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的成果,撰寫(xiě)成博碩士學(xué)位論文= = y ! 墨塾扭墊圣丕統(tǒng)的亙?nèi)z班究曼座用:。除論文中已經(jīng)注明引用的內(nèi)容外,對(duì)論文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本論文中不包含任何未加明確注明的其他個(gè)人或集體已經(jīng)公開(kāi)發(fā)表或未公開(kāi)發(fā)表的成果。本聲明的法律責(zé)任由本人承擔(dān)。學(xué)位論文作者簽名:學(xué)位論文版權(quán)使用授權(quán)書(shū)本學(xué)位論文作者及指導(dǎo)教師完全了解大連海事大學(xué)有關(guān)保留、使用研究生學(xué)位論文的規(guī)定,即:大連海事大學(xué)有權(quán)保留并向國(guó)家有關(guān)部門(mén)或機(jī)構(gòu)送交學(xué)位論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)大連海事大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,也可采用影印、縮印或掃描等復(fù)制手段保存和匯編學(xué)位論文。同意將本學(xué)位論文收錄到中國(guó)優(yōu)秀博碩士學(xué)位論文全文數(shù)據(jù)庫(kù)( 中國(guó)學(xué)術(shù)期刊( 光盤(pán)版) 電子雜志社) 、中國(guó)學(xué)位論文全文數(shù)據(jù)庫(kù)( 中國(guó)科學(xué)技術(shù)信息研究所) 等數(shù)據(jù)庫(kù)中,并以電子出版物形式出版發(fā)行和提供信息服務(wù)。保密的論文在解密后遵守此規(guī)定。不保密0 ( 請(qǐng)?jiān)谝陨戏娇騼?nèi)打“,)。印緲e t 菇j(luò) - 師筘碧舅v t s 雙機(jī)熱備系統(tǒng)的可靠性研究與應(yīng)用1 1 研究背景第1 章緒論1 1 1v t s 項(xiàng)目簡(jiǎn)介在進(jìn)入二十一世紀(jì)以來(lái),海事系統(tǒng)開(kāi)始逐步實(shí)施水上安全監(jiān)督信息系統(tǒng)工程,海事系統(tǒng)主要包括雷達(dá)系統(tǒng)、信息傳輸系統(tǒng)、船舶交通管理信息系統(tǒng)、顯示系統(tǒng)、船岸通信系統(tǒng)等;另外的配套或輔助設(shè)施主要包括電源系統(tǒng)、氣象系統(tǒng)、閉路電視系統(tǒng)等【l 】,如圖1 1 。v t s 是v e s s e lt r a f f i cs e r v i c e s 的縮寫(xiě),意為船舶交通服務(wù)。v t s 系統(tǒng)一般也叫船舶交通管理信息系統(tǒng),至今還沒(méi)有明確的定義。本文討論的v t s 系統(tǒng)就是海事系統(tǒng)中的船舶交通管理信息系統(tǒng)。圖1 1 海事系統(tǒng)結(jié)構(gòu)f i g 1 1s t r u c t u r eo ft h em a r i t i m es y s t e m第1 章緒論本文的v t s 系統(tǒng)是采用j s p + s e r v l e t 開(kāi)發(fā)的基于m v c 設(shè)計(jì)模式b s 結(jié)構(gòu)的w e b 應(yīng)用程序,并結(jié)合當(dāng)今流行的s t r u t s ,h i b e r n a t e 等開(kāi)源框架和e x t 控件,具有較強(qiáng)的可移植性,便于維護(hù)等優(yōu)點(diǎn)。主要的功能有:申報(bào)、審批進(jìn)出港口的船舶。管理相關(guān)船舶的基本信息,并對(duì)其它子系統(tǒng)提供數(shù)據(jù)支持。解析和顯示港口內(nèi)船舶的動(dòng)態(tài)情況以及天氣情況。并且這個(gè)系統(tǒng)聯(lián)合了高科技的海上監(jiān)視網(wǎng)絡(luò),可同時(shí)跟蹤監(jiān)視動(dòng)態(tài)和靜態(tài)目標(biāo)各2 0 0 個(gè)左右。當(dāng)船舶進(jìn)入v t s 區(qū)域時(shí),雷達(dá)系統(tǒng)自動(dòng)捕捉目標(biāo),其它系統(tǒng)立即計(jì)算出其運(yùn)動(dòng)參數(shù),v t s 監(jiān)督員可對(duì)船舶進(jìn)行動(dòng)態(tài)跟蹤監(jiān)視,掌握船舶航行態(tài)勢(shì),并可通過(guò)v h f 無(wú)線電話與船舶交流、溝通,實(shí)施交通管理和組織。能為海上交通事故的調(diào)查、取證提供寶貴的第一手資料。1 1 2v t s 系統(tǒng)服務(wù)器情況隨著我國(guó)海上交通、船舶運(yùn)輸?shù)刃袠I(yè)的快速發(fā)展,也給海事局v t s 系統(tǒng)服務(wù)器的性能帶來(lái)巨大的挑戰(zhàn),由于海事局一些部門(mén)的v t s 系統(tǒng)采用的服務(wù)器已經(jīng)對(duì)目前的高性能計(jì)算機(jī)系統(tǒng)應(yīng)用服務(wù)提供不了相應(yīng)保障,經(jīng)常會(huì)因?yàn)檐浖蛘哂布矫娴脑驅(qū)е路?wù)器故障,進(jìn)而引起數(shù)據(jù)丟失等方面問(wèn)題。然而還有一些部門(mén)采用的服務(wù)器平臺(tái)是多點(diǎn)集群的方式,雖然可以對(duì)應(yīng)用服務(wù)提供保障,性能也更佳。但是缺乏對(duì)操作業(yè)務(wù)、數(shù)據(jù)量等方面的考慮,造成計(jì)算機(jī)資源及部門(mén)資金的浪費(fèi)。另外,服務(wù)器系統(tǒng)需要長(zhǎng)時(shí)間無(wú)故障運(yùn)行,可靠性缺乏相應(yīng)的保障,這樣會(huì)造成應(yīng)用系統(tǒng)服務(wù)的暫停,從而導(dǎo)致業(yè)務(wù)操作中斷等一系列的問(wèn)題。1 2 研究目的1 、構(gòu)建一個(gè)既能滿足海事局相關(guān)部門(mén)的業(yè)務(wù)需求,又能保證v t s 系統(tǒng)的穩(wěn)定運(yùn)行,同時(shí)也大大降低運(yùn)行和維護(hù)系統(tǒng)的資金費(fèi)用的服務(wù)器平臺(tái),以滿足海事局用戶的迫切要求。2 、可靠性是衡量服務(wù)器系統(tǒng)質(zhì)量的重要技術(shù)指標(biāo),在保證v t s 系統(tǒng)中的應(yīng)用程序能夠長(zhǎng)時(shí)問(wèn)的無(wú)故障運(yùn)行的前提下,還應(yīng)當(dāng)使服務(wù)器系統(tǒng)具有較強(qiáng)的故障檢v t s 雙機(jī)熱備系統(tǒng)的可靠性研究與應(yīng)用測(cè)以及快速修復(fù)的能力,確保服務(wù)器系統(tǒng)滿足用戶提出的高可靠性要求。雙機(jī)熱各系統(tǒng)可以擴(kuò)展到多點(diǎn)集群,雙機(jī)熱備的可靠性研究成果對(duì)集群系統(tǒng)來(lái)說(shuō)也有著很大的借鑒和參考價(jià)值。1 3 研究現(xiàn)狀1 3 1 雙機(jī)熱備現(xiàn)狀目前國(guó)內(nèi)外在服務(wù)器平臺(tái)的構(gòu)建方面,日益被用戶接受和廣泛使用的高可用系統(tǒng)是多節(jié)點(diǎn)集群,但對(duì)于一些中小企業(yè)用戶來(lái)將,服務(wù)器的價(jià)格相對(duì)來(lái)講比較昂貴,多點(diǎn)集群系統(tǒng)所需要的硬件及軟件成本很高,加上集群系統(tǒng)技術(shù)較雙機(jī)熱備系統(tǒng)的復(fù)雜度有所提高,需要更專業(yè)的技術(shù)人員進(jìn)行管理,這無(wú)形中就增加了系統(tǒng)的維護(hù)費(fèi)用。新用戶在選擇高可用解決方案時(shí)往往已經(jīng)擁有不止一個(gè)關(guān)鍵應(yīng)用,或者就算某些用戶目前只有極少的關(guān)鍵應(yīng)用,但其考慮未來(lái)關(guān)鍵業(yè)務(wù)數(shù)量的增加,仍然可以先購(gòu)買兩個(gè)節(jié)點(diǎn)的“集群”,也就是通常所說(shuō)的的雙機(jī)熱備系統(tǒng),日后可以進(jìn)行擴(kuò)展,如何簡(jiǎn)單的擴(kuò)充也是用戶急需解決的問(wèn)題,“集群”的“平滑擴(kuò)展”就能很好的滿足用戶這些需求。不久前,日本的f 5 公司開(kāi)發(fā)出了高可用性集群b i g i p ,它是使用于本地網(wǎng)絡(luò)站點(diǎn)或數(shù)據(jù)中心的高可用的、智能化的負(fù)載平衡產(chǎn)品,并且提供了對(duì)網(wǎng)絡(luò)流量的自動(dòng)和智能的管理【2 】【3 1 。與其它的高可用集群系統(tǒng)不同的是,b i g i p 向用戶提供的是一個(gè)即插即用設(shè)備,而其它的提供的都是軟件方法。在國(guó)內(nèi)方面,聯(lián)想公司推出了用于高性能計(jì)算分布式n s l 0 0 0 0 高可用集群服務(wù)器,主要基于聯(lián)想萬(wàn)全4 5 0 0 r服務(wù)器,以總體成本相對(duì)較低的設(shè)備組合,足以替代傳統(tǒng)r i s c 小型機(jī)和中型機(jī)的工作,而價(jià)格僅為市場(chǎng)上同等性能小型機(jī)的1 2 1 4 【4 | 。雙機(jī)熱備或多點(diǎn)集群大多是通過(guò)集群軟件( 對(duì)于雙機(jī)熱備來(lái)說(shuō)也叫雙機(jī)軟件)來(lái)實(shí)現(xiàn)的。那么,目前市場(chǎng)上的高可用集群軟件有那些呢? 據(jù)了解,由于集群的技術(shù)含金量比較高,因此能夠擁有集群核心開(kāi)發(fā)技術(shù)及產(chǎn)品的企業(yè)在國(guó)際上也較少,而且往往是一些技術(shù)實(shí)力較強(qiáng)的公司才能推動(dòng)及支持集群產(chǎn)品的研發(fā)。集群軟件基本分為三個(gè)派系【5 】:第1 章緒論1 、歐美系列:以s y m a n t e c 、e m c 為主,其產(chǎn)品功能較好,產(chǎn)品支持平臺(tái)較全,但對(duì)應(yīng)用環(huán)境要求較高,操作、配置都比較繁瑣復(fù)雜,產(chǎn)品價(jià)格偏高,售后服務(wù)成本也相對(duì)較高;2 、國(guó)內(nèi)系列:以聯(lián)鼎軟件l a n d e r c l u s t e r 為主,聯(lián)鼎軟件是國(guó)內(nèi)高可用領(lǐng)域歷史悠久的著名開(kāi)發(fā)企業(yè),其高可用產(chǎn)品l a n d e r c l u s t e r 的用戶眾多,在國(guó)內(nèi)各個(gè)重要行業(yè)都擁有大量成功案例。產(chǎn)品支持平臺(tái)全面,包括w i n d o w s 、l i n u x 、u n i x ,功能也非常全面。3 、日本系列:以n e c 的產(chǎn)品為主,支持w i n d o w s 及l(fā) i n u x 平臺(tái),由于n e c的產(chǎn)業(yè)鏈較多,集群只是其中很小一部分,因此技術(shù)及投入力度相對(duì)有限。圖1 2是初步市場(chǎng)調(diào)查得出的各個(gè)集群軟件派系所占的市場(chǎng)份額。圖1 2 集群軟件市場(chǎng)份額f i g 1 2t h em a r k e ts h a r eo fc l u s t e rs o f t w a r e1 3 2 可靠性的研究現(xiàn)狀對(duì)計(jì)算機(jī)系統(tǒng)性能單方面的關(guān)注容易使人忽略其他的一些重要的方面,例如可靠性就是一個(gè)常常被忽略的因素6 1 ,由于系統(tǒng)的可靠性較差,往往給人們帶來(lái)巨大損失,尤其對(duì)于關(guān)鍵業(yè)務(wù),停機(jī)通常是災(zāi)難性的,因此停機(jī)帶來(lái)的損失也是巨大的。如表1 1 所統(tǒng)汁的數(shù)據(jù),列舉了不同類型企業(yè)應(yīng)用系統(tǒng)停機(jī)所帶來(lái)的損失。v t s 雙機(jī)熱備系統(tǒng)的可靠性研究與應(yīng)用表1 1 各種計(jì)算機(jī)應(yīng)用系統(tǒng)宕機(jī)損失統(tǒng)計(jì)t a b 1 1l o s so fc o m p u t e rs y s t e md o w n t i m es t a t i s t i c s損失( 美元每分鐘)應(yīng)用系統(tǒng)4 3 0 0 03 6 0 0 02 8 0 0 02 3 0 0 01 9 0 0 0呼叫中心( c c )電子商務(wù)( e c )企業(yè)資源計(jì)劃( e r p )客戶服務(wù)系統(tǒng)( c s c )供應(yīng)鏈管理( s 例)由此可見(jiàn),服務(wù)器系統(tǒng)的可靠性己是非常緊迫且急待解決的問(wèn)題,在對(duì)系統(tǒng)可靠性方面的研究中,建模是一種比較常用而有效的方式。通過(guò)對(duì)系統(tǒng)進(jìn)行簡(jiǎn)化和抽象后,應(yīng)用現(xiàn)在多種的模型分析方法,可以使我們對(duì)系統(tǒng)的整體性能和行為方式有更加具體的分析和預(yù)測(cè)。在理論和技術(shù)的不斷發(fā)展中,產(chǎn)生了組合模型【7 1 、動(dòng)態(tài)故障樹(shù)【8 】、神經(jīng)網(wǎng)絡(luò)【9 1 和m a r k o v 模型【1 0 】【1 1 1 等多種分析方法。通過(guò)分析和比較,并將這種研究成果應(yīng)用于關(guān)鍵應(yīng)用的服務(wù)器系統(tǒng)上,不同程度地滿足和優(yōu)化了某些應(yīng)用系統(tǒng)的需求,從而使用戶更容易接受價(jià)格低廉、應(yīng)用廣泛、性能可靠的服務(wù)器系統(tǒng)。1 4 論文組織結(jié)構(gòu)論文總共有六個(gè)部分。第一部分,在介紹課題背景和研究目的后,闡述了研究現(xiàn)狀。第二部分,探討雙機(jī)熱備的作用和實(shí)現(xiàn)方式基礎(chǔ)上,深入研究雙機(jī)熱備的關(guān)鍵技術(shù)。第三部分,以海事局v t s 項(xiàng)目為背景,提出了系統(tǒng)實(shí)現(xiàn)的設(shè)計(jì)方案,包括系統(tǒng)設(shè)計(jì)原則、系統(tǒng)的結(jié)構(gòu)層次設(shè)計(jì)和工作流程設(shè)計(jì)等。第四部分,利用馬爾柯夫預(yù)測(cè)法對(duì)v t s 雙機(jī)熱備系統(tǒng)建立了相應(yīng)的可靠度數(shù)學(xué)模型,分析相關(guān)參數(shù)對(duì)系統(tǒng)的可靠性影響,并通過(guò)改進(jìn)系統(tǒng)的檢測(cè)率來(lái)提高v t s 雙機(jī)熱備系統(tǒng)的可靠性。第五部分,給出了v t s 雙機(jī)熱備系統(tǒng)的具體部署和實(shí)現(xiàn)過(guò)程,并采用故障注入法對(duì)系統(tǒng)進(jìn)行測(cè)試,最后通過(guò)比較改進(jìn)前后可靠度,驗(yàn)證了系統(tǒng)可靠性的提高。第六部分,對(duì)全文工作進(jìn)行總結(jié),指出進(jìn)一步的工作。第2 章艤機(jī)熱備的相關(guān)理論與技術(shù)第2 章雙機(jī)熱備的相關(guān)理論與技術(shù)2 1 雙機(jī)熱備概述2 1 1h a 簡(jiǎn)介高可用性h a ( h i g ha v a i l a b i l i t y ) :指的是通過(guò)盡量縮短因日常維護(hù)操作( 計(jì)劃)和突發(fā)的系統(tǒng)崩潰( 非計(jì)劃) 所導(dǎo)致的停機(jī)時(shí)間,以提高系統(tǒng)或者應(yīng)用的可用性。它與不間斷操作的容錯(cuò)技術(shù)有所不同。高可用性系統(tǒng)是目前企業(yè)防止核心計(jì)算機(jī)系統(tǒng)因故障停機(jī)的最有效手段。通過(guò)硬件冗余或軟件的方法都可以很大程度上提高系統(tǒng)的可用性,硬件冗余主要是通過(guò)在系統(tǒng)中維護(hù)多個(gè)冗余部件如硬盤(pán)、網(wǎng)線等來(lái)保證工作部件失效時(shí)可以繼續(xù)使用冗余部件來(lái)提供服務(wù);而軟件的方法是通過(guò)軟件對(duì)系統(tǒng)中多臺(tái)機(jī)器的運(yùn)行狀態(tài)進(jìn)行監(jiān)測(cè),在某臺(tái)機(jī)器失效時(shí)啟動(dòng)備用機(jī)器接管失效機(jī)器的工作來(lái)繼續(xù)提供服務(wù),所以集群是h a 系統(tǒng)的主要表現(xiàn)方式。集群:是由兩臺(tái)或多臺(tái)節(jié)點(diǎn)機(jī)( 服務(wù)器) 構(gòu)成的一種松散耦合的計(jì)算節(jié)點(diǎn)集合,為用戶提供網(wǎng)絡(luò)服務(wù)或應(yīng)用程序( 包括數(shù)據(jù)庫(kù)、w e b 服務(wù)和文件服務(wù)等) 的單一客戶視圖,同時(shí)提供接近容錯(cuò)機(jī)的故障恢復(fù)能力。集群系統(tǒng)一般通過(guò)兩臺(tái)或多臺(tái)節(jié)點(diǎn)服務(wù)器系統(tǒng)通過(guò)相應(yīng)的硬件及軟件互連,每個(gè)群集節(jié)點(diǎn)都是運(yùn)行其自己進(jìn)程的獨(dú)立服務(wù)器。這些進(jìn)程可以彼此通信,對(duì)網(wǎng)絡(luò)客戶機(jī)來(lái)說(shuō)就像是形成了一個(gè)單一系統(tǒng),協(xié)同起來(lái)向用戶提供應(yīng)用程序、系統(tǒng)資源和數(shù)據(jù)。除了作為單一系統(tǒng)提供服務(wù),集群系統(tǒng)還具有恢復(fù)服務(wù)器級(jí)故障的能力。集群系統(tǒng)還可通過(guò)在集群中繼續(xù)增加服務(wù)器的方式,從內(nèi)部增加服務(wù)器的處理能力,并通過(guò)系統(tǒng)級(jí)的冗余提供固有的可靠性。雙機(jī)熱各系統(tǒng)屬于集群的一種,這一概念包括了廣義與狹義兩種意義【1 2 】【1 3 j :從廣義上講,雙機(jī)熱備系統(tǒng)就是對(duì)于重要的服務(wù),使用兩臺(tái)服務(wù)器,互相備份,共同執(zhí)行同一服務(wù)。當(dāng)一臺(tái)服務(wù)器出現(xiàn)故障時(shí),可以由另一臺(tái)服務(wù)器承擔(dān)服務(wù)任務(wù),從而在不需要人工干預(yù)的情況下,自動(dòng)保證服務(wù)器系統(tǒng)能持續(xù)的提供服務(wù)。v t s 雙機(jī)熱備系統(tǒng)的可靠性研究與應(yīng)用從狹義上講,雙機(jī)熱備系統(tǒng)特指基于a c t i v e s t a n d b y 方式的服務(wù)器熱各。服務(wù)器數(shù)據(jù)包括數(shù)據(jù)庫(kù)數(shù)據(jù)同時(shí)往兩臺(tái)服務(wù)器上寫(xiě),或者使用一個(gè)共享的存儲(chǔ)設(shè)備。在同一時(shí)間內(nèi)只有一臺(tái)服務(wù)器運(yùn)行即a c t i v e 機(jī)器,當(dāng)其中運(yùn)行著的一臺(tái)服務(wù)器出現(xiàn)故障無(wú)法啟動(dòng)時(shí),就會(huì)通過(guò)雙機(jī)軟件的偵測(cè)( 一般是通過(guò)心跳檢測(cè)) 將s t a n d b y機(jī)器激活,保證應(yīng)用在短時(shí)間內(nèi)完全恢復(fù)正常使用。2 1 2r a idr a i d :r a i d 是“r e d u n d a n ta r r a yo f i n d e p e n d e n td i s k ”的縮寫(xiě),中文意思是獨(dú)立冗余磁盤(pán)陣列( 最初為廉價(jià)磁盤(pán)冗余陣列) 冗余磁盤(pán)陣列技術(shù)誕生于1 9 8 7 年,由美國(guó)加州大學(xué)伯克利分校提出。最初研制目的是為了組合小的廉價(jià)磁盤(pán)來(lái)代替大的昂貴磁盤(pán),以降低大批量數(shù)據(jù)存儲(chǔ)的費(fèi)用,同時(shí)也希望采用冗余信息的方式,使得磁盤(pán)失效時(shí)不會(huì)使對(duì)數(shù)據(jù)的訪問(wèn)受損失,從而開(kāi)發(fā)出一定水平的數(shù)據(jù)保護(hù)技術(shù),并且能適當(dāng)?shù)奶嵘龜?shù)據(jù)傳輸速度【h 】。r a i d 的優(yōu)點(diǎn)【1 5 】:擴(kuò)大了存貯能力,可由多個(gè)硬盤(pán)組成容量巨大的存貯空間。降低了單位容量的成本,市場(chǎng)上最大容量的硬盤(pán)每兆容量的價(jià)格要大大高于普及型硬盤(pán),因此采用多個(gè)普及型硬盤(pán)組成的陣列其單位價(jià)格要低得多。提高了存貯速度,單個(gè)硬盤(pán)速度的提高均受到各個(gè)時(shí)期的技術(shù)條件限制,要更進(jìn)一步往往是很因難的,而使用r a i d ,則可以讓多個(gè)硬盤(pán)同時(shí)分?jǐn)倲?shù)據(jù)的讀或?qū)懖僮鳎虼苏w速度有成倍地提高。另外,可靠性r a i d 系統(tǒng)可以使用兩組硬盤(pán)同步完成鏡像存貯,這種安全措施對(duì)于網(wǎng)絡(luò)服務(wù)器來(lái)說(shuō)是最重要不過(guò)的了;容錯(cuò)性r a i d控制器的一個(gè)關(guān)鍵功能就是容錯(cuò)處理,容錯(cuò)陣列中如有單塊硬盤(pán)出錯(cuò),不會(huì)影響到整體的繼續(xù)使用,高級(jí)r a i d 控制器還具有拯救功能。r a i d 技術(shù)規(guī)范:r a i d 技術(shù)主要包含r a i d0 一- - r a i d7 等數(shù)個(gè)規(guī)范,它們的側(cè)重點(diǎn)各不相同,這里重點(diǎn)介紹下r a i d 5 。r a i d5 不單獨(dú)指定奇偶校驗(yàn)磁盤(pán),而是在所有磁盤(pán)上交叉地存取數(shù)據(jù)及奇偶校驗(yàn)信息。方法是將校驗(yàn)數(shù)據(jù)以循環(huán)的方式放在每一個(gè)磁盤(pán)中;磁盤(pán)陣列的第一個(gè)磁盤(pán)分段是校驗(yàn)值,第二個(gè)磁盤(pán)至后一個(gè)磁盤(pán)再折回第一個(gè)磁盤(pán)的分段是數(shù)據(jù),然后第二個(gè)磁盤(pán)的分段是校驗(yàn)值,從第三個(gè)磁盤(pán)再折回第二個(gè)磁盤(pán)的分段是數(shù)據(jù),以此類推,直到放完為止。這種方式第2 章艤機(jī)熱備的相關(guān)理論與技術(shù)能大幅增加小檔案的存取性能,不但可同時(shí)讀取,甚至有可能同時(shí)執(zhí)行多個(gè)寫(xiě)入的動(dòng)作,就是說(shuō)讀寫(xiě)指針可同時(shí)對(duì)陣列設(shè)備進(jìn)行操作,提供了更高的數(shù)據(jù)流量。r a i d5 更適合于小數(shù)據(jù)塊和隨機(jī)讀寫(xiě)的數(shù)據(jù)。其應(yīng)用最好是聯(lián)機(jī)應(yīng)用處理系統(tǒng),至于用于圖像處理等,未必會(huì)有最佳的性能【1 6 】。其各種規(guī)范的比較如表2 1 。表2 1 常見(jiàn)r a i d 技術(shù)比較t a b 2 1c o m p a r i s o no f c o m m o nr a i dt e c h n o l o g yr a i d0r a i d1r a i d3r a i d5名稱無(wú)差錯(cuò)控制鏡像結(jié)構(gòu)專用校驗(yàn)條帶校驗(yàn)條帶分散允許故障否是是是冗余類型無(wú)副本校驗(yàn)校驗(yàn)熱備用操作不可可以可以可以硬盤(pán)數(shù)量一個(gè)以上兩個(gè)三個(gè)以上三個(gè)以上可用容量最人最小中間中間減少容量無(wú)5 0 一個(gè)磁盤(pán)一個(gè)磁盤(pán)讀性能高中間高高隨機(jī)寫(xiě)性能最高中間最低低連續(xù)寫(xiě)性能最高中間低最低另外,我們可以結(jié)合多種r a i d 規(guī)范來(lái)構(gòu)筑所需的r a i d 陣列,例如r a i d1 0( r a i d i + o ) 、r a i d 3 0 、r a i d 5 0 就是- - ;f d p 應(yīng)用較為廣泛的陣列形式。用戶一般可以通過(guò)靈活配置磁盤(pán)陣列來(lái)獲得更加符合其要求的磁盤(pán)存儲(chǔ)系統(tǒng),比較如表2 2 。表2 2 組合r a i d 技術(shù)比較t a b 2 2c o m p a r i s o no fc o m b i n a t i o no fr a i dt e c h n o l o g yr a i d1 0r a i d3 0r a i d5 0名稱跨越鏡像陣列跨越專用校驗(yàn)陣列跨越分散校驗(yàn)陣列允許故障是是是冗余類型副本校驗(yàn)校驗(yàn)熱備用操作可以可以可以磁盤(pán)數(shù)量跨越2 個(gè)陣列跨越3 個(gè)陣列跨越4 個(gè)陣列可用容量最小中間中間減少容量5 0 一個(gè)磁盤(pán)一個(gè)磁盤(pán)讀性能中間高高隨機(jī)寫(xiě)性能中間最低低連續(xù)寫(xiě)性能低中間最低v t s 雙機(jī)熱備系統(tǒng)的可靠性研究與應(yīng)用2 2 作用及實(shí)現(xiàn)方式1 、雙機(jī)熱備的作用目前,國(guó)內(nèi)企業(yè)使用的雙機(jī)熱備系統(tǒng)大多是基于中小型計(jì)算機(jī)系統(tǒng)的,實(shí)踐證明,雙機(jī)熱備是提高計(jì)算機(jī)服務(wù)器系統(tǒng)可靠性的有力措施。隨著國(guó)內(nèi)計(jì)算機(jī)信息系統(tǒng)的推廣和普及,許多中小企業(yè)提出了利用p c 服務(wù)器作為計(jì)算機(jī)主機(jī)系統(tǒng)的需求1 7 】。對(duì)于較重要或很重要的應(yīng)用需求來(lái)說(shuō),建立雙機(jī)熱各,可以更好的保證服務(wù)器系統(tǒng)的安全運(yùn)行,而雙機(jī)熱備究竟能為我們帶來(lái)些什么呢?( 1 ) 提高穩(wěn)定性服務(wù)器是一種高穩(wěn)定性的計(jì)算機(jī),作為網(wǎng)絡(luò)的節(jié)點(diǎn)存儲(chǔ)、處理網(wǎng)絡(luò)中的數(shù)據(jù)、信息,它被稱為應(yīng)用服務(wù)的靈魂。雖然服務(wù)器最大的特點(diǎn)就是它的穩(wěn)定性超過(guò)了一般的臺(tái)式機(jī),但服務(wù)器要想做到1 0 0 不死機(jī)或不出問(wèn)題是不可能的。通過(guò)對(duì)服務(wù)器的雙機(jī)熱備,可大大減少因服務(wù)器癱瘓帶來(lái)的網(wǎng)絡(luò)癱瘓。因此雙機(jī)熱備技術(shù)大大提高了服務(wù)器以及網(wǎng)絡(luò)的穩(wěn)定性。( 2 ) 安全保障對(duì)于服務(wù)器來(lái)說(shuō),最需要重視的就是數(shù)據(jù)安全和服務(wù)安全。服務(wù)器常見(jiàn)的數(shù)據(jù)安全保障方法有數(shù)據(jù)備份及r a i d 等。雖然這些數(shù)據(jù)備份方案能解決硬盤(pán)的數(shù)據(jù)及服務(wù)安全問(wèn)題,但仍解決不t n 務(wù)器故障引發(fā)的數(shù)據(jù)安全問(wèn)題【1 8 】。在采用雙機(jī)熱備后,當(dāng)一臺(tái)服務(wù)器出現(xiàn)軟、硬件故障時(shí),另一臺(tái)服務(wù)器可以在短時(shí)間內(nèi)將故障服務(wù)器的職權(quán)接管過(guò)來(lái),能很快地恢復(fù)服務(wù)器的應(yīng)用,保證網(wǎng)絡(luò)應(yīng)用服務(wù)的持續(xù)性。2 、雙機(jī)熱備的實(shí)現(xiàn)方式雙機(jī)熱備有兩種實(shí)現(xiàn)方式,一種是基于共享存儲(chǔ)設(shè)備的方式,另一種是沒(méi)有共享存儲(chǔ)設(shè)備的方式,一般稱為純軟件方式。( 1 ) 共享存儲(chǔ)設(shè)備方式基于共享存儲(chǔ)設(shè)備的雙機(jī)熱備是雙機(jī)熱備的最標(biāo)準(zhǔn)方案【1 9 】【2 0 1 。對(duì)于這種方式,采用兩臺(tái)服務(wù)器,使用共享的存儲(chǔ)設(shè)備( 磁盤(pán)陣列柜或存儲(chǔ)區(qū)域網(wǎng)s a n ) 。兩臺(tái)服務(wù)器可以采用互備、主從、并行等不同的方式。在工作過(guò)程中,兩臺(tái)服務(wù)器將第2 章雙機(jī)熱備的相關(guān)理論與技術(shù)以一個(gè)虛擬的i p 地址對(duì)外提供服務(wù),依工作方式的不同,將服務(wù)請(qǐng)求發(fā)送給其中一臺(tái)服務(wù)器承擔(dān)。同時(shí),服務(wù)器通過(guò)心跳線( 目前往往采用建立私有網(wǎng)絡(luò)的方式)偵測(cè)另一臺(tái)服務(wù)器的工作狀況。當(dāng)一臺(tái)服務(wù)器出現(xiàn)故障時(shí),另一臺(tái)服務(wù)器根據(jù)心跳偵測(cè)的情況做出判斷,并進(jìn)行切換,接管服務(wù)。對(duì)于用戶而言,這一過(guò)程是全自動(dòng)的,在很短時(shí)間內(nèi)完成,從而對(duì)業(yè)務(wù)不會(huì)造成影響。由于使用共享的存儲(chǔ)設(shè)備,因此兩臺(tái)服務(wù)器使用的實(shí)際上是一樣的數(shù)據(jù),由雙機(jī)軟件對(duì)其進(jìn)行管理。這種實(shí)現(xiàn)方式的主要優(yōu)點(diǎn)有:由于磁盤(pán)陣列柜能加快系統(tǒng)i o 速度,所以對(duì)于i o 要求較高的系統(tǒng)運(yùn)行效率高。雙機(jī)通過(guò)共享數(shù)據(jù)來(lái)達(dá)到高可用目的,風(fēng)險(xiǎn)集中到磁盤(pán)陣列柜上面。而磁盤(pán)陣列柜是由很多便宜、容量較小、穩(wěn)定性較高、速度較慢磁盤(pán),組合成一個(gè)大型的磁盤(pán)組,利用個(gè)別磁盤(pán)提供數(shù)據(jù)所產(chǎn)生的加成效果來(lái)提升整個(gè)磁盤(pán)系統(tǒng)的效能。前面已經(jīng)介紹過(guò)其相關(guān)知識(shí)和優(yōu)點(diǎn),這里不再贅述。其基本結(jié)構(gòu)如圖2 1 所示。圖2 1 共享存儲(chǔ)設(shè)備的雙機(jī)熱備f i g 2 1s h a r e ds t o r a g ed e v i c eo ft h ed u a l m a c h i n eh o ts t a n d b y( 2 ) 純軟件方式v t s 雙機(jī)熱備系統(tǒng)的可靠性研究與應(yīng)用對(duì)于純軟件的方式【2 1 1 ,則是通過(guò)鏡像軟件,將數(shù)據(jù)可以實(shí)時(shí)復(fù)制到另臺(tái)服務(wù)器上,這樣同樣的數(shù)據(jù)就在兩臺(tái)服務(wù)器上各存在一份,如果一臺(tái)服務(wù)器出現(xiàn)故障,可以及時(shí)切換到另一臺(tái)服務(wù)器。這一方式不受距離的限制,但會(huì)產(chǎn)生數(shù)據(jù)的前后不一致或數(shù)據(jù)庫(kù)讀取的速度會(huì)受一定的影響,如圖2 2 。純軟件方式還有另外一種情況,即服務(wù)器只是提供應(yīng)用服務(wù),而并不保存數(shù)據(jù)( 比如只進(jìn)行某些計(jì)算,做為應(yīng)用服務(wù)器使用) 。這種情況下同樣也不需要使用共享的存儲(chǔ)設(shè)備,而可以直接使用雙機(jī)或集群軟件即可。但這種情況其實(shí)與鏡像軟件無(wú)關(guān),只不過(guò)是標(biāo)準(zhǔn)的雙機(jī)熱備一種小的變化。圖2 2 純軟件方式的雙機(jī)熱備f i g 2 2p u r es o f t w a r eo ft h ed u a l m a c h i n eh o ts t a n d b y純軟件方式的優(yōu)點(diǎn):避免了磁盤(pán)陣列的單點(diǎn)故障,對(duì)于雙機(jī)熱備,本身即是防范由于單個(gè)設(shè)備的故障導(dǎo)致服務(wù)中斷,但磁盤(pán)陣列恰恰又形成了一個(gè)新的單點(diǎn)。( 比如,服務(wù)器的可靠系數(shù)是9 9 9 ,磁盤(pán)陣列的可靠系數(shù)是9 9 9 5 ,則純軟雙機(jī)的可靠系數(shù)是9 9 9 * 9 9 9 = 9 9 9 9 ,而基于磁盤(pán)陣列的雙機(jī)熱備系統(tǒng)的可靠系數(shù)則會(huì)是略低于9 9 9 5 ) 。節(jié)約投資,不需購(gòu)買昂貴的磁盤(pán)陣列。第2 章雙機(jī)熱備的相關(guān)理論與技術(shù)不受距離的限制,兩臺(tái)服務(wù)器不需受磁盤(pán)電纜的長(zhǎng)度限制( 光纖通道的磁盤(pán)陣列也不受距離限制,但投資會(huì)大得多) 。這樣,可以更靈活地部署服務(wù)器,包括通過(guò)物理位置的距離來(lái)提高安全性。但純軟件方式有非常明顯的缺點(diǎn):可靠性相對(duì)較差,兩臺(tái)服務(wù)器之間的數(shù)據(jù)實(shí)時(shí)復(fù)制是一個(gè)比較脆弱的環(huán)節(jié)。一旦某臺(tái)服務(wù)器出現(xiàn)中斷,恢復(fù)后還要進(jìn)行比較復(fù)雜的數(shù)據(jù)同步恢復(fù)。并且,這個(gè)時(shí)段系統(tǒng)處于無(wú)保護(hù)狀態(tài)。沒(méi)有事務(wù)機(jī)制,由于其復(fù)制是在文件和磁盤(pán)層進(jìn)行的,復(fù)制是否成功不會(huì)影響數(shù)據(jù)庫(kù)事務(wù)操作,因此有出現(xiàn)數(shù)據(jù)不完整變化的情況,這個(gè)存在著相當(dāng)?shù)娘L(fēng)險(xiǎn)。因此,建議除非不得已,不要選擇純軟件方案。何況現(xiàn)在市面上大多采用共享存儲(chǔ)的方式來(lái)實(shí)現(xiàn)雙機(jī)熱備系統(tǒng),純軟件方式以前應(yīng)用得較少,主要一方面是由于當(dāng)時(shí)市場(chǎng)上比較流行的雙機(jī)軟件不支持純軟件方式,另一方面是由于少數(shù)支持純軟件方式的產(chǎn)品其可靠性不太令人放心。所以在進(jìn)行雙機(jī)熱備時(shí),如果投資充裕、數(shù)據(jù)量大( 1 t 以上) ,可以采用共享磁盤(pán)陣列柜的方式,并且應(yīng)盡量選擇高可靠性( 如著名品牌的) 設(shè)備。當(dāng)然,本文由于具有一定的實(shí)驗(yàn)條件,以往也沒(méi)有采用純軟件的方式實(shí)現(xiàn)過(guò)雙機(jī)熱各系統(tǒng)的經(jīng)驗(yàn)和對(duì)軟件穩(wěn)定性的信心,故本文不采用純軟件的方式,而采用共享存儲(chǔ)設(shè)備的方式來(lái)實(shí)現(xiàn)雙機(jī)熱備系統(tǒng)。2 3 雙機(jī)熱備關(guān)鍵技術(shù)在雙機(jī)熱備系統(tǒng)中,常用的關(guān)鍵技術(shù)有故障診斷、檢查點(diǎn)機(jī)制、證實(shí)策略、任務(wù)接管等。2 3 1 故障診斷故障診斷機(jī)制【2 2 】中最常用的模式是報(bào)告式、問(wèn)答式以及根據(jù)它們的形式作出各種變化的模式。v 1 弓雙機(jī)熱各系統(tǒng)的可靠性研究與應(yīng)用1 、報(bào)告式圖2 3 報(bào)告式故辟診斷f i g 2 3 r e p o r t f a u l td e t e c t i o n在報(bào)告式中,如圖2 3 。被監(jiān)測(cè)節(jié)點(diǎn)是活動(dòng)的,它會(huì)周期性的發(fā)送一c , 副b ( h e a r t b e , t )數(shù)據(jù)信息以通知監(jiān)測(cè)節(jié)點(diǎn)它仍然處于正常狀態(tài)。如果監(jiān)測(cè)節(jié)點(diǎn)在一定限制時(shí)間內(nèi)沒(méi)有收到被監(jiān)測(cè)節(jié)點(diǎn)的心跳信息,它則懷疑該節(jié)點(diǎn)己失效。因?yàn)樾畔?shù)據(jù)的傳送在系統(tǒng)內(nèi)只有一個(gè)方向的( 對(duì)于某一臺(tái)服務(wù)器節(jié)點(diǎn)來(lái)說(shuō)) ,所以它的效率較高??勺栌糜布亩嗖? m u l f i c a s 0 機(jī)制來(lái)實(shí)現(xiàn)多個(gè)監(jiān)測(cè)節(jié)點(diǎn)同時(shí)監(jiān)測(cè)相同對(duì)象,被監(jiān)測(cè)節(jié)點(diǎn)周期性的發(fā)送心跳數(shù)據(jù)信息給監(jiān)測(cè)節(jié)點(diǎn),只要收到信息,監(jiān)測(cè)節(jié)點(diǎn)設(shè)置一個(gè)時(shí)間限制,如果在接收到同一被監(jiān)測(cè)節(jié)點(diǎn)發(fā)來(lái)的一c , t j b 信息之前超過(guò)了這個(gè)時(shí)間限制,則觸發(fā)失效事件。2 、問(wèn)答式在問(wèn)答式中,信息數(shù)據(jù)的方向與控制數(shù)據(jù)的方向是相反的。如圖24 所示,在這種模式中,被監(jiān)控節(jié)點(diǎn)是被動(dòng)的。監(jiān)測(cè)節(jié)點(diǎn)周期性的發(fā)送“a r ey o ua l i v e ? ”請(qǐng)求給被監(jiān)測(cè)節(jié)點(diǎn)。如果被監(jiān)測(cè)節(jié)點(diǎn)回應(yīng)“ia ma l i v e ”則表明其仍然處于良好狀態(tài)。因?yàn)閷?duì)被監(jiān)測(cè)節(jié)點(diǎn)而言有兩個(gè)方向的信息數(shù)據(jù)發(fā)送,所以這種模式可能比報(bào)告式效率低點(diǎn),但對(duì)于應(yīng)用開(kāi)發(fā)者來(lái)說(shuō),因?yàn)楸槐O(jiān)測(cè)節(jié)點(diǎn)是被動(dòng)的,而且不需要任何關(guān)于時(shí)間的知識(shí),這種模式較為方便使用,例如它們并不需要知道監(jiān)測(cè)節(jié)點(diǎn)希望收到數(shù)據(jù)的頻率,即報(bào)告式中的心跳周期。第2 章般機(jī)熱備的相關(guān)理論與技術(shù)圖2 4 問(wèn)答式故障診斷f i g2 4 a s k a n da n s w e r f a u l t d e t e c t i o n3 、混合式混合式組臺(tái)了以上兩種模式,在這種模式里面,報(bào)告式和問(wèn)答式可以在同類對(duì)象卜同時(shí)使用。診斷過(guò)程分成兩個(gè)不同的階段,在第一階段中,所有被監(jiān)測(cè)節(jié)點(diǎn)假設(shè)使 j 報(bào)告式,因此發(fā)送心跳數(shù)據(jù)。在一段延遲后,監(jiān)測(cè)轉(zhuǎn)為第二階段,在這個(gè)階段里,假設(shè)所有在第一階段中沒(méi)有發(fā)送心跳數(shù)據(jù)的被監(jiān)測(cè)節(jié)點(diǎn)使用問(wèn)答式,監(jiān)測(cè)節(jié)點(diǎn)發(fā)送a l i v e n e s s 信息給每個(gè)被監(jiān)測(cè)節(jié)點(diǎn),并且期望從被監(jiān)測(cè)節(jié)點(diǎn)上收到心跳數(shù)據(jù),如圖2 5 所示。圖2 5 混臺(tái)式故障診斷f i g2 5m i x e df a u l td e t e c t i o nv t s 雙機(jī)熱備系統(tǒng)的可靠性研究與應(yīng)用如果被監(jiān)測(cè)節(jié)點(diǎn)沒(méi)有在一定時(shí)間限制內(nèi)發(fā)送這種信息,則假定其己失效?;旌鲜皆诒举|(zhì)上并不是一種新的故障診斷模式。它可以被看成是一種混合不同監(jiān)控類型的方法,即它不需要監(jiān)測(cè)節(jié)點(diǎn)知道每個(gè)被監(jiān)測(cè)節(jié)點(diǎn)支持哪種診斷模式。因此它提供了更多的靈活性,讓被監(jiān)測(cè)節(jié)點(diǎn)使用最合適的信息交互模式。以上就是最常見(jiàn)的三種故障診斷模式,它們有著各自的特色,并在不同的應(yīng)用中有著不同的效率。根據(jù)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和應(yīng)用的通訊方式,選擇不同的模式對(duì)系統(tǒng)的性能有著很大的影響。2 3 2 檢查點(diǎn)機(jī)制檢查點(diǎn)機(jī)制2 3 】【2 4 1 是指為了能夠在程序執(zhí)行到中間出故障后不必從頭開(kāi)始,周期性地設(shè)置檢查點(diǎn)以保存中間狀態(tài),一旦發(fā)生故障,可以從最近的檢查點(diǎn)重新執(zhí)行,這種檢查點(diǎn)設(shè)置與卷回方法是容錯(cuò)中常采用的一種軟件技術(shù)。系統(tǒng)發(fā)生故障后,將相關(guān)進(jìn)程回滾到故障前系統(tǒng)一致性狀態(tài)( 檢查點(diǎn)) ,經(jīng)過(guò)狀態(tài)恢復(fù)后從該檢查點(diǎn)處重新執(zhí)行( 而不是從程序開(kāi)始執(zhí)行) ,實(shí)現(xiàn)對(duì)系統(tǒng)故障的恢復(fù);從而節(jié)省了大量重復(fù)計(jì)算時(shí)間。這種基于檢查點(diǎn)的后向恢復(fù)技術(shù)不僅可以對(duì)系統(tǒng)瞬時(shí)故障進(jìn)行自動(dòng)恢復(fù),也是恢復(fù)未知故障( 在某一應(yīng)用設(shè)計(jì)過(guò)程中未預(yù)料到的故障) 的唯一手段,如圖2 6 所示。圖2 6 檢查點(diǎn)機(jī)制f i g 2 6c h e c k p o i n tm e c h a n i s m第2 章雙機(jī)熱備的相關(guān)理論與技術(shù)當(dāng)錯(cuò)誤發(fā)生時(shí),使用檢查點(diǎn)可使受影響的進(jìn)程從最后一次保存的檢查點(diǎn)( 狀態(tài)) 而不是進(jìn)程開(kāi)始重新運(yùn)行。這個(gè)技術(shù)特別適合于保護(hù)長(zhǎng)時(shí)間運(yùn)行程序中出現(xiàn)短暫錯(cuò)誤的情況。長(zhǎng)時(shí)間運(yùn)行的應(yīng)用程序通常是運(yùn)行數(shù)天或數(shù)周的處理數(shù)字程序,對(duì)于這種應(yīng)用程序重新開(kāi)始而言,即便恢復(fù),但由錯(cuò)誤造成的偶然損壞也是不可接受的。檢查點(diǎn)可以是透明的并且在運(yùn)行時(shí)自動(dòng)插入,或者由應(yīng)用程序的程序員手工插入。在透明的方法中,檢查點(diǎn)由處理器地址狀態(tài)的全局快照組成,包括操作系統(tǒng)的所有動(dòng)態(tài)數(shù)據(jù)。其他透明的方法包括處理器內(nèi)部描述表、棧以及靜態(tài)和動(dòng)態(tài)數(shù)據(jù)段。另一方面,在手工方法中,程序員負(fù)責(zé)精確定義哪些數(shù)據(jù)對(duì)應(yīng)用程序確實(shí)是關(guān)鍵性的,這樣可以顯著的減少檢查點(diǎn)的規(guī)模。2 3 3 證實(shí)策略要使雙機(jī)熱備系統(tǒng)的備份節(jié)點(diǎn)應(yīng)用程序按照主節(jié)點(diǎn)的執(zhí)行軌跡運(yùn)行。不能單純依賴于消息到達(dá)的實(shí)際順序,因?yàn)槊總€(gè)處理節(jié)點(diǎn)都同時(shí)從多個(gè)端口接收消息,雖然采用通訊協(xié)議可以保證主備節(jié)點(diǎn)從同一個(gè)端口接收到的消息順序一致,但端口之間消息的順序就無(wú)法保證。為此,可以采用證實(shí)的策略來(lái)保證主備節(jié)點(diǎn)應(yīng)用執(zhí)行軌跡的一致性,如圖2 7 。圖2 7 證實(shí)策略f i g 2 7t h es t r a t e g yt oc o n f i r mv t s 雙機(jī)熱備系統(tǒng)的可靠性研究與應(yīng)用當(dāng)主節(jié)點(diǎn)運(yùn)行到一個(gè)同步點(diǎn)時(shí),向備份節(jié)點(diǎn)發(fā)送一條證實(shí)消息,表明剛才處理的是哪一條消息,備份節(jié)點(diǎn)對(duì)接收到的原始消息進(jìn)行緩存而不送給應(yīng)用程序處理。只有收到主節(jié)點(diǎn)的證實(shí)消息后才將得到匹配的原始消息送給相應(yīng)的應(yīng)用程序進(jìn)行處理。2 3 4 任務(wù)接管任務(wù)接管( f a i l o v e r ) t 2 5 】是雙機(jī)熱備系統(tǒng)恢復(fù)功能的核心。這里先說(shuō)明下系統(tǒng)出現(xiàn)錯(cuò)誤后的恢復(fù)技術(shù),錯(cuò)誤恢復(fù)技術(shù)主要有前向恢復(fù)和后向恢復(fù)兩種。前向恢復(fù)技術(shù)指的是系統(tǒng)從故障中恢復(fù)時(shí),從出錯(cuò)時(shí)刻以后的某一時(shí)刻點(diǎn)開(kāi)始恢復(fù)。后向恢復(fù)技術(shù)指的是系統(tǒng)從故障恢復(fù)時(shí),退回到以前的某一個(gè)狀態(tài),重新開(kāi)始處理。采用后向恢復(fù)方案中,系統(tǒng)的周期性為運(yùn)行在雙機(jī)熱備系統(tǒng)的進(jìn)程中保存檢查點(diǎn)信息,發(fā)生故障后系統(tǒng)回滾到故障發(fā)生處,如圖2 8 所示。在獨(dú)立于應(yīng)用程序的可移植方式下后向恢復(fù)較容易實(shí)現(xiàn),并已被廣泛采用。然而回滾的時(shí)間開(kāi)銷問(wèn)題是一個(gè)應(yīng)仔細(xì)考慮的問(wèn)題;同時(shí),后向恢復(fù)需要避免出現(xiàn)多米諾效應(yīng)。圖2 8 錯(cuò)誤恢復(fù)技術(shù)f i g 2 8t e c h n i q u e so ff a u l tr e c o v e r y第2 章艤機(jī)熱各的相關(guān)理論與技術(shù)如果執(zhí)行時(shí)間是一個(gè)很重要的參數(shù),比如在實(shí)時(shí)性系統(tǒng)中不能容忍回滾恢復(fù)花掉如此長(zhǎng)的執(zhí)行時(shí)間,此時(shí)應(yīng)采用前向恢復(fù)方案。這個(gè)方案中,系統(tǒng)不是回滾到故障前的某個(gè)檢查點(diǎn);相反,系統(tǒng)利用故障診斷信息構(gòu)建一個(gè)有效的系統(tǒng)狀態(tài),繼續(xù)執(zhí)行下去。前向恢復(fù)依賴于應(yīng)用程序且可能需要額外的硬件設(shè)備加以支持。任務(wù)接管應(yīng)該是完全透明的,不需要管理員的干預(yù)或用戶手動(dòng)重新連接。任務(wù)接管也能有效地用于另一個(gè)目的:維護(hù)操作,它可以簡(jiǎn)單的通過(guò)將一個(gè)服務(wù)器上保護(hù)的應(yīng)用服務(wù)切換到第二個(gè)服務(wù)器上來(lái)實(shí)現(xiàn),這樣就實(shí)現(xiàn)了系統(tǒng)的在線維護(hù),并且減少甚至消除了普通維護(hù)任務(wù)的檢修時(shí)間以及操作系統(tǒng)或其他應(yīng)用軟件升級(jí)所帶來(lái)的服務(wù)器停機(jī)?,F(xiàn)在這一點(diǎn)相當(dāng)?shù)闹匾?,因?yàn)橄到y(tǒng)不可用的最大單方面的因素就是維護(hù)或升級(jí)造成的。v t s 職機(jī)熱各系統(tǒng)的可靠性研究與應(yīng)用第3 章v t s 雙機(jī)熱備系統(tǒng)的分析設(shè)計(jì)在前一章中介紹了雙機(jī)熱備系統(tǒng)的相關(guān)理論和關(guān)鍵技術(shù)。本文采用共享存儲(chǔ)設(shè)備的方式即通過(guò)在兩臺(tái)服務(wù)器上運(yùn)行雙機(jī)軟件和共享磁盤(pán)陣列柬對(duì)v t s 雙機(jī)熱各系統(tǒng)進(jìn)行分析設(shè)計(jì),其的物理架構(gòu)如圖3 1 ??蛻羿丝蛻舳巳?lv t s 烈機(jī)熱備物理架構(gòu)圖f i g3ip h y s i c a ls t r u c t u r eo f t h e v t sd u a l - m a c h i n eh o ts t a n d b ys y s t e m31v t s 雙機(jī)熱備系統(tǒng)的設(shè)計(jì)原則本文根據(jù)海事局v t s 系統(tǒng)的要求在設(shè)訃雙機(jī)熱備系統(tǒng)時(shí)主要遵循以下幾個(gè)方向的原則。( 1 ) 硬、軟件設(shè)計(jì)模塊化,擴(kuò)展、重組方便靈活;( 2 ) 仲裁切換邏輯單兀智能化,以雙機(jī)軟件實(shí)現(xiàn)自動(dòng)判決;第3 章v t s 艤機(jī)熱備系統(tǒng)的分析設(shè)計(jì)( 3 ) 避免不必要的無(wú)效切換,即切換執(zhí)行后能夠保證系統(tǒng)正常工作;( 4 ) 主機(jī)能夠偵測(cè)到備份機(jī)故障,并發(fā)出相關(guān)通知;( 5 ) 要求確保切換單元正常工作并且具有可靠的自測(cè)試、自檢測(cè)功能。3 2v t s 雙機(jī)熱備系統(tǒng)的工作模式雙機(jī)熱備系統(tǒng)常見(jiàn)的工作模式有三種:主從式雙機(jī)熱備模式、雙機(jī)互備模式、雙機(jī)雙工模式。主從式雙機(jī)熱備份模式是一臺(tái)服務(wù)器為工作機(jī)( a c t i v e s e r v e r ) ,另一臺(tái)服務(wù)器為備份機(jī)( s t a n d b y s e r v e r ) ,在系統(tǒng)于常情況下,工作機(jī)為應(yīng)用系統(tǒng)提供支持,備份機(jī)監(jiān)視工作機(jī)的運(yùn)行情況( 工作機(jī)也同時(shí)監(jiān)視備份機(jī)是否正常,有時(shí)備份機(jī)因某種原因出現(xiàn)異常,工作機(jī)應(yīng)盡早通知系統(tǒng)管理員解決,確保下一次切換的可靠性) ,如圖3 2 所示。當(dāng)工作機(jī)出現(xiàn)異常,不能支持應(yīng)用系統(tǒng)運(yùn)行時(shí),備份機(jī)主動(dòng)接管( t a k e o v e r ) - v 作機(jī)的全部工作2 6 1 ,繼續(xù)支持應(yīng)用系統(tǒng)的運(yùn)行,從而保證提供不問(wèn)斷的應(yīng)用服務(wù)。圖3 2 主從式雙機(jī)熱備示意圖f i g 3 2t h em a s t e r - s l a v ed u a l m a c h i n eh o ts t a n d b ys y s t e m另外還有兩種模式是
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026上半年安徽事業(yè)單位聯(lián)考馬鞍山市直單位招聘88人備考題庫(kù)附答案詳解(綜合題)
- 2026廣東廣州市天河區(qū)東風(fēng)實(shí)驗(yàn)小學(xué)招聘語(yǔ)文、數(shù)學(xué)、音樂(lè)教師備考題庫(kù)帶答案詳解(達(dá)標(biāo)題)
- 2026中國(guó)建筑材料工業(yè)地質(zhì)勘查中心江西總隊(duì)招聘12人備考題庫(kù)附答案詳解(模擬題)
- 2026上半年貴州事業(yè)單位聯(lián)考務(wù)川自治縣招聘48人備考題庫(kù)附參考答案詳解(培優(yōu))
- 2026廣西北海市第十一中學(xué)臨聘教師招聘9人備考題庫(kù)及參考答案詳解(新)
- 2026上半年安徽事業(yè)單位聯(lián)考懷遠(yuǎn)縣筆試招聘58人備考題庫(kù)附答案詳解(考試直接用)
- 2026中國(guó)日?qǐng)?bào)社及所屬事業(yè)單位招聘國(guó)內(nèi)高校應(yīng)屆畢業(yè)生21人備考題庫(kù)附答案詳解(預(yù)熱題)
- 浙江省環(huán)大羅山聯(lián)盟2025-2026學(xué)年高一上學(xué)期11月期中聯(lián)考物理試題(原卷版)
- 26 詩(shī)詞五首 2025-2026學(xué)年語(yǔ)文統(tǒng)編版八年級(jí)上冊(cè)(學(xué)案含答案)
- 2026陜西建工控股集團(tuán)秋招面試題及答案
- 2025年中國(guó)鋼結(jié)構(gòu)市場(chǎng)全景評(píng)估及戰(zhàn)略咨詢報(bào)告
- DB1331-T 025.1-2022 雄安新區(qū)工程建設(shè)關(guān)鍵質(zhì)量指標(biāo)體系:建筑工程
- 旅游行業(yè)如何玩轉(zhuǎn)視頻號(hào) 從0到1開(kāi)啟私域營(yíng)銷
- 急腹癥影像診斷課件
- 【《紫鑫藥業(yè)財(cái)務(wù)報(bào)告審計(jì)失敗案列分析》12000字(論文)】
- 三級(jí)醫(yī)院營(yíng)養(yǎng)科建設(shè)方案
- 集團(tuán)內(nèi)部融媒體管理辦法
- ASTM-D1238中文翻譯(熔融流動(dòng)率、熔融指數(shù)、體積流動(dòng)速率)
- 2025年浙江省寧波市鎮(zhèn)海中學(xué)高考英語(yǔ)模擬試卷(1月份)
- 短視頻創(chuàng)作-短視頻手機(jī)拍攝與剪輯
- 車輛掛靠駕校合同協(xié)議
評(píng)論
0/150
提交評(píng)論