版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
新一篇:
VERITAS全線存放備份容災處理方案第一章 災難備份背景及優(yōu)勢 31.1什么是計算機業(yè)務系統(tǒng)災難 31.2 國外計算機業(yè)務系統(tǒng)災難備份應用情況 31.3 中國計算機系統(tǒng)災難備份計劃應用情況 41.4 建設災難備份中心關鍵意義 4第二章 災難分析 7第三章 災難備份設計目標 83.1 災難備份設計目標 8第四章 災難備份設計思緒及模型 94.1容災項目開始 94.2災難風險分析 94.3制訂恢復計劃 94.4方案實施 94.5支持和維護 9第五章 xxxx業(yè)務系統(tǒng)災難備份/恢復體系設計 125.1 災難備份/恢復體系總體設計 125.2 應用層方法容災結(jié)構(gòu)介紹 135.3 數(shù)據(jù)庫方法容災結(jié)構(gòu)介紹 155.4 鏡像軟件容災方法結(jié)構(gòu)介紹 195.5 XP磁盤陣列容災方法結(jié)構(gòu)介紹 215.5.1災難恢復系統(tǒng)硬件,軟件配置說明 235.5.2XPCA軟件容災原理 245.5.3切換步驟 265.5.5XP容災方案性能分析 30第六章 災難備份恢復步驟 31第七章 培訓測試及維護 337.1 培訓 337.2 測試災難備份計劃 337.3 維護 34第八章 成功案例介紹 358.1 國外成功案例 358.2 中國成功案例 35
第一章 災難備份背景及優(yōu)勢1.1什么是計算機業(yè)務系統(tǒng)災難今天,XXXX比以往任何時候全部愈加依靠于計算機系統(tǒng),計算機系統(tǒng)在為XXXX迅猛發(fā)展提供技術基礎架構(gòu)同時,因為用戶業(yè)務處理高度集中,和不可預見故障和災難,造成整個系統(tǒng)存在很多災難性破壞隱患,有可能成為整體系統(tǒng)中單故障點。所以,業(yè)務拓展和災難防范是全部用戶全部必需同時重視問題。那么,什么是計算機業(yè)務系統(tǒng)災難呢?通常定義是指采取計算機系統(tǒng)處理關鍵電子數(shù)據(jù)丟失至不可恢復或由此造成業(yè)務中止以至于延長到不可接收時間。1.2 國外計算機業(yè)務系統(tǒng)災難備份應用情況災難備份計劃在發(fā)達國家電信行業(yè)和金融行業(yè)得到了較早實施,現(xiàn)已較為普遍。比如在美國,因一九八五年紐約銀行計算機故障,聯(lián)邦管理部門愈加強了在這方面監(jiān)管力度?,F(xiàn)美國計算機業(yè)務系統(tǒng)通常出于以下三方面來考慮災難備份計劃:關鍵數(shù)據(jù)保護和業(yè)務連續(xù)運行需要:在美國,各行業(yè)內(nèi)部競爭猛烈;在計算機管理制度上較為完善;一旦因突發(fā)災難而造成數(shù)據(jù)丟失或業(yè)務中止,將會造成重大乃至致命打擊。審計要求:美國較大型企業(yè)通常會由第三家獨立審計企業(yè)來提供其資信業(yè)務、管理等方面咨詢服務,而世界著名六大審計企業(yè)在對企業(yè)評定項目中均包含災難備份計劃一項;評定企業(yè)數(shù)據(jù)在災難等威脅破壞下數(shù)據(jù)完整性,一致性和安全性,及業(yè)務可恢復性等,有些咨詢審計企業(yè)還會參與驗證所制訂容災計劃具體過程和其可行性。缺乏災難備份計劃及其危害性會在評定匯報中被顯示出來。法律要求:美國政府及州政府經(jīng)過多項法律強制性要求電信、金融業(yè)等大型企業(yè)備有計算機安全及災難備份計劃。對于沒有遵守這項災難備份計劃企業(yè),會遭受曝光及罰款等嚴重處理,同時亦可能對相關責任人采取罰款甚至監(jiān)禁等處罰。已知災難例子有:日本神戶大地震、美國佛羅里達州颶風(數(shù)百家企業(yè)實施了災難備份計劃)、臺灣大地震等。1.3 中國計算機系統(tǒng)災難備份計劃應用情況伴隨中國入“世”腳步越來越近,傳統(tǒng)產(chǎn)業(yè)在進入新市場新方法競爭中,企業(yè)電子信息架構(gòu)搭建,成為最含有戰(zhàn)略意義資源投資。作為信息架構(gòu)關鍵數(shù)據(jù),其安全備份和災難恢復伴隨世紀交替Y2K問題引發(fā),逐步引發(fā)大家思索和重視。現(xiàn)代企業(yè)必需直面一個迫在眉睫問題:怎樣對數(shù)據(jù)進行連續(xù)不停地存放,并經(jīng)過有效地應用這些信息,提升企業(yè)利潤率和競爭力。所以,在當今企業(yè)運行電子化進程中,存放將和網(wǎng)絡、軟件應用和系統(tǒng)CPU處于相同關鍵地位,成為決定系統(tǒng)成熟是否關鍵。因為存在著多種數(shù)據(jù)丟失可能,伴隨大家對網(wǎng)絡系統(tǒng)依靠日益增加,從硬件到軟件對數(shù)據(jù)保護和備份確實是不容忽略步驟。企業(yè)IT教授們逐步認識到,可能造成數(shù)據(jù)丟失原因關鍵有三種:自然災難災難性破壞造成數(shù)據(jù)永久丟失,最好處理方案就是異地數(shù)據(jù)備份;計算機和網(wǎng)絡系統(tǒng)硬件和軟件故障,這種損失也只有經(jīng)過完整數(shù)據(jù)備份來填補;另外,自然免不了黑客破壞和人員操作失誤。這些事故發(fā)生全部是防不勝防,唯一能把損失降到最低措施就只有依靠含有數(shù)據(jù)備份和災難恢復功效存放設備。多年來中國用戶在計算機應用方面飛速發(fā)展,計算機系統(tǒng)基礎架構(gòu)建設、尤其是計算機容災系統(tǒng)設計和建設正逐步被用戶所重視。不言而喻,假如用戶業(yè)務系統(tǒng)有一套完備災難備份/恢復體系,當突發(fā)性災難發(fā)生后,業(yè)務系統(tǒng)關鍵業(yè)務數(shù)據(jù)損失將減至最小。尤其是伴隨中國加入WTO日益臨近和行業(yè)競爭越來越猛烈,完善災難備份/恢復體系在不遠未來將是中國企業(yè)發(fā)展可靠保障。在中國,伴隨Internet逐步普及和電子商務熱潮興起,企業(yè)需要整合越來越多數(shù)據(jù),而數(shù)據(jù)合并、管理、分享、保護全部需要一個強大、高可靠性數(shù)據(jù)中心;同時,伴隨中國企業(yè)經(jīng)營者對企業(yè)數(shù)據(jù)信息價值和數(shù)據(jù)安全備份認識提升,存放設備投資也正在企業(yè)信息化建設投入中占據(jù)著越來越高比重。IT行業(yè)權威人士認為,在未來一至兩年中,數(shù)據(jù)存放系統(tǒng)要花費全部企業(yè)計算系統(tǒng)投資70%。1.4 建設災難備份中心關鍵意義伴隨計算機管理技術和網(wǎng)絡技術發(fā)展,為了提升企業(yè)業(yè)務管理水平、增強企業(yè)市場競爭能力,越來越多企業(yè)開始使用計算機來處理內(nèi)部日常事務和外部業(yè)務往來,從而使得這些企業(yè)越來越依靠于系統(tǒng)管理數(shù)據(jù)和業(yè)務信息。尤其是在企業(yè)業(yè)務不停增加、數(shù)據(jù)量成倍增加乃至出現(xiàn)數(shù)據(jù)膨脹現(xiàn)象時,由此引發(fā)企業(yè)從數(shù)據(jù)膨脹、到計算機性能提升、再造成新一輪數(shù)據(jù)膨脹循環(huán)不停加劇,進而在企業(yè)中引發(fā)新數(shù)據(jù)安全恐慌,數(shù)據(jù)失效問題時有發(fā)生。建設災難備份中心目標就是在于預防部分災難性小概率事件可能對集中式信息系統(tǒng)造成不可恢復原始數(shù)據(jù)丟失,這些災難性事件可能包含為火災,地震,電源故障及部分人為操作失誤等,以下圖所表示。
現(xiàn)代企業(yè)管理很重視總體擁有成本(TCO)。所謂TCO,實際上是由實際成本、使用成本和風險成本三項組成。實際成本和使用成本在企業(yè)建設和生產(chǎn)中往往輕易引發(fā)大家重視,所以考慮得很周到。而風險成本不僅是企業(yè)看不見、摸不著東西,也是企業(yè)運作時極難預料和把握內(nèi)容。在使用計算機系統(tǒng)企業(yè)中,風險成本包含用于管理關系到企業(yè)生命各項數(shù)據(jù)和信息安全、正常、可靠高速運行所需費用。所以,為將風險成本降至最低,同時使企業(yè)長久處于最好狀態(tài),對企業(yè)業(yè)務和計算機管理和控制系統(tǒng)數(shù)據(jù)進行全方面存放備份是一項絕對值得、也是必需投資。我們知道,伴隨企業(yè)計算機系統(tǒng)建設計劃逐步實施,XXXX日常業(yè)務同計算機系統(tǒng)聯(lián)絡越來越緊密。所以,業(yè)務主機系統(tǒng)運行出現(xiàn)故障所帶來業(yè)務影響范圍會被快速擴大,而用戶對企業(yè)計算機業(yè)務系統(tǒng)連續(xù)運行,業(yè)務系統(tǒng)、用戶數(shù)據(jù)高可用性和業(yè)務計算機系統(tǒng)抵御突發(fā)性災難能力要求也肯定急劇提升。XXXX建設災難備份/恢復中心有以下意義:關鍵業(yè)務數(shù)據(jù)在災難發(fā)生后得以有效保護關鍵業(yè)務在災難發(fā)生后能夠在設定時間內(nèi)恢復,從而實現(xiàn)業(yè)務連續(xù)運行業(yè)務計算機系統(tǒng)抵御突發(fā)性災難能力和等級提升深入提升XXXX聲譽,增強用戶及潛在用戶信心擴大對同行業(yè)競爭對手優(yōu)勢
第二章 災難分析可能發(fā)生災難因各城市/地域地理、氣候、社會治安、城市管理,如供水、供電、通訊條件等差異而有所不一樣。仔細地分析多種突發(fā)性災難發(fā)生可能性和由此所造成后果,對于制訂和構(gòu)建完整和有很強針對性災難備份體系是有很大幫助。
下表是一張分析表樣本,可使我們對于可能發(fā)生突發(fā)性災難評定有較為清楚概念。
可能災難可能性:
12345工作場所火災
數(shù)據(jù)中心火災
電源故障
氣候災難(臺風,洪水等)
工業(yè)破壞
城市事件(罷工,動亂等)
硬件故障
軟件故障
設備問題(如管道漏水等)
供水故障
通訊系統(tǒng)故障
計算機有意破壞(如病毒等)
爆炸威脅
工作場所環(huán)境緊急事件(化學污染等)
第三章 災難備份設計目標3.1 災難備份設計目標采取何種容災方法(邏輯數(shù)據(jù)復制/物理數(shù)據(jù)復制)實現(xiàn)災難備份系統(tǒng)設計目標關鍵應從以下四個方面來考慮:具體數(shù)據(jù)類型和目標災難保護:從用戶業(yè)務系統(tǒng)正常運作角度分析多種關鍵業(yè)務數(shù)據(jù),作出關鍵性和可恢復性要求評定,并由此制訂系統(tǒng)數(shù)據(jù)災難保護政策。災難發(fā)生后可恢復業(yè)務分析:對用戶多種業(yè)務和管理步驟進行分析評定,并據(jù)此制訂出用戶關鍵業(yè)務系統(tǒng)災難備份/恢復策略。災難發(fā)生后可恢復分析:對于突發(fā)性災難這么重大事件,有時受災地域并不茍求全部業(yè)務系統(tǒng)全部能夠可連續(xù)運行,故可按實際需求和百分比進行分析,并由此配置對應容災設備。災難發(fā)生后業(yè)務可恢復時間指標:能夠?qū)碾y發(fā)生分為兩類,一類是能夠估計具體時間災難,如損害性極大臺風等;另一類是不可估計具體時間突發(fā)性災難,如地震、主機系統(tǒng)非計劃性Down機等。針對兩種不一樣災難類型,要設定不一樣業(yè)務恢復時間指標。通常來說,對第一類災難業(yè)務恢復時間要大大短于對第二類突發(fā)性災難業(yè)務恢復時間.依據(jù)用戶對系統(tǒng)容災能力不一樣要求和投資方面原因,HP企業(yè)提供多個容災處理方案,各有側(cè)重不一樣,我們會從不一樣角度介紹容災系統(tǒng)實現(xiàn)方法,和系統(tǒng)經(jīng)典配置。
第四章 災難備份設計思緒及模型為了設計和實施xxxx災難備份系統(tǒng),根據(jù)大型項目標管理方法和HP企業(yè)在項目管理方面所積累豐富經(jīng)驗,在這里將整體項目標設計和實施分為五個階段:4.1容災項目開始明確xxxx災難備份/恢復計劃必需性明確災難備份計劃責任人和實施隊伍制訂項目實施時間表。4.2災難風險分析確定對xxxx業(yè)務至關關鍵系統(tǒng)、網(wǎng)絡和用戶確定因為自然或人為災難對這些造成威脅和損失,并盡可能正確為具體損失搜集多種業(yè)務和用戶對系統(tǒng)中止時間等要求4.3制訂恢復計劃制訂當災難發(fā)生,原業(yè)務主機系統(tǒng)或網(wǎng)絡系統(tǒng)不可用時,提供第二主機(災備主機)或網(wǎng)絡(災備網(wǎng)絡)選擇策略。4.4方案實施開始實施災難備份計劃,如數(shù)據(jù)實時在線備份、應用系統(tǒng)切換、統(tǒng)計當?shù)財?shù)據(jù)備份磁帶管理等。4.5支持和維護由指定人員、部門或企業(yè)提供容災系統(tǒng)日常支持和維護服務,確保災難備份/恢復系統(tǒng)可連續(xù),高可用運行。以下為容災方案實施各階段框圖:項目開始災難風險分析方案實施支持和維護制訂恢復計劃
對于其中關鍵部分-第三項“制訂恢復計劃”,依據(jù)xxxx業(yè)務特點,這里分為以下多個步驟:1、制訂業(yè)務主機系統(tǒng)集群系統(tǒng)熱備份計劃:包含對服務器、操作系統(tǒng)、應用系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、關鍵數(shù)據(jù)等熱備份計劃。2、制訂在生產(chǎn)地、和業(yè)務主機系統(tǒng)相關前置服務器數(shù)據(jù)熱備份計劃:包含對其它機型操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、應用系統(tǒng)、關鍵數(shù)據(jù)和通訊配置等熱備份計劃。3、制訂網(wǎng)絡通訊備份計劃:對網(wǎng)絡設備、網(wǎng)絡協(xié)議、網(wǎng)絡參數(shù)設定、故障切換邏輯過程、通訊線路備份計劃等。4、制訂用戶端備份計劃:包含終端設備,終端用戶注冊和權限管理備份。5、制訂磁帶備份計劃:包含系統(tǒng)備份、非系統(tǒng)數(shù)據(jù)文件備份、業(yè)務數(shù)據(jù)庫數(shù)據(jù)備份,及和備份系統(tǒng)相關其它全量備份、增量備份等,以組成完整系統(tǒng)保護方法。6、制訂災難備份指示系統(tǒng):此系統(tǒng)用來提供清楚全方面災難備份指南,能夠在災難發(fā)生時在最短時間內(nèi)找到災難備份步驟,和相關責任人和供給商聯(lián)絡方法,和應該采取應急方法等。
以下為步驟框圖:
第五章 xxxx業(yè)務系統(tǒng)災難備份/恢復體系設計5.1 災難備份/恢復體系總體設計惠普企業(yè)為xxxx業(yè)務系統(tǒng)提供災難備份/恢復方案能夠滿足用戶對于計算機系統(tǒng)、數(shù)據(jù)最高保護要求,確保即使發(fā)生斷電,火災等嚴重災難時,用戶業(yè)務也能夠7x二十四小時連續(xù)運行,同時確保業(yè)務數(shù)據(jù)在主中心和備份中心得到立即更新,確保用戶數(shù)據(jù)最大完整性。依據(jù)惠普企業(yè)多年來所積累實施高可靠性災難備份/恢復處理方案成功經(jīng)驗,我們能夠承諾用戶在最小投資范圍內(nèi),根據(jù)惠普企業(yè)項目實施步驟,在最短時間周期內(nèi)達成整個項目標設計目標,而且經(jīng)過惠普企業(yè)完善周全售后服務體系,確保XXXX關鍵業(yè)務計算機系統(tǒng)全天候、安全、穩(wěn)定運行。因為用戶數(shù)據(jù)中心關鍵業(yè)務系統(tǒng)相對集中,所以在數(shù)據(jù)中心實現(xiàn)關鍵業(yè)務數(shù)據(jù)規(guī)范化當?shù)財?shù)據(jù)備份是災備系統(tǒng)建設前提基礎;同時經(jīng)過進行關鍵業(yè)務數(shù)據(jù)遠程同時實現(xiàn)用戶關鍵業(yè)務數(shù)據(jù)遠程異地存放,為實現(xiàn)業(yè)務系統(tǒng)遠程正常運作奠定堅實基礎;容災系統(tǒng)關鍵就是遠程生產(chǎn)數(shù)據(jù)自動復制,因為用戶應用均為基于數(shù)據(jù)庫聯(lián)機事務處理(OLTP)業(yè)務系統(tǒng),所以業(yè)務數(shù)據(jù)遠程復制關鍵就是確保數(shù)據(jù)庫數(shù)據(jù)完整性、連續(xù)性,實時性和可恢復性。而現(xiàn)在惠普企業(yè)基于用戶不一樣容災需求所提供災難備份/恢復方案關鍵有以下四大類型:1)
經(jīng)過應用程序來進行遠程數(shù)據(jù)復制(應用層次);其關鍵原理就是經(jīng)過修改應用程序或使用BEA等企業(yè)中間件產(chǎn)品,使得前端平臺在向數(shù)據(jù)庫服務器發(fā)送生產(chǎn)數(shù)據(jù)時,同時向主數(shù)據(jù)中心和備份數(shù)據(jù)中心均發(fā)送交易數(shù)據(jù),主數(shù)據(jù)中心處理交易數(shù)據(jù)并返回處理結(jié)果,備份中心在正常情況下,只處理交易數(shù)據(jù),當主數(shù)據(jù)中心無法正常工作時,備份中心服務器接替主中心服務器向前端平臺返回處理結(jié)果。2)
利用數(shù)據(jù)庫廠家軟件產(chǎn)品完成遠程數(shù)據(jù)備份(數(shù)據(jù)庫層次);現(xiàn)有部分數(shù)據(jù)庫廠家比如Oracle數(shù)據(jù)庫能夠提供STANDBY數(shù)據(jù)庫功效,經(jīng)過通信網(wǎng)絡將實際數(shù)據(jù)庫日志文件傳至備份中心存放系統(tǒng),備份中心STANDBY數(shù)據(jù)庫根據(jù)主數(shù)據(jù)庫結(jié)構(gòu)從日志文件中重新恢復數(shù)據(jù)庫;又比如Informix數(shù)據(jù)庫能夠提供HADR(High-AvailabilityDataReplication)功效,在初始化時將主數(shù)據(jù)中心數(shù)據(jù)庫中全部dbspace進行一次零級備份,并恢復到備份數(shù)據(jù)中心數(shù)據(jù)庫中,以后主數(shù)據(jù)中心數(shù)據(jù)庫服務器能夠經(jīng)過通信網(wǎng)絡將生產(chǎn)數(shù)據(jù)庫邏輯日志文件傳送至備份中心數(shù)據(jù)庫服務器,備份中心secondary數(shù)據(jù)庫將這些邏輯日志恢復到對應dbspace上.3)
利用主機上安裝操作系統(tǒng)級鏡像軟件進行遠程數(shù)據(jù)鏡像(系統(tǒng)軟件,如HP-UXMirrorDisk/UX,VeritasVolumeReplicator等);主中心存放設備和備份中心存放設備進行邏輯卷鏡像,主機同時將數(shù)據(jù)分別寫到當?shù)睾瓦h程磁盤設備上,實現(xiàn)業(yè)務數(shù)據(jù)遠程復制。4)
經(jīng)過惠普最新存放產(chǎn)品XP系列磁盤陣列(磁盤陣列硬件層次),能夠?qū)崿F(xiàn)主數(shù)據(jù)中心和備份中心操作系統(tǒng)、文件系統(tǒng)、數(shù)據(jù)庫、應用程序?qū)崟r遠程拷貝復制。主、備中心XP磁盤陣列本身就能夠經(jīng)過陣列上微處理器完成數(shù)據(jù)實時同時功效,將災難發(fā)生時關鍵數(shù)據(jù)損失降至最低,而且不需要主機干涉或占用主機資源,能夠做到災難發(fā)生同時實現(xiàn)應用處理過程恢復。遠程備份系統(tǒng)重新開啟能夠做到象通常輸入電源故障后重新開啟那么簡單。以下是對多種容災實現(xiàn)方案總體比較:
數(shù)據(jù)量應用復雜度數(shù)據(jù)實時性對主機性能影響帶寬投資成本交易數(shù)據(jù)備份交易數(shù)據(jù)高(可能修改應用)低<10%幾十萬數(shù)據(jù)庫日志備份2-4倍交易數(shù)據(jù)數(shù)據(jù)庫工具可能最少丟失1個LOG較高(10-20%)幾十萬鏡像軟件4-8倍交易數(shù)據(jù)應用透明高(I/O級),網(wǎng)絡/鏡像軟件故障影響主機業(yè)務高(10-30%)幾百萬磁盤陣列4-8倍交易數(shù)據(jù)應用透明高(I/O級)無幾百萬
5.2 應用層方法容災結(jié)構(gòu)介紹利用應用層容災方法建立針對用戶業(yè)務災難備份系統(tǒng),其關鍵原理是經(jīng)過應用程序或中間件產(chǎn)品同時向主中心和備份中心傳輸未經(jīng)處理生產(chǎn)數(shù)據(jù),主中心服務器和備份中心服務器同時處理數(shù)據(jù)。在正常情況下,只用主中心和業(yè)務系統(tǒng)聯(lián)絡,備份中心只在后臺處理數(shù)據(jù);當主中心癱瘓時,因為備份中心也存有生產(chǎn)數(shù)據(jù)庫,也存有生產(chǎn)數(shù)據(jù),所以能夠快速接管業(yè)務。因為是利用應用軟件來實現(xiàn)數(shù)據(jù)同時及確保一致性,所以對于硬件方面影響較小。圖所表示:這種方案關鍵優(yōu)點就是:a)
因為經(jīng)過網(wǎng)絡傳輸交易數(shù)據(jù)時未經(jīng)數(shù)據(jù)庫處理,所以傳輸數(shù)據(jù)量小,對傳輸數(shù)據(jù)網(wǎng)絡帶寬要求不高;b)
傳輸數(shù)據(jù)過程中,主中心和備份中心異步進行,由傳輸距離產(chǎn)生延遲和通信帶寬瓶頸不會對應用產(chǎn)生較大影響.缺點是:a)
對應用程序修改較大,增加應用軟件商二次開發(fā)負擔;b)
因為主,備數(shù)據(jù)中心業(yè)務處理過程為異步進行,怎樣保障數(shù)據(jù)一致性很困難,需要在應用中對數(shù)據(jù)同時進行周密設計;
這種容災方法適合于傳輸距離極長(幾千公里),且網(wǎng)絡傳輸帶寬和通信質(zhì)量無法得到有效確保用戶環(huán)境.而對于存放設備則沒有嚴格限制,用戶能夠靈活選擇滿足容量和速度要求存放設備。5.3 數(shù)據(jù)庫方法容災結(jié)構(gòu)介紹5.3.1原理數(shù)據(jù)庫方法因為只是傳送數(shù)據(jù)庫日志,和應用沒有直接關系,所以無須對應用程序作大量修改。以下介紹關鍵以Oracle和Informix數(shù)據(jù)庫為主。數(shù)據(jù)庫方法容災經(jīng)過數(shù)據(jù)復制把數(shù)據(jù)定時、在線地復制到目標地機器上去,以保持分布在不一樣地方兩個或多個數(shù)據(jù)庫系統(tǒng)內(nèi)容一致性,來實現(xiàn)數(shù)據(jù)保護。但它將消耗大量主機資源(最少要占用監(jiān)控和復制兩個進程)。復制對象是數(shù)據(jù)庫處理單位,如事務日志(邏輯日志),實現(xiàn)方法也有同時和異步兩種,嚴格來講,這種方法極難有真正同時方案。因為同時數(shù)據(jù)復制要求做任何一筆交易,全部要實時地將結(jié)果發(fā)送到遠程站點中,等遠程操作結(jié)束后,再實施下一筆交易;而在實際操作中,極難做到這一點,只能做異步數(shù)據(jù)復制。所以一個實時應用系統(tǒng)中,通常采取異步方法。
備份數(shù)據(jù)中心經(jīng)過網(wǎng)絡連接到中央數(shù)據(jù)中心。在正常情況下,Oracle數(shù)據(jù)庫運行在主數(shù)據(jù)中心服務器上,數(shù)據(jù)存放于主數(shù)據(jù)中心磁盤陣列中。利用Oracle數(shù)據(jù)庫提供STANDBY數(shù)據(jù)庫功效,能夠經(jīng)過通信網(wǎng)絡將實際數(shù)據(jù)庫日志文件傳至備份中心存放系統(tǒng),備份中心STANDBY數(shù)據(jù)庫根據(jù)主數(shù)據(jù)庫結(jié)構(gòu)從日志文件中重新恢復數(shù)據(jù)庫,以保持數(shù)據(jù)一致性。一旦中央數(shù)據(jù)中心出現(xiàn)問題,用戶能夠立即開啟備份數(shù)據(jù)中心備份數(shù)據(jù)庫和相關應用。Achivelog備份方法
這一實現(xiàn)方法關鍵在于經(jīng)過一個專用程序?qū)⒅鲾?shù)據(jù)中心數(shù)據(jù)庫中AchiveLog定時經(jīng)過通信網(wǎng)絡傳輸?shù)絺浞葜行臄?shù)據(jù)庫中。一旦主數(shù)據(jù)中心不能提供服務,備份中心首先經(jīng)過RedoLog恢復數(shù)據(jù),然后再替換主數(shù)據(jù)中心恢復應用。基于數(shù)據(jù)庫方法容災能夠把改變了數(shù)據(jù)定時、在線地復制到目標地機器上去。對用戶來說,這種復制方法優(yōu)點是能夠很好地確保數(shù)據(jù)一致性,但它將消耗大量主機資源(最少要占用監(jiān)控和復制兩個進程)。此方案能夠做到在有限投資范圍內(nèi),充足利用現(xiàn)有機器設備,實現(xiàn)應用系統(tǒng)和關鍵數(shù)據(jù)災難恢復功效。作為惠普企業(yè)成熟災難恢復技術,此方案已經(jīng)在中國很多用戶中成功實施過。其中包含:上海浦東國際機場災難恢復系統(tǒng)等。
建立遠程容災環(huán)境:利用中央數(shù)據(jù)庫全備份(零級備份)建立災難備份數(shù)據(jù)庫由專門進程負責傳輸中央數(shù)據(jù)庫生成日志文件到遠地,這里能夠經(jīng)過定義日志文件大小及傳輸時機來控制災難發(fā)生時數(shù)據(jù)損失盡可能降低,并可加緊容災應用切換速度,立即恢復業(yè)務在備份數(shù)據(jù)中心系統(tǒng)上運行。災難備份數(shù)據(jù)庫使用傳輸來日志文件(Archivelog或Logicallog)不停更新備份數(shù)據(jù)庫,這時數(shù)據(jù)庫一直處于恢復狀態(tài)(Informix數(shù)據(jù)庫為quiescent狀態(tài)),其數(shù)據(jù)不可被訪問(對于Informix數(shù)據(jù)庫,備份數(shù)據(jù)庫中數(shù)據(jù)可被用來進行讀操作,但無法進行寫操作)。災難備份數(shù)據(jù)庫更新犯錯且無法處理時,應重新建立備份數(shù)據(jù)庫。災難備份數(shù)據(jù)庫應定時做激活測試,以確保其在關鍵時刻可用性。應用系統(tǒng)需考慮發(fā)生災難時怎樣將聯(lián)接切換到災難備份數(shù)據(jù)庫。
容災切換:將中央數(shù)據(jù)庫可取得日志文件傳至災難數(shù)據(jù)庫后,將災難備份數(shù)據(jù)庫更新到最近點,并開啟數(shù)據(jù)庫供給用系統(tǒng)使用;立即對災難數(shù)據(jù)庫做數(shù)據(jù)庫全備份;對損失數(shù)據(jù)進行修補;以建立災難數(shù)據(jù)庫一樣方法建立中央數(shù)據(jù)庫,并將運行系統(tǒng)切換回中央數(shù)據(jù)庫,該次切換可做到數(shù)據(jù)無損失;立即對中央數(shù)據(jù)庫做數(shù)據(jù)庫全備份;重新建立災難備份環(huán)境,恢復容災系統(tǒng).5.3.2容災環(huán)境維護(中央數(shù)據(jù)庫結(jié)構(gòu)發(fā)生改變)日常管理中,需對中央數(shù)據(jù)庫歸檔日志(邏輯日志)目錄定時進行備份和清理,亦需清除災難備份數(shù)據(jù)庫歸檔日志(邏輯日志)目錄中使用過歸檔日志(邏輯日志)。在系統(tǒng)運行過程中,可能發(fā)生改變中央數(shù)據(jù)庫結(jié)構(gòu)情況,這時需要進行合適操作使災難備份數(shù)據(jù)庫跟上更新改變,保持數(shù)據(jù)庫結(jié)構(gòu)一致和同時:1增加數(shù)據(jù)文件在中央數(shù)據(jù)庫上增加數(shù)據(jù)文件將產(chǎn)生對應日志,當被施用到災難備份數(shù)據(jù)庫時控制文件中會加入此數(shù)據(jù)文件名,此時如災難備份數(shù)據(jù)庫能在對應目錄找到此數(shù)據(jù)文件,恢復操作繼續(xù);不然會停止,在繼續(xù)恢復操作之前,需選擇以下操作:-將此新數(shù)據(jù)文件拷貝到災難備份節(jié)點對應目錄下;-在災難備份數(shù)據(jù)庫上實施命令AlterDatabaseCreateDatafile‘filename’.2數(shù)據(jù)文件更名對中央數(shù)據(jù)庫數(shù)據(jù)文件進行更名,需要刷新災難備份數(shù)據(jù)庫控制文件,或在對中央數(shù)據(jù)庫作該操作時亦對災難備份數(shù)據(jù)庫作類似操作,即可確保中央和災難備份數(shù)據(jù)庫同時。3修改聯(lián)機日志文件設置在對中央數(shù)據(jù)庫聯(lián)機日志文件進行增加、刪除等操作后,全部不會影響災難備份數(shù)據(jù)庫。但在中央數(shù)據(jù)庫上實施命令AlterDatabaseClearUnarchivedLogfile,或以Resetlogs選項打開數(shù)據(jù)庫,則會使容災備份數(shù)據(jù)庫失效,因為容災備份數(shù)據(jù)庫無法得到進行恢復操作所需歸檔日志文件,這時需要重新建立容災環(huán)境。4修改控制文件若在中央數(shù)據(jù)庫上使用CreateControlfile命令實施以下操作,將使容災數(shù)據(jù)庫控制文件失效:-改變聯(lián)機日志組或文件最大數(shù)目參數(shù)-改變數(shù)據(jù)文件最大數(shù)目參數(shù)-改變并發(fā)打開數(shù)據(jù)庫實例最大數(shù)目參數(shù)此時需要刷新災難備份數(shù)據(jù)庫控制文件。在中央數(shù)據(jù)庫上使用帶Resetlogs選項CreateControlfile命令將在下一次打開中央數(shù)據(jù)庫時重置聯(lián)機日志,日志序列回到1,從而造成容災備份數(shù)據(jù)庫失效。5數(shù)據(jù)庫開啟參數(shù)提議使中央數(shù)據(jù)庫和災難備份數(shù)據(jù)庫參數(shù)配置相同,以免因參數(shù)不一樣影響容災數(shù)據(jù)庫性能甚至恢復操作實現(xiàn)。6刷新災難備份數(shù)據(jù)庫控制文件當中央數(shù)據(jù)庫控制文件發(fā)生改變時,依據(jù)以下步驟刷新災難備份數(shù)據(jù)庫控制文件:-停止災難備份數(shù)據(jù)庫恢復操作-關閉災難備份數(shù)據(jù)庫-在中央數(shù)據(jù)庫上實施命令AlterDatabaseCreateStandbyDatabaseControlfileAs‘filename’創(chuàng)建供災難備份數(shù)據(jù)庫使用控制文件-在中央數(shù)據(jù)庫上實施命令AlterSystemArchiveLogCurrent歸檔出目前日志-將上兩步產(chǎn)生控制文件及歸檔日志文件傳送至容災節(jié)點-開啟災難備份數(shù)據(jù)庫在Nomount狀態(tài),實施AlterDatabaseMountStandbyDatabase使數(shù)據(jù)庫處于Mount狀態(tài)-進行災難備份數(shù)據(jù)庫正?;謴筒僮?相關Unrecoverable操作產(chǎn)生數(shù)據(jù)中央數(shù)據(jù)庫上用Unrecoverable選項操作(如CreateTable…unrecoverable)產(chǎn)生數(shù)據(jù)更新不生產(chǎn)日志,所以無法傳送到災難備份數(shù)據(jù)庫,此時只能采取以下三種方法之一:-在災難備份數(shù)據(jù)庫中,使受該操作影響數(shù)據(jù)文件處于Offline狀態(tài)。災難切換后,刪除災難備份數(shù)據(jù)庫中對應表空間。該方法在許可損失此整個表空間數(shù)據(jù)時才能使用。-重建容災環(huán)境-在中央數(shù)據(jù)庫上備份該操作影響表空間,歸檔目前日志,傳送到容災節(jié)點后,開啟災難備份數(shù)據(jù)庫恢復操作。注意:如在中央數(shù)據(jù)庫做了Unrecoverable操作,而未采取以上方法進行操作,仍在災難備份數(shù)據(jù)庫上進行正?;謴?,將不會有錯誤信息提醒,該錯誤信息將出現(xiàn)在數(shù)據(jù)庫日志中($ORACLE_BASE/admin/<sid>/bdump/alert_<sid>.log)。所以管理員必需定時檢驗數(shù)據(jù)庫日志。5.3.3優(yōu)缺點比較用數(shù)據(jù)庫功效實現(xiàn)遠程數(shù)據(jù)復制優(yōu)點為:a)
支持廣域網(wǎng)協(xié)議,備份中心地點不受傳輸距離影響;b)
硬件/軟件投資較少;缺點關鍵為:a)傳輸歸檔日志或邏輯日志需占用主機資源(CPU,內(nèi)存,網(wǎng)絡等,具體指標未確定);b)
當災難發(fā)生時,業(yè)務無法在備份中心得到快速恢復;c)
備份中心數(shù)據(jù)無法快速恢復回主數(shù)據(jù)中心,從而應用無法快速切換回主中心運行;d)
無法實現(xiàn)非數(shù)據(jù)庫數(shù)據(jù)遠程復制;
此種容災方法適合于只遠程備份數(shù)據(jù)庫數(shù)據(jù),傳輸距離較長(幾百公里以上),且網(wǎng)絡傳輸帶寬不大用戶環(huán)境.5.4 鏡像軟件容災方法結(jié)構(gòu)介紹利用操作系統(tǒng)層鏡像軟件,如HP-UXMirrorDisk/UX,實現(xiàn)當?shù)刂鲾?shù)據(jù)中心邏輯卷和遠端備份數(shù)據(jù)中心邏輯卷之間實時同時數(shù)據(jù)復制.當主數(shù)據(jù)中心發(fā)生突發(fā)性災難時,用戶能夠經(jīng)過在備份中心服務器上激活對應卷組和邏輯卷,進而開啟備份中心服務器上數(shù)據(jù)庫和應用系統(tǒng),從而實現(xiàn)業(yè)務系統(tǒng)災難恢復目標.
正常情況下,業(yè)務系統(tǒng)運行在主中心服務器上,數(shù)據(jù)存放在主中心磁盤陣列中,同時在備份中心配置相同容量磁盤陣列。主中心和備份中心距離通常限制在10公里左右,主中心服務器使用光纖通道卡經(jīng)過光纖交換機和光纜分別連接兩個中心磁盤陣列,利用服務器端鏡像軟件對數(shù)據(jù)鏡像存放。在發(fā)生災難時最嚴重損失就是數(shù)據(jù)本身丟失,而磁盤鏡像要求向磁盤進行每個物理寫操作全部被復制到另一個地點另一個磁盤。因為復制是向磁盤進行物理寫操作,所以它和應用程序無關。在主中心因故出現(xiàn)存放陣列損壞、癱瘓時,備份中心數(shù)據(jù)仍然完好。主中心服務器仍能正常訪問備份中心數(shù)據(jù)。一旦主中心磁盤陣列恢復后,能夠在系統(tǒng)上使用磁盤重新鏡像命令將數(shù)據(jù)進行同時,從而備份中心陣列中數(shù)據(jù)會拷貝到主中心存放陣列中。
鏡像軟件容災方法優(yōu)缺點比較.優(yōu)點:可完全確保數(shù)據(jù)復制完整性,一致性;容災結(jié)構(gòu)相對簡單;對磁盤子系統(tǒng)透明,主/備數(shù)據(jù)中心可采取不一樣磁盤陣列設備.缺點:遠程數(shù)據(jù)復制操作占用主機較多資源(10-30%);主中心應用系統(tǒng)寫操作性能受主/備中心傳輸距離影響較大;網(wǎng)絡連接和鏡像軟件故障將造成主中心業(yè)務系統(tǒng)中止;備份中心更新數(shù)據(jù)無法快速恢復回主數(shù)據(jù)中心;
這種容災方法適適用于對主機寫操作性能要求不高,而且業(yè)務系統(tǒng)能夠忍受因光纖傳輸線路臨時故障而造成業(yè)務中止用戶環(huán)境.5.5 XP磁盤陣列容災方法結(jié)構(gòu)介紹惠普企業(yè)XP陣列由ContinuousAccessXP/XPExtension軟件提供完全災難備份/恢復功效。
主數(shù)據(jù)中心和備份數(shù)據(jù)中心結(jié)構(gòu)基礎一致:采取HPXP系列磁盤陣列作為中心存放,全部主機經(jīng)過光纖和磁盤陣列相連。磁盤陣列上運行ContinueAccessXP容災軟件。主中心和備份中心之間XP磁盤陣列物理上經(jīng)過兩條光纖通道直聯(lián),采取XP磁盤陣列上容災軟件ContinueAccess做到兩地數(shù)據(jù)實時同時。兩套磁盤陣列之間數(shù)據(jù)一致性依靠磁盤陣列本身專用軟件(直接運行在磁盤陣列上)來完成,完全不依靠主機系統(tǒng),也不影響當?shù)貞庙憫俣?。當配置了ContinuousAccessXP/XPExtension軟件兩臺XP陣列分別處于兩數(shù)據(jù)中心時,經(jīng)過光纖線路進行連接,主數(shù)據(jù)中心XP存放磁盤陣列能夠隨時自動將更新后數(shù)據(jù)傳送至異地備份XP存放設備,以保持兩臺XP陣列數(shù)據(jù)完全一致性。整個工作由XP陣列本身完成,對主機系統(tǒng)完全透明,不需占用任何主機資源。當主數(shù)據(jù)中心因為地震,火災等多種意外原因造成整個主中心關鍵業(yè)務系統(tǒng)瓦解時,異地備份系統(tǒng)將完全接管全部工作,在極短時間內(nèi),恢復業(yè)務系統(tǒng)運行。用戶端也是災難備份恢復系統(tǒng)防護對象,需要經(jīng)過網(wǎng)絡連接到災難備份中心運行系統(tǒng)。災難備份中心運行系統(tǒng)含有重構(gòu)運行環(huán)境能力,在災難發(fā)生后替換生產(chǎn)中心行使運行系統(tǒng)職能,接收用戶端注冊和訪問,其運行環(huán)境和業(yè)務數(shù)據(jù)由備份服務器和備份數(shù)據(jù)系統(tǒng)提供。特點:傳統(tǒng)災難備份系統(tǒng)主備機切換過程為1)
主機發(fā)生故障2)
系統(tǒng)切換到備機3)
修復主機4)
關閉全套系統(tǒng)包含主機及備機5)
將系統(tǒng)從新切換回主機其中在第4個步驟中,用戶將不得不承受停機所帶來損失。而惠普企業(yè)SureStoreEContinuousAccessXP/XPExtension軟件將使用戶避免這一損失,因為當系統(tǒng)從主機切換到備機后,備機將成為主機,修復后“主機”成為備機使用。此方案最大優(yōu)勢就是對主機應用完全透明,全部數(shù)據(jù)復制工作由磁盤陣列硬件層完成,不需修改應用,而且能夠確保大量數(shù)據(jù)復制性能。因為磁盤陣列數(shù)據(jù)復制原理是利用磁盤遠程鏡像功效,所以能夠確保主數(shù)據(jù)中心關鍵業(yè)務數(shù)據(jù)和備份中心關鍵業(yè)務數(shù)據(jù)完全一致,而且容災系統(tǒng)實現(xiàn)起來很簡便。還能夠充足利用現(xiàn)有服務器設備,實現(xiàn)應用系統(tǒng)和關鍵數(shù)據(jù)災難恢復功效。作為惠普企業(yè)成熟災難備份/恢復技術,此方案已經(jīng)在中國外很多用戶環(huán)境中成功實施過。其中包含上海熱線,大連電信,云南建行,湖南建行等災難備份恢復系統(tǒng)。因為XXXX容災距離,用戶環(huán)境和業(yè)務需求也十分適合于使用XP磁盤陣列實現(xiàn)存放硬件層災難備份恢復方案,所以HP企業(yè)也向XXXX推薦這種容災方法.而這種容災方案關鍵限制就是因為在磁盤一級進行數(shù)據(jù)復制,對應用系統(tǒng)完全透明,所以相比應用層和數(shù)據(jù)庫層容災方法,復制數(shù)據(jù)量較大,對光纖數(shù)據(jù)鏈路傳輸質(zhì)量和傳輸帶寬要求較高.優(yōu)點:1、
現(xiàn)在而言是全部異地容災方法中最為可靠和成熟技術;2、
有磁盤陣列本身來完成,完全不影響主機性能,也不依靠于操作系統(tǒng)平臺,所以形式全部實現(xiàn)方法中性能最好,使用范圍最廣泛一個;3、
經(jīng)過磁盤陣列之間專用互連完成通信,所以不占用局域網(wǎng)資源。缺點:投資較大
5.5.1災難恢復系統(tǒng)硬件,軟件配置說明我們推薦數(shù)據(jù)中心中心磁盤陣列采取HP高性能全光纖通道交換式結(jié)構(gòu)磁盤陣列XP512。為了適應該前數(shù)據(jù)中心越來越顯著存放中心化趨勢(即:存放作為整套系統(tǒng)關鍵,多種平臺服務器作為存放外設),XP512和傳統(tǒng)磁盤陣列相比已經(jīng)不是單純硬盤堆疊,而是新一代存放+服務器結(jié)構(gòu)。不管從它硬件結(jié)構(gòu)還是直接運行在XP512上多個多樣軟件全部能夠顯著感覺到這一點。系統(tǒng)數(shù)據(jù)存放在主中心存放磁盤陣列XP512中。同時在異地備份中心配置相同結(jié)構(gòu)存放磁盤陣列XP。因為XXXX容災環(huán)境距離為10公里左右,從數(shù)據(jù)復制性能和數(shù)據(jù)復制完整性和一致性方面考慮,提議用戶在主中心和備份中心之間構(gòu)建單模光纖線路用于傳輸備份數(shù)據(jù),并選擇DWDM(密集波分復用)設備實現(xiàn)數(shù)據(jù)復制鏈路多路復用,從而提升數(shù)據(jù)復制傳輸帶寬,并改善遠程數(shù)據(jù)傳輸性能。經(jīng)過HP企業(yè)提供災難備份恢復軟件(HPContinuousAccessXP)能夠自動實現(xiàn)主中心存放數(shù)據(jù)和備份中心數(shù)據(jù)實時完整備份。在主數(shù)據(jù)中心,根據(jù)用戶要求,還能夠配置磁帶備份服務器,用來安裝HP備份軟件OmnibackII,和SureStoreE磁帶庫。備份服務器直接連接到存放陣列和磁帶庫,控制業(yè)務系統(tǒng)日常數(shù)據(jù)磁帶備份。為確保用戶主數(shù)據(jù)中心主機系統(tǒng)負載分擔,容錯能力等功效,惠普企業(yè)提供了優(yōu)異,含有高度可靠性群集結(jié)構(gòu)。該結(jié)構(gòu)可由兩臺或多臺HP9000/800系列高級服務器組成,并經(jīng)過LAN和共用硬盤組成協(xié)調(diào)、高效群集結(jié)構(gòu)。當Cluster中某個節(jié)點出現(xiàn)異常(服務器硬件,系統(tǒng)軟件,應用程序和局域網(wǎng)故障等)時,MC/ServiceGuard能夠立即發(fā)覺故障節(jié)點,自動將故障節(jié)點目前應用系統(tǒng)遷移到其它正常節(jié)點中,使之繼續(xù)進行正常業(yè)務處理,并可自動隔離故障節(jié)點方便于技術人員故障排除工作,從而消除關鍵業(yè)務系統(tǒng)中單故障點。主數(shù)據(jù)中心配置為:部件名稱數(shù)量說明XP5121臺:高速數(shù)據(jù)緩存44塊x4GB(每塊)=8GB磁盤柜1
73GB光纖磁盤8822組x4(每組)x73GB=6424GBHOTSPARE磁盤222組x4(每組)x73GB=6424GB指令內(nèi)存2
主機接口卡2
CommandViewXP1不依靠于平臺基于Web控制管理軟件LUNConfigurationXP1LUN配置、管理軟件存放光纖交換機2臺:光纖端口24
備份數(shù)據(jù)中心配置為:部件名稱數(shù)量說明XP5121臺:高速數(shù)據(jù)緩存44塊x4GB(每塊)=8GB磁盤柜1
73GB光纖磁盤8822組x4(每組)x73GB=6424GBHOTSPARE磁盤222組x4(每組)x73GB=6424GB指令內(nèi)存2
主機接口卡2
CommandViewXP1不依靠于平臺基于Web控制管理軟件LUNConfigurationXP1LUN配置、管理軟件存放光纖交換機2臺:光纖端口24
5.5.2XPCA軟件容災原理
XP(MCU)RCP
XP(RCU)服務器(主)服務器(備)FiberChannel連接CA磁盤卷組拷貝方向SVPM-VOLR-VOLR-VOLLCPREMOTECONTROLREMOTECONTROL(TCP/IP)M-VOLSVP(TCP/IP)
(1)CA磁盤卷組CA磁盤卷組由不一樣XP磁盤陣列裝置內(nèi)或不一樣CLUSTER內(nèi)命名為M-VOL和R-VOL2個邏輯磁盤卷組成。在含有CA磁盤卷組關系后,M-VOL被稱為主磁盤卷。M-VOL可被讀/寫。R-VOL(遠程磁盤卷)被稱為副磁盤卷。在XP磁盤陣列內(nèi)部控制裝置作用下,M-VOL內(nèi)容和服務器來寫數(shù)據(jù)被拷貝到R-VOL。CA卷組建立后,R-VOL為只讀磁盤卷。在一個XP設備內(nèi)部,既可有M-VOL,也可有R-VOL。這么能夠?qū)崿F(xiàn)雙向數(shù)據(jù)境像。
(2〕MCU和RCUMCU(主磁盤控制器)和RCU(遠程磁盤控制器)分別和M-VOL,R-VOL相連,MCU控制由服務器來寫向M-VOL數(shù)據(jù)寫操作,還控制M-VOL和R-VOL之間數(shù)據(jù)拷貝操作。而且提供CA磁盤卷組狀態(tài)和組成管理。RCU實施由MCU發(fā)出寫命令操作。寫操作實施方法和實施服務器來寫操作過程相同。除此之外,RCU還含有管理一部分CA磁盤卷組狀態(tài)和組成信息能力。對于任何一個磁盤卷組,全部需要定義MCU/RCU。一個XP設備磁盤控制裝置在控制M-VOL時,可作為MCU使用,當控制R-VOL時侯,又可作為RCU使用。(3)遠程備份連接MCU和RCU之間由專用光纖(ESCON)來連結(jié)。當光纖直聯(lián),不增加任何設備時,兩臺XP512之間最遠可相隔3KM。在兩臺XP512之間加入ESCON延長裝置(ESCONDIRECTOR或REPATER)可使磁盤陣列間距離最大延長至43KM。假如使用E3或ATM遠程電信協(xié)議,在兩臺XP512之間將不會有距離限制。加入ESCON延長裝置連接圖以下圖所表示:經(jīng)過ESCON光纖通道,MCU和RCU可相互進行數(shù)據(jù)傳送和控制命傳送。在構(gòu)筑CA時,考慮到消除單點故障引患,兩臺XP512之間ESCON光纖最低需要2根。這么當一根光纖出現(xiàn)意外不能使用時,利用剩下一根可完成MCU和RCU間通信。不至引發(fā)系統(tǒng)數(shù)據(jù)傳輸中止。(4)RemotecontrolRemoteControl可完成CA組成設定,卷組狀態(tài)變更和表示。
5.5.3高可靠性方案和高可用性方案選擇當主利用端發(fā)生不可恢復數(shù)據(jù)損失后,遠地備份中心鏡象磁盤卷R-VOL里數(shù)據(jù)和數(shù)據(jù)損失發(fā)生前主中心磁盤卷M-VOL一致性往往會決定系統(tǒng)損失大小和把主應用恢復到正常狀態(tài)所需時間。鏡象卷組間數(shù)據(jù)完全一致時,只要將遠地備份中心數(shù)據(jù)拷回到主利用端起動修復程序便可恢復到正常業(yè)務處理。不過因為數(shù)據(jù)傳輸是經(jīng)過ESCON及CNT進行,而且路徑較遠,鏈路中止等原因全部有可能造成鏡象卷組間數(shù)據(jù)不完全一致。在鏡象卷組失去同時時,主利用端發(fā)生不可恢復數(shù)據(jù)損失后,將會造成部分數(shù)據(jù)丟失。當然,鏈路故障和主利用端同時發(fā)生損壞可能性很低。基于用戶系統(tǒng)是否有優(yōu)先確保在任何時候鏡象卷組全部要一致需要,CAXP提供兩種運行方案:高可靠性方案和高可用性方案。高可靠性方案:在此方案中,將日志文件和表數(shù)據(jù)更新拷貝模式全部設為“DATA”。在這種拷貝模式下,在M-VOL和R-VOL鏡象卷組失去同時前,MCU會據(jù)絕服務器對M-VOL發(fā)出寫操作并發(fā)出寫錯誤信息。所以,M-VOL和R-VOL鏡象卷組一致性得到確保。這種模式即使提供了良好一致性確保,不過對應用環(huán)境也有較高要求。當兩條ESCON鏈路全部斷掉或遠地備份中心XP512因停電造成運行中止等偶發(fā)性故障發(fā)生時,CAXP鏡象卷組M-VOL狀態(tài)變?yōu)椤癝USPEND”,MCU檢測出此狀態(tài)后為了確保鏡象卷組一致性將嚴禁M-VOL寫操作即有可能中止主利用端應用正常運行。所以,此方案要求系統(tǒng)含有忍受應用臨時停止能力。當因為M-VOL以外地方發(fā)生故障引發(fā)主利用端應用運行中止時,系統(tǒng)管理員又想繼續(xù)應用進行,能夠用命令刪除CAXP鏡象卷組邏輯關系,使M-VOL狀態(tài)該變?yōu)椤癝IMPLEX”,開放對M-VOL寫操作。以后,主利用對M-VOL更新不會被反應到R-VOL端,即鏡象卷組失去同時。鏡像失去同時后提議增加對在當?shù)豈-VOL在線BACKUP頻度。高可靠性方案能夠確保M-VOL和R-VOL嚴格同時。但即使主利用端不發(fā)生故障也有可能造成應用中止。此方案適適用于優(yōu)先磁盤卷組內(nèi)容一致系統(tǒng)利用,且此方案要求系統(tǒng)含有忍受應用臨時停止能力。
高可用性方案在此方案中,將日志文件和表數(shù)據(jù)更新拷貝模式全部設為“NEVER”。在這種拷貝模式下建立起來CAXP鏡像卷組即使在光纖或R-VOL故障引發(fā)M-VOL和R-VOL鏡象卷組失去同時后,只要M-VOL沒有遭到損壞,MCU就不會據(jù)絕服務器對M-VOL發(fā)出寫操作。從服務器端來看,M-VOL對R-VOL鏡象卷數(shù)據(jù)更新象在正常進行,服務器應用也不會被中止。不過實際當光纖鏈路故障發(fā)生后,對R-VOL更新會被停止,M-VOL里被更新磁道會被標上標識,而且MCU向服務器和RETOMECONTROL發(fā)出磁盤卷組異常信息提醒。當出現(xiàn)光纖、CNT、遠地備份中心XP512停電等故障時,因為不影響應用運行,所以沒有必需象“DATA”那樣強制中止CAXP卷組。在此期間M-VOL更新數(shù)據(jù)會被統(tǒng)計下來。故障修復后,可用激活命令實施M-VOL更新部分拷備再同時磁盤卷組。鏡像卷失去同時后提議增加對在當?shù)豈-VOL在線BACKUP頻度。此應用方案適適用于優(yōu)先確保主利用系統(tǒng)和光纖線路狀態(tài)不太安定地域。但使用此方案前,必需有一個明確認識,那就是在恢復CAXP卷組同步前,假如主利用端發(fā)生不可修復災難,將會造成數(shù)據(jù)丟失。數(shù)據(jù)丟失量和R-VOL變?yōu)椤癝USPEND”時間相關,即M-VOL停止向R-VOL更新時間。鑒于XXXX業(yè)務為關鍵應用,因為部分次要原因故障如線路故障等停止在線服務會對信譽,業(yè)務造成較大損失。所以我們提議用戶使用高可用性方案。5.5.4切換步驟向備份中心切換概要:(a)主中心端XPMCU因為災難故障不能使用。卷組狀態(tài)
MCU
RCU服務器(主〕服務器(備用〕步驟1:分析R-VOL一致性-從RCU看卷組狀態(tài)及更新拷備模式
RDeletePair步驟2:刪除全部CA卷組-在RCU側(cè)實施DeletePair命令-R-VOL狀態(tài)變?yōu)椤竤implex」
MCU
RCU服務器(主〕服務器(備用〕S假如沒有在備用服務器上再開新應用,則到此為止。
MCU
RCU服務器(主〕服務器(備用〕S步驟3:使用前準備(假如在備用服務器上再開應用〕-實施Vgchang-ae命令-實施Fsck命令-MountR-VOL
(b)由備份中心切換回主中心端
RCU
MCU服務器(主〕
服務器(備用〕MR步驟4:中止備用服務器上應用,從服務器上將M-VOL解放(unmount)
RCU
MCU服務器(主〕
服務器(備用〕MR步驟5:確任全部CA磁盤卷組狀態(tài)全部變?yōu)镈uplex。(CA卷組處于同時狀態(tài)〕CA卷組狀態(tài)
服務器(主〕
服務器(備用〕
SS步驟6:在RCU上刪除全部CA磁盤卷組。-DeletePair:刪除全部CA磁盤卷組-DeleteRCU-端口變更:將RCP改變?yōu)長CP。DeletePairDeleteRCU變更Portmode
MCU
RCU服務器(主〕
服務器(備用〕步驟7:按原來方向建立CA磁盤卷組(不實施初始拷貝〕,MountM-VOL->恢復主利用運行。將LCP端口改為RCP端口?AddRCU?AddPair
-MR
注:M:M-ROL,R:R-VOL,S:Simplex卷組
5.5.5XP容災方案性能分析XP陣列在用光纖構(gòu)筑CAXP時,為了確保系統(tǒng)不會因單點故障,而出現(xiàn)數(shù)據(jù)傳輸中止現(xiàn)象,要求最少配置兩根光纖通道,CNTUWM間一條光纖傳輸速率為100MB/Sec,可經(jīng)過轉(zhuǎn)換FC波長實現(xiàn)最多8路光纖信號同時傳輸,即可達成800MB/Sec傳輸帶寬.依據(jù)XXXX關鍵業(yè)務系統(tǒng)現(xiàn)有和未來一段時間發(fā)展業(yè)務量統(tǒng)計,我們能夠得出結(jié)論,XXXX需要實現(xiàn)實時備份每秒鐘數(shù)據(jù)傳輸量小于以上線路實際傳輸能力,所以不會引發(fā)遠程數(shù)據(jù)復制傳輸瓶頸現(xiàn)象,對于用戶系統(tǒng)數(shù)據(jù)有足夠傳送能力。對異步寫響應時間計算:當然在衡量CA組成合理性時,不能單單只重視數(shù)據(jù)傳送能力,還有一個很關鍵指標就是相關CA卷組寫操作響應時間。即使對于異步寫操作而言,XP之間數(shù)據(jù)復制不直接影響生產(chǎn)系統(tǒng)正常寫操作。不過在距離較遠時,因為時延較大,兩臺XP假如在較長時間里得不到相互信息,將會影響到應用系統(tǒng)運行。相關CA卷組寫操作過程介紹中,我們知道完成一個寫操作要有4個過程,其中影響寫性能部分有:MCU,RCU處理寫操作時間和由光纖引發(fā)延遲2部分。
總時延=主機時延+4*CNT時延+數(shù)據(jù)塊大小/帶寬(FC)+2*傳輸時延
在XXXX容災環(huán)境中,因為傳輸距離約為10公里,經(jīng)計算,傳輸時延約為0.05ms,CNTUWM時延為10ns(0.00001ms),所以對主機應用性能無顯著影響.在實際情況中,為確保系統(tǒng)正常運行,我們必需同廣域網(wǎng)帶寬租賃商具體確定數(shù)據(jù)傳輸延時(依據(jù)路由個數(shù))。
第六章 災難備份恢復步驟災難恢復步驟是指在主數(shù)據(jù)中心發(fā)生計算機系統(tǒng)故障或災難事件時,為了盡可能降低對業(yè)務造成損失,而制訂搶救方法、故障隔離方法、恢復步驟和方法、和各相關部門和人員聯(lián)絡方法等。災難恢復步驟是控制風險一個有效方法,是災難備份恢復一個關鍵組成部分。災難恢復步驟內(nèi)容應盡可能詳盡,并易于操作。任何災難恢復步驟實施全部需要有一個強有力、訓練有素工作小組去操作,小組中人員應熟知災難恢復步驟。平時應對小組人員進行培訓和教育,方便使小組中每個人全部明白在救災和恢復過程中應擔負職責,提升災難救護和恢復技能。另外,應定時對災難恢復步驟進行演練,使小組人員能夠在災難發(fā)生時做到從容不迫、擔心有序地開展搶救、隔離和恢復工作。需要做好各個生產(chǎn)中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)一體化運營體系初設及建議方案
- 腿部養(yǎng)生專業(yè)知識課件
- 新時代黨課講稿模板
- 2026年中國科學院高能物理研究所軟件工程師崗位招聘備考題庫有答案詳解
- 2026年華潤雪花啤酒(中國)有限公司招聘備考題庫帶答案詳解
- 江西銷售分公司招聘筆試題庫2026
- 大港石化分公司招聘筆試題庫2026
- 深化采購規(guī)范管理制度
- 煙草案件審核制度規(guī)范
- 工地車輛管理制度規(guī)范
- 2026北京市通州區(qū)事業(yè)單位公開招聘工作人員189人筆試重點基礎提升(共500題)附帶答案詳解
- 2025~2026學年山東省菏澤市牡丹區(qū)第二十一初級中學八年級上學期期中歷史試卷
- 土壓平衡盾構(gòu)克泥效同步注入抑制沉降施工工法
- QSB知識培訓資料重點
- 安全庫存基準表
- (37)-24.1.4黃芪中藥中醫(yī)學課件
- 高中生物競賽課件:蛋白質(zhì)的性質(zhì)與分離、分析技術
- 刑法學(上冊)馬工程課件 第1章 刑法概說
- 《紅樓夢中的禮儀習俗研究報告》
- GB/T 1041-2008塑料壓縮性能的測定
- 全國計算機等級考試三級網(wǎng)絡技術歷年真題版
評論
0/150
提交評論