服務(wù)器集群解決方案綜述_第1頁
服務(wù)器集群解決方案綜述_第2頁
服務(wù)器集群解決方案綜述_第3頁
服務(wù)器集群解決方案綜述_第4頁
服務(wù)器集群解決方案綜述_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、服務(wù)器集群解決方案綜述 第一章、計(jì)算機(jī)集群技術(shù)概述 隨著計(jì)算機(jī)技術(shù)的發(fā)展和越來越廣泛的應(yīng)用,越來越多的依賴于計(jì)算機(jī)技術(shù)的應(yīng)用系統(tǒng)走進(jìn)了我們的工作和生活。在給我們帶來方便和效率的同時(shí),也使得各行各業(yè)對(duì)于計(jì)算機(jī)技術(shù)的依賴程度越來越高。盡管隨著計(jì)算機(jī)技術(shù)以日新月異的速度發(fā)展,單臺(tái)計(jì)算機(jī)的性能和可靠性越來越好,但還是有許多現(xiàn)實(shí)的要求是單臺(tái)計(jì)算機(jī)難以達(dá)到的??纯聪旅娴睦樱?*某銀行需要一臺(tái)服務(wù)器來儲(chǔ)存財(cái)務(wù)數(shù)據(jù)。他要求這臺(tái)計(jì)算機(jī)即使是在機(jī)房坍塌的情況下也能夠被各個(gè)業(yè)務(wù)網(wǎng)點(diǎn)訪問。 在這些情況下,往往需要將多臺(tái)計(jì)算機(jī)組織起來進(jìn)行協(xié)同工作來模擬一臺(tái)功能更強(qiáng)大解決問題。這種技術(shù)稱為集群技術(shù)。目前應(yīng)用最為廣泛的集

2、群計(jì)算技術(shù)可以分為三大類:高可用性集群技術(shù)、高性能計(jì)算集群技術(shù)和高可擴(kuò)展性集群技術(shù)。下面我們將主要介紹高可用性群集系統(tǒng)。 (一)、高可用性集群概述 高可用性集群,英文原文為High Availability Cluster 簡(jiǎn)稱HA Cluster,是指以減少服務(wù)中斷(宕機(jī))時(shí)間為目的的服務(wù)器集群技術(shù)。 隨著全球經(jīng)濟(jì)的增長(zhǎng),世界各地各種各樣的組織對(duì)IT系統(tǒng)的依賴都在不斷增加,電子貿(mào)易使得商務(wù)一周七天24小時(shí)不間斷的進(jìn)行成為了可能。新的強(qiáng)大的應(yīng)用程序使得商業(yè)和社會(huì)機(jī)構(gòu)對(duì)日常操作的計(jì)算機(jī)化要求達(dá)到了空前的程度,趨勢(shì)非常明顯,我們無時(shí)無刻不依賴于穩(wěn)定的計(jì)算機(jī)系統(tǒng)。 為了提高整個(gè)系統(tǒng)的可用性,除了提高

3、計(jì)算機(jī)各個(gè)部件的可靠性以外,一般情況下都會(huì)采用集群的方案。 所謂集群,就是共同為客戶機(jī)提供網(wǎng)絡(luò)資源的一組計(jì)算機(jī)系統(tǒng)。而其中的每一臺(tái)提供服務(wù)的計(jì)算機(jī),我們稱之為節(jié)點(diǎn)。當(dāng)一個(gè)節(jié)點(diǎn)不可用或者不能處理客戶的請(qǐng)求時(shí),該請(qǐng)求將會(huì)轉(zhuǎn)到另外的可用節(jié)點(diǎn)來處理,而這些對(duì)于客戶端來說,它根本不必關(guān)心這些要使用的資源的具體位置,集群系統(tǒng)會(huì)自動(dòng)完成。 集群中節(jié)點(diǎn)可以以不同的方式來運(yùn)行,這要看它們是如何設(shè)置的。在一個(gè)理想的兩個(gè)節(jié)點(diǎn)的集群中,兩個(gè)服務(wù)器都同時(shí)處于活動(dòng)狀態(tài),也就是在兩個(gè)節(jié)點(diǎn)上同時(shí)運(yùn)行應(yīng)用程序,當(dāng)一個(gè)節(jié)點(diǎn)出現(xiàn)故障時(shí),運(yùn)行在出故障的節(jié)點(diǎn)上的應(yīng)用程序就會(huì)轉(zhuǎn)移到另外的沒有出現(xiàn)故障的服務(wù)器上,這樣一來,由于兩個(gè)節(jié)點(diǎn)的工

4、作現(xiàn)在由一個(gè)服務(wù)器來承擔(dān),自然會(huì)影響服務(wù)器的性能。 針對(duì)這種情況的解決方案是,在正常操作時(shí),另一個(gè)節(jié)點(diǎn)處于備用狀態(tài),只有當(dāng)活動(dòng)的節(jié)點(diǎn)出現(xiàn)故障時(shí)該備用節(jié)點(diǎn)才會(huì)接管工作,但這并不是一個(gè)很經(jīng)濟(jì)的方案,因?yàn)槟悴坏貌毁I兩個(gè)服務(wù)器來做一個(gè)服務(wù)器的工作。雖然當(dāng)出現(xiàn)故障時(shí)不會(huì)對(duì)性能產(chǎn)生任何影響,但是在正常運(yùn)行時(shí)的性能價(jià)格比并不太好。 從上面的工作方式出發(fā),我們可以把集群分為下面幾種(特別是兩節(jié)點(diǎn)的集群) 主/主 (Active/active) 這是最常用的集群模型,它提供了高可用性,并且在只有一個(gè)節(jié)點(diǎn)在線時(shí)提供可以接受的性能,該模型允許最大程度的利用硬件資源。每個(gè)節(jié)點(diǎn)都通過網(wǎng)絡(luò)對(duì)客戶機(jī)提供資源,每個(gè)節(jié)點(diǎn)的容量

5、被定義好,使得性能達(dá)到最優(yōu),并且每個(gè)節(jié)點(diǎn)都可以在故障轉(zhuǎn)移時(shí)臨時(shí)接管另一個(gè)節(jié)點(diǎn)的工作。所有的服務(wù)在故障轉(zhuǎn)移后仍保持可用,但是性能通常都會(huì)下降。 主/從(Active/passive) 為了提供最大的可用性,以及對(duì)性能最小的影響,Active/passive模型需要一個(gè)在正常工作時(shí)處于備用狀態(tài),主節(jié)點(diǎn)處理客戶機(jī)的請(qǐng)求,而備用節(jié)點(diǎn)處于空閑狀態(tài),當(dāng)主節(jié)點(diǎn)出現(xiàn)故障時(shí),備用節(jié)點(diǎn)會(huì)接管主節(jié)點(diǎn)的工作,繼續(xù)為客戶機(jī)提供服務(wù),并且不會(huì)有任何性能上影響。 混合型(Hybrid) 混合是上面兩種模型的結(jié)合,只針對(duì)關(guān)鍵應(yīng)用進(jìn)行故障轉(zhuǎn)移,這樣可以對(duì)這些應(yīng)用實(shí)現(xiàn)可用性的同時(shí)讓非關(guān)鍵的應(yīng)用在正常運(yùn)作時(shí)也可以在服務(wù)器上運(yùn)行。當(dāng)

6、出現(xiàn)故障時(shí),出現(xiàn)故障的服務(wù)器上的不太關(guān)鍵的應(yīng)用就不可用了,但是那些關(guān)鍵應(yīng)用會(huì)轉(zhuǎn)移到另一個(gè)可用的節(jié)點(diǎn)上,從而達(dá)到性能和容錯(cuò)兩方面的平衡。 (二)、高可用性集群工作原理 下面針對(duì)高可用性集群,介紹一下它的工作原理。 在微軟的MSCS(Microsoft Cluster Server)術(shù)語中,所有的應(yīng)用程序、數(shù)據(jù)文件、磁盤、網(wǎng)絡(luò)IP地址等都被稱為資源,一些資源可以組成一個(gè)資源組,一個(gè)資源組存在于一個(gè)節(jié)點(diǎn)上,但同時(shí)只能在一個(gè)節(jié)點(diǎn)上,它是MSCS可以進(jìn)行故障切換(FailOver)的最小單元。 在MSCS中,所有的資源都處于資源監(jiān)視器的監(jiān)視之下,資源監(jiān)視器通過資源動(dòng)態(tài)鏈接庫(kù)文件與資源進(jìn)行通信,這些資源動(dòng)

7、態(tài)鏈接庫(kù)會(huì)偵測(cè)對(duì)應(yīng)資源的狀態(tài),并通知資源監(jiān)視器,之后,監(jiān)視器再把信息提供給集群服務(wù)(Cluster Service),缺省情況下,集群服務(wù)會(huì)啟動(dòng)一個(gè)資源監(jiān)視器來監(jiān)視節(jié)點(diǎn)中的全部資源。 MSCS用依賴性來定義不同資源彼此之間的關(guān)系,MSCS會(huì)根據(jù)資源間的相互依賴關(guān)系來決定把這些資源變?yōu)樵诰€或者是離線的順序。舉一個(gè)WEB服務(wù)器文件共享的例子,文件共享的資源需要硬盤驅(qū)動(dòng)器來存儲(chǔ)數(shù)據(jù),把這些有關(guān)系的資源一起放在MSCS組中,要實(shí)現(xiàn)共享,就必須先把硬盤準(zhǔn)備好。同時(shí),為了完成文件共享,我們還需要準(zhǔn)備好網(wǎng)絡(luò)名稱以及IP地址。 從上圖可以看出,文件共享資源依賴于硬盤資源,網(wǎng)絡(luò)名稱資源依賴于IP地址資源,而對(duì)應(yīng)

8、的WEB服務(wù)剛依賴于文件共享和網(wǎng)絡(luò)名稱。 資源的存在可以分為五種狀態(tài) 1、Offline,資源不能被別的資源或者客戶機(jī)使用 2、Offline Pending,資源正處于Offline的過程中 3、Online,資源處于可用的狀態(tài) 4、Online Pending,資源正處于Online的過程中 5、Failed,資源出現(xiàn)了MSCS無法解決的問題 前面已經(jīng)提到,MSCS可以從一個(gè)節(jié)點(diǎn)故障切換到另一個(gè)節(jié)點(diǎn)的最小單元是資源組。被定義好的相關(guān)的資源放在同一個(gè)組中,并建立對(duì)應(yīng)的依賴關(guān)系。以下圖為例,如果節(jié)點(diǎn)A中的資源組1要移到節(jié)點(diǎn)B上的話,資源組1中的資源(資源A,資源B,資源C)也必須從節(jié)點(diǎn)A移到節(jié)

9、點(diǎn)B才行。 在MSCS的資源中,有一個(gè)非常重要的資源,Quorum,它是一個(gè)可以被兩個(gè)節(jié)點(diǎn)訪問的物理硬盤,用來保存集群的信息。這些信息是用來維護(hù)集群的完整性以及使節(jié)點(diǎn)保持同步,特別是當(dāng)節(jié)點(diǎn)不能與另一個(gè)節(jié)點(diǎn)通信的時(shí)候。Quorum盤在某一時(shí)刻只能被一個(gè)節(jié)點(diǎn)所擁有,并用來決定由哪個(gè)節(jié)點(diǎn)來擁有集群的所有資源。Quorum必須位于共享的磁盤子系統(tǒng)中,一般都是使用外接的磁盤柜。一般情況下,不建議把應(yīng)用程序和數(shù)據(jù)保存到包含Quorum的硬盤上。 故障切換(Failover)是指把出現(xiàn)故障的節(jié)點(diǎn)上的資源重新定位到另一個(gè)可用的節(jié)點(diǎn)上。負(fù)責(zé)監(jiān)視資源的資源監(jiān)視器一旦發(fā)現(xiàn)資源出現(xiàn)故障,它就會(huì)通知集群服務(wù),集群服務(wù)會(huì)

10、根據(jù)事前定義好的策略觸發(fā)對(duì)應(yīng)的事件。雖然發(fā)現(xiàn)的是個(gè)別資源的故障,但是,集群還是會(huì)把整個(gè)資源組進(jìn)行故障切換。 故障切換會(huì)在三種不同的情況下發(fā)生,人工(一般是因?yàn)楣芾韱T的請(qǐng)求),自動(dòng),或者在特定的時(shí)間(由集群管理軟件設(shè)定)。自動(dòng)故障切換又包含了三個(gè)階段:1、故障發(fā)現(xiàn)。2、資源重新定位。3、重新啟動(dòng)應(yīng)用程序(一般是故障切換過程中最耗費(fèi)時(shí)間的)。當(dāng)達(dá)到資源組的故障切換閥值時(shí),自動(dòng)的故障切換才會(huì)發(fā)生,閥值是可以設(shè)定的,一般由管理員來設(shè)定。 故障恢復(fù)(Failback)是一種故障切換的特例,是指發(fā)生故障切換之后,把部分或者全部資源組移回它們首選的節(jié)點(diǎn)的過程。首選的節(jié)點(diǎn),就是指集群中指定的運(yùn)行資源組的道選的

11、節(jié)點(diǎn),如果是多個(gè)節(jié)點(diǎn)的高可用性方案,就會(huì)有多個(gè)首選的節(jié)點(diǎn)。當(dāng)首選的節(jié)點(diǎn)出現(xiàn)故障后,對(duì)應(yīng)的資源組就切換到另外的可用節(jié)點(diǎn)上,當(dāng)出現(xiàn)故障的節(jié)點(diǎn)恢復(fù)正常后,資源組可以自動(dòng)的切換回首選節(jié)點(diǎn)。如果沒有定義首選節(jié)點(diǎn),資源組就不會(huì)自動(dòng)切換回來。 要檢查資源是不是可用,資源監(jiān)視器會(huì)向?qū)?yīng)的動(dòng)態(tài)鏈接庫(kù)發(fā)送狀態(tài)信息的請(qǐng)求,一般會(huì)有兩種級(jí)別的檢查,LooksAlive和IsAlive。LooksAlive級(jí)別的檢查相對(duì)比較簡(jiǎn)單,每隔一段時(shí)間(相對(duì)比較短的時(shí)間,缺省是5秒),資源監(jiān)視器會(huì)進(jìn)行一次LooksAlive級(jí)別的檢查,如果資源沒有響應(yīng),監(jiān)視器會(huì)向集群服務(wù)報(bào)告。IsAlive級(jí)別的檢查是非常完整的檢查,它會(huì)徹底檢

12、查資源是不是工作正常,IsAlive檢查的時(shí)間間隔比LooksAlive要長(zhǎng),缺省是1分鐘。 結(jié)合上面提到的各個(gè)要素,高可用性就是通過下面的過程來實(shí)現(xiàn)的: 首先,資源監(jiān)視器根據(jù)設(shè)定的時(shí)間間隔對(duì)資源進(jìn)行LookAlive和IsAlive兩種級(jí)別的檢查,一旦發(fā)現(xiàn)某一個(gè)資源不可用,就會(huì)試圖重新啟動(dòng)該資源。根據(jù)閥值的設(shè)定,如果在某一時(shí)間段內(nèi),資源不可用的情況達(dá)到了設(shè)定的閥值時(shí),就會(huì)發(fā)生故障切換。經(jīng)過故障切換的過程,對(duì)應(yīng)的資源組在另外一個(gè)節(jié)點(diǎn)上重新啟動(dòng)了,繼續(xù)為客戶機(jī)提供服務(wù),對(duì)客戶來說,工作沒有影響,這就完成了一次故障切換。當(dāng)出現(xiàn)故障的節(jié)點(diǎn)恢復(fù)正常以后,如果事先對(duì)該資源組設(shè)定了首選節(jié)點(diǎn),就會(huì)把該資源組

13、移回該首選節(jié)點(diǎn)。 經(jīng)過前面的介紹,我們已經(jīng)對(duì)高可用性的原理有了一些了解,下面,我們具體闡述一下IBM xSeries 服務(wù)器集群解決方案 第二章、IBM xSeries 服務(wù)器群集解決方案 (一)、體系結(jié)構(gòu) 如今,計(jì)算機(jī)解決方案與性能高低之間已經(jīng)互為代名詞高性能的軟件是以硬件平臺(tái)的能力大小為基礎(chǔ)的而能力的大小可以從兩方面進(jìn)行擴(kuò)展,垂直的(在一個(gè)系統(tǒng)內(nèi)部)和水平(多系統(tǒng)互連)實(shí)現(xiàn)垂直方向上的性能擴(kuò)展的關(guān)鍵在于整個(gè)系統(tǒng)的均衡設(shè)計(jì),包括可擴(kuò)展的處理器,內(nèi)存,存儲(chǔ)器和輸入輸出設(shè)備等各子系統(tǒng)為滿足日益增長(zhǎng)的要求,許多商家已將單處理器系統(tǒng)升級(jí)為具有對(duì)稱多處理器(SMP)的可垂直擴(kuò)展的大系統(tǒng) 當(dāng)運(yùn)算需求或有

14、效性需求超出SMP系統(tǒng)的能力范圍時(shí),許多公司將目光轉(zhuǎn)向群集,以滿足商務(wù)活動(dòng)中所要求的有效性,可擴(kuò)展和可管理性等各項(xiàng)指標(biāo)群集被認(rèn)為是可將原有的系統(tǒng)擴(kuò)展為更大型系統(tǒng)的行之有效的解決辦法IBM曾推出兩組大型處理系統(tǒng)系列:Scalable POWERparallel (SP)和zSeries(S390) Parallel Sysplex系統(tǒng)這兩組基于群集技術(shù)原理的服務(wù)器系列,性能可靠,并具有幾乎可升級(jí)至無限計(jì)算能力的擴(kuò)展性IBM服務(wù)器家族的另一成員iSeries(AS/400),不僅提供了性能可靠的中等規(guī)模的服務(wù)器平臺(tái),而且綜合了業(yè)界領(lǐng)先的各種解決方案基于同樣的設(shè)計(jì)原理,以及我們?cè)诖笮拖到y(tǒng)方面的經(jīng)驗(yàn),

15、IBM 正在xSeries服務(wù)器上發(fā)展新的群集體系結(jié)構(gòu) 決定整個(gè)系統(tǒng)最終性能的關(guān)鍵步驟之一是如何設(shè)計(jì)系統(tǒng)的體系結(jié)構(gòu)SMP系統(tǒng)具有集中式的存貯器,這樣不僅限制了處理器的擴(kuò)展能力,而且因?yàn)閮H有一個(gè)操作系統(tǒng)鏡像,系統(tǒng)崩潰帶來的危險(xiǎn)非常巨大因此,SMP系統(tǒng)很難滿足有效性和擴(kuò)展性兩方面的要求而群集構(gòu)建于分布式模型的基礎(chǔ)之上,不僅提高了整個(gè)系統(tǒng)的有效性,而且允許將系統(tǒng)中處理器的數(shù)目擴(kuò)展到上百個(gè)之多IBM的集群技術(shù)解決方案著重于三個(gè)方面:有效性、可靠性和可管理性。 持續(xù)的可靠性 推動(dòng)集群技術(shù)發(fā)展的一個(gè)主要?jiǎng)恿σ蛩卦谟谌藗冊(cè)噲D尋找一個(gè)具有持續(xù)的有效性的技術(shù)解決方案。實(shí)現(xiàn)這個(gè)目標(biāo)需要按照以下3個(gè)步驟進(jìn)行: 1

16、減少故障發(fā)生的可能性 2 盡可能減輕故障所引起的負(fù)面影響 3 在無需系統(tǒng)停止運(yùn)行的前提下有計(jì)劃地修復(fù)和升級(jí) 提高系統(tǒng)各組成部件的可靠性可以降低故障發(fā)生的概率,IBM xSeries服務(wù)器在產(chǎn)品設(shè)計(jì)開發(fā)過程中投入了大量的人力及資金,研發(fā)出很多的先進(jìn)技術(shù),以提高服務(wù)器整體的可靠性。 為了實(shí)現(xiàn)系統(tǒng)不間斷運(yùn)行的目標(biāo),IBM 提供了大量專門設(shè)計(jì)的新工具以極大的降低計(jì)劃與非計(jì)劃系統(tǒng)宕機(jī)時(shí)間。技術(shù)包括:光通路診斷技術(shù)有助于迅速定位并替換失效組件;Active PCI 技術(shù)允許您無需關(guān)閉系統(tǒng)即可添加或替換適配器。IBM 采用增強(qiáng)的內(nèi)存子系統(tǒng),在企業(yè)級(jí)X架構(gòu)技術(shù)模型中擴(kuò)展了系統(tǒng)高可用性功能。IBM 對(duì)子系統(tǒng)的升

17、級(jí)使之更加堅(jiān)固,給您提供更高級(jí)別的系統(tǒng)可用性并保證用戶可以247不間斷的進(jìn)行系統(tǒng)訪問。將以前僅在硬盤驅(qū)動(dòng)器中使用的數(shù)據(jù)保護(hù)技術(shù)應(yīng)用到內(nèi)存子系統(tǒng)后,使用企業(yè)級(jí)X-架構(gòu)技術(shù)構(gòu)建的xSeries 服務(wù)器提供更高的系統(tǒng)可用性。 n Active Memory提供內(nèi)存熱插拔和熱添加技術(shù)特性。如果需要替換任何內(nèi)存或需 要增加更多內(nèi)存容量,則無需關(guān)閉服務(wù)器系統(tǒng)即可實(shí)現(xiàn)。 n ChipKill 內(nèi)存現(xiàn)在,作為第三代行業(yè)標(biāo)準(zhǔn)計(jì)算機(jī)系統(tǒng), ChipKill 內(nèi)存提供全新 級(jí)別的系統(tǒng)可靠性。ChipKill 內(nèi)存可以修正在一個(gè)芯片組或多個(gè)芯片 組的內(nèi)存DIMM 模塊的多位錯(cuò)誤。 n Memory ProteXion

18、使用與硬盤驅(qū)動(dòng)器熱備份技術(shù)類似的冗余數(shù)據(jù)通道,在出現(xiàn) DIMM 模塊芯片組失效時(shí)自動(dòng)重新進(jìn)行數(shù)據(jù)路由以保證服務(wù)器系統(tǒng)平穩(wěn)運(yùn)行。Memory ProteXion 在修正內(nèi)存錯(cuò)誤方面比ECC 內(nèi)存更有效。專門設(shè)計(jì)集成Memory ProteXion 和ChipKill 內(nèi)存就可以修正服務(wù)器系統(tǒng)運(yùn)行所遇到的幾乎任何錯(cuò)誤。 n 內(nèi)存鏡像如果有時(shí)候服務(wù)器運(yùn)行時(shí)出現(xiàn)的內(nèi)存數(shù)據(jù)錯(cuò)誤太多導(dǎo)致Memory ProteXion和ChipKill內(nèi)存無法完全正確修復(fù)所有數(shù)據(jù)時(shí), 則內(nèi)存鏡像技術(shù)就可以保證系統(tǒng)無差錯(cuò)運(yùn)行。內(nèi)存鏡像技術(shù)的工作原理與RAID-1磁盤鏡像類似:數(shù)據(jù)同時(shí)寫到兩個(gè)獨(dú)立的內(nèi)存卡上,但是從標(biāo)記為“活

19、動(dòng)”的內(nèi)存卡中僅能進(jìn)行數(shù)據(jù)讀取。 目前以有很多的方案試圖減輕故障帶來的負(fù)面影響。這些方案通常是利用冗余部件來代替出錯(cuò)部件進(jìn)行工作,直到故障被修復(fù)。IBM集群解決方案所采用的設(shè)計(jì)方案著重于避免整個(gè)系統(tǒng)的癱瘓,系統(tǒng)在盡量提高單個(gè)節(jié)點(diǎn)的可靠性的同時(shí)可以容忍單個(gè)節(jié)點(diǎn)的故障,當(dāng)某個(gè)節(jié)點(diǎn)上發(fā)生故障時(shí),系統(tǒng)將故障局限于這個(gè)節(jié)點(diǎn)范圍內(nèi)以避免其負(fù)面影響繼續(xù)擴(kuò)大。IBM集群系統(tǒng)允許在修復(fù)某個(gè)節(jié)點(diǎn)時(shí),該節(jié)點(diǎn)被單獨(dú)斷電并切斷與系統(tǒng)其它部分的連接,還允許在整個(gè)系統(tǒng)保持運(yùn)行的狀態(tài)下替換某個(gè)節(jié)點(diǎn)或開啟節(jié)點(diǎn)電源,類似的,當(dāng)整個(gè)系統(tǒng)的某個(gè)節(jié)點(diǎn)或某一部分的軟硬件需要檢修或升級(jí)時(shí),不需要整個(gè)系統(tǒng)停止運(yùn)行。 近似線形的可擴(kuò)展性 盡管

20、SMP系統(tǒng)的垂直擴(kuò)展能夠滿足某些性能需求,但由于集群所帶來的水平擴(kuò)展會(huì)使系統(tǒng)性能具有更強(qiáng)大的可擴(kuò)展性。盡管IBM已在企業(yè)級(jí)的大型集群服務(wù)器設(shè)計(jì)中成功的解決了垂直擴(kuò)展中的問題,但水平擴(kuò)展所面臨的問題和挑戰(zhàn)遠(yuǎn)不同于垂直擴(kuò)展所要面對(duì)的問題。延遲短而有高速可靠的通信、共享I/O設(shè)備的訪問以及最優(yōu)工作量平衡是實(shí)現(xiàn)水平擴(kuò)展要解決的3個(gè)關(guān)鍵技術(shù)問題。 當(dāng)您的業(yè)務(wù)隨著增長(zhǎng)而變得日益復(fù)雜的時(shí)候,您的系統(tǒng)也會(huì)變得復(fù)雜。擴(kuò)展意味著在現(xiàn)有的硬件基礎(chǔ)上利用集群件和優(yōu)化了的應(yīng)用程序擴(kuò)大容量,提高性能,上圖說明了在增加節(jié)點(diǎn)時(shí),集群的處理能力按近似線形的速度增長(zhǎng)。 可管理性 盡管集群可以提供非常出色的可擴(kuò)展性和可靠性,但是否

21、能夠高效地管理多個(gè)節(jié)點(diǎn)仍然是衡量集群功能的重要指標(biāo)。管理集群的目的是能夠在一個(gè)控制點(diǎn)連續(xù)監(jiān)視整個(gè)系統(tǒng)的運(yùn)行情況,并且在故障發(fā)生時(shí),能夠自動(dòng)地采取相應(yīng)措施。促使聯(lián)合多個(gè)服務(wù)器的動(dòng)機(jī)之一就是要提高服務(wù)器的可管理性和使用價(jià)值,從而降低總體擁有成本。將服務(wù)器和數(shù)據(jù)集中到一個(gè)地點(diǎn)可以極大地提高效率,這在很大程度上要?dú)w功于由集中而帶來的更出色的管理手段。 隨著集群的規(guī)模越來越大,并且要包含越來越復(fù)雜的資源,IBM致力于運(yùn)用多年積累的關(guān)于集群的經(jīng)驗(yàn)和技術(shù)來提高單點(diǎn)管理的能力。其中IBM的優(yōu)勢(shì)領(lǐng)域包括以下幾個(gè)方面: l 性能監(jiān)視和調(diào)整 l 處理能力規(guī)劃 l 負(fù)載均衡和規(guī)劃 l 報(bào)警及管理能力 同時(shí)IBM Di

22、rector 系統(tǒng)管理軟件工具包,在大多數(shù)xSeries 服務(wù)器中免費(fèi)提供,用于擴(kuò)展支持客戶管理、客戶服務(wù)器群集系統(tǒng)和處理功能并減少系統(tǒng)瓶頸。IBM 還不斷擴(kuò)展該軟件包以提供廣泛的,包括高級(jí)系統(tǒng)管理功能的服務(wù)器解決方案。自我管理、自我修復(fù)技術(shù)是IBM Project eLiza(電子蜥蜴) 新工具的特征,該工具可以使服務(wù)器進(jìn)行主動(dòng)的自我管理、無需或很少人工干預(yù)。創(chuàng)新的技術(shù)例如Memory ProteXion和軟件復(fù)原技術(shù),以及IBM Director 工具功能的不斷增強(qiáng),都保證了真正的系統(tǒng)可靠性,這也反過來降低技術(shù)人員對(duì)系統(tǒng)維護(hù)所耗費(fèi)的精力、時(shí)間和金錢。IBM 智能化工具幫助您越來越靠近不間斷

23、地?cái)?shù)據(jù)中心運(yùn)作。 (二)、構(gòu)建一個(gè)群集系統(tǒng) 為了能夠從群集技術(shù)中獲取最大的收益,所有組成模塊都應(yīng)集成化并且標(biāo)準(zhǔn)到位這些模塊包括: 服務(wù)器節(jié)點(diǎn) 可擴(kuò)展I/O 企業(yè)級(jí)存儲(chǔ)器 強(qiáng)健的中間件 群集管理 一個(gè)群集解決方案應(yīng)賦予您管理和監(jiān)督群集的能力,并在您做決定,安裝及運(yùn)行的時(shí)候提供相應(yīng)的服務(wù)和幫助解決方案還應(yīng)當(dāng)能完成一般的功能,比如數(shù)據(jù)庫(kù),協(xié)同計(jì)算,網(wǎng)絡(luò)服務(wù),服務(wù)器聯(lián)合等 為了能夠在這些活動(dòng)中給您提供幫助,IBM在全球范圍有7個(gè)ServerProven解決方案中心這意味這無論您在世界的哪個(gè)角落,您都可以通過家中的電話,從規(guī)模較大的獨(dú)立軟件供應(yīng)商(ISV)那里獲得最好的解決方案 IBM xSeries

24、服務(wù)器企業(yè)級(jí)X-體系結(jié)構(gòu)中的IBM xSeries群集結(jié)構(gòu)部分涵蓋了上文中提到的所有構(gòu)成模塊IBM著眼于以服務(wù)器節(jié)點(diǎn),可擴(kuò)展I/O,群集中間部件和群集管理為技術(shù)核心的客戶解決方案,并在其間實(shí)現(xiàn)有關(guān)檢修,系統(tǒng)主要應(yīng)用程序和數(shù)據(jù)管理的內(nèi)容 服務(wù)節(jié)點(diǎn) 作為IBM xSeries群集結(jié)構(gòu)的組成部分,服務(wù)器節(jié)點(diǎn)通過高速交換機(jī)互相連接成為一個(gè)計(jì)算機(jī)我們的策略是及時(shí)引入新的硬件特性,盡可能同步或超前于其它業(yè)界同行基于IBM 對(duì)客戶的承諾:提供創(chuàng)新性的技術(shù)、靈活的應(yīng)用程序和新工具,IBM 發(fā)布了針對(duì)Intel 架構(gòu)服務(wù)器平臺(tái)的新一代的創(chuàng)新技術(shù)。該技術(shù)稱為企業(yè)級(jí)X-架構(gòu)技術(shù),IBM 利用在大型機(jī)與超級(jí)計(jì)算機(jī)實(shí)驗(yàn)

25、室所采用的技術(shù),極大的提高IBM xSeries 服務(wù)器的I/O、內(nèi)存和系統(tǒng)性能。新型IBM 服務(wù)器同時(shí)建立了一種“按照服務(wù)器處理能力增長(zhǎng)付費(fèi)”的方式,以引導(dǎo)客戶購(gòu)買Intel 體系架構(gòu)的32位或64位高端xSeries 服務(wù)器系統(tǒng)。這就意味著為客戶提供了頂級(jí)的系統(tǒng)可用性、系統(tǒng)的靈活性和高性能,并且可以迅速、方便、低成本的進(jìn)行系統(tǒng)擴(kuò)展。所有這些服務(wù)器技術(shù)上的優(yōu)勢(shì)將繼續(xù)推動(dòng)群集在性能上的進(jìn)一步發(fā)展和完善 可擴(kuò)展I/O 可擴(kuò)展系統(tǒng),無論是在一個(gè)系統(tǒng)內(nèi)部的垂直擴(kuò)展,還是在群集服務(wù)期間的水平擴(kuò)展,都需要可擴(kuò)展的I/O,IBM 企業(yè)級(jí)X-架構(gòu)技術(shù)還通過遠(yuǎn)程I/O 功能提供了您初始投資的幾乎是無限的擴(kuò)展能

26、力。遠(yuǎn)程I/O 技術(shù)特性通過使用并已證明的、高速交互網(wǎng)絡(luò)連接和高達(dá)12 個(gè)PCI 與 PCI-X 適配卡插槽,在單一系統(tǒng)中三倍提高系統(tǒng)的I/O 處理能力。甚至,兩個(gè)服務(wù)器可以共享一個(gè)遠(yuǎn)程I/O設(shè)計(jì)結(jié)構(gòu)。并且,如果服務(wù)器組成群集系統(tǒng),遠(yuǎn)程I/O 特性能夠提供更佳的冗余保護(hù)和災(zāi)難恢復(fù)功能,還技術(shù)還作為未來InfiniBand技術(shù)的實(shí)現(xiàn)橋梁作用。 今天IBM的xSeries服務(wù)器由于在IBM光纖通道RAID控制器單元,ServerRAID適配器及串行存貯結(jié)構(gòu)(SSA)PCI RAID適配器中使用了智能I/O處理器,所以能夠支持可擴(kuò)展I/O. 設(shè)計(jì)I/O處理器的目的在于要通過它們來完成I/O頻繁的任務(wù)

27、從而減輕主處理器的工作負(fù)擔(dān). IBM RAID適配器由高性能的RISC處理器來驅(qū)動(dòng)IBM將繼續(xù)努力提高RAID適配器的吞吐速度,并將采用新出現(xiàn)的各種符合工業(yè)標(biāo)準(zhǔn)的新技術(shù),如I2O設(shè)備驅(qū)動(dòng)支持,更快速的I/O處理器以及性能更強(qiáng)大的PCI的版本 對(duì)那些需要極寬的帶寬,較大的布線距離及高有效性的解決方案,IBM光纖通道子系統(tǒng)能夠擴(kuò)展至數(shù)百TB的存儲(chǔ)量,2Gbps的讀寫速率,它還支持服務(wù)器于存儲(chǔ)盤之間最遠(yuǎn)10公里,這一點(diǎn)更是對(duì)數(shù)據(jù)的安全性提供了額外的保證最新的IBM xSeries服務(wù)器由于實(shí)施工業(yè)標(biāo)準(zhǔn),提高了PCI總線的能力使整個(gè)系統(tǒng)具有更高水準(zhǔn)的性能其中對(duì)64位PCI的支持已在ServerRAID

28、-6和IBM光纖通道子系統(tǒng)中使用,大大提高了數(shù)據(jù)傳輸率 企業(yè)級(jí)存儲(chǔ)器 群集技術(shù)的發(fā)展對(duì)存儲(chǔ)子系統(tǒng)的有效性和容量提出越來越高的要求企業(yè)級(jí)存儲(chǔ)器是一個(gè)工業(yè)標(biāo)準(zhǔn)術(shù)語,30多年來,IBM在發(fā)展大型企業(yè)計(jì)算系統(tǒng)的過程中始終處于企業(yè)級(jí)存儲(chǔ)技術(shù)的領(lǐng)先地位在信息技術(shù)的投資增加或信息存儲(chǔ)平臺(tái)聯(lián)合時(shí),企業(yè)級(jí)存儲(chǔ)器可以滿足各種業(yè)務(wù)的需求企業(yè)級(jí)存儲(chǔ)器可以將商務(wù)活動(dòng)中所需要的信息匯總在一個(gè)地方并共享給其它所有的計(jì)算平臺(tái),它同時(shí)還是提供一種安全有效的管理信息的手段如果您已經(jīng)按照傳統(tǒng)的方法規(guī)劃了網(wǎng)絡(luò)中的小型服務(wù)器,企業(yè)級(jí)存儲(chǔ)器可以將分布于各服務(wù)器硬盤中的數(shù)據(jù)存儲(chǔ)方式轉(zhuǎn)變?yōu)榻y(tǒng)一存儲(chǔ)和管理數(shù)據(jù)的方式 創(chuàng)新精神曾使IBM 的存儲(chǔ)

29、系統(tǒng)部門在硬盤存儲(chǔ)和RAID技術(shù)方面處于領(lǐng)先地位如今,這種精神在開發(fā)自適應(yīng)RAID算法的過程中得到了充分體現(xiàn)自適應(yīng)RAID算法能在不同的工作負(fù)載及系統(tǒng)配置之下,實(shí)現(xiàn)智能優(yōu)化吞吐速率的功能到目前為止, RAID 子系統(tǒng)的固件可以配置 RAID陣列,并且在工作負(fù)載發(fā)生變化時(shí),自動(dòng)調(diào)節(jié)參數(shù)和算法以優(yōu)化系統(tǒng)性能 IBM將繼續(xù)保持在存儲(chǔ)器及存儲(chǔ)管理環(huán)境方面的領(lǐng)導(dǎo)地位另外,某些IBM處于領(lǐng)先地位的技術(shù)創(chuàng)新,如硬盤驅(qū)動(dòng)器,風(fēng)扇,電源,硬盤及內(nèi)存等的預(yù)測(cè)故障分析(PFA)技術(shù),使IBM xSeries服務(wù)器在有效性及可檢修方面處于同類產(chǎn)品的領(lǐng)導(dǎo)地位 強(qiáng)健的中間件 中間件有兩個(gè)關(guān)鍵要素首先,中間件要為群集提供基

30、本的服務(wù),如拓?fù)?,事件和組服務(wù)等IBM在DB2通用數(shù)據(jù)庫(kù)和Oracle并行服務(wù)器的解決方案中,從屢獲殊榮的RS/6000S產(chǎn)品系列借鑒了群集技術(shù)IBM xSeries服務(wù)器在技術(shù)上的兼收并蓄使它提供的擴(kuò)展能力既能適用于企業(yè)界要求而又能經(jīng)受工業(yè)屆測(cè)試IBM全力支持目前廣泛使用的基于Windows和Linux的群集解決方案,并將與其后繼產(chǎn)品繼續(xù)合作 其次,所有重要的中間件產(chǎn)品應(yīng)支持群集結(jié)構(gòu)這些中間件產(chǎn)品包括數(shù)據(jù)庫(kù)-IBM DB2,Web服務(wù)器-IBM Websphere,通訊服務(wù)器,交易處理軟件及報(bào)文排隊(duì)軟件等IBM除了支持基于Windows和Linux的全線標(biāo)準(zhǔn)中間件外,還與Oracle這樣的軟

31、件供應(yīng)商合作,以保證IBM xSeries群集服務(wù)器能夠完全支持他們的產(chǎn)品我們?cè)跒槠髽I(yè)提供解決方案時(shí)積累豐富的經(jīng)驗(yàn),而上述合作方式則將這些經(jīng)驗(yàn)應(yīng)用到了基于Intel處理器的服務(wù)器市場(chǎng) 群集管理 隨著群集系統(tǒng)復(fù)雜性的增加,群集管理成為用戶日益關(guān)注的焦點(diǎn)問題pSeries (RS/600)SP 的單點(diǎn)控制采用了透視技術(shù),IBM準(zhǔn)備借鑒此經(jīng)驗(yàn)以增加xSeries群集的可管理性這種技術(shù)可以通過一般的圖形用戶界面(GUI)完成對(duì)群集內(nèi)部所有節(jié)點(diǎn)的普通系統(tǒng)管理任務(wù),并在每一節(jié)點(diǎn)之間平衡高級(jí)系統(tǒng)管理處理器的遠(yuǎn)程控制能力而這一點(diǎn)會(huì)隨著群集和服務(wù)器聯(lián)合規(guī)模的日益復(fù)雜化而顯得愈發(fā)至關(guān)重要,尤其是在不遠(yuǎn)的將來,當(dāng)x

32、Series和pSeries系統(tǒng)變得更加一體化,并可通過同一控制工作站實(shí)現(xiàn)監(jiān)管的時(shí)候 群集管理和中間件技術(shù)是群集水平擴(kuò)展時(shí)兩個(gè)極其重要的制約因素,IBM xSeries服務(wù)器提供了基于Windows 和Linux群集系統(tǒng)的管理解決方案,“IBM群集系統(tǒng)管理程序”和IBM CSM Linux 群集管理程序“IBM群集系統(tǒng)管理程序”,它在Windows版服務(wù)器的Microsoft群集服務(wù)器(MSCS)的頂上又構(gòu)建了管理和控制的功能“IBM群集系統(tǒng)管理”賦予MSCS管理者更加強(qiáng)化的控制群集化安裝的權(quán)力IBM能夠?qū)Χ鄠€(gè)群集及相應(yīng)資源實(shí)現(xiàn)單點(diǎn)監(jiān)控,從而簡(jiǎn)化了群集管理另外,通過和IBM Director系

33、統(tǒng)管理軟件的整合,可進(jìn)一步增強(qiáng)其管理控制功能 (三)、集群解決方案 綜合以上所討論的集群技術(shù)的各個(gè)方面,IBM xSeries服務(wù)器集群方案將讓您充分享受具有高度有效性和(或)可擴(kuò)展性的應(yīng)用集群技術(shù)的優(yōu)勢(shì)。除了能夠支持MSCS,IBM xSeries服務(wù)器為L(zhǎng)otus Domino,IBM DB2,IBM WebSphere 防火墻及調(diào)度器,還可以針對(duì)Oracle并行服務(wù)器,以及Linux集群提供了解決方案。 這些解決方案為處理系統(tǒng)在集群應(yīng)用環(huán)境下的節(jié)點(diǎn)、硬盤或網(wǎng)絡(luò)接口故障而設(shè)計(jì),它們的目標(biāo)就是保證停機(jī)時(shí)間為零或接近于零。 DB2通用數(shù)據(jù)庫(kù)企業(yè)級(jí)增強(qiáng)版。 為了能夠滿足復(fù)雜決策支持及滿足數(shù)據(jù)倉(cāng)庫(kù)

34、型應(yīng)用程序的要求,IBM將DB2大型數(shù)據(jù)庫(kù)企業(yè)級(jí)增強(qiáng)版所具有的豐富特性擴(kuò)展到了Windows和Linux平臺(tái)上。它的非共享體系結(jié)構(gòu),可以完成節(jié)點(diǎn)間數(shù)據(jù)傳輸量最小的并行查詢。在此情形下,節(jié)點(diǎn)數(shù)目的多少對(duì)節(jié)點(diǎn)間數(shù)據(jù)流量影響極小。所以,增加xSeries服務(wù)器的數(shù)目對(duì)系統(tǒng)性能的提高將呈幾何線性的關(guān)系。一個(gè)唯一的節(jié)點(diǎn)映射表將使得DB2能夠管理數(shù)據(jù)的分配及再分配。 Lotus Domino。 在Domino應(yīng)用程序和報(bào)文傳輸環(huán)境下,IBM xSeries服務(wù)器和Lotus Domino提供了幾種具有高度有效性和擴(kuò)展性的選擇。IBM xSeries服務(wù)器支持所有這些解決方案。您可以利用Domino企業(yè)服務(wù)

35、器而使應(yīng)用集群包括多至6個(gè)節(jié)點(diǎn)。 早在Lotus Domino 4.6.1版本中,您就可以在微軟Windows 服務(wù)器上同時(shí)安裝和Lotus Domino和MSCS。這使得在主動(dòng)、被動(dòng)環(huán)境下,只要是連接到同一臺(tái)Domino服務(wù)器上,無論是Lotus Notes客戶還是瀏覽器客戶,都可以得到故障保護(hù)支持。Domino企業(yè)版服務(wù)器甚至可以加入到MSCS的應(yīng)用集群中。如果在一臺(tái)通過了MSCS認(rèn)證的IBM xSeries服務(wù)器上Domino企業(yè)版服務(wù)器的話,您可以獲得業(yè)界最好的主動(dòng)主動(dòng)模式的配置。在生產(chǎn)環(huán)境及所有的3種配置條件下,Domino企業(yè)版服務(wù)器最多可以帶動(dòng)6個(gè)服務(wù)器,而它們具有故障更正、負(fù)載

36、均衡的能力。在已推出的Lotus Domino R5中可支持協(xié)同工作日程安排及規(guī)劃中的故障更正,Web瀏覽器客戶端的負(fù)載均衡和故障更正,以及郵件代理等功能。 WebSphere集群方案。 IBM xSeries 服務(wù)器支持IBM 的可擴(kuò)展Web服務(wù)器解決方案WebSphere。該方案能夠提供帶寬管理、緩存、文件管理與復(fù)制,以及卓越的負(fù)載均衡功能及強(qiáng)有效性。這些特性能夠使多個(gè)服務(wù)器象一個(gè)服務(wù)器一樣的工作,從而可大大增加訪問頻繁的網(wǎng)站的容量。而系統(tǒng)性能的增強(qiáng)有望進(jìn)一步提高向終端用戶發(fā)送信息的速度。該方案的安全性有IBM電子網(wǎng)絡(luò)防火墻保證。兩者之間強(qiáng)有力的聯(lián)合可使單個(gè)或分布的網(wǎng)站在降低帶寬資源占用、

37、提高安全性的同時(shí),保證強(qiáng)有效性和終端用戶響應(yīng)的質(zhì)量以及站點(diǎn)規(guī)模的持續(xù)增長(zhǎng)。 瘦客戶/服務(wù)器解決方案。 IBM xSeries服務(wù)器可運(yùn)行Winframe和Wincenter。另外,Citrix Metaframe的制造商已證明:IBM xSeries服務(wù)器支持這一運(yùn)行于Windows終端上的軟件。所有這些操作系統(tǒng)都提供了連接瘦客戶機(jī)的功能,其中包括IBM網(wǎng)絡(luò)工作站。這些操作系統(tǒng)中還包含了一個(gè)平衡服務(wù)器負(fù)載的可選授權(quán)軟件包。IBM xSeries服務(wù)器被認(rèn)證可以支持這個(gè)可選軟件包。這意味著如果您在多服務(wù)器環(huán)境下的IBM xSeries服務(wù)器上運(yùn)行這些操作系統(tǒng),您可以平衡服務(wù)器間的工作負(fù)載。用戶可

38、以登陸到某臺(tái)服務(wù)器或特定的一部分應(yīng)用程序上,而系統(tǒng)管理員可以一直監(jiān)視服務(wù)器的運(yùn)行情況,并根據(jù)當(dāng)時(shí)的服務(wù)器負(fù)載分配或回收資源。這些操作是通過察看服務(wù)器的性能監(jiān)視記錄以及調(diào)整服務(wù)器而完成的。 Oracle并行服務(wù)器。 IBM xSeries服務(wù)器能夠支持Oracle的并行服務(wù)器(OPS),IBM是第一個(gè)成功為OPS提供光纖通道存儲(chǔ)方案的硬件提供商。因?yàn)镺PS依賴于共享硬盤技術(shù)的發(fā)展,所以可以說光纖通道技術(shù)最能滿足多節(jié)點(diǎn)OPS方案的要求。在為Oracle關(guān)系數(shù)據(jù)庫(kù)管理技術(shù)提供的基于Windows的6節(jié)點(diǎn)的配置方案中,IBM也處于業(yè)界領(lǐng)先的地位。在數(shù)據(jù)倉(cāng)庫(kù)以及企業(yè)資源規(guī)劃(ERP)等應(yīng)用程序中,工作負(fù)

39、載共享及6個(gè)節(jié)點(diǎn)的規(guī)模會(huì)使用戶受益無窮。與Oracle之間的合作使我們能夠在將來推出具有更多節(jié)點(diǎn)和更大規(guī)模的方案。 IBM Datacenter Solution Program 目前,各個(gè)公司的服務(wù)器產(chǎn)品都提供了高可用性方案,而IBM,針對(duì)微軟新推出的Windows 2000 Datacenter Server,也提供了全面的解決方案。 Microsoft Windows 2000 Datacenter Server 操作系統(tǒng)是為了那些將高度可靠的高端硬件和軟件用于其大型通訊計(jì)算機(jī)網(wǎng)絡(luò)組件的企業(yè)而設(shè)計(jì)的。它是Microsoft有史以來提供的最強(qiáng)大和有效的服務(wù)器操作系統(tǒng)。它支持最大32個(gè)對(duì)稱多

40、處理器(SMP)和最多64GB的物理內(nèi)存。作為標(biāo)準(zhǔn)功能,它同時(shí)提供4節(jié)點(diǎn)群集和負(fù)載平衡服務(wù)。它也提供Windows 2000所有版本的豐富Internet和網(wǎng)絡(luò)操作系統(tǒng)(NOS)服務(wù)。它是為大型數(shù)據(jù)存儲(chǔ)、經(jīng)濟(jì)分析、科學(xué)和工程中的大型模擬、在線事務(wù)處理(OLTP)和服務(wù)的合并作過優(yōu)化的。目前,Windows 2000 Datacenter Server 只提供給原始設(shè)備制造商,由原始設(shè)備制造商向客戶提供相應(yīng)的解決方案。 IBM 通過對(duì)硬件和軟件部件進(jìn)行不斷的嚴(yán)格測(cè)試,為客戶提供經(jīng)過 Windows 2000 Datacenter Server 認(rèn)證的解決方案,這種認(rèn)證可以確保方案只包含通過測(cè)試的

41、硬件、設(shè)備驅(qū)動(dòng)程序以及經(jīng)過確認(rèn)的核心級(jí)應(yīng)用程序。IBM 通過 ServerProven 和 ClusterProven 來完成這些全面的測(cè)試。 IBM 擁有支持企業(yè)級(jí)用戶的豐富經(jīng)驗(yàn),IBM Datacenter Solution Program 提供了基于 Microsoft Datacenter 操作系統(tǒng)的全套方案,包括經(jīng)過認(rèn)證的硬件配置,經(jīng)過認(rèn)證的核心級(jí)應(yīng)用程序以及標(biāo)準(zhǔn)的和可選的服務(wù),IBM也與其它的方案開發(fā)商以及硬件開發(fā)商合作,使他們的部件在IBM的Datacenter方案中可用。 IBM Datacenter Solution Program 是以 Microsoft Datacent

42、er 操作系統(tǒng)為中心,它可以支持比 Windows 2000 Advanced Server 和 Windows 2000 Server 更大的內(nèi)存、處理器以及節(jié)點(diǎn),同時(shí),IBM 還通過獨(dú)有的企業(yè)級(jí)X架構(gòu)技術(shù),提供杰出的擴(kuò)展性,系統(tǒng)管理性以及適用性。IBM Datacenter Solution Program 是設(shè)計(jì)用來提供關(guān)鍵業(yè)務(wù)所需要的服務(wù)和支持級(jí)別的。為了實(shí)現(xiàn)一個(gè)高可用性方案,您需要一個(gè)穩(wěn)定的配置,它具有可控制的更改以及更好的支持和服務(wù)。IBM Global Services(IGS)擁有足夠的經(jīng)驗(yàn)來提供適合的服務(wù)。 目前,IBM xSeries 445 是 Datacenter 方案

43、的基本組成部分,由于采用了為關(guān)鍵業(yè)務(wù)設(shè)計(jì)的企業(yè)級(jí)X架構(gòu)技術(shù),x445提供了更高的可用性,支持8路、16路處理器,可選配置包括2.5GHz 1MB L3 Cache 或者 2.8GHz 2MB L3 Cache 的Intel Xeon MP 處理器,64GB ECC SDRAM 內(nèi)存,兩個(gè)內(nèi)置硬盤,外接的光纖通道存儲(chǔ)設(shè)備以及多種網(wǎng)絡(luò)連接設(shè)備等,而高性能的I/O子系統(tǒng)和高可用性使x445成為Datacenter Server的最佳選擇。除了預(yù)裝Windows 2000 Datacenter Server以外,方案中還包括IBM Director 和 APC UPS 的相關(guān)軟件。 DataCente

44、r 的認(rèn)證必須經(jīng)過嚴(yán)格的測(cè)試過程,這其中還包括相應(yīng)的軟件產(chǎn)品,以確保其不會(huì)對(duì)操作系統(tǒng)有任何的影響,除此之外,IBM還致力于與業(yè)界著名的軟件開發(fā)商合作,來確保他們的應(yīng)用程序可以在 Datacenter 可能遇到的高負(fù)荷下正常工作。同時(shí),IBM還對(duì) Datacenter 系統(tǒng)提供的系統(tǒng)管理,存儲(chǔ)管理以及數(shù)據(jù)庫(kù)進(jìn)行全面的測(cè)試來滿足客戶的需求。另外,位于微軟總部旁邊的IBM Center for Microsoft Technologies,擁有130資深的專業(yè)技術(shù)人員,與微軟合作開發(fā)最佳的解決方案。 在IBM Datacenter Solution Program中,IBM Global Servi

45、ces(IGS)提供了一系列標(biāo)準(zhǔn)的和可選的服務(wù),包括硬件集成和操作系統(tǒng)的安裝,System Assurance Review,7天24小時(shí)當(dāng)天的硬件服務(wù)。通過提供硬件集成和操作系統(tǒng)的安裝,IBM可以對(duì)硬件配置的可行性進(jìn)行完全的測(cè)試。 要了解更多Datacenter的相關(guān)信息,可以訪問下面的網(wǎng)址 /ww/eserver/xseries/windows/datacenter.html 結(jié)論 IBM在群集技術(shù)方面有著多年的經(jīng)驗(yàn),更重要的是:IBM了解客戶的環(huán)境及其關(guān)鍵業(yè)務(wù)的需求我們知道:僅僅掌握全球領(lǐng)先的技術(shù)并不能保證一定成功,我們還要在提供軟件時(shí)于他人共享異

46、種環(huán)境系統(tǒng)管理的知識(shí),我們還要與其它廠商發(fā)展合作關(guān)系,提供完整的群集解決方案完整的群集解決方案在高可靠性,可擴(kuò)展性,易管理性等諸多方面都有數(shù)不盡數(shù)的優(yōu)點(diǎn)這些優(yōu)點(diǎn)將轉(zhuǎn)換成客戶的高生產(chǎn)率以及低擁有成本 IBM以繼續(xù)增強(qiáng)xSeries 服務(wù)器的性能,可擴(kuò)展性,控制及服務(wù)為己任,IBM在涉及計(jì)算的各個(gè)領(lǐng)域都有精深的背景,這就是IBM為什么能夠?yàn)槟档蛽碛谐杀镜脑?IBM的xSeries服務(wù)器群集解決方案是IBM的 企業(yè)級(jí)X-體系結(jié)構(gòu)策略的重要組成部分這一策略將工業(yè)標(biāo)準(zhǔn)的計(jì)算引入新一代的水平企業(yè)級(jí) X-體系結(jié)構(gòu)以IBM的系列工具,中間件,及系統(tǒng)管理特性為依托,組合了業(yè)界最新的標(biāo)準(zhǔn)計(jì)算硬件及操作系統(tǒng)單元

47、所有這些,都是為了賦予您最高水平的性能,擴(kuò)展性,控制及服務(wù),也是為了我們能提高xSeries服務(wù)器的能力,從而為您的關(guān)鍵業(yè)務(wù)提供更高水平的計(jì)算服務(wù)IBM 對(duì)企業(yè)級(jí)計(jì)算能力的延承,xSeries產(chǎn)品及相關(guān)服務(wù)將使您信心百倍地面向今天及未來的關(guān)鍵義務(wù)的挑戰(zhàn)信息條形碼:51599Windows Server 2003集群服務(wù)技術(shù)概述2008-11-27 10:12:41 閱讀(49) 發(fā)表評(píng)論 預(yù)配置分析 分析和驗(yàn)證硬件和軟件配置并且發(fā)現(xiàn)潛在問題。在創(chuàng)建服務(wù)器群集之前,就任何潛在的配置問題提交一份完善和易于閱讀的報(bào)告。優(yōu)點(diǎn): 兼容性 確保任何一致的不兼容問題都能夠在進(jìn)行配置之間被檢測(cè)到。例如,Ser

48、vice for Macintosh(SFM)、網(wǎng)絡(luò)負(fù)載平衡(Network Load Balancing,NLB)、動(dòng)態(tài)磁盤以及DHCP問題地址都不受群集服務(wù)的支持。 默認(rèn)值 創(chuàng)建一個(gè)服務(wù)器群集,使用默認(rèn)值和啟發(fā)式過程滿足最佳實(shí)踐的要求。對(duì)于許多新創(chuàng)建的服務(wù)器群集,默認(rèn)值都是最為適合的配置。優(yōu)點(diǎn): 更易于管理 創(chuàng)建服務(wù)器群集過程中需要回答的問題數(shù)量、需要收集的數(shù)據(jù)和代碼更少。其目標(biāo)是獲得一個(gè)“默認(rèn)”情況下即可投入運(yùn)行的服務(wù)器群集,然后再使用服務(wù)器群集管理工具進(jìn)行定制(如果需要)。 添加多個(gè)節(jié)點(diǎn) 允許在一次操作中將多個(gè)節(jié)點(diǎn)添加到服務(wù)器群集中。優(yōu)點(diǎn) 更易于管理 更快捷、更輕松地創(chuàng)建多節(jié)點(diǎn)服務(wù)器群

49、集。 可擴(kuò)展的體系結(jié)構(gòu) 可擴(kuò)展的體系結(jié)構(gòu)允許應(yīng)用程序和系統(tǒng)組件參與到服務(wù)器群集的配置中。例如,應(yīng)用程序可以在服務(wù)器進(jìn)入群集之前安裝,而且應(yīng)用程序可以參與(或者阻止)節(jié)點(diǎn)加入服務(wù)器群集。優(yōu)點(diǎn) 第三方支持 允許應(yīng)用程序?qū)⒃O(shè)置服務(wù)器群集資源和(或)修改它們的配置的過程作為服務(wù)器群集安裝的一部分,而不是作為一個(gè)服務(wù)器群集安裝結(jié)束后的單獨(dú)工作。 遠(yuǎn)程管理 以遠(yuǎn)程方式全面創(chuàng)建和配置服務(wù)器群集??梢栽谝粋€(gè)遠(yuǎn)程管理站點(diǎn)創(chuàng)建新的服務(wù)器群集,也可以將節(jié)點(diǎn)添加到現(xiàn)有服務(wù)器群集中。此外,驅(qū)動(dòng)器盤符的變化和物理磁盤資源的故障轉(zhuǎn)移都會(huì)在Terminal Server 的客戶端會(huì)話中得到更新。優(yōu)點(diǎn) 更易于管理 允許通過Te

50、rminal Services實(shí)現(xiàn)更好的遠(yuǎn)程管理。 命令行工具 可以通過為命令行工具cluster.exe編寫腳本創(chuàng)建或配置服務(wù)器群集。優(yōu)點(diǎn) 更易于管理 更易于實(shí)現(xiàn)群集創(chuàng)建過程的自動(dòng)化。 更簡(jiǎn)單的卸載過程 從某個(gè)節(jié)點(diǎn)卸載群集服務(wù)的過程現(xiàn)在通過去除節(jié)點(diǎn)的一步操作即可完成。而以前的版本需要在卸載之后進(jìn)行節(jié)點(diǎn)去除操作。優(yōu)點(diǎn) 更易于管理 卸載群集服務(wù)的過程更加有效,因?yàn)槟鷥H僅需要通過“群集管理器”或者Cluster.exe去除節(jié)點(diǎn),節(jié)點(diǎn)便會(huì)解除對(duì)群集的支持。此外,Cluster.exe 具有一個(gè)新的開關(guān)參數(shù),在“群集管理器”發(fā)生了問題的情況下可以強(qiáng)行卸載群集服務(wù):cluster node %NODEN

51、AME% /force 仲裁日志的大小 仲裁日志的默認(rèn)大小已經(jīng)被提高到4096 KB(以前是64 KB)。優(yōu)點(diǎn) 更多共享數(shù)量 4,096 KB的仲裁日志運(yùn)行使用大量的文件或打印機(jī)共享(例如200臺(tái)共享打印機(jī))。在先前版本中,在共享數(shù)量很大的情況下,仲裁日志的空間會(huì)被用盡,從而導(dǎo)致資源不一致的故障轉(zhuǎn)移。 本地仲裁 如果節(jié)點(diǎn)沒有被附加到共享磁盤,它會(huì)自動(dòng)配置一個(gè)“本地仲裁”資源。此外,還可以在群集服務(wù)運(yùn)行后創(chuàng)建一個(gè)本地仲裁資源。優(yōu)點(diǎn) 測(cè)試群集 用戶可以容易地在本地PC上創(chuàng)建測(cè)試群集以測(cè)試群集中的應(yīng)用程序。,或者熟悉群集服務(wù)的使用方法。用戶不需要使用那些通過了Microsoft Cluster HC

52、L認(rèn)證的特殊群集硬件來運(yùn)行測(cè)試群集。說明:本地仲裁僅僅被單節(jié)點(diǎn)群集(例如lonewolf)所支持。此外,沒有通過HCL認(rèn)證的硬件設(shè)備不能使用在生產(chǎn)環(huán)境中。 恢復(fù) 在丟失了所有共享磁盤的情況下,可以使用cluster.exe /fixquorum開關(guān)參數(shù)啟動(dòng)群集,讓一個(gè)臨時(shí)群集投入運(yùn)行(例如,在您等待新硬件送達(dá)的時(shí)候),然后再創(chuàng)建一個(gè)本地仲裁資源并講它作為您的仲裁。在使用打印群集的情況下,可以指向本地磁盤的后臺(tái)打印文件夾。對(duì)于文件共享,可以指向本地磁盤上的文件共享資源,以將備份數(shù)據(jù)恢復(fù)到那里。顯而易見,這不會(huì)提供任何故障轉(zhuǎn)移能力,僅僅是一種臨時(shí)性的手段。 仲裁選擇 您不再需要選擇使用哪一個(gè)磁盤作

53、為仲裁資源(Quorum Resource)。它會(huì)自動(dòng)配置到容量大于50MB并且以NTFS格式進(jìn)行了格式化的最小的磁盤上。服務(wù)器的SMP技術(shù)SMP:Symmetric Multiprocessing.既對(duì)稱多處理。指在一個(gè)計(jì)算機(jī)上匯集了一組處理器(多個(gè)CPU)。多處理是指一臺(tái)計(jì)算機(jī)中的多個(gè)處理器通過共享同一存儲(chǔ)區(qū)來協(xié)調(diào)工作。真正意義上的多處理要求系統(tǒng)中的每個(gè)CPU能訪問同一物理內(nèi)存。這意味著多CPU必須能使用同一系統(tǒng)總線或系統(tǒng)交換方式。 “對(duì)稱多處理”技術(shù),是指在一個(gè)計(jì)算機(jī)上匯集了一組處理器即多CPU,各CPU之間共享內(nèi)存子系統(tǒng)以及總線結(jié)構(gòu)。它是相對(duì)非對(duì)稱多處理技術(shù)而言的、應(yīng)用十分廣泛的并行技

54、術(shù)。在這種架構(gòu)中,一臺(tái)電腦不再由單個(gè)CPU組成,而同時(shí)由多個(gè)處理器運(yùn)行操作系統(tǒng)的單一復(fù)本,并共享內(nèi)存和一臺(tái)計(jì)算機(jī)的其他資源。雖然同時(shí)使用多個(gè)CPU,但是從管理的角度來看,它們的表現(xiàn)就像一臺(tái)單機(jī)一樣。系統(tǒng)將任務(wù)隊(duì)列對(duì)稱地分布于多個(gè)CPU之上,從而極大地提高了整個(gè)系統(tǒng)的數(shù)據(jù)處理能力。所有的處理器都可以平等地訪問內(nèi)存、I/O和外部中斷。在對(duì)稱多處理系統(tǒng)中,系統(tǒng)資源被系統(tǒng)中所有CPU共享,工作負(fù)載能夠均勻地分配到所有可用處理器之上。 基于SMP技術(shù)的系統(tǒng)框架SMP應(yīng)用目前的SMP技術(shù)主要用在RISC服務(wù)器陣營(yíng)的多路小型機(jī)、X86服務(wù)器陣營(yíng)的多路處理系統(tǒng)以及采用部分采用虛擬CPU技術(shù)實(shí)現(xiàn)單CPU(或多C

55、PU)虛擬多路中。我們平時(shí)見到的雙路CPU系統(tǒng),屬于對(duì)稱多處理系統(tǒng)中最常見的一種,通常稱為2路對(duì)稱多處理,它在普通的商業(yè)、家庭應(yīng)用之中并沒有太多實(shí)際用途,但在專業(yè)制作,如3DMax Studio、Photoshop等軟件應(yīng)用中獲得了非常良好的性能表現(xiàn),是組建廉價(jià)工作站的良好伙伴。隨著用戶應(yīng)用水平的提高,只使用單個(gè)的處理器確實(shí)已經(jīng)很難滿足實(shí)際應(yīng)用的需求,因而各服務(wù)器廠商紛紛通過采用對(duì)稱多處理系統(tǒng)來解決這一矛盾。在國(guó)內(nèi)市場(chǎng)上這類機(jī)型的處理器一般以4個(gè)或8個(gè)為主,有少數(shù)是16個(gè)處理器。但是一般來講,SMP結(jié)構(gòu)的機(jī)器可擴(kuò)展性較差,很難做到100個(gè)以上多處理器,常規(guī)的一般是8個(gè)到16個(gè),不過這對(duì)于多數(shù)的

56、用戶來說已經(jīng)夠用了。這種機(jī)器的好處在于它的使用方式和微機(jī)或工作站的區(qū)別不大,編程的變化相對(duì)來說比較小,原來用微機(jī)工作站編寫的程序如果要移植到SMP機(jī)器上使用,改動(dòng)起來也相對(duì)比較容易。SMP結(jié)構(gòu)的機(jī)型可用性比較差。因?yàn)?個(gè)或8個(gè)處理器共享一個(gè)操作系統(tǒng)和一個(gè)存儲(chǔ)器,一旦操作系統(tǒng)出現(xiàn)了問題,整個(gè)機(jī)器就完全癱瘓掉了。而且由于這個(gè)機(jī)器的可擴(kuò)展性較差,不容易保護(hù)用戶的投資。但是這類機(jī)型技術(shù)比較成熟,相應(yīng)的軟件也比較多,因此現(xiàn)在國(guó)內(nèi)市場(chǎng)上推出的并行機(jī)大量都是這一種。PC服務(wù)器中最常見的對(duì)稱多處理系統(tǒng)通常采用2路、4路、6路或8路處理器。目前UNIX服務(wù)器可支持最多64個(gè)CPU的系統(tǒng),如Sun公司的產(chǎn)品Enterprise 10000。SMP系統(tǒng)中最關(guān)鍵的技術(shù)是如何更好地解決多個(gè)處理器的相互通訊和協(xié)調(diào)問題。幾種多路SMP技術(shù)簡(jiǎn)介 什么是對(duì)稱多處理技術(shù)? 最一般的定義,多處理器技術(shù)被定義為使用多于兩個(gè)處理器去執(zhí)行計(jì)算任務(wù)。這被最普遍的用于描述在一個(gè)機(jī)柜中包含有兩個(gè)或多個(gè)相連處理器

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論