云計(jì)算監(jiān)測(cè)平臺(tái)_第1頁(yè)
云計(jì)算監(jiān)測(cè)平臺(tái)_第2頁(yè)
云計(jì)算監(jiān)測(cè)平臺(tái)_第3頁(yè)
云計(jì)算監(jiān)測(cè)平臺(tái)_第4頁(yè)
云計(jì)算監(jiān)測(cè)平臺(tái)_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(1)云計(jì)算網(wǎng)絡(luò)監(jiān)測(cè)平臺(tái)研究?jī)?nèi)容云計(jì)算是一種新興的商業(yè)計(jì)算模型,它將計(jì)算任務(wù)分布在大量計(jì)算機(jī)構(gòu)成的資源池上,使各種應(yīng)用系統(tǒng)能夠根據(jù)需要獲取計(jì)算力、存儲(chǔ)空間和各種軟件服務(wù)。服務(wù)可用性保障技術(shù)是云進(jìn)算平臺(tái)所面臨最大技術(shù)挑戰(zhàn)之一,作為服務(wù)可用性保障的資源性能和負(fù)載監(jiān)測(cè)則是其中一個(gè)重要的研究點(diǎn)。面向云計(jì)算平臺(tái)的異構(gòu)分布計(jì)算環(huán)境,提出了一種自適應(yīng)的資源信息和負(fù)載監(jiān)控方法。自適應(yīng)的負(fù)載監(jiān)控方法將周期性的拉模式和事件驅(qū)動(dòng)的推模式結(jié)合起來(lái),能夠根據(jù)異構(gòu)分布計(jì)算系統(tǒng)運(yùn)行環(huán)境和系統(tǒng)資源負(fù)載的變化,適應(yīng)性地發(fā)布獲取系統(tǒng)的負(fù)載信息。實(shí)驗(yàn)表明,自適應(yīng)的負(fù)載監(jiān)控方法的系統(tǒng)監(jiān)控效率較普通的負(fù)載監(jiān)控方法有了明顯提高,具有較好的可擴(kuò)展性。本項(xiàng)目設(shè)計(jì)開發(fā)的云計(jì)算網(wǎng)絡(luò)監(jiān)測(cè)平臺(tái)主要研究以下內(nèi)容。A.對(duì)分布系統(tǒng)的資源信息和負(fù)載檢測(cè)模式進(jìn)行了系統(tǒng)的分析,將其劃分為周期性推模式、周期性拉模式、事件驅(qū)動(dòng)的推模式和事件驅(qū)動(dòng)的拉模式四類,并對(duì)其性能和使用環(huán)境進(jìn)行分析。B.定義資源信息和負(fù)載監(jiān)控的一致性指標(biāo)coh,并通過(guò)實(shí)驗(yàn)統(tǒng)計(jì)的方法推斷系統(tǒng)監(jiān)控的合理周期。C.研究將周期性拉和事件驅(qū)動(dòng)推模式相結(jié)合的自適應(yīng)的系統(tǒng)資源和負(fù)載監(jiān)控方法,并對(duì)原型系統(tǒng)RLMonitor進(jìn)行實(shí)驗(yàn)測(cè)試。(1)云計(jì)算網(wǎng)絡(luò)監(jiān)測(cè)平臺(tái)特點(diǎn)云計(jì)算網(wǎng)絡(luò)監(jiān)測(cè)平臺(tái)即是一個(gè)面向集群計(jì)算系統(tǒng)的完整的分布資源和負(fù)載監(jiān)測(cè)系統(tǒng),又是一個(gè)面向異構(gòu)網(wǎng)絡(luò)環(huán)境下面向個(gè)人工作站的計(jì)算資源和負(fù)載的監(jiān)測(cè)系統(tǒng)。它能夠?qū)λ鸭男畔⑦M(jìn)行集中管理,通過(guò)UDP多播或者TCP連接發(fā)布資源和負(fù)載信息。整個(gè)平臺(tái)采用資源和負(fù)載監(jiān)測(cè)的分布式框架,其目標(biāo)是對(duì)一系列計(jì)算資源性能的動(dòng)態(tài)變化做出短期預(yù)報(bào)。其監(jiān)測(cè)的主要參數(shù)包括新進(jìn)程的CPU可用比例、TCP的連接時(shí)間、端到端的網(wǎng)絡(luò)延遲以及端到端的網(wǎng)絡(luò)帶寬等。該平臺(tái)將周期性地對(duì)被監(jiān)測(cè)節(jié)點(diǎn)的資源和負(fù)載狀況進(jìn)行采樣,并做出短期預(yù)報(bào)。其工作原理是首先通過(guò)所謂的性能“傳感器”收集系統(tǒng)的各種負(fù)載信息,然后對(duì)收集的信息進(jìn)行數(shù)學(xué)分析從而做出預(yù)報(bào)。DRMonitort~3是一個(gè)。被監(jiān)測(cè)計(jì)算機(jī)的性能和負(fù)載信息從而支持應(yīng)用實(shí)現(xiàn)資源監(jiān)測(cè)和負(fù)載共享策略。另外DRMonitor允許用戶通過(guò)—組API使得應(yīng)用可以周期性地獲得系統(tǒng)資源和負(fù)載狀況的更新消息。CarnegieMellon大學(xué)開發(fā)的DSMon系統(tǒng)以服務(wù)的形式搜集分布計(jì)算系統(tǒng)中各節(jié)點(diǎn)的資源狀況和負(fù)載信息,然后將這些信息分發(fā)給系統(tǒng)中的其他節(jié)點(diǎn),DSMon的重點(diǎn)是為分布式容錯(cuò)提供支持。3系統(tǒng)資源信息和負(fù)載狀況監(jiān)測(cè)模式分析根據(jù)交互過(guò)程中啟動(dòng)策略的不同,可將分布計(jì)算系統(tǒng)的資源性能和負(fù)載監(jiān)測(cè)分為Push和Pull兩種模式。Push模式指由被監(jiān)測(cè)節(jié)點(diǎn)主動(dòng)向系統(tǒng)資源性能和負(fù)載監(jiān)測(cè)構(gòu)件匯報(bào)自己的資源性能和負(fù)載信息。其工作原理如圖1(a)所示,各被監(jiān)測(cè)節(jié)點(diǎn)的Node構(gòu)件主動(dòng)向RLMonitor報(bào)告其資源和負(fù)載信鼠。Pull模式指由系統(tǒng)的負(fù)載檢測(cè)構(gòu)件主動(dòng)向被監(jiān)測(cè)節(jié)點(diǎn)查詢其資源性能和負(fù)載信息。其工作原理如圖1(b)所示,RLMonitor構(gòu)件主動(dòng)向各被監(jiān)測(cè)節(jié)點(diǎn)的索取其資源和負(fù)載信息。No如No(a)Push模式(b)Pull模式圖1負(fù)載和資源監(jiān)控的兩種主流模式根據(jù)導(dǎo)致系統(tǒng)資源性能和負(fù)載信息交互過(guò)程的原因可以將負(fù)載監(jiān)測(cè)分為周期性和事件驅(qū)動(dòng)兩種類型。周期性方式是指被監(jiān)測(cè)節(jié)點(diǎn)定期將其資源性能和負(fù)載信息“推”給系統(tǒng)監(jiān)測(cè)構(gòu)件或者由系統(tǒng)監(jiān)測(cè)構(gòu)件周期性地從其他監(jiān)測(cè)節(jié)點(diǎn)“拉”監(jiān)測(cè)數(shù)據(jù)。而事件驅(qū)動(dòng)方式只有在某些特定事件發(fā)生后被監(jiān)測(cè)節(jié)點(diǎn)才將其監(jiān)測(cè)信息“推”給系統(tǒng)監(jiān)測(cè)構(gòu)件或由系統(tǒng)監(jiān)測(cè)構(gòu)件主動(dòng)從各被監(jiān)測(cè)節(jié)點(diǎn)“拉”監(jiān)測(cè)信息。Push模式指由被監(jiān)測(cè)節(jié)點(diǎn)主動(dòng)向系統(tǒng)資源性能和負(fù)載監(jiān)測(cè)構(gòu)件匯報(bào)自己的資源性能和負(fù)載信息。其工作原理如圖1(a)所示,各被監(jiān)測(cè)節(jié)點(diǎn)的Node構(gòu)件主動(dòng)向RLMonitor報(bào)告其資源和負(fù)載信息。Pull模式指由系統(tǒng)的負(fù)載檢測(cè)構(gòu)件主動(dòng)向被監(jiān)測(cè)節(jié)點(diǎn)查詢其資源性能和負(fù)載信息。其工作原理如圖1(b)所示,RLMonitor構(gòu)件主動(dòng)向各被監(jiān)測(cè)節(jié)點(diǎn)的Node索取其資源和負(fù)載信息。將這兩類模式進(jìn)行組合,則負(fù)載監(jiān)控可以分為如表1所示的四類。其中:一致性是指基于該模式進(jìn)行負(fù)載監(jiān)測(cè)時(shí)獲取的信息和系統(tǒng)實(shí)際的資源性能和負(fù)載狀況的一致程度。適應(yīng)性指當(dāng)被監(jiān)測(cè)節(jié)點(diǎn)的資源性能或負(fù)載狀況發(fā)生變化時(shí),該模式能否及時(shí)地進(jìn)行反映。通信開銷是指完成一次監(jiān)測(cè)信息交互所需要的_______消息數(shù)目。表1負(fù)載監(jiān)控的四種組合模式文獻(xiàn)[4—5,7]采用了周期性的“拉”模式,而文獻(xiàn)『61采用了基于事件驅(qū)動(dòng)的“推”模式來(lái)搜集系統(tǒng)的資源信息和負(fù)載狀態(tài)。4自適應(yīng)資源信息和負(fù)載監(jiān)測(cè)4.1模型自適應(yīng)資源信息和負(fù)載監(jiān)測(cè)結(jié)構(gòu)如圖5所示:用于監(jiān)測(cè)系統(tǒng)節(jié)點(diǎn)狀態(tài)的Node構(gòu)件和系統(tǒng)負(fù)載監(jiān)控服務(wù)RLMonitor。Node構(gòu)件在資源性能和負(fù)載監(jiān)測(cè)域中的每個(gè)節(jié)點(diǎn)均需部署,負(fù)責(zé)周期性地對(duì)被監(jiān)測(cè)節(jié)點(diǎn)的資源性能和負(fù)載狀態(tài)進(jìn)行采樣和平滑處理,然后將其發(fā)送給RLMonitor構(gòu)件。RLMonitor構(gòu)件只需在資源性能和負(fù)載監(jiān)測(cè)域的服務(wù)器上進(jìn)行部署,負(fù)責(zé)從Node構(gòu)件獲取、存儲(chǔ)和分發(fā)資源性能和負(fù)載信息。(1)采樣器(Sampler):周期性地對(duì)Node所駐留節(jié)點(diǎn)的資源性能和負(fù)載信息進(jìn)行采樣。(2)通告器(Notifier):被RLMonitor用來(lái)將所收集的系統(tǒng)資源性能和負(fù)載信息通告給系統(tǒng)中的其他構(gòu)件,如負(fù)載均衡器等。(3)激發(fā)器(Excitor):負(fù)責(zé)驅(qū)動(dòng)RLMonitor或者Node進(jìn)行動(dòng)作,相當(dāng)于其決策機(jī)構(gòu)。對(duì)RLMonitor而言,決定是否需要從各Node“拉”采樣信息以及是否需要將已經(jīng)收集的信息通告給其他構(gòu)件;對(duì)Node而言,需要決策是否要將更新的采樣信息“推”給RLMonitor以及是否需要進(jìn)行采樣動(dòng)作。(4)Push構(gòu)件:Node用來(lái)主動(dòng)將采樣信息“推”給RLMoni—tor的通信接口。(5)Pull構(gòu)件:RLMonitor用來(lái)從各Node構(gòu)件“拉”采樣信息的通信接口。(6)API:是由RLMonitor提供的一個(gè)輕量級(jí)的庫(kù),將RT廣Monitor的功能進(jìn)行了封裝。霞圖2自適應(yīng)資源信息和負(fù)載監(jiān)測(cè)模型和部署4.2自適應(yīng)監(jiān)測(cè)方法通過(guò)對(duì)表1四類監(jiān)測(cè)模式從一致性、適應(yīng)性、復(fù)雜性以及實(shí)現(xiàn)的難易程度等幾個(gè)方面進(jìn)行分析,發(fā)現(xiàn)“推”和“拉”方式以及周期性監(jiān)測(cè)模式和基于事件驅(qū)動(dòng)的監(jiān)測(cè)模式之間具有良好的互補(bǔ)性?;谝陨戏治觯岢隽艘环N自適應(yīng)系統(tǒng)資源性能和負(fù)載監(jiān)測(cè)機(jī)制。RLMonitor周期性地從系統(tǒng)各被監(jiān)測(cè)節(jié)點(diǎn)的Node“拉”其資源性能和負(fù)載狀態(tài)信息,見算法1。Node構(gòu)件則在其資源性能和負(fù)載變化超過(guò)了一定的閾值時(shí)主動(dòng)將其資源性能和負(fù)載狀態(tài)信息“推”給RLMonitor,見算法2。算法1RLMonitor的周期性Pull算法procedurePPULLRLINFOforallnode∈Ⅳ0dedoifthenode’pullperiodhasreachedthenNmifythenodetoreportitsinformation5:Resetthen0de’stimer....\一/162009,45(29)ComputerEngineeringandApplications計(jì)算機(jī)工程與應(yīng)用endifendforendprocedure算法1中RLMonitor周期性通知各節(jié)點(diǎn)匯報(bào)其資源性能和負(fù)載狀況信息時(shí),采用Ice目的基于UDP的單向方法調(diào)用實(shí)現(xiàn)。其原因是該方法會(huì)被周期性調(diào)用,只要不發(fā)生連續(xù)性的通信故障就不會(huì)影響信息采集的有效性,而在局域網(wǎng)絡(luò)發(fā)生連續(xù)性的通信故障概率較低;即使發(fā)生了連續(xù)『生的通信故障,但只要節(jié)點(diǎn)的資源性能和負(fù)載狀況發(fā)生明顯改變,該節(jié)點(diǎn)即會(huì)通過(guò)可靠的雙向調(diào)用對(duì)其信息進(jìn)行刷新;可以降低系統(tǒng)開銷,提高系統(tǒng)效率。算法2中所選擇的事件是節(jié)點(diǎn)最新的平滑負(fù)載向量和前一個(gè)平滑負(fù)載向量之差的長(zhǎng)度超過(guò)某一設(shè)定的閾值。通過(guò)選擇不同的閾值可以對(duì)該算法進(jìn)行調(diào)節(jié)。所選的閾值越大,則對(duì)節(jié)點(diǎn)資源性能和負(fù)載的變化越不敏感,算法即退化成周期性的“拉”算法;所選的閾值越小,則對(duì)節(jié)點(diǎn)的資源性能和負(fù)載變化越敏感,算法即退化為基于事件的“推”算法。算法2Node基于事件驅(qū)動(dòng)的Phsh算法procedureEPUSHRLINFOifIrl≥thresh0ldthenReporttoRLMonitorResetthenode’StimerinRLMonitor5:endifendprocedureRLMonitor和Node都是以ICE[9-q對(duì)象的形式實(shí)現(xiàn)的。另外在RLMonitor部署了一個(gè)分布回調(diào)對(duì)象Refresh,所有的Node對(duì)象均通過(guò)Refresh對(duì)象來(lái)報(bào)告其資源性能和負(fù)載信息。圖3(a)和圖3(b)展示了這三個(gè)分布對(duì)象在P—Pull和E—Push兩種情況下的交互關(guān)系。[RegistermeinRLMonitorRemembertheRefreshI’s:ObjectReference,nPleaserefresrh.uf!Refreshmyres0ur℃eIand:loadinginformatin(a)周期性的“拉”模式1aNode1lRLMonitorIjR黜UⅥo一nitornIjRmenlbertheRefres’sObjectReference:echange。floadin;OVerrunthresh。l4value]Refreshmyresource.',andloadinginfo,,r0Ii?!發(fā)/(b)事件驅(qū)動(dòng)的“推”模式圖3RLMonitor、Node和Refresh的交互關(guān)系5實(shí)驗(yàn)與結(jié)果分析5.1實(shí)驗(yàn)環(huán)境5.1.1實(shí)驗(yàn)說(shuō)明以一臺(tái)Linux服務(wù)器為實(shí)驗(yàn)對(duì)象,在服務(wù)器上部署Node構(gòu)件,每隔50毫秒對(duì)其CPU負(fù)載進(jìn)行一次采樣,并將該采樣結(jié)果近似看作CPU的實(shí)際負(fù)載變化曲線。同時(shí),系統(tǒng)RLMonitor構(gòu)件按照系統(tǒng)設(shè)定的采樣周期從服務(wù)器的CPU構(gòu)件“拉”負(fù)載信息。系統(tǒng)設(shè)定的采樣周期從200毫秒開始,以200毫秒為步長(zhǎng),直至10秒。每次實(shí)驗(yàn)持續(xù)1小時(shí),共進(jìn)行了6次實(shí)驗(yàn)。實(shí)驗(yàn)選用的服務(wù)器的配置如表2。表2監(jiān)測(cè)周期實(shí)驗(yàn)中服務(wù)器的配置5.1.2一致性度量指標(biāo)假設(shè)CPU的負(fù)載的實(shí)際變化函數(shù)為Cr(f)。另系統(tǒng)設(shè)定采樣周期的采樣結(jié)果形成一條階梯曲線,兩個(gè)采樣點(diǎn)之間的值取為前一個(gè)采樣點(diǎn)的值,并將形成該曲線的函數(shù)記作c(t)。定義在[£,t2]時(shí)段內(nèi)采樣一致性指標(biāo)為:在實(shí)驗(yàn)中,每隔50毫秒對(duì)這兩條曲線分別取值并記作cr和c:,并用這些取值的一致性來(lái)代替c。h。故可將上式簡(jiǎn)化為::掣,(2)5.2實(shí)驗(yàn)結(jié)果和分析5.2.1監(jiān)測(cè)周期一致性實(shí)驗(yàn)監(jiān)控周期是資源性能和負(fù)載監(jiān)測(cè)決定其一致性的最主要的因素。就所掌握的大部分文獻(xiàn)均未對(duì)監(jiān)測(cè)周期進(jìn)行分析。DRMonitor[~的監(jiān)測(cè)周期設(shè)定為1秒,DSMonm中也將監(jiān)測(cè)周期設(shè)定為1秒,但均未對(duì)其合理性進(jìn)行分析。一般而言,監(jiān)測(cè)周期越短則一致性越高,監(jiān)測(cè)周期越長(zhǎng)則一致性越低。通過(guò)實(shí)驗(yàn)和統(tǒng)計(jì)來(lái)確定負(fù)載監(jiān)測(cè)周期的合理范圍。共進(jìn)行了六次實(shí)驗(yàn),每次實(shí)驗(yàn)的監(jiān)測(cè)周期從200毫秒開始,以200毫秒為步長(zhǎng),直至10秒。試驗(yàn)結(jié)果顯示在圖4,其中橫軸為采樣周期,縱軸為六次實(shí)驗(yàn)的一致性的平均值。從圖4可得出:32302826專24222018l6CPU負(fù)載的監(jiān)測(cè)周期/s圖4監(jiān)控周期與一致性的關(guān)系(1)采樣周期越短,和實(shí)際負(fù)載的一致性程度越高。這與常識(shí)一致。(2)在(0,1.8]秒這段區(qū)間,采樣和CPU實(shí)際負(fù)載的一致性隨著采樣周期的加長(zhǎng)迅速降低。(3)從1.8秒之后,采樣和CPU實(shí)際負(fù)載的一致性呈震蕩降低,但降低的幅度逐漸遞減。(4)在[1.0,1.2】秒這段區(qū)間,采樣和CPU實(shí)際負(fù)載的一致楊剛,隨玉磊:面向云計(jì)算平臺(tái)自適應(yīng)資源監(jiān)測(cè)方法2009,45(29)17性無(wú)明顯變化。綜合權(quán)衡開銷和一致性,系統(tǒng)資源性能和負(fù)載監(jiān)測(cè)周期的合理區(qū)間應(yīng)該為『O.8,2]秒,1秒應(yīng)該是較佳的選擇。5.2.2自適應(yīng)檢測(cè)方法實(shí)驗(yàn)在5.1.1節(jié)所描述的實(shí)驗(yàn)環(huán)境對(duì)自適應(yīng)負(fù)載監(jiān)測(cè)算法和周期性負(fù)載監(jiān)測(cè)算法進(jìn)行了對(duì)比測(cè)試,結(jié)果見圖5。監(jiān)測(cè)周期/s圖5自適應(yīng)監(jiān)測(cè)方法與周期性檢測(cè)方法性能比較船表示該次測(cè)試事件驅(qū)動(dòng)算法所選擇的事件過(guò)濾閾值??梢园l(fā)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論