服務(wù)水平管理和服務(wù)水平協(xié)議_第1頁(yè)
服務(wù)水平管理和服務(wù)水平協(xié)議_第2頁(yè)
服務(wù)水平管理和服務(wù)水平協(xié)議_第3頁(yè)
服務(wù)水平管理和服務(wù)水平協(xié)議_第4頁(yè)
服務(wù)水平管理和服務(wù)水平協(xié)議_第5頁(yè)
已閱讀5頁(yè),還剩91頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

服務(wù)水平管理和服務(wù)水平協(xié)議(SLA)

?服務(wù)水平管理概述

網(wǎng)絡(luò)公司一直以來(lái)都通過(guò)構(gòu)建堅(jiān)實(shí)的網(wǎng)絡(luò)基礎(chǔ)設(shè)施及積極解

決每個(gè)業(yè)務(wù)問題來(lái)滿足不斷擴(kuò)展的網(wǎng)絡(luò)規(guī)定。當(dāng)業(yè)務(wù)異常中斷

時(shí),公司將構(gòu)建新流程、管理功能或基礎(chǔ)設(shè)施來(lái)防止此類故障

再次發(fā)生。然而,由于快速變更及日益增長(zhǎng)的可用性規(guī)定,我

們現(xiàn)在需要改善模式來(lái)預(yù)先防止意外故障并快速修復(fù)網(wǎng)絡(luò)。許

多服務(wù)供應(yīng)商和公司一直都試圖更好地定義服務(wù)水平以便實(shí)

現(xiàn)商業(yè)目的。

關(guān)鍵成功因素

SLA的關(guān)鍵成功因素用來(lái)定義支持成功構(gòu)建可獲得的服務(wù)水平

及維護(hù)SLA的重要要素。要成為合格的關(guān)鍵成功因素,流程或

流程環(huán)節(jié)必須可以改善SLA質(zhì)量并從整體上提高網(wǎng)絡(luò)的可用

性。關(guān)鍵成功因素還應(yīng)具有可測(cè)量性,以便使公司可以判斷:

與定義的程序相比,它所取得的成功限度。

性能指標(biāo)

性能指標(biāo)提供了公司測(cè)量關(guān)鍵成功因素的機(jī)制。您通常需要每

月審查一次,以保證服務(wù)水平定義或SLA運(yùn)營(yíng)良好。網(wǎng)絡(luò)運(yùn)營(yíng)

小組及必要的工具組可實(shí)行以下測(cè)量標(biāo)準(zhǔn)。

注意:對(duì)于沒有SLA的公司,我們建議您同時(shí)實(shí)行服務(wù)水平定

義、服務(wù)水平審核及測(cè)量標(biāo)準(zhǔn)。

性能指標(biāo)涉及:

?記錄的服務(wù)水平定義或SLA,涉及可用性、性能、積極業(yè)務(wù)應(yīng)

答時(shí)間、排障目的及問題升級(jí)等。

?月度網(wǎng)絡(luò)服務(wù)水平審核會(huì)議,審核對(duì)服務(wù)水平的執(zhí)行情況并實(shí)

行改善。

?性能指標(biāo)測(cè)量標(biāo)準(zhǔn),涉及可用性、性能、按優(yōu)先級(jí)劃分的業(yè)務(wù)

應(yīng)答時(shí)間、按優(yōu)先級(jí)劃分的排障時(shí)間以及其他可測(cè)量的SLA參

數(shù)。

?服務(wù)水平管理流程

面向服務(wù)水平管理的高級(jí)別流程重要涉及兩組:

1.定義網(wǎng)絡(luò)服務(wù)水平

2.創(chuàng)建并維護(hù)SLA

實(shí)行服務(wù)水平管理

實(shí)行服務(wù)水平管理涉及十六步,分為以下兩個(gè)重要范疇:

?定義網(wǎng)絡(luò)服務(wù)水平一環(huán)節(jié)1-6

?創(chuàng)建并維護(hù)SLA一環(huán)節(jié)7-16

?定義網(wǎng)絡(luò)服務(wù)水平

網(wǎng)絡(luò)管理人員需要定義支持、管理并測(cè)量網(wǎng)絡(luò)的重要規(guī)則。服

務(wù)水平為所有網(wǎng)絡(luò)人員提供目的并可用作整體業(yè)務(wù)質(zhì)量的測(cè)

量標(biāo)準(zhǔn)。您也可將服務(wù)水平定義用作網(wǎng)絡(luò)資源預(yù)算工具以及投

資于更高服務(wù)質(zhì)量的證據(jù)。它們還提供評(píng)估供應(yīng)商及運(yùn)營(yíng)商的

表現(xiàn)的方法。

假如沒有服務(wù)水平定義和測(cè)量,公司不也許制定明確的目的。

服務(wù)是否滿意由用戶決定,在應(yīng)用、服務(wù)器/客戶機(jī)運(yùn)營(yíng)或網(wǎng)

絡(luò)支持方面并無(wú)明顯差距。由于公司對(duì)最終結(jié)果沒有把握,因

此很難作預(yù)算。最終,網(wǎng)絡(luò)公司在提高網(wǎng)絡(luò)及支持模式方面都

趨向于選擇被動(dòng)應(yīng)答,而非積極防止的方式。

我們建議采用以下環(huán)節(jié)來(lái)構(gòu)建并支持服務(wù)水平模式:

?分析技術(shù)目的及限制因素。

?擬定可用性預(yù)算。

?創(chuàng)建具體記錄關(guān)犍應(yīng)用網(wǎng)絡(luò)特性的應(yīng)用資料庫(kù)。

?定義可用性、性能衡量標(biāo)準(zhǔn)及通用術(shù)語(yǔ)。

.創(chuàng)建服務(wù)水平定義,涉及可用性、性能、業(yè)務(wù)應(yīng)答時(shí)間、排障

平均時(shí)、故障檢測(cè)、升級(jí)門限及上報(bào)途徑。

?收集測(cè)量標(biāo)準(zhǔn)并監(jiān)控服務(wù)水平定義。

?第1步:分析技術(shù)目的及限制因素

開始分析技術(shù)目的和限制因素的最佳方式是集體討論或研究

技術(shù)目的與規(guī)定。由于這些人都有特定的業(yè)務(wù)目的,所以有時(shí)

這有助于規(guī)定其他IT技術(shù)人員參與討論。技術(shù)目的涉及可用

性級(jí)別、吞吐量、抖動(dòng)、延遲、應(yīng)答時(shí)間、可用性規(guī)定、新特

?當(dāng)前的話務(wù)負(fù)載或應(yīng)用行為

網(wǎng)絡(luò)技術(shù)、故障恢復(fù)能力及配置限制

因素是指與當(dāng)前技術(shù)、硬件、鏈路、

設(shè)計(jì)或配置相關(guān)的任何限制因素或風(fēng)

險(xiǎn)。技術(shù)限制因素指技術(shù)自身導(dǎo)致的

任何限制。例如,當(dāng)前沒有一種技術(shù)

允許冗余網(wǎng)絡(luò)環(huán)境中實(shí)現(xiàn)少于1秒的

聚合時(shí)間,而這恰恰是維持整個(gè)網(wǎng)絡(luò)

上的話音連接的關(guān)鍵。另一個(gè)例子是

數(shù)據(jù)通過(guò)地面鏈路時(shí)的原始速度,大

約是100英里/毫秒。

限制因素類型潛在影響

網(wǎng)絡(luò)硬件故障恢復(fù)能力風(fēng)險(xiǎn)調(diào)查應(yīng)集

中在硬件拓?fù)?、分?jí)體系、模塊化、

冗余、MTBF及定義的途徑這幾方面。

網(wǎng)絡(luò)鏈路限制因素應(yīng)強(qiáng)調(diào)公司網(wǎng)絡(luò)鏈

路及運(yùn)營(yíng)商連接。鏈路限制因素也許

涉及鏈路冗余和多樣性、媒介限制、

布線基礎(chǔ)設(shè)施、本地環(huán)路連接性以及

長(zhǎng)距離連接性。設(shè)計(jì)限制因素與網(wǎng)絡(luò)

的物理或邏輯設(shè)計(jì)相關(guān),涉及從為設(shè)

備可用空間到路由協(xié)議實(shí)行的可擴(kuò)展

性等各個(gè)方而。您應(yīng)在配置、可用性、

可擴(kuò)展性、性能及容量方面考慮所有

協(xié)議和媒介設(shè)計(jì)動(dòng)態(tài)主機(jī)配置協(xié)議

(DHCP)、域名系統(tǒng)(DNS)、防火墻、

協(xié)議轉(zhuǎn)換及網(wǎng)絡(luò)地址轉(zhuǎn)換等網(wǎng)絡(luò)業(yè)務(wù)

限制因素也應(yīng)列入考慮之列。

生命周期方案定義用于實(shí)現(xiàn)解決方案

的統(tǒng)一部署、檢測(cè)和修復(fù)故障、防止

容量或性能問題以及配置一致性和模

塊化的網(wǎng)絡(luò)流程和管理。您需要認(rèn)真

考慮這個(gè)領(lǐng)域,由于專業(yè)技術(shù)和流程

通常是導(dǎo)致不可用性的最大影響因

素。網(wǎng)絡(luò)生命周期指規(guī)劃、設(shè)計(jì)、實(shí)

行和運(yùn)營(yíng)周期。在每個(gè)階段中,您都

必須了解性能管理、配置管理、故障

管理及安全性等網(wǎng)絡(luò)管理功能。思科

NSA高可用性服務(wù)部(HAS)提供網(wǎng)絡(luò)

生命周期評(píng)估服務(wù),擬定與網(wǎng)絡(luò)生命

周期方案相關(guān)的當(dāng)前網(wǎng)絡(luò)可用性限制

因素。

當(dāng)前的話務(wù)量或應(yīng)用限制因素只是指

當(dāng)前話務(wù)和應(yīng)用的影響。

不幸的是,許多應(yīng)用都帶有大量需要

慎重管理的限制因素。當(dāng)前應(yīng)用的抖

動(dòng)、延遲、吞吐量及帶寬規(guī)定通常帶

有許多限制因素。編寫應(yīng)用的方式也

也許產(chǎn)生一些限制因素。匯編應(yīng)用資

料庫(kù)可幫您更好地了解這些問題;下

文將介紹這一特性。研究當(dāng)前的可用

性、話務(wù)、容量及性能還可幫助網(wǎng)絡(luò)

管理人員了解當(dāng)前的服務(wù)水平目的及

風(fēng)險(xiǎn)。這一工作常通過(guò)名為網(wǎng)絡(luò)基準(zhǔn)

制定的流程來(lái)完畢,該流程可幫您定

義規(guī)定期段內(nèi)(通常是一個(gè)月)的平

均網(wǎng)絡(luò)性能、可用性或容量。這些信

息通常用于容量規(guī)劃和趨勢(shì)分析,但

也可用來(lái)了解服務(wù)水平問題。

下面的工作表使用了上述目的/限制

因素方法來(lái)實(shí)現(xiàn)防止安全性襲擊或拒

絕服務(wù)襲擊(DoS)的目的。您也可使

用該工作表來(lái)決定可最大限度地減少

安全性襲擊的業(yè)務(wù)范圍。

風(fēng)險(xiǎn)或限制因素

可用的DoS檢測(cè)工具無(wú)法檢測(cè)出所有DoS襲擊類型。技術(shù)/故障恢更能力高

不具有對(duì)告警做出相應(yīng)所需的人員和流程。生命周期方案高

當(dāng)前網(wǎng)絡(luò)接入策略未加執(zhí)行。牛.命周期方案一般

假如運(yùn)用帶寬擁塞來(lái)發(fā)動(dòng)襲擊,則當(dāng)前的低帶寬互聯(lián)網(wǎng)連

接成為限制因素。網(wǎng)絡(luò)容量一微

幫助防止襲擊的當(dāng)前安全性配理不完善。技術(shù)/故障恢復(fù)能力一般

?第2步:擬定可用性預(yù)算

可用性預(yù)算是盼望在定義的兩點(diǎn)間出現(xiàn)的、理論上的網(wǎng)絡(luò)可用

性。準(zhǔn)確的理論信息可在多個(gè)方面發(fā)揮作用:

?公司可將其視為內(nèi)部可用性目的,并且可以立刻定義偏離并進(jìn)

行補(bǔ)救。

?網(wǎng)絡(luò)規(guī)劃人員可使用這些信息來(lái)擬定系統(tǒng)的可用性,以保證設(shè)

計(jì)滿足商業(yè)規(guī)定。

.導(dǎo)致不可用性或故障停機(jī)的因素涉及軟硬件故障、電源和環(huán)境

問題、鏈路或運(yùn)營(yíng)商故障、網(wǎng)絡(luò)設(shè)計(jì)、人為錯(cuò)誤或缺少流程等。

在評(píng)估網(wǎng)絡(luò)的整體可用性預(yù)算時(shí),您必須嚴(yán)格評(píng)估上述的所有

參數(shù)。

假如公司目前正在測(cè)量可用性,則也許不需要可用性預(yù)算。用

可用性測(cè)量標(biāo)準(zhǔn)作為基準(zhǔn)來(lái)評(píng)估服務(wù)水平定義使用的當(dāng)前服務(wù)

水平。然而,您可將兩者進(jìn)行對(duì)比,以便了解潛在的理論可用

性與實(shí)際測(cè)量結(jié)果間的差距。

可用性指產(chǎn)品或業(yè)務(wù)在需要時(shí)投入運(yùn)營(yíng)的也許性。參見以下定

義:

a.可用性

-1-(總的連接中斷時(shí)間)/(總服務(wù)連接時(shí)間)

,*I-[總和(業(yè)務(wù)中斷期間受影響的連接數(shù)量X業(yè)務(wù)中斷時(shí)

間)]/(運(yùn)營(yíng)的連接數(shù)量X運(yùn)營(yíng)時(shí)間)

b.不可用性

1-由以下因素導(dǎo)致的可用性或總的連接中斷時(shí)間:軟硬件故障、

電源和環(huán)境問題、鏈路和運(yùn)營(yíng)商故障、網(wǎng)絡(luò)設(shè)計(jì)、用戶錯(cuò)誤及

流程故障等。

c.硬件可用性

一方面需要研究的領(lǐng)域是潛在硬件故障及其對(duì)不可用性的影

響。要擬定這方面的影響,公司應(yīng)了解所有網(wǎng)絡(luò)組件的MTBF

以及MTTR,以擬定兩點(diǎn)間的途徑中所有設(shè)備的潛在硬件問題。

假如網(wǎng)絡(luò)采用模塊化和分級(jí)體系結(jié)構(gòu),則幾乎任意兩點(diǎn)間的硬

件可用性都是相同的。MTBF信息可用于所有思科組件,并且可

根據(jù)請(qǐng)求、向本地客戶經(jīng)理提供。CiscoNSAHAS項(xiàng)目還使用

一種工具來(lái)幫助擬定硬件可用性及網(wǎng)絡(luò)途徑,即使在系統(tǒng)中存

在模塊冗余、機(jī)底冗余及途徑冗余時(shí)也可以使用這種工具。硬

件可靠性的一個(gè)重要因素是MTTRO公司應(yīng)評(píng)估它們修復(fù)故障硬

件的速度。假如公司未制定備用方案,只依賴于標(biāo)準(zhǔn)Cisco

SMARTnet?協(xié)議,則潛在的評(píng)估硬件更換時(shí)間為24小時(shí)。在帶

有核心冗余但不帶有接入。

冗余的典型LAN環(huán)境中,適當(dāng)?shù)目捎眯允?9.99%,平均修復(fù)

時(shí)間是4-小時(shí)。

d.軟件可用性

下一個(gè)需要研究的領(lǐng)域是軟件故障。出于測(cè)量的目的,思科將

軟件故障定義為由軟件錯(cuò)誤引發(fā)的設(shè)備冷啟動(dòng)。思科已經(jīng)開發(fā)

出許多流程來(lái)幫助了解軟件的可用性;然而,更新的版本尚需

一段時(shí)間進(jìn)行測(cè)量,并且我們認(rèn)為它的可用性不及一般的部署

軟件。IOS11.2版(18)等一般部署軟件經(jīng)測(cè)量,證明具有

99.9999%的可用性。這個(gè)數(shù)字是基于修復(fù)時(shí)間為六分鐘(路由

器重新裝載的時(shí)間)的思科路由器的實(shí)際冷啟動(dòng)次數(shù)來(lái)計(jì)算的。

采用不同版本的公司,可用性將隨著復(fù)雜性的增長(zhǎng)、互操作性

的增強(qiáng)以及排障時(shí)間的縮短略有減少。采用最新軟件版本的公

司,不可用性將有所提高。不可用性的分派也相稱廣泛,這意

味著客戶將感覺到很高的不可用性或接近一般部署版本的可用

性。

e.環(huán)境和電源的可用性

您還必須考慮環(huán)境和電源的可用性問題。環(huán)境問題與將設(shè)備保

持在特定的運(yùn)營(yíng)溫度范圍內(nèi)的冷卻系統(tǒng)的故障相關(guān)。當(dāng)溫度大

大超過(guò)技術(shù)指標(biāo)時(shí),許多思科設(shè)備只是停止運(yùn)轉(zhuǎn),而不會(huì)損害

所有硬件。出于可用性預(yù)算的目的,您必須將電源考慮在內(nèi),

由于它是導(dǎo)致本領(lǐng)域中不可用性的重要因素。

雖然電源故障是導(dǎo)致網(wǎng)絡(luò)不可用性的重要因素,但對(duì)它的討論

還是受到限制,這是由于無(wú)法進(jìn)行準(zhǔn)確的、理論上的電源分析。

公司必須基于所在地區(qū)的經(jīng)驗(yàn)、電源備份功能以及實(shí)行的流程,

對(duì)其設(shè)備的電源可用性的大約測(cè)量結(jié)果進(jìn)行評(píng)估,以保證為所

有設(shè)備提供具有一致質(zhì)量的電源。

基于保守的估計(jì),我們可以認(rèn)為配備了備用發(fā)電機(jī)、不間斷供

電電源(UPS)系統(tǒng)并采用合格電源實(shí)行流程的公司,可實(shí)現(xiàn)高

達(dá)六個(gè)九(99.9999%)的可用性,而未配備這些系統(tǒng)的公司,其

可用性僅為99.99%,或者說(shuō)每年有36分鐘的故障停機(jī)時(shí)間。

當(dāng)然,您可根據(jù)公司的觀測(cè)或?qū)嶋H數(shù)據(jù)來(lái)調(diào)整這些數(shù)值,使其

更真實(shí)地反映公司的具體情況。

f.鏈路或運(yùn)營(yíng)商故障

鏈路和運(yùn)營(yíng)商故漳是影響WAN環(huán)境中的可用性的重要因素,牢

記:WAN環(huán)境只是同公司網(wǎng)絡(luò)遭遇同樣可用性問題的其他網(wǎng)絡(luò),

涉及:軟硬件故障、用戶錯(cuò)誤及電源故障等。

許多運(yùn)營(yíng)商網(wǎng)絡(luò)都已經(jīng)開始對(duì)系統(tǒng)進(jìn)行可用性預(yù)算,但獲得這

些信息并不容易。牢記,運(yùn)營(yíng)商的可用性保證級(jí)別很少基于或

主線不基于實(shí)際可用性預(yù)算。這些保證級(jí)別有時(shí)只是用來(lái)提高

運(yùn)營(yíng)商知名度的營(yíng)銷和銷售方法。在某些情況下,這些網(wǎng)絡(luò)還

公布看似互相突出的可用性記錄數(shù)據(jù)。牢記,這些記錄數(shù)據(jù)也

許只合用于完全冗余的核心網(wǎng)絡(luò),而不作為導(dǎo)致不可用性的因

素(不可用性由本地環(huán)路接入引起),本地環(huán)路接入才是WAN

網(wǎng)絡(luò)中不可用性的重要因素。

對(duì)WAN環(huán)境進(jìn)行可用性評(píng)估應(yīng)基于實(shí)際的運(yùn)營(yíng)商信息以及WAN

連接的冗余級(jí)別。假如公司擁有多個(gè)大樓入口設(shè)施,冗余本地

環(huán)路供應(yīng)商、同步光網(wǎng)絡(luò)(SONET)本地接入、以及分布在多個(gè)

地區(qū)的冗余長(zhǎng)途運(yùn)營(yíng)商,則WAN的可用性將得到明顯增強(qiáng)。

電話業(yè)務(wù)是WAN環(huán)境中、非冗余網(wǎng)絡(luò)連接相稱準(zhǔn)確的可用性預(yù)

算。使用類似于本文所描述的可用性預(yù)算方法進(jìn)行測(cè)量,電話

業(yè)務(wù)的端到端連接的可用性預(yù)算大約為99.94%o這種方法業(yè)己

成功應(yīng)用于數(shù)據(jù)環(huán)境中,結(jié)果基本相同,目前正被用作服務(wù)供

應(yīng)商有線網(wǎng)絡(luò)中分組有線規(guī)程的預(yù)算。假如將該數(shù)值用于完全

冗余的系統(tǒng),則我們可以假定,WAN可用性會(huì)接近99.9999%。

當(dāng)然,由于成本及可用性問題,目前很少有哪家公司部署了分

布在多個(gè)地區(qū)且完全冗余的WAN系統(tǒng),所以應(yīng)使用適當(dāng)?shù)呐袛?/p>

方法測(cè)定這種功能。

LAN環(huán)境中不太也許發(fā)生鏈路故障,然而,規(guī)劃人員也許希望

假定連接器斷開或松動(dòng)會(huì)引發(fā)短時(shí)間的故障停機(jī)。對(duì)LAN網(wǎng)絡(luò)

而言,保守的可用性估計(jì)約為99.9999%,或大約30秒故障停

機(jī)/年。

g.網(wǎng)絡(luò)設(shè)計(jì)

網(wǎng)絡(luò)設(shè)計(jì)是影響可用性的另一個(gè)重要因素。不可擴(kuò)展的設(shè)計(jì)、

設(shè)計(jì)錯(cuò)誤及網(wǎng)絡(luò)聚合時(shí)間都會(huì)對(duì)可用性產(chǎn)生負(fù)面影響。

注意:出于本文的目的,我們將在下面的篇幅中描述不可擴(kuò)展

的設(shè)計(jì)或設(shè)計(jì)錯(cuò)誤。

網(wǎng)絡(luò)設(shè)計(jì)被限定在可測(cè)量的數(shù)值上(基于網(wǎng)絡(luò)中導(dǎo)致話務(wù)重新

路由的軟硬件故障)。這些數(shù)值通常被稱作“系統(tǒng)故障切換時(shí)

間”,并且是系統(tǒng)中自治愈協(xié)議功能的影響因素。

使用與系記錄算相同的方法便可計(jì)算可用性。然而,它只有在

網(wǎng)絡(luò)故障切換時(shí)間滿足網(wǎng)絡(luò)應(yīng)用規(guī)定期才有效。假如故障切換

時(shí)間可以接受,則不把它計(jì)算在內(nèi)。假如故障切換時(shí)間不能接

受,則計(jì)算時(shí)必須將其考慮在內(nèi),例如:估計(jì)或?qū)嶋H的故障切

換時(shí)間為30秒的環(huán)境中卜的IP話音(VoIP)。在這個(gè)例子中,

用戶只是掛斷電話,并有也許重新?lián)芙?。用戶肯定?huì)將這30

秒看作是非可用時(shí)段,但在可用性預(yù)算時(shí)卻未加考慮。

根據(jù)系統(tǒng)故障切換時(shí)間來(lái)計(jì)算不可用性時(shí)耍著眼于理論的軟硬

件可用性以及冗余途徑,由于故障切換將出現(xiàn)在這個(gè)領(lǐng)域。您

必須了解也許發(fā)生故障并導(dǎo)致冗余途徑中出現(xiàn)故障切換的設(shè)備

數(shù)量,這些設(shè)備的MTBF以及故障切換時(shí)間。一個(gè)簡(jiǎn)樸的例子就

是,冗余的相同設(shè)備中,每臺(tái)設(shè)備的WTBF為35433小時(shí),故障

切換時(shí)間為30秒。用35,433除以8766(年平均小時(shí)數(shù),涉

及閏年),我們可以看出該設(shè)備每四年出現(xiàn)一次故障。假如使

用30秒作為故障切換時(shí)間,我們便可以假設(shè):由于故障切換,

每臺(tái)設(shè)備每年平均停機(jī)7.5秒。由于用戶也許會(huì)跨兩條途徑,

因此需要將此結(jié)果乘以2,即:每年15秒。當(dāng)以秒/每年進(jìn)行

計(jì)算時(shí),這個(gè)簡(jiǎn)樸系統(tǒng)中由于故障切換引起的可用性的計(jì)算結(jié)

果為99.99999785%。由于也許出現(xiàn)故障切換的網(wǎng)絡(luò)中的冗余設(shè)

備數(shù)量,在其他環(huán)境中,這個(gè)數(shù)字也許還要略高些。

h.用戶錯(cuò)誤和流程

用戶錯(cuò)誤和流程可用性問題是導(dǎo)致公司和運(yùn)營(yíng)商網(wǎng)絡(luò)中不可用

性的重要因素。約80%的不可用性問題是由于無(wú)法檢測(cè)錯(cuò)誤、

變化故障及性能問題導(dǎo)致的。

公司在制定可用性預(yù)算時(shí):不樂意接受用戶錯(cuò)誤和流程引發(fā)的

不可用性是其他所有理論上的不可用性的四倍這一實(shí)行,然而,

各種證據(jù)一致表白,這種情況存在于許多環(huán)境中。下面我們將

具體闡述不可用性的這個(gè)方面。

由于您無(wú)法從理論上計(jì)算由用戶錯(cuò)誤和流程引發(fā)的不可用性數(shù)

量,我們建議您在制定公司力求完美的可用性預(yù)算時(shí)不將其考

慮在內(nèi)。但公司必須了解其流程和專業(yè)技術(shù)水平中現(xiàn)在所面臨

的可用性風(fēng)險(xiǎn)。透徹地了解了這些風(fēng)險(xiǎn)及克制因素之后,網(wǎng)絡(luò)

規(guī)劃人員便有也許將這些問題引發(fā)的一定數(shù)量的不可用性考慮

在內(nèi)。CiscoNSAHAS項(xiàng)目進(jìn)一步研究了這些問題,并可幫助

公司了解由于流程、用戶錯(cuò)誤或?qū)I(yè)技術(shù)問題引發(fā)的不可用性。

L制定最終的可用性預(yù)算

您可將以前定義的所有領(lǐng)域的可用性相乘來(lái)決定整個(gè)可用性預(yù)

算。這種方法通常合用于任意兩點(diǎn)間的連接相類似的同機(jī)種環(huán)

境,如:分級(jí)體系模塊化LAN環(huán)境或分級(jí)體系標(biāo)準(zhǔn)WAN環(huán)境等。

這下面的例子中,為分級(jí)體系模塊化LAN環(huán)境擬定了可用性預(yù)

算。該環(huán)境為所有網(wǎng)絡(luò)組件都配備了備用發(fā)電機(jī)和UPS系統(tǒng),

并對(duì)電源進(jìn)行適當(dāng)?shù)墓芾怼9疚词褂肰oIP,也不希望將軟件

故障切換時(shí)間考慮在內(nèi)。估算結(jié)果如下:

?兩個(gè)端點(diǎn)間的硬件途徑可用性二99.99%

?使用GD軟件可靠性作為基準(zhǔn)的軟件可用性二99.9999%

?帶有備用系統(tǒng)的環(huán)境和電源可用性=99.999%

?考慮LAN環(huán)境中的鏈路故障的口J用性=99.9999%

?未將系統(tǒng)故障切換時(shí)間計(jì)算在內(nèi)的可用性二100%

?認(rèn)為不存在用戶錯(cuò)誤和流程缺陷的可用性二100%

?公司希望達(dá)成的最終可用性預(yù)算是:0.9999X0.999999

X0.999999X0.999999=0.999896,或99.9896%的可用性。

假如我們將用戶或流程錯(cuò)誤引發(fā)的潛在不可用性考慮在內(nèi),并

假設(shè)其引發(fā)的不可用性是技術(shù)因素引發(fā)的可用性的四倍,則最

終可用性預(yù)算是99.95%o

對(duì)這個(gè)例子的分析使我們了解到,LAN可用性在99.95%與

99.989%之間?,F(xiàn)在,這些數(shù)值可以用作網(wǎng)絡(luò)公司的服務(wù)水平目

的。可以測(cè)量系統(tǒng)中的可用性并擬定上述六個(gè)領(lǐng)域分別引發(fā)的

不可用性百分率來(lái)計(jì)算其他數(shù)值。這使公司可以對(duì)供應(yīng)商、運(yùn)

營(yíng)商、流程和人員進(jìn)行適當(dāng)評(píng)估。這些數(shù)值也可用來(lái)設(shè)立業(yè)務(wù)

盼望值。假如您.時(shí)99.95%與99.989%之間的可用性不滿意,可

投資更多資源來(lái)獲得抱負(fù)的可用性級(jí)別。

網(wǎng)絡(luò)管理人員了解每個(gè)特定可用性級(jí)別的故障停機(jī)時(shí)間將大有

幫助。計(jì)算任何可用性級(jí)別的年故障停機(jī)時(shí)間(分鐘)的公式

如下:

故障停機(jī)(分鐘)/年二525600—(可用性級(jí)別X5256)

假如可用性級(jí)別是99.95%,則結(jié)果是525600o(99.95X5256),

或者相稱于222.8分鐘的故障停機(jī)。對(duì)于上述可用性定義,這

等于網(wǎng)絡(luò)中所有業(yè)務(wù)連接的平均故障停機(jī)時(shí)間。

第3步:創(chuàng)建應(yīng)用資料庫(kù)

應(yīng)用資料庫(kù)可幫助網(wǎng)絡(luò)公司了解并定義每個(gè)應(yīng)用的網(wǎng)絡(luò)服務(wù)水

平規(guī)定。這有助于保證網(wǎng)絡(luò)支持每個(gè)應(yīng)用規(guī)定及整體網(wǎng)絡(luò)業(yè)務(wù)。

當(dāng)應(yīng)用或服務(wù)器組指出網(wǎng)絡(luò)存在問題時(shí),應(yīng)用資料庫(kù)還可用作

網(wǎng)絡(luò)服務(wù)支持的書面基準(zhǔn)。最后,應(yīng)用資料庫(kù)可將性能及可用

性等應(yīng)用規(guī)定與真實(shí)的網(wǎng)絡(luò)業(yè)務(wù)目的或當(dāng)前限制因素進(jìn)行對(duì)比,

來(lái)調(diào)節(jié)網(wǎng)絡(luò)業(yè)務(wù)目的,使其與商業(yè)規(guī)定保持一致。這不僅對(duì)服

務(wù)水平管理很重要,并且對(duì)整個(gè)網(wǎng)絡(luò)設(shè)計(jì)也相稱重要。

每次向網(wǎng)絡(luò)中添加新應(yīng)用時(shí)都應(yīng)創(chuàng)建應(yīng)用資料庫(kù)。您還也許需

要在IT應(yīng)用部門、服務(wù)器管理部門以及組網(wǎng)部門間達(dá)成協(xié)議,

以便為現(xiàn)有及全新業(yè)務(wù)創(chuàng)建應(yīng)用資料庫(kù),完畢用于商業(yè)應(yīng)用及

系統(tǒng)應(yīng)用的應(yīng)用資料庫(kù)。商業(yè)應(yīng)用也許涉及電子郵件、文獻(xiàn)傳

輸、Wob瀏覽、醫(yī)療圖象解決或制造等。系統(tǒng)應(yīng)用也許涉及軟

件分發(fā)、用戶鑒權(quán)、網(wǎng)絡(luò)備份及網(wǎng)絡(luò)管理等。

網(wǎng)絡(luò)分析員及應(yīng)用或服務(wù)器支持應(yīng)用小組應(yīng)負(fù)責(zé)創(chuàng)建應(yīng)用資料

庫(kù)。新應(yīng)用也許規(guī)定使用協(xié)議分析程序以及具有延遲模擬功能

的WAN模擬程序來(lái)適本地劃分應(yīng)用規(guī)定的特性。這有助于擬定

必要帶寬、應(yīng)用可用性的最大延遲及抖動(dòng)規(guī)定。只要您具有所

需服務(wù)器,便可在實(shí)驗(yàn)室環(huán)境中開展這項(xiàng)工作。在VoIP等其他

情況下,涉及抖動(dòng)、延遲及帶寬在內(nèi)的網(wǎng)絡(luò)規(guī)定會(huì)很好地公布,

且無(wú)需再進(jìn)行實(shí)驗(yàn)室測(cè)試。應(yīng)用資料庫(kù)應(yīng)涉及以卜項(xiàng)目:

?應(yīng)用名稱

?應(yīng)用類型

?新應(yīng)用

?業(yè)務(wù)重要性

?可用性規(guī)定

?使用的協(xié)議和端口

?估計(jì)的用戶帶寬(kbps)

?用戶數(shù)量和位置

?文獻(xiàn)傳輸規(guī)定(涉及時(shí)間、量及端點(diǎn))

?網(wǎng)絡(luò)故障停機(jī)影響

?延遲、抖動(dòng)及可用性規(guī)定

1.應(yīng)用資料庫(kù)的目的是了解應(yīng)用的商業(yè)規(guī)定、業(yè)務(wù)關(guān)鍵性以及帶

寬、延遲及抖動(dòng)等網(wǎng)絡(luò)規(guī)定。此外,網(wǎng)絡(luò)公司還應(yīng)了解網(wǎng)絡(luò)故

障停機(jī)的影響。在某些情況下,您也許需要重啟應(yīng)用或服務(wù)器,

這將大幅度延長(zhǎng)總的應(yīng)用故障停機(jī)時(shí)間。完畢應(yīng)用資料庫(kù)后,

您可將所有網(wǎng)絡(luò)功能進(jìn)行對(duì)比,并幫助調(diào)節(jié)網(wǎng)絡(luò)服務(wù)水平,使

其與商業(yè)和應(yīng)用規(guī)定相一致。

第4步:定義可用性及性能標(biāo)準(zhǔn)

可用性及性能標(biāo)準(zhǔn)為公司制定業(yè)務(wù)盼望值。可根據(jù)不同網(wǎng)絡(luò)區(qū)

域或特定應(yīng)用進(jìn)行定義這些標(biāo)準(zhǔn)。還可以擬定往返延遲、抖動(dòng)、

最大吞吐量、帶寬承諾及總體可擴(kuò)展性等方面的性能。此外,為

了制定業(yè)務(wù)盼望值,公司還應(yīng)謹(jǐn)慎定義每個(gè)業(yè)務(wù)標(biāo)準(zhǔn),以便使

致力于網(wǎng)絡(luò)工作的用戶及IT工作組可以全面了解業(yè)務(wù)標(biāo)準(zhǔn)以

及他們與應(yīng)用或眼務(wù)器管理規(guī)定的關(guān)系。用戶及1T工作組還應(yīng)

了解如何測(cè)量業(yè)務(wù)標(biāo)準(zhǔn)。

以前服務(wù)水平定義環(huán)節(jié)的結(jié)果可以幫助制定標(biāo)準(zhǔn)。這時(shí),網(wǎng)絡(luò)

公司應(yīng)明確了解當(dāng)前網(wǎng)絡(luò)所面臨的風(fēng)險(xiǎn)和限制因素及應(yīng)用行為,

并進(jìn)行理論上的可用性分析或制定可用性基準(zhǔn)。

2.定義業(yè)務(wù)標(biāo)準(zhǔn)合用的地理區(qū)域或應(yīng)用領(lǐng)域,也許涉及園區(qū)

LAN、本國(guó)WAN,外聯(lián)網(wǎng)及合作伙伴連接等。在某些情況下,公

司在相同區(qū)域內(nèi)的服務(wù)水平目的也許有所不同。這對(duì)公司或服

務(wù)器供應(yīng)商來(lái)說(shuō)并不罕見。這時(shí),它們通常基于各自的業(yè)務(wù)規(guī)

定制定不同的服務(wù)水平標(biāo)準(zhǔn)。這些在同一地理區(qū)域或服務(wù)區(qū)域

中的標(biāo)準(zhǔn)有金牌、銀牌和銅牌之分。

定義業(yè)

務(wù)標(biāo)準(zhǔn)

參數(shù)???/p>

用性及

往返延

遲是最

常見的

網(wǎng)絡(luò)業(yè)

務(wù)標(biāo)準(zhǔn)??山邮艿?/p>

可用性平均網(wǎng)絡(luò)應(yīng)答應(yīng)答時(shí)間管理

根據(jù)需管理方法最常應(yīng)答

目的時(shí)間目的方法

要,還時(shí)間

可以涉

及最大

吞吐量、

最低帶

寬承諾、

抖動(dòng)、接

受的錯(cuò)

誤率以

及可擴(kuò)

展性功

能。當(dāng)審

核用于

測(cè)量方

法的業(yè)

務(wù)參數(shù)

時(shí)要特

別謹(jǐn)慎。

無(wú)論參

數(shù)是否

涉及在

SLA中,

公司都

應(yīng)考慮

出現(xiàn)問

題或業(yè)

務(wù)不一

致性時(shí),

如何測(cè)

量并證

明業(yè)務(wù)

參數(shù)的

可行性。

完畢對(duì)

業(yè)務(wù)領(lǐng)

域和業(yè)

務(wù)參數(shù)

的定義

后,您

可使用

以前環(huán)

節(jié)獲得

的信息

來(lái)構(gòu)建

業(yè)務(wù)標(biāo)

準(zhǔn)圖。公

司還需

要定義

也許使

用戶和

IT工作

組產(chǎn)生

混淆的

區(qū)域。例

如,往

返ping

的最長(zhǎng)

應(yīng)答時(shí)

間與在

遠(yuǎn)程位

置單擊

回車鍵

啟動(dòng)特

定應(yīng)用

最長(zhǎng)應(yīng)

答時(shí)間

有很大

區(qū)別。下

表列出

了美國(guó)

采用的

性能目

的:

網(wǎng)名各區(qū)

受影響的用往返ping應(yīng)

LAN99.99%5毫秒內(nèi)10毫秒

戶時(shí)間答

受影響的用100毫秒內(nèi)(往往返ping應(yīng)

WAN99.9%150毫秒

戶時(shí)間返ping)答

關(guān)鍵

受影響的用100毫秒內(nèi)(往往返ping應(yīng)

WAN及99.95%150毫秒

戶時(shí)間返ping)答

外聯(lián)網(wǎng)

?第5步:定義網(wǎng)絡(luò)業(yè)務(wù)

這是實(shí)現(xiàn)基本的服務(wù)水平管理的最后一步;它定義您實(shí)行用于

實(shí)現(xiàn)服務(wù)水平目的的被動(dòng)/積極流程和管理功能。最終文獻(xiàn)通

常被稱作“運(yùn)營(yíng)支持計(jì)劃”。大多數(shù)應(yīng)用支持計(jì)劃只涉及被動(dòng)

支持規(guī)定。在高可用性環(huán)境中,公司必須考慮采用積極的管理

流程,以便在網(wǎng)絡(luò)故障發(fā)生前對(duì)其進(jìn)行隔離并加以解決解決。

總的來(lái)說(shuō),最終文獻(xiàn)應(yīng):

?描述用于實(shí)現(xiàn)服務(wù)水平目的的被動(dòng)和積極流程

?介紹業(yè)務(wù)流程的管理方式

?介紹測(cè)量業(yè)務(wù)目的和業(yè)務(wù)流程的方式

本部分將描述

許多服務(wù)供應(yīng)嚴(yán)重級(jí)別2嚴(yán)重級(jí)別3嚴(yán)重級(jí)別4

商和公司均需

考慮的積極和

被動(dòng)業(yè)務(wù)定義

的實(shí)例。構(gòu)建

服務(wù)水平定義

的目的是創(chuàng)建

滿足可用性及

性能目的的業(yè)

務(wù)。為了實(shí)現(xiàn)

上述目的,公

司必須構(gòu)建業(yè)

務(wù),并謹(jǐn)記當(dāng)

前的技術(shù)限制

因素、可用性

預(yù)算及應(yīng)用資

料庫(kù)。特別是,

公司應(yīng)定義并

構(gòu)建始終可以

在可用性模式

規(guī)定的時(shí)間內(nèi)

快速擬定并排

除故障的業(yè)

務(wù)。公司還必

須定義可快速

辨認(rèn)并解決潛

在業(yè)務(wù)問題的

業(yè)務(wù),假如忽

略這些問題,

將對(duì)可用性及

性能產(chǎn)生負(fù)面

影響。

實(shí)現(xiàn)抱負(fù)的服

務(wù)水平非一朝

一夕之事。專

業(yè)水準(zhǔn)低、當(dāng)

前流程限制或

人員不合格等

缺陷將妨礙公

司實(shí)現(xiàn)抱負(fù)的

標(biāo)準(zhǔn)或目的,

即使在完畢對(duì)

以前業(yè)務(wù)環(huán)節(jié)

的分析后也是

如此。沒有一

種方法可將所

需服務(wù)水平與

抱負(fù)目的準(zhǔn)確

匹配。為了適

應(yīng)現(xiàn)實(shí)情況,

公司應(yīng)測(cè)量業(yè)

務(wù)標(biāo)準(zhǔn)及用于

支持業(yè)務(wù)標(biāo)準(zhǔn)

的業(yè)務(wù)參數(shù)。

假如沒有達(dá)成

業(yè)務(wù)目的,公

司應(yīng)運(yùn)用業(yè)務(wù)

測(cè)量標(biāo)準(zhǔn)來(lái)幫

助了解問題。

在許多情況

下,可適當(dāng)增

長(zhǎng)預(yù)算以改善

支持業(yè)務(wù),并

使這些改善功

能成為實(shí)現(xiàn)抱

負(fù)業(yè)務(wù)目的的

必要條件。公

司也許會(huì)逐步

進(jìn)行多次調(diào)節(jié)

(涉及業(yè)務(wù)目

的或業(yè)務(wù)定

義),以使網(wǎng)

絡(luò)業(yè)務(wù)與商業(yè)

規(guī)定保持一

致。

例如,當(dāng)目的

遠(yuǎn)遠(yuǎn)高于

99.9%可用性

時(shí),公司也許

只實(shí)現(xiàn)了99%

的可用性。在

服務(wù)及支持測(cè)

量標(biāo)準(zhǔn)方面,

公司代表發(fā)現(xiàn)

硬件替換約需

要24小時(shí),遠(yuǎn)

遠(yuǎn)高出最初的

估計(jì)的4小時(shí)。

此外,公司還

發(fā)現(xiàn)積極管理

功能受到忽視

且故障的冗余

網(wǎng)絡(luò)設(shè)計(jì)沒有

及時(shí)修復(fù)。公

司發(fā)現(xiàn)的問題

尚有缺少實(shí)行

改善的員工

等。因此,考

慮減少當(dāng)前服

務(wù)目的后,公

司便投資購(gòu)買

實(shí)現(xiàn)抱負(fù)服務(wù)

水平所需的其

他資源。業(yè)務(wù)

定義應(yīng)同時(shí)涉

及積極和被動(dòng)

支持定義。被

動(dòng)定義規(guī)定公

司如何解決根

據(jù)用戶投訴或

網(wǎng)絡(luò)管理功能

中擬定已經(jīng)發(fā)

生的問題。枳

極定義描述公

司如何擬定并

解決潛在的網(wǎng)

絡(luò)問題,涉及

修復(fù)故障的

“備用”網(wǎng)絡(luò)

組件、錯(cuò)誤檢

測(cè)、容量門限

問題及升級(jí)問

題等。以下提

供積極與被動(dòng)

服務(wù)水平定義

實(shí)例。

被動(dòng)服務(wù)水平

定義

以下的服務(wù)水

平領(lǐng)域通常使

用幫助臺(tái)數(shù)據(jù)

庫(kù)記錄數(shù)據(jù)進(jìn)

行測(cè)量并定期

審計(jì)。下表顯

示公司故障嚴(yán)

重限度的實(shí)

例。請(qǐng)注意:

此表不涉及解

決新業(yè)務(wù)請(qǐng)求

的方式,這項(xiàng)

工作可通過(guò)

SLA或其他應(yīng)

用資料庫(kù)編制

及性能假設(shè)分

析來(lái)完畢。假

如通過(guò)相同的

支持流程進(jìn)行

解決,新業(yè)務(wù)

請(qǐng)求可以數(shù)據(jù)

嚴(yán)重級(jí)別5o

嚴(yán)重級(jí)別1

嚴(yán)重的業(yè)務(wù)影網(wǎng)絡(luò)功能的丟失或降某些特定的網(wǎng)絡(luò)

對(duì)公司無(wú)業(yè)

響級(jí)對(duì)業(yè)務(wù)導(dǎo)致嚴(yán)重影功能丟失或降級(jí),

務(wù)影響的功

LAN用戶或服響,也許需要運(yùn)營(yíng)應(yīng)如:冗余丟失等

能查詢或故

務(wù)器部分停機(jī)變措施園區(qū)LAN性能受到

嚴(yán)重的WAN站園區(qū)LAN故障停機(jī);影響LAN冗余丟

點(diǎn)故障停機(jī)5-99名用戶受到影響失

國(guó)內(nèi)WA\站點(diǎn)故障停

機(jī)

國(guó)際WA\站點(diǎn)故障停

機(jī)

嚴(yán)重影響性能

完畢問題

嚴(yán)重性級(jí)

別定義之

后,定義

或研究創(chuàng)

建業(yè)務(wù)應(yīng)

答定義的

支持流程。職責(zé)目的

總的來(lái)說(shuō),

業(yè)務(wù)應(yīng)答

定義規(guī)定

采用分級(jí)

支持結(jié)構(gòu),

以及幫助

臺(tái)軟件支

持系統(tǒng)來(lái)

運(yùn)用故障

票跟蹤問

題。同時(shí)還

應(yīng)為每個(gè)

優(yōu)先級(jí)故

障的應(yīng)答

時(shí)間和解

決時(shí)間、按

優(yōu)先級(jí)劃

分的呼喊

數(shù)量以及

應(yīng)答解決

質(zhì)量制定

測(cè)量標(biāo)準(zhǔn)。

定義支持

流程可幫

助定義公

司內(nèi)部每

個(gè)支持級(jí)

別的目的

及其任務(wù)

與責(zé)任。這

有助于公

司了解用

于每個(gè)支

持級(jí)別的

資源規(guī)定

及專業(yè)技

術(shù)水平。下

表舉例說(shuō)

明了分級(jí)

支持結(jié)構(gòu)

及其問題

解決指導(dǎo)

原則。

支持級(jí)別

專職幫助臺(tái)支持

第1級(jí)支接聽支持甩話、發(fā)放故障票、15分鐘

解決40%的入局呼喊

持內(nèi)解決問題、記錄故障票并上報(bào)到第

2級(jí)支持

隊(duì)列監(jiān)控、網(wǎng)絡(luò)管理、工作站管理

第2級(jí)支在第2級(jí)解決所有呼

為擬定的軟件故障發(fā)放故障票

持喊

實(shí)行

接聽第1級(jí)、供應(yīng)商的電話,并上報(bào)

到第3級(jí)支持

對(duì)呼喊負(fù)責(zé),直到排障為止

必須立刻為第2級(jí)提供優(yōu)先級(jí)為1的

第3級(jí)支所有故障所需的支持

不直接對(duì)故障負(fù)責(zé)

持批準(zhǔn)在SLA解決期限內(nèi)幫助解決所有

第2級(jí)未排除的故障

下一步是

擬定業(yè)務(wù)

應(yīng)答及排

障業(yè)務(wù)定

義。它為

如何快速

排障(涉第2級(jí)應(yīng)現(xiàn)場(chǎng)第2

幫助臺(tái)應(yīng)答硬件更換解決問題

及硬件更答級(jí)

換在內(nèi))

制定了目

的。為這

個(gè)領(lǐng)域制

定目的是

非常重要

的,由于

業(yè)務(wù)應(yīng)答

及恢復(fù)時(shí)

間直會(huì)接

影響網(wǎng)絡(luò)

的可用

性。問題

解決時(shí)間

也要與可

用性預(yù)算

保持一

致。假如

在制定可

用性預(yù)算

時(shí)未將大

量高嚴(yán)重

級(jí)別的故

障考慮在

內(nèi),則公

司隨后將

需開展大

量工作來(lái)

了解此類

故障的根

源及也許

的填補(bǔ)方

法。詳見

下表:

問題嚴(yán)重

級(jí)別

立刻上報(bào)到第2

級(jí),網(wǎng)絡(luò)運(yùn)營(yíng)部

15分鐘2小時(shí)2小時(shí)4小時(shí)

經(jīng)理

立刻上報(bào)到第2

級(jí),網(wǎng)絡(luò)運(yùn)營(yíng)部

25分鐘4小時(shí)4小時(shí)8小時(shí),

經(jīng)理

315分鐘2小時(shí)12小時(shí)24小時(shí)36小時(shí)

415分鐘4小時(shí)3天3天6天

除業(yè)務(wù)應(yīng)答

及業(yè)務(wù)排障嚴(yán)重級(jí)別

嚴(yán)重級(jí)別:1嚴(yán)重級(jí)別2嚴(yán)重級(jí)別3

外,還需制4

定上報(bào)規(guī)定。

上報(bào)表有助

于保證將可

用資源集中

用于解決嚴(yán)

重影響業(yè)務(wù)

的問題。總的

來(lái)說(shuō),假如

分析員集中

精力解決問

題時(shí),他們

很少重視運(yùn)

用其他資源

來(lái)解決問題。

定義何時(shí)需

要其他資源

有助于促進(jìn)

管理層對(duì)問

題的結(jié)識(shí),

并有助于促

成未來(lái)的積

極測(cè)量或防

止性測(cè)量。詳

見下表:

過(guò)去的時(shí)間

網(wǎng)絡(luò)運(yùn)營(yíng)部經(jīng)

5分鐘理、第3級(jí)支持、

聯(lián)網(wǎng)部主管

及時(shí)告知網(wǎng)絡(luò)及時(shí)告知網(wǎng)絡(luò)運(yùn)

運(yùn)營(yíng)部經(jīng)理、第營(yíng)部經(jīng)理、第3

1小時(shí)

3級(jí)支持、聯(lián)網(wǎng)級(jí)支持、聯(lián)網(wǎng)部主

部主管管

上報(bào)副總裁、及

時(shí)告知主任及

2小時(shí)

網(wǎng)絡(luò)運(yùn)營(yíng)部經(jīng)

向副總裁、主

管、運(yùn)營(yíng)部經(jīng)

上報(bào)副總裁,及

理、第3級(jí)支持

時(shí)告知主管及網(wǎng)

4小時(shí)提交根源分析,

絡(luò)運(yùn)營(yíng)部經(jīng)理

向CEO告知未排

除的故障

網(wǎng)絡(luò)運(yùn)營(yíng)

24小時(shí)

部經(jīng)理

網(wǎng)絡(luò)運(yùn)營(yíng)

5天

部經(jīng)理

迄今為止,服

務(wù)水平定義始

終集中在運(yùn)營(yíng)

支持部門如何

在問題發(fā)生后

對(duì)其采用被動(dòng)

措施上。運(yùn)營(yíng)部

門數(shù)年前便制

定出了涉及上

述相似內(nèi)容的

積極故障辨認(rèn)率被動(dòng)故障辨認(rèn)率

運(yùn)營(yíng)支持計(jì)劃。

然而,該方案

中忽略了部門

如何辨認(rèn)問題

以及他們將辨

認(rèn)哪些故障等

內(nèi)容。比較成

熟的網(wǎng)絡(luò)公司

試圖制定預(yù)先

擬定的網(wǎng)絡(luò)問

題百分率目的

來(lái)解決這個(gè)問

題,而不是通

過(guò)用戶故障報(bào)

告或投訴來(lái)被

動(dòng)地?cái)M定故障。

下表列出了公

司對(duì)積極支持

功能和被動(dòng)支

持功能的整體

測(cè)量目的。

網(wǎng)絡(luò)領(lǐng)域

LAN80%20%

WAN80%20%

這為擬

定更多

的積極

支持定檢測(cè)方5x8告7x5x8排7x24排

義開了法知24告知障障

一個(gè)好

頭,由

于它測(cè)

量起來(lái)

很簡(jiǎn)樸、

也很容

易特

別在積

極檢測(cè)

工具可

自動(dòng)生

成故障

票。這

尚有助

于將網(wǎng)

絡(luò)管理

工具/信

息集中

用于積

極排障,

而不是

在故障

發(fā)生后

被動(dòng)地

查找根

源。然

而,這

種方法

的重要

問題在

于它無(wú)

法定義

積極支

持規(guī)定。

這通常

會(huì)導(dǎo)致

積極支

持管理

功能問

的差距

并導(dǎo)致

更大的

可用性

風(fēng)險(xiǎn)。

積極服

務(wù)水平

定義

更全面

的制定

服務(wù)水

平定義

方法涉

及,更

具體地

解釋如

何7x24

全天候

地監(jiān)控

網(wǎng)絡(luò),

以及運(yùn)

營(yíng)部門

如何7x

24全天

候?qū)σ?/p>

定義的

網(wǎng)絡(luò)管

理站

(NMS)

門限做

出響應(yīng)。

鑒于管

理信息

站(MIB)

數(shù)量的

不擬定

性以及

提供MIB

的網(wǎng)絡(luò)

管理信

息數(shù)量

與網(wǎng)絡(luò)

的運(yùn)營(yíng)

情況相

關(guān),因

此這看

上去是

一項(xiàng)無(wú)

法完畢

的任務(wù)。

同時(shí),

完畢這

項(xiàng)任務(wù)

需大量

資源且

代價(jià)非

常高昂。

不幸的

是,這

些缺陷

大大妨

礙了我

們對(duì)積

極業(yè)務(wù)

定義的

實(shí)行,

而這種

實(shí)行從

本質(zhì)上

來(lái)說(shuō)非

常簡(jiǎn)樸

輕松,

且只合

用于可

用性或

性能風(fēng)

險(xiǎn)極大

的網(wǎng)絡(luò)。

假如公

司隨后

看到了

基本積

極業(yè)務(wù)

定義的

價(jià)值,

那么只

要采用

分階段

實(shí)行的

方法,

就可以

逐漸添

加更多

變量,

但不會(huì)

對(duì)業(yè)務(wù)

產(chǎn)生重

大影響。

所有運(yùn)

營(yíng)支持

方案中

均應(yīng)涉

及第一

個(gè)領(lǐng)域

的積極

業(yè)務(wù)定

義。該業(yè)

務(wù)定義

只是簡(jiǎn)

樸闡述

運(yùn)營(yíng)部

門如何

辨認(rèn)不

同網(wǎng)絡(luò)

區(qū)域中

的網(wǎng)絡(luò)

或鏈路

故障并

對(duì)此做

出響應(yīng)。

沒有這

個(gè)定義

(或管

理支

持),公

司也許

碰到支

持不穩(wěn)

定、無(wú)法

達(dá)成用

戶盼望

等問題,

最終會(huì)

減少網(wǎng)

絡(luò)可用

性。

下表顯

示了公

司如何

針對(duì)鏈

路/設(shè)備

故障制

定服務(wù)

定義。該

實(shí)例中

的公司

在天天

的不同

時(shí)段及

網(wǎng)名各區(qū)

域方面

有著不

同的告

知和響

應(yīng)規(guī)定。

網(wǎng)絡(luò)設(shè)

備或鏈

路故障

SNMP設(shè)NOC創(chuàng)建故自動(dòng)向負(fù)責(zé)NOC在15分立刻研究并排

備和鏈障票、向負(fù)LAN的人員鐘內(nèi)派出除優(yōu)先級(jí)1和2

核心LAN

路輪詢責(zé)LAN的人發(fā)出尋呼、LAN分析員、的故障、優(yōu)先

陷阱員發(fā)出尋呼LAN負(fù)責(zé)人根據(jù)業(yè)務(wù)應(yīng)級(jí)3和4的故

員為核心答定義解決障排隊(duì)等候次

LAN隊(duì)列創(chuàng)問題日上午排除

建故障票

自動(dòng)向負(fù)責(zé)

立刻研究并排

WAN的人員NOC在15分

SNMP設(shè)NOC創(chuàng)建故除優(yōu)先級(jí)1和2

發(fā)出尋呼、鐘內(nèi)派出

國(guó)內(nèi)備和鏈障票、向負(fù)的故障、優(yōu)先

WAN負(fù)責(zé)人WAN分析員、

WAN路輪詢責(zé)WAN的人級(jí)3和4的故

員為核心根據(jù)業(yè)務(wù)應(yīng)

陷阱員發(fā)出尋呼障排隊(duì)等候次

WAN隊(duì)列創(chuàng)答定義排障

日上午排除

建故障票

自動(dòng)向負(fù)責(zé)

合作伙伴的

NOC在15分立刻研究并排

NOC創(chuàng)建故人員發(fā)出尋

SNMP設(shè)鐘內(nèi)派出合除優(yōu)先級(jí)1和2

障票、向負(fù)呼,合作伙

備和鏈作伙伴分析的故障、優(yōu)先

外聯(lián)網(wǎng)責(zé)合作伙伴伴負(fù)責(zé)人員

路輪詢員、根據(jù)業(yè)級(jí)3和4的故

的人員發(fā)出為合作伙伴

陷阱務(wù)應(yīng)答定義障排隊(duì)等候次

尋呼隊(duì)列創(chuàng)建故

排障日上午排除

障票

?其余的積極服務(wù)水平定義可提成兩類:網(wǎng)絡(luò)錯(cuò)誤和容量/性能

問題。只有少數(shù)網(wǎng)絡(luò)公司擁有這兩個(gè)領(lǐng)域的服務(wù)水平定義。因

此,這些問題常被忽視或無(wú)法得到統(tǒng)一解決。這對(duì)某些網(wǎng)絡(luò)環(huán)

境的影響也許不大,但高可用性環(huán)境一般都需要一致的積極業(yè)

務(wù)管理。

網(wǎng)絡(luò)公司希望實(shí)現(xiàn)積極業(yè)務(wù)定義的因素很多,重要是他們尚未

基于可用性風(fēng)險(xiǎn)、可用性規(guī)劃及應(yīng)用問題對(duì)積極業(yè)務(wù)定義進(jìn)行

規(guī)定分析,致使積極業(yè)務(wù)定義的規(guī)定及優(yōu)勢(shì)不明確,這重要是

由于需要更多的資源。

第二個(gè)因素是要平衡可以運(yùn)用現(xiàn)有及新定義的資源來(lái)實(shí)行的積

極管理數(shù)量。但生成這些告警就也許對(duì)可用性或性能產(chǎn)生嚴(yán)重

影響。您還必須考慮事件關(guān)聯(lián)管理或流程,以保證不就同樣的

問題生成多個(gè)積極故障票。最后一個(gè)因素在于:創(chuàng)建一組全新

的積極告警經(jīng)常會(huì)生成以前未檢測(cè)出的初始信息流。運(yùn)營(yíng)部門

必須為解決這些最初問題以及增長(zhǎng)短期資源做好準(zhǔn)備,以便解

決這些以前未檢測(cè)出的問題。

第一類積極服務(wù)水平定義是網(wǎng)絡(luò)錯(cuò)誤。網(wǎng)絡(luò)錯(cuò)誤還可細(xì)分為系

統(tǒng)錯(cuò)誤(涉及軟硬件錯(cuò)誤)、協(xié)議錯(cuò)誤、媒介控制錯(cuò)誤、準(zhǔn)確

性錯(cuò)誤及環(huán)境警告。制定服務(wù)水平定義一方面耍耍大體了解如

何檢測(cè)出此類問題、由誰(shuí)負(fù)責(zé)解決問題以及故障的影響。必要

時(shí)在服務(wù)水平定義中添加特定的信息或問題。您也許還需要在

以下領(lǐng)域開展更多工作以保證成功定義:

?第1.2和3級(jí)支持的責(zé)任

?運(yùn)用運(yùn)營(yíng)部門可以有效開展的積極工作量來(lái)平衡網(wǎng)絡(luò)管理信息

的優(yōu)先級(jí)

?按規(guī)定進(jìn)行培訓(xùn)以便保證支持人員可以有效地解決定義的告警

?擬定事件關(guān)聯(lián)方法以保證不為同樣的問題生成多個(gè)故障票

記錄特定信息或告警,以幫助辨認(rèn)屬于第1級(jí)支持級(jí)別的事件

下表是用于網(wǎng)

絡(luò)錯(cuò)誤的服務(wù)

水平實(shí)例,幫

助您明確了解

誰(shuí)負(fù)責(zé)發(fā)送積

極網(wǎng)絡(luò)故隙告

警、如何擬定

檢測(cè)方法門限采用的行動(dòng)

故障以及故障

影響。根據(jù)上

文所述,公司

尚需開展更多

工作以保證成

功。

故障類型

軟件故障(軟天天都使用系統(tǒng)發(fā)生任何優(yōu)先級(jí)審查問題、創(chuàng)建故

件導(dǎo)致的故障日記查看程序?qū)?、1和2的故障障票并在新問題出

停機(jī))核系統(tǒng)日記信息發(fā)生100多起優(yōu)先現(xiàn)或問題需要特別

由第2級(jí)支持完級(jí)3(或更高)的注意時(shí)派出人員解

畢故障決

任何第0、1和2

天天都使用系統(tǒng)審核問題、創(chuàng)建故

優(yōu)先級(jí)別的故障的

硬件故障(硬日記查看程序?qū)徴掀辈⒃谛聠栴}出

發(fā)生

件導(dǎo)致的故障核系統(tǒng)日記信息現(xiàn)或問題需要特別

發(fā)生100多起優(yōu)先

停機(jī))由第2級(jí)支持完注意時(shí)派遣人員解

級(jí)3(或更高)的

畢決

故障

使用系統(tǒng)日記查發(fā)生任何優(yōu)先級(jí)審核問題、創(chuàng)建故

協(xié)議錯(cuò)誤(只看程序每日審核0、1和2的故障障票并在新問題出

合用于IP路由系統(tǒng)日汜信息發(fā)生100多起第3現(xiàn)或問題需要特別

協(xié)議)由第2級(jí)支持完優(yōu)先級(jí)(或更高)注意時(shí)派出人員解

畢故障決

任何第0、1和2

使用系統(tǒng)日記查審核問題、創(chuàng)建故

媒介控制故障優(yōu)先級(jí)別的故障的

看程序每日審核障票并在新問題出

(只限于FDDI、發(fā)生

系統(tǒng)口汜信息現(xiàn)或問題需要特別

P0S及快速以發(fā)生100多起優(yōu)先

由第2級(jí)支持完注意時(shí)派出人員解

太網(wǎng))級(jí)3(或更高)的

畢決

故障

環(huán)境信息(電使用系統(tǒng)日記查對(duì)新問題創(chuàng)建故隙

任何信息

源和溫度)看程序每口審核票并派遣相關(guān)人員

系統(tǒng)日汜信息解決問題

由第2級(jí)支持完

每五分鐘進(jìn)行一

準(zhǔn)確度錯(cuò)誤輸入或輸犯錯(cuò)誤對(duì)新問題創(chuàng)建故障

次SNMP輪詢

(鏈路輸入錯(cuò)任何鏈路上、每5票并派出笫2級(jí)支

NOC受理的門限

誤)分鐘出現(xiàn)一次錯(cuò)誤持人員解決問題

事件

?另一類積極服務(wù)水平是性能及容量。真正的性能和容量管理涉

及例外情況管理、基準(zhǔn)制定與趨勢(shì)分析以及假設(shè)分析。服務(wù)水

平定義只定義需要調(diào)查或更新的性能及容量的例外門限以及平

均門限。隨后,可以以某種方式將這些門限應(yīng)用到三種性能和

容量管理流程中。

容量及性能服務(wù)水平定義可細(xì)提成幾個(gè)類別:網(wǎng)絡(luò)鏈路、網(wǎng)絡(luò)

設(shè)備、端到端性能及應(yīng)用性能。制定這些領(lǐng)域的服務(wù)水平定義

需要具有與設(shè)備容量、媒介容量、QoS特性及應(yīng)用規(guī)定的特定

領(lǐng)域相關(guān)的淵博技術(shù)知識(shí)。出于這個(gè)因素,我們建議網(wǎng)絡(luò)設(shè)計(jì)

師通過(guò)供應(yīng)商輸入的信息制定與性能和容量相關(guān)的服務(wù)水平定

義。

與網(wǎng)絡(luò)錯(cuò)誤相似,為容量和性能制定服務(wù)水平定義一方面應(yīng)大

體了解如何檢測(cè)此類故障、由誰(shuí)負(fù)責(zé)排障以及故障的影響。必

要時(shí)向服務(wù)水平定義中添加特定的信息或問題。您也許還需要

在以下領(lǐng)域開展更多工作以保證成功:

?明確了解應(yīng)用性能規(guī)定

?基于業(yè)務(wù)規(guī)定及總成本,對(duì)公司重要的門限值進(jìn)行進(jìn)一步的技

術(shù)研究

.預(yù)算周期以內(nèi)和以外的升級(jí)規(guī)定

?第1.2和3級(jí)支持的責(zé)任

?運(yùn)用運(yùn)營(yíng)部門可以有效開展的積極工作量平衡的網(wǎng)絡(luò)管理信息

的優(yōu)先級(jí)及危急限度

?按規(guī)定進(jìn)行培訓(xùn)以便保證支持人員了解信息或告警,并可有效

地解決所定義的情況

?擬定事件關(guān)聯(lián)方法以保證不為同樣的問題生成多個(gè)故障票

記錄特定信息或告警,以幫助辨認(rèn)屬于第1級(jí)支持的事件

下表是面向鏈路

使用情況的服務(wù)

水平定義實(shí)例,

幫助您明確了解

檢測(cè)方法門限采用的行動(dòng)

誰(shuí)負(fù)責(zé)發(fā)送積極

網(wǎng)絡(luò)故障告警、

如何擬定故障以

及故障影響。公

司仍需開展上面

定義的更多工作

以保證成功。

網(wǎng)絡(luò)領(lǐng)域/媒介

向性能和容量電

五分鐘進(jìn)行一次每五分鐘的使

子郵件別名發(fā)送

SNMP輪詢用率為50%

園區(qū)LAN骨干及電子郵件告知

核心及分派鏈路通過(guò)例外陷阱

分派鏈路安排小組組解決

上的RMON例外陷實(shí)現(xiàn)90%的使用

問題或制定升級(jí)

阱率

計(jì)戈U

向性能電子郵件

別名發(fā)送電子郵

件告知

五分鐘進(jìn)行一次每五分鐘的使

國(guó)內(nèi)WAN鏈路安排工作組評(píng)估

SNMP輪詢用率為75%

QoS規(guī)定或?yàn)榉?/p>

復(fù)出現(xiàn)的故障制

定升級(jí)計(jì)劃

向性能和容量電

子郵件別名發(fā)送

五分鐘進(jìn)行一次每五分鐘的使

外聯(lián)網(wǎng)WAN鏈路電子郵件告知

SNMP輪詢用率為65%

安排工作組評(píng)估

QoS規(guī)定或?yàn)榉?/p>

復(fù)出現(xiàn)的故障制

定升級(jí)計(jì)劃

下表給出了設(shè)備容

量和性能門限的服

務(wù)水平定義,以保

證您創(chuàng)建對(duì)防止出

現(xiàn)網(wǎng)絡(luò)故障或可用

性問題故意義、很

有用的門限。這是重要信息檢測(cè)方法門限采用的行動(dòng)

一個(gè)非常重要的領(lǐng)

域,由于未檢測(cè)出

的設(shè)備控制板資源

問題可對(duì)網(wǎng)絡(luò)導(dǎo)致

嚴(yán)重影響。

設(shè)備

五分鐘內(nèi)的向性能和容量

五分鐘進(jìn)行CPU使用率門電子郵件別名

一次SNMP限是75%,達(dá)工作組發(fā)送電

CPU、內(nèi)

Cisco7500輪詢成99%時(shí),運(yùn)子郵件告知以

存、顯卡

面向CPU的用RMON發(fā)出便解決問題或

RM0N告知告知五分鐘制定升級(jí)計(jì)劃

內(nèi)的內(nèi)存使RMONCPU為

用率門限是99%,發(fā)放故障

50%、顯卡使票并向第2級(jí)

用率門限是支持人員發(fā)送

99%尋呼

五分鐘內(nèi)的向性能和容量

CPU使用率門電子郵件別名

五分鐘進(jìn)行

CPU、內(nèi)限是75%五分工作組發(fā)送電

Cisco2600一次SNMP

存、鐘內(nèi)的內(nèi)存子郵件告知以

輪詢

使用率門限便解決問題或

是50%制定升級(jí)計(jì)劃

向性能和容量

背板使用率電子郵件別名

背板使用五分鐘進(jìn)行

門限是50%工作組發(fā)送電

Catalyst?5000情況、內(nèi)一次SNMP

內(nèi)存使用率子郵件告知以

存輪詢

門限是75%便解決問題或

制定升級(jí)計(jì)劃

向性能和容量

CPU使用率匚1

LightStream?1010五分鐘進(jìn)行電子郵件別名

限是65%

ATMCPU、內(nèi)存一次SNMP工作組發(fā)送電

內(nèi)存使用率

switch輪詢子郵件告知以

門限是50%

便解決問題或

制定升級(jí)計(jì)劃

下表給出了端到

端性能和容量的

服務(wù)水平定義。

這些門限值一般

基于應(yīng)用規(guī)定,

但也可用于指示

某類網(wǎng)絡(luò)性能或

容量問題。由于

測(cè)量網(wǎng)絡(luò)中任意

兩點(diǎn)間的性能需

要大量資源并會(huì)測(cè)量方法門限采用的行動(dòng)

帶來(lái)大量的網(wǎng)絡(luò)

開銷,所以大多

數(shù)有性能服務(wù)水

平的公司都只創(chuàng)

建少數(shù)性能定

義。這些端到端

的性能問題也也

許出現(xiàn)在鏈路或

設(shè)備容量門限

中。我們建議根

據(jù)地理位置制定

一般定義。必要

時(shí)需添加一些關(guān)

鍵站點(diǎn)及鏈路。

網(wǎng)絡(luò)領(lǐng)域/媒介

向性能和容量電

無(wú)子郵件別名工作

始終保證10-毫

不會(huì)出現(xiàn)問題組發(fā)送電子郵件

園區(qū)LAN秒或更短的往

很難測(cè)量整個(gè)LAN基告知以便解決問

返響應(yīng)時(shí)間或

礎(chǔ)設(shè)施題或制定升級(jí)計(jì)

向性能電子郵件

別名工作組發(fā)送

目前只使用互聯(lián)網(wǎng)

電子郵件告知,

監(jiān)視器(IPM)和ICMP五分鐘內(nèi)平均

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論