已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
IT運維監(jiān)控管理平臺建設(shè)方案XXXXXXXIT系統(tǒng)監(jiān)控管理平臺項目技術(shù)方案(運維綜合監(jiān)控管理)目錄第1章 概述31.1 建設(shè)背景31.2 建設(shè)目標31.3 建設(shè)思路4第2章 系統(tǒng)總體設(shè)計52.1 總體架構(gòu)52.2 設(shè)計原則62.3 運維管理體系架構(gòu)設(shè)計72.3.1 系統(tǒng)總體架構(gòu)設(shè)計72.3.2 監(jiān)控采集層82.3.3 數(shù)據(jù)處理層82.3.4 運行展現(xiàn)層82.4 系統(tǒng)技術(shù)路線92.4.1 采用Java語言開發(fā)92.4.2 采用J2EE框架102.4.3 采用WebService進行數(shù)據(jù)互連互通102.4.4 數(shù)據(jù)庫技術(shù)122.4.5 性能控制132.4.6 開發(fā)、運行環(huán)境132.5 應用接口總體設(shè)計132.5.1 系統(tǒng)內(nèi)部集成接口132.5.2 與基礎(chǔ)運維管理工具的集成接口142.5.3 與ITSM系統(tǒng)的集成接口142.5.4 與相關(guān)外部系統(tǒng)的統(tǒng)一身份認證與單點登錄接口142.6 系統(tǒng)安全設(shè)計及部署152.6.1 輸入檢驗152.6.2 GET請求和Cookie中的敏感數(shù)據(jù)152.6.3 防通過嵌入標記實現(xiàn)的攻擊152.6.4 防口令猜測功能162.6.5 頁面和字段級的權(quán)限控制162.6.6 系統(tǒng)安全架構(gòu)16第3章 系統(tǒng)功能設(shè)計173.1 動環(huán)監(jiān)控173.1.1 配電柜監(jiān)測173.1.2 配電開關(guān)及電流監(jiān)控173.1.3 發(fā)電機監(jiān)控183.1.4 ATS監(jiān)測183.1.5 STS監(jiān)測183.1.6 UPS監(jiān)控子系統(tǒng)193.2 統(tǒng)一門戶子系統(tǒng)193.2.1 信息主管領(lǐng)導內(nèi)容展示203.2.2 運維人員內(nèi)容展現(xiàn)203.2.3 一般用戶內(nèi)容展現(xiàn)213.3 IT運行監(jiān)控子系統(tǒng)213.3.1 基礎(chǔ)平臺功能213.3.2 網(wǎng)絡設(shè)備管理233.3.3 服務器監(jiān)控管理263.3.4 存儲監(jiān)控管理293.3.5 數(shù)據(jù)庫監(jiān)控管理293.3.6 中間件監(jiān)控管理303.3.7 web與應用監(jiān)控管理313.3.8 虛擬化監(jiān)控管理323.3.9 IP地址管理管理333.3.10 信息點管理343.3.11 告警監(jiān)控管理與轉(zhuǎn)發(fā)處理353.3.12 綜合監(jiān)控管理363.3.13 綜合報表管理373.4 IT服務管理子系統(tǒng)383.4.1 功能特點383.4.2 服務臺管理413.4.3 服務目錄管理423.4.4 服務請求管理423.4.5 事件管理433.4.6 問題管理433.4.7 變更管理443.4.8 值班管理443.4.9 公告管理453.4.10 IT運維報告453.4.11 用戶管理46第4章 培訓方案46第5章 系統(tǒng)價值47第6章 售后服務47IT系統(tǒng)監(jiān)控管理平臺項目技術(shù)方案(運維綜合監(jiān)控管理)第1章 概述1.1 建設(shè)背景隨著近年來經(jīng)濟的進一步迅速發(fā)展,企事業(yè)機關(guān)單位IT運行環(huán)境日趨復雜,運行監(jiān)控工作難度加大,尤其是隨著信息化建設(shè)的不斷深入,信息系統(tǒng)越來越多,各類系統(tǒng)越來越復雜,系統(tǒng)的關(guān)聯(lián)度也越來越高。數(shù)據(jù)處理量成倍增長,而隨著互聯(lián)網(wǎng)應用的發(fā)展,網(wǎng)上應用系統(tǒng)也越來越多,使IT系統(tǒng)運行環(huán)境變得更加復雜,造成了機房管理、系統(tǒng)監(jiān)控、運行維護工作十分困難的局面。雖然信息中心各科室對已經(jīng)有各的監(jiān)控管理手段,但缺乏一個集中、統(tǒng)一的監(jiān)控平臺,及時發(fā)現(xiàn)與解決網(wǎng)絡、硬件、安全設(shè)備、操作系統(tǒng)、數(shù)據(jù)庫、中間件、應用系統(tǒng)、機房空調(diào)、UPS等突然出現(xiàn)的問題。因服務對象的不同,使用產(chǎn)品混雜。怎樣很好地解決以上問題,把各種類型的監(jiān)控對象進行統(tǒng)一集中監(jiān)控,并將其格式統(tǒng)一規(guī)范,并對其有效處理、分析,以直觀的界面展現(xiàn)給各科室管理員、領(lǐng)導,成為目前面臨最大的挑戰(zhàn)。1.2 建設(shè)目標加強信息資源的維護平臺建設(shè),提高信息資源的運行管理水平,通過運維體系的建設(shè),結(jié)合構(gòu)建集中式的服務熱線、運維流程、系統(tǒng)監(jiān)控和綜合展示系統(tǒng),通過系統(tǒng)聯(lián)動,及時、準確、全面反映與掌握信息系統(tǒng)的運行狀態(tài),保障各業(yè)務系統(tǒng)的正常運行,應達成如下目標:(1) 強化主動監(jiān)控,實現(xiàn)集中管理。以IT資源可用性監(jiān)控為主線,構(gòu)建統(tǒng)一集成的IT資源及應用服務監(jiān)控平臺,能夠主動、及時地發(fā)現(xiàn)問題,并調(diào)度資源解決問題,形成IT運維管理主動服務的新局面。(2) 幫助定位故障,快速恢復系統(tǒng)運行。建立集中的告警分析及展現(xiàn)平臺,提供靈活、自動化的事件處理能力。當故障產(chǎn)生時,可以進行故障的快速定位,發(fā)現(xiàn)故障原因,調(diào)度資源快速恢復系統(tǒng)服務,從而縮短故障解決時間,降低維護成本,提高系統(tǒng)整體可用性。(3) 掌握運行質(zhì)量與效率,合理利用資源。建立IT運維平臺后,可以實時了解全部IT資源的負載與使用情況,根據(jù)需要從整體角度考慮資源的使用,同時可以根據(jù)業(yè)務高峰期的不同來調(diào)劑業(yè)務系統(tǒng)對資源的使用。(4) 規(guī)范運行管理,有序開展維護。參照ITIL規(guī)范,對運維管理工作進行優(yōu)化,對服務管理進行改善,將管理數(shù)據(jù)電子化,管理過程規(guī)范化。根據(jù)相關(guān)制度進行運行維護管理,對內(nèi)完善流程,對外提高服務,加強管理,使流程更規(guī)范更合理,使技術(shù)人員具備更高的工作效率,提高業(yè)務技術(shù)能力和解決實際問題的能力。(5) 共享運維經(jīng)驗,完善知識庫。把運維過程中產(chǎn)生的豐富經(jīng)驗進行積累和總結(jié),形成有效的知識庫,建立知識的共享機制,提供信息共享和交流的平臺,提高運維人員的工作效率。1.3 建設(shè)思路IT運維管理理論、方法和標準,結(jié)合中心實際和建設(shè)需要,遵循立足需求、統(tǒng)一規(guī)劃、保障重點、分步實施、務求實效的原則,建立一套融合組織、制度、流程、人員、技術(shù)的IT運維管理體系,建立組織機構(gòu),制定規(guī)章制度,規(guī)范管理流程,明確職責分工,強化技術(shù)支撐,實現(xiàn)對網(wǎng)絡及信息系統(tǒng)的綜合管理監(jiān)控和日常技術(shù)支持,快速響應和及時解決信息系統(tǒng)運行過程中出現(xiàn)的各種問題和故障,確保所維護網(wǎng)絡及信息系統(tǒng)正常、穩(wěn)定、高效運行。第2章 系統(tǒng)總體設(shè)計2.1 總體架構(gòu)依據(jù)對IT運維管理體系的建設(shè)經(jīng)驗,以及對用戶信息系統(tǒng)現(xiàn)狀、需求的分析,我們提出三位一體綜合運維管理平臺框架圖如下:IT運維管理平臺包括:“IT運行集中監(jiān)控、IT運維流程服務、統(tǒng)一運維門戶”三個部分。底層基礎(chǔ)平臺主要實現(xiàn)對底層數(shù)據(jù)的采集、存儲、分析等工作,為上層監(jiān)控及流程系統(tǒng)提供基礎(chǔ)數(shù)據(jù);IT運行監(jiān)控主要完成對基礎(chǔ)設(shè)施故障、性能、配置等方面的全面監(jiān)控管理,實現(xiàn)主動式的IT管理;IT運維流程服務主要根據(jù)IT服務管理的國際標準ISO2000,并結(jié)合ITIL最佳實踐,梳理出了事件管理、問題管理、變更管理等運維流程,實現(xiàn)對日常運維工作的流程化、規(guī)劃范管理,提升IT服務的質(zhì)量。統(tǒng)一門戶主要實現(xiàn)對監(jiān)控信息、運維流程信息進行集中展示。平臺三個子系統(tǒng)關(guān)系如下:(1) 以IT運行監(jiān)控為“基礎(chǔ)”這部分的功能主要是對被管對象運行的狀態(tài)以及其配置資產(chǎn)信息進行統(tǒng)一監(jiān)控、管理、分析,實現(xiàn)對各種故障和性能異常的及時報警,對系統(tǒng)運行性能進行實時監(jiān)控,對系統(tǒng)運行的各種狀態(tài)信息進行匯總、分析以及預測。另外,還包括對IT系統(tǒng)的全部配置資產(chǎn)情況進行統(tǒng)一管理,對配置信息的異動提供檢查及告警。IT監(jiān)控管理除了實現(xiàn)網(wǎng)管的告警、性能、配置幾大基本功能以外,還從運維的角度提供豐富的數(shù)據(jù)綜合分析和運維工具,例如綜合報表、綜合監(jiān)控、信息點管理等。(2) 以IT服務管理為“導向”這部分功能主要依據(jù)ITIL架構(gòu)進行建設(shè),為IT系統(tǒng)的維護服務提供電子化的控制手段。系統(tǒng)通過事件管理、問題管理、變更管理、配置管理等功能,為IT維護人員提供以流程為基礎(chǔ)的服務管理方式,規(guī)范管理模式,達到快速消除IT系統(tǒng)故障、解決潛在問題,減少不規(guī)范的系統(tǒng)變更引發(fā)的系統(tǒng)故障率和故障隱患等目的,實現(xiàn)對IT系統(tǒng)的主動式服務,提高服務水平。(3) 以統(tǒng)一運維門戶為“體現(xiàn)”即是整個系統(tǒng)的對外界面,通過統(tǒng)一的權(quán)限管理和統(tǒng)一風格的B/S展現(xiàn),為系統(tǒng)的操作使用人員提供統(tǒng)一的系統(tǒng)接口,做到一點接入,通觀全局,能夠以靈活的組織數(shù)據(jù)的展現(xiàn)方式,定義用戶、角色、組織機構(gòu),并為每個不同角色提供不同的功能模塊,為每個用戶分配不同的展現(xiàn)內(nèi)容,方便用戶進行企業(yè)整體的運行維護管理。2.2 設(shè)計原則IT運維平臺作為信息中心未來運維工作的核心支撐系統(tǒng),需要系統(tǒng)本身具有高可靠、易擴展、易維護等特點,并且在系統(tǒng)功能應用上要具備一定的技術(shù)先進性和實用性。所以,本次項目的方案設(shè)計遵循以下設(shè)計原則:(1) 先進實用平臺注重先進性和實用性的統(tǒng)一,以實用為目的,合理選用各類成熟、先進技術(shù)。在體系結(jié)構(gòu)、功能算法等諸多方面都采用先進計算機技術(shù)和理論,應用功能體現(xiàn)實用性。(2) 可靠性在系統(tǒng)結(jié)構(gòu)、設(shè)計方案、設(shè)備選擇、技術(shù)服務等方面綜合考慮,保證系統(tǒng)能夠7*24安全無故障運行,系統(tǒng)有很好的容錯功能;對IT資源的監(jiān)測應保證不影響相關(guān)設(shè)備和系統(tǒng)的正常良好運行,并實現(xiàn)最好的響應效率及最小的資源占用。(3) 安全性注重安全方面的設(shè)計,確保IT運維監(jiān)控管理平臺的穩(wěn)定、安全運行。系統(tǒng)要保證數(shù)據(jù)的安全,不會增加現(xiàn)有應用系統(tǒng)的復雜性,更不會降低現(xiàn)有應用系統(tǒng)的穩(wěn)定性。(4) 開放性采用符合國際國內(nèi)標準的通用協(xié)議,為實現(xiàn)與其他系統(tǒng)監(jiān)控軟硬件互聯(lián)或接入本系統(tǒng)進行監(jiān)控提供接口,支持各種主流計算機平臺、操作系統(tǒng)以及數(shù)據(jù)庫廠商的各類軟硬件產(chǎn)品。(5) 可擴展、易集成系統(tǒng)需具備很好的擴展性,能適應不斷發(fā)展的業(yè)務需求。隨著IT資源種類和數(shù)量的擴大,系統(tǒng)也應能適應新的系統(tǒng)的對IT運維管理的需求。系統(tǒng)具備高度集成性,可以和第三方產(chǎn)品進行集成,進行功能擴展。系統(tǒng)提供開發(fā)工具和接口,方便其他監(jiān)控系統(tǒng)集成和統(tǒng)一管理。2.3 運維管理體系架構(gòu)設(shè)計與運維綜合監(jiān)控相關(guān)的運維管理體系架構(gòu)主要包括以下內(nèi)容:1)資源監(jiān)控與操作管理體系:面向資源,以統(tǒng)一資源配置庫(資產(chǎn)與配置、監(jiān)控數(shù)據(jù)庫)為基礎(chǔ),建設(shè)面向被管理資源的監(jiān)控管理與操作自動化管理體系。2)數(shù)據(jù)綜合分析體系:面向管理者,以統(tǒng)一資源配置庫為基礎(chǔ),對資源監(jiān)控與操作管理體系數(shù)據(jù)進行分析挖掘,建設(shè)輔助運營決策的數(shù)據(jù)綜合分析體系。運維管理體系架構(gòu)是一個完整的IT系統(tǒng)運維管理架構(gòu),是IT綜合運維管理的較高目標。2.3.1 系統(tǒng)總體架構(gòu)設(shè)計系統(tǒng)由監(jiān)控采集層、數(shù)據(jù)處理層、服務管理層、運行展現(xiàn)層組成。2.3.2 監(jiān)控采集層監(jiān)控采集層主要由網(wǎng)絡監(jiān)控模塊(NCC)、應用監(jiān)控模塊(BCC)組成,實現(xiàn)對IT基礎(chǔ)支撐系統(tǒng)的監(jiān)控,包括:網(wǎng)絡設(shè)備、業(yè)務服務器、存儲設(shè)備、數(shù)據(jù)庫系統(tǒng)、中間件系統(tǒng)、安全設(shè)備、業(yè)務應用系統(tǒng)、網(wǎng)絡流量等。同時,從第三方系統(tǒng)(如機房環(huán)境監(jiān)控和視頻監(jiān)控系統(tǒng)等)抽取數(shù)據(jù)(包括資產(chǎn)配置數(shù)據(jù)、故障告警數(shù)據(jù)),實現(xiàn)對IT資源的全面監(jiān)控。2.3.3 數(shù)據(jù)處理層數(shù)據(jù)處理層由統(tǒng)一事件平臺(Arbiter)、數(shù)據(jù)指標抽取模塊(Bridge)、監(jiān)控指標庫(RDB)、可視化展現(xiàn)視圖(Live)等模塊組成。監(jiān)控指標庫(RDB)存放了所有監(jiān)控對象的當前運行狀況、重要告警、重要KPI性能指標等數(shù)據(jù),實現(xiàn)性能基線管理,并為監(jiān)控對象的可視化展現(xiàn)提供數(shù)據(jù)支持。CMDB與RDB數(shù)據(jù)庫的記錄通過資源唯一標識ID(UUID)實現(xiàn)一一對應,并能夠自動維護其相互關(guān)聯(lián)關(guān)系。數(shù)據(jù)指標抽?。˙ridge)負責從底層監(jiān)控工具和第三方系統(tǒng)抽取各類管理數(shù)據(jù),如資產(chǎn)配置數(shù)據(jù)、性能數(shù)據(jù)、監(jiān)控對象運行狀態(tài)數(shù)據(jù)、故障告警數(shù)據(jù)等。其中故障告警數(shù)據(jù)送到統(tǒng)一事件平臺進行處理,性能和狀態(tài)數(shù)據(jù)進過處理后存放到RDB數(shù)據(jù)庫中,資產(chǎn)配置數(shù)據(jù)經(jīng)過數(shù)據(jù)清洗、調(diào)和處理后送到CMDB數(shù)據(jù)庫中。統(tǒng)一事件平臺負責對來源不同的告警信息進行過濾、壓縮和關(guān)聯(lián),以及對不同來源的性能數(shù)據(jù)進行規(guī)范、匯聚、分析等,并通過根源問題發(fā)現(xiàn)等功能,實現(xiàn)快速的故障定位,保證業(yè)務系統(tǒng)的監(jiān)控運行。靈動展現(xiàn)平臺是一個個性化監(jiān)控視圖開發(fā)工具,可以根據(jù)管理需求,對各類資源進行靈活組合,生成各類資源展現(xiàn)監(jiān)控視圖。2.3.4 運行展現(xiàn)層運行展現(xiàn)層有運維門戶(Portal)、用戶管理(ACM)、報表開發(fā)工具(Report)組成。運維門戶(portal):向用戶提供基于WEB的統(tǒng)一運維管理訪問入口,使用戶能夠在統(tǒng)一登錄、統(tǒng)一認證的情況下,實現(xiàn)對故障告警臺、服務臺、服務流程管理、監(jiān)控視圖、統(tǒng)計報表的訪問。報表開發(fā)工具能夠根據(jù)管理需要抽取監(jiān)控、操作、資產(chǎn)、流程等各管理層面的數(shù)據(jù),并生成各類統(tǒng)計報表,為運行分析和管理提升提供支持。用戶管理實現(xiàn)組織架構(gòu)管理、帳戶管理、角色管理、授權(quán)管理等功能,實現(xiàn)整個運維平臺的統(tǒng)一帳戶和授權(quán)管理。2.4 系統(tǒng)技術(shù)路線2.4.1 采用Java語言開發(fā)系統(tǒng)采用JAVA和XML相結(jié)合的技術(shù)進行網(wǎng)站設(shè)計開發(fā),由于Java的平臺無關(guān)等特性,而在數(shù)據(jù)表示和傳輸方面,XML有著得天獨厚的優(yōu)勢。Java與XML的組合提供了建立三層應用程序的最佳手段,開發(fā)的系統(tǒng)具有跨平臺運行的能力,無論在windows環(huán)境下還是在其他主流操作系統(tǒng)環(huán)境下都能運行。主要特點:平臺獨立性這是Java最吸引人的地方。由于它采用先編譯成中間碼(字節(jié)碼),然后裝載與校驗,再解釋成不同的機器碼來執(zhí)行,即“Java虛擬機”的思想,“屏蔽”了具體的“平臺環(huán)境”特性要求,使得只要能支持Java虛擬機,就可運行各種Java程序。面向?qū)ο蟮募夹g(shù)面向?qū)ο蟮募夹g(shù)是近年來軟件開發(fā)中用得最為普遍的程序設(shè)計方法,它通過把客觀事物進行分類組合、參數(shù)封裝、用成員變量來描述對象的性質(zhì)、狀態(tài),而用方法(成員函數(shù))來實現(xiàn)其行為和功能。面向?qū)ο蠹夹g(shù)具有繼承性、封裝性、多態(tài)性等眾多特點,Java在保留這些優(yōu)點的基礎(chǔ)上,又具有動態(tài)聯(lián)編的特性,更能發(fā)揮出面向?qū)ο蟮膬?yōu)勢。多線程多線程機制使應用程序能并行執(zhí)行,Java有一套成熟的同步原語,保證了對共享數(shù)據(jù)的正確操作。通過使用多線程,程序設(shè)計者可以分別用不同的線程完成特定的行為,而不需要采用全局的事件循環(huán)機制,這樣就很容易實現(xiàn)網(wǎng)絡上實時的交互行為。動態(tài)性Java的設(shè)計使它適合于一個不斷發(fā)展的環(huán)境。在類庫中可以自由地加入新的方法和實例變量而不會影響用戶程序的執(zhí)行。并且Java通過接口來支持多重繼承,使之比嚴格的類繼承具有更靈活的方式和擴展性。安全性 Java有建立在公共密鑰技術(shù)基礎(chǔ)上的確認技術(shù),指示器語義的改變將使應用程序不能再去訪問以前的數(shù)據(jù)結(jié)構(gòu)或是私有數(shù)據(jù),大多數(shù)病毒也就無法破壞數(shù)據(jù)。因而用Java可以構(gòu)造出無病毒、安全的系統(tǒng)。2.4.2 采用J2EE框架考慮到系統(tǒng)的跨平臺性和將來良好的移植性,并且考慮到系統(tǒng)能夠?qū)砗芎玫嘏c其他業(yè)務子系統(tǒng)的集成,本系統(tǒng)采用J2EE平臺,并且根據(jù)J2EE的中間件規(guī)范進行產(chǎn)品開發(fā),本系統(tǒng)采用J2EE平臺集成的標準中間件,并在數(shù)據(jù)交換和數(shù)據(jù)導出上支持XML標準。平臺比較目前,可作為開放式數(shù)據(jù)應用集成的規(guī)范和平臺的技術(shù)主流有兩種,一種是微軟公司的Windows DNA平臺,另一種是SUN公司的J2EE平臺。雖然這兩種集成平臺和分布式計算技術(shù)都能滿足實施開放式的數(shù)據(jù)應用集成的需求,但是從規(guī)范的開放性、支持異構(gòu)性、可移植性、支持的廣泛性、對現(xiàn)有系統(tǒng)數(shù)據(jù)的繼承性和技術(shù)優(yōu)勢等方面比較, J2EE比Windows DNA具有優(yōu)勢。平臺優(yōu)勢J2EE是一種利用Java 2平臺來簡化諸多與多級企業(yè)解決方案的開發(fā)、部署和管理相關(guān)的復雜問題的體系結(jié)構(gòu)。J2EE技術(shù)的基礎(chǔ)就是核心Java平臺或Java 2平臺的標準版,J2EE不僅鞏固了標準版中的許多優(yōu)點,例如“編寫一次、到處運行”的特性、方便存取數(shù)據(jù)庫的JDBC API、CORBA技術(shù)以及能夠在Internet應用中保護數(shù)據(jù)的安全模式等等,同時還提供了對 EJB(Enterprise JavaBeans)、Java Servlets API、JSP(Java Server Pages)以及XML技術(shù)的全面支持,可以更好地與其他的分布式應用系統(tǒng)集成。因此J2EE是一種更理想的集成平臺和規(guī)范。2.4.3 采用WebService進行數(shù)據(jù)互連互通Web服務是一個或者一組應用程序,向外界提供一個能夠通過Web進行調(diào)用的API。Web服務的主要目標是在現(xiàn)有的各種異構(gòu)平臺的基礎(chǔ)上構(gòu)筑一個通用的與平臺無關(guān)、語言無關(guān)的技術(shù)層,多種不同平臺上的應用依靠這個技術(shù)層來實施彼此的連接和集成。1Web服務模型 Web服務體系結(jié)構(gòu)是基于三種角色之間的交互,分別是服務提供者、服務注冊中心和服務請求者。其中:(1)服務提供者:創(chuàng)建Web服務實體,為能實現(xiàn)一組特定任務的軟件提供服務接口;(2)服務請求者:發(fā)現(xiàn)和調(diào)用軟件服務,請求者一般會調(diào)用服務提供者發(fā)布的遠程方法,把參數(shù)數(shù)據(jù)發(fā)送給提供者并接收相應結(jié)果;(3)服務注冊表:管理和發(fā)布服務。當服務請求者需要調(diào)用服務時,它首先到UDDI注冊中心搜索該服務,得到如何調(diào)用該服務的信息,然后根據(jù)這些信息去調(diào)用服務提供者發(fā)布的服務。在Web Service服務體系中,使用WSDL來描述服務,UDDI來發(fā)布、查找服務,而SOAP用來執(zhí)行服務調(diào)用。下圖顯示了這些操作、提供這些操作的組件及它們之間的交互。發(fā)布WSDL, UDDI服務注冊服務請求者服務提供者服務描述服務服務描述查找WSDL, UDDI綁 定2Web服務的相關(guān)標準在Web服務協(xié)議棧中,涉及了數(shù)據(jù)、消息、服務和注冊庫的描述定義,這些要用到具體的標準技術(shù),包括XML、SOAP、WSDL、UDDI等。其中XML用來描述不同層次的數(shù)據(jù),它使得不同平臺、不同環(huán)境中的數(shù)據(jù)和消息得以互通;SOAP協(xié)議用來交換XML消息;WSDL用來統(tǒng)一描述服務;UDDI提供了統(tǒng)一的框架和編程接口,與WSDL、SOAP相互結(jié)合來管理Web服務,提供服務發(fā)布和服務發(fā)現(xiàn)能力。(1)擴展標記語言(XML) (2)簡單對象訪問協(xié)議(SOAP) (3)Web服務描述語言(WSDL) (4)統(tǒng)一描述、發(fā)現(xiàn)和集成協(xié)議(UDDI)3Web服務的協(xié)議棧 為了實現(xiàn)上述Web服務模型中的發(fā)布、查找、綁定等操作,需要定義一系列分層的協(xié)議規(guī)范。服務發(fā)現(xiàn):這一層用來發(fā)現(xiàn)Web服務,來滿足自己的需求。由UDDI來處理的。服務描述:對Web服務進行自我描述。它使用WSDL來進行服務描述。服務調(diào)用:這一層的實質(zhì)是基于XML的消息傳遞。當前基于XML消息傳遞的行業(yè)標準是SOAP。SOAP是一種簡單的、輕量級的基于XML的機制,用于應用程序之間進行結(jié)構(gòu)化數(shù)據(jù)交換。SOAP可以和各種網(wǎng)絡協(xié)議相結(jié)合使用。當然我們可以使用其他的基于XML的消息如XMLRPC等。傳輸層:用來傳送客戶端和服務器之間的消息。這一層使用的協(xié)議通常是HTTP協(xié)議。理論上,我們可以使用任何網(wǎng)絡協(xié)議,如FTP,SMTP,IIOP等,但目前使用最廣泛的是HTTP協(xié)議2.4.4 數(shù)據(jù)庫技術(shù)數(shù)據(jù)庫(Database)是按照數(shù)據(jù)結(jié)構(gòu)來組織、存儲和管理數(shù)據(jù)的倉庫,它產(chǎn)生于距今五十年前,隨著信息技術(shù)和市場的發(fā)展,特別是二十世紀九十年代以后,數(shù)據(jù)管理不再僅僅是存儲和管理數(shù)據(jù),而轉(zhuǎn)變成用戶所需要的各種數(shù)據(jù)管理的方式。數(shù)據(jù)庫有很多種類型,從最簡單的存儲有各種數(shù)據(jù)的表格到能夠進行海量數(shù)據(jù)存儲的大型數(shù)據(jù)庫系統(tǒng)都在各個方面得到了廣泛的應用。在選擇數(shù)據(jù)庫時,成本因素是主要要考慮的問題。采用J2EE作為系統(tǒng)的開發(fā)平臺,在開發(fā)上使用ORM(Object/Relation Mapping)技術(shù)和JDBC技術(shù),盡力去縮小數(shù)據(jù)的差異性,實現(xiàn)跨數(shù)據(jù)庫平臺。系統(tǒng)數(shù)據(jù)庫初步采用Oracle 11g。2.4.5 性能控制采用Jmeter做web系統(tǒng)壓力測試,通過優(yōu)化程序、優(yōu)化數(shù)據(jù)庫等方法實現(xiàn)系統(tǒng)性能要求。2.4.6 開發(fā)、運行環(huán)境操作系統(tǒng)支持:Linux、Window Server 2003/2008瀏覽器支持:IE6、IE7、IE8、Firefox 3.5開發(fā)平臺及語言: J2EE平臺、采用JAVA語言設(shè)計工具: ProwerDesigner 15.0開發(fā)工具: Eclipse 3.1、Maven 3.0版本控制: SVN 1.5項目管理: Microsoft Project 2007缺陷管理工具: Bugzilla 3.2 web測試工具: Jmeter 2.3、IETester 2.1Web服務器支持: Weblogic 10.3、Tomcat 6.02.5 應用接口總體設(shè)計IT系統(tǒng)監(jiān)控管理平臺在實現(xiàn)IT運維監(jiān)控管理等信息的采集、存儲、處理、加工、傳輸、統(tǒng)計分析、應用、系統(tǒng)管理的同時,與相關(guān)外部系統(tǒng)有著密切的聯(lián)系,包括:基礎(chǔ)運維管理工具、機房動力環(huán)境監(jiān)控系統(tǒng)、ITSM系統(tǒng)、短信平臺等系統(tǒng)有著緊密的聯(lián)系。2.5.1 系統(tǒng)內(nèi)部集成接口(1)接口功能設(shè)計本接口實現(xiàn)分級情況下支撐系統(tǒng)之間的告警、性能等數(shù)據(jù)交互。(2)接口實現(xiàn)設(shè)計1)接口服務:利用應用支撐層的數(shù)據(jù)交換接口服務來實現(xiàn)接口功能。2)接口技術(shù):Web Service、SOAP、文件、碼流等。2.5.2 與基礎(chǔ)運維管理工具的集成接口(1)接口功能設(shè)計該接口對基礎(chǔ)運維管理工具的網(wǎng)管、安管、主機管理、存儲管理、機房動力環(huán)境監(jiān)控等系統(tǒng)之間的事件、性能、告警等關(guān)鍵數(shù)據(jù)進行抽取、匯聚,以支持對監(jiān)控數(shù)據(jù)的預警、統(tǒng)一展現(xiàn)。(2)接口實現(xiàn)設(shè)計1)接口服務:利用應用支撐層的數(shù)據(jù)交換接口服務來實現(xiàn)接口功能。2)接口技術(shù):Web Service、SOAP、文件、碼流等。2.5.3 與ITSM系統(tǒng)的集成接口本接口實現(xiàn)IT系統(tǒng)監(jiān)控管理平臺與原有ITSM(運維服務管理)系統(tǒng)之間的數(shù)據(jù)交互,滿足監(jiān)控數(shù)據(jù)的實時抽取、匯總、預警、統(tǒng)一展現(xiàn)的需求。(1)接口功能設(shè)計1)運維監(jiān)控數(shù)據(jù)抽取、匯聚、展示該接口對IT系統(tǒng)監(jiān)控管理平臺的網(wǎng)絡監(jiān)測與管理、業(yè)務系統(tǒng)監(jiān)測的告警、性能等關(guān)鍵數(shù)據(jù)進行抽取、匯總、預警、統(tǒng)一展現(xiàn)。2)生成基于故障告警事件信息的故障工單信息ITSM系統(tǒng)根據(jù)IT系統(tǒng)監(jiān)控管理平臺所產(chǎn)生的故障告警事件信息自動生成相應的故障工單信息。3)故障工單數(shù)據(jù)和處理狀態(tài)同步該接口輔助兩邊系統(tǒng)保持故障工單數(shù)據(jù)和處理狀態(tài)的同步。(2)接口實現(xiàn)設(shè)計1)接口服務:利用應用支撐層的數(shù)據(jù)交換接口服務來實現(xiàn)接口功能。2)接口技術(shù):Web Service、SOAP、文件、碼流等。2.5.4 與相關(guān)外部系統(tǒng)的統(tǒng)一身份認證與單點登錄接口本系統(tǒng)將對IT系統(tǒng)監(jiān)控管理平臺與基礎(chǔ)運維管理工具、ITSM系統(tǒng)、機房動力環(huán)境監(jiān)控系統(tǒng)等相關(guān)外部系統(tǒng)進行門戶集成,從而在統(tǒng)一運維管理門戶中實現(xiàn)這些系統(tǒng)的統(tǒng)一身份認證和單點登錄,形成統(tǒng)一的運維管理運行機制,從而有效集成并利用各類運維管理資源。1)統(tǒng)一身份認證:對IT系統(tǒng)監(jiān)控管理平臺與基礎(chǔ)運維管理工具、ITSM系統(tǒng)、機房動力環(huán)境監(jiān)控系統(tǒng)等相關(guān)外部系統(tǒng)的用戶進行管理集成,納入到統(tǒng)一運維管理門戶訪問控制體系中,實現(xiàn)對IT系統(tǒng)監(jiān)控管理平臺用戶的統(tǒng)一身份認證。2)單點登錄:對IT系統(tǒng)監(jiān)控管理平臺的各模塊,以及該系統(tǒng)與基礎(chǔ)運維管理工具、ITSM系統(tǒng)、機房動力環(huán)境監(jiān)控系統(tǒng)等相關(guān)外部系統(tǒng)在統(tǒng)一運維管理門戶中的單點登錄控制,使用戶登錄一次便可訪問全部授權(quán)應用資源。2.6 系統(tǒng)安全設(shè)計及部署采用Web技術(shù)實現(xiàn),在具有方便實用優(yōu)點的同時,存在一些安全威脅和隱患,在系統(tǒng)平臺上構(gòu)建應用時應充分考慮以下的安全問題。在系統(tǒng)平臺設(shè)計時充分考慮下列安全問題:腳本語言的安全性問題,特別是用SQL查詢時所書寫的語句。訪問文件、數(shù)據(jù)庫或其他網(wǎng)絡連接時不應該接受未經(jīng)檢驗的用戶輸入。2.6.1 輸入檢驗輸入檢驗包括對來自外部數(shù)據(jù)源(非置信數(shù)據(jù)源)的數(shù)據(jù)進行語法檢查,有時還要進行語義檢查。根據(jù)應用的關(guān)鍵程度和其他因素,對輸入檢驗結(jié)果采取的安全過濾處理。2.6.2 GET請求和Cookie中的敏感數(shù)據(jù)就像CGI協(xié)議所定義的,把請求數(shù)據(jù)從客戶端傳輸?shù)椒掌鞫俗詈唵蔚姆椒ㄊ荊ET請求方法。如果要在客戶請求中傳輸敏感數(shù)據(jù),我們應該使用POST方法,再加上一種合適的加密機制(例如,通過SSL連接)。2.6.3 防通過嵌入標記實現(xiàn)的攻擊這種攻擊通常包含一個由用戶提交的病態(tài)腳本,或者包含惡意的HTML(或XML)標記,JSP引擎會把這些內(nèi)容引入到動態(tài)生成的頁面。這種攻擊可能針對其他用戶進行,也可能針對服務器。要防止出現(xiàn)這種問題要靠輸入檢查和輸出過濾。2.6.4 防口令猜測功能當用戶試圖多次猜測時,系統(tǒng)會不斷增加響應的時延,并最終拒絕為用戶提供服務。另外,建議對系統(tǒng)口令長度加以限制,并且不能取特別熟悉的單詞,進一步提高猜中的難度。2.6.5 頁面和字段級的權(quán)限控制在建議的系統(tǒng)中,我們將在每一個頁面中包含權(quán)限檢查代碼,檢查用戶是否有權(quán)限訪問該頁面。如果沒有權(quán)限(如一般用戶訪問系統(tǒng)管理頁面),則轉(zhuǎn)到錯誤信息頁面。如果沒有登錄,則轉(zhuǎn)到系統(tǒng)登錄界面,請求用戶登錄。另外,還可以結(jié)合平臺的安全控制能力,使系統(tǒng)的安全性進一步增強。對于某些復雜的頁面,需施加字段級的安全控制,使得某些字段只有具有權(quán)限的人才能察看或修改,為應用程序提供更加細粒度的安全控制。2.6.6 系統(tǒng)安全架構(gòu)從安全方針策略、信息安全管理、用戶行為安全、數(shù)據(jù)信息安全、應用系統(tǒng)安全、系統(tǒng)平臺安全、網(wǎng)絡平臺安全、物理環(huán)境安全等幾個方面予以規(guī)劃考慮,并與行業(yè)關(guān)于信息系統(tǒng)安全體系建設(shè)的要求密切結(jié)合。 以完整的安全體系結(jié)構(gòu)模型為依據(jù),確保整個安全體系的完備性、合理性和適應性,為提供全面的、多方位的和合理的安全服務,切實滿足各方面各層次的安全需求,在合理的代價下將各種安全風險降低到可以接受的水平,最終達到保證正??煽窟\行和使用的目的。第3章 系統(tǒng)功能設(shè)計3.1 動環(huán)監(jiān)控3.1.1 配電柜監(jiān)測 監(jiān)控對象各樓層市電輸入柜、其他配電柜。 監(jiān)控實現(xiàn)每一個串口總線回路的配電柜電量采集設(shè)備采用手拉手的接法將 監(jiān)控信號接起來連至區(qū)域匯總采集箱,最終接至監(jiān)控主機。監(jiān)控主機通過實時不間斷的輪詢采集將信息傳送給監(jiān)控平臺進行顯示、報警。 監(jiān)控性能實時監(jiān)測配電柜輸出相電壓、電流、頻率、最大千伏安、輸出功率(有功、無功、視在)、諧波率、功率因素等;監(jiān)測輸出電壓、電流、頻率超限,過載,負載不平衡,交流電源失效等告警信息,監(jiān)測到報警時主系統(tǒng)發(fā)出報警。3.1.2 配電開關(guān)及電流監(jiān)控 監(jiān)控對象配電柜開關(guān)、輸出配電柜支路電流。 監(jiān)控實現(xiàn)將每一個串口總線回路的配電柜開關(guān)及電流采集設(shè)備采用手拉手 的接法將監(jiān)控信號接起來連至區(qū)域匯總采集箱,最終接至監(jiān)控主機。監(jiān)控主機通過實時不間斷的輪詢采集將信息傳送給監(jiān)控平臺進行顯示、報警。 監(jiān)控性能通過配電柜廠家提供的協(xié)議,實時監(jiān)測配電開關(guān)狀態(tài)及各路開關(guān) 的電流值。實時判斷開關(guān)是否跳閘及各路電源的負載情況,當開關(guān)跳閘或者負載越限時,系統(tǒng)診斷為有故障(報警)事件發(fā)生,監(jiān)控主系統(tǒng)發(fā)出報警。3.1.3 發(fā)電機監(jiān)控 監(jiān)控對象發(fā)電機。 監(jiān)控實現(xiàn)設(shè)備已經(jīng)帶有串行接口。將發(fā)電機組分為兩組,每組智能接口采用手拉手的接法將監(jiān)控信號接起來連至區(qū)域匯總采集箱,最終接至監(jiān)控主機。監(jiān)控主機通過實時不間斷的輪詢采集將信息傳送給監(jiān)控平臺進行顯示、報警。 監(jiān)控性能實時顯示并保存各發(fā)電機通訊協(xié)議所提供的能遠程監(jiān)測的運行參數(shù)和各部件狀態(tài)。實時判斷發(fā)電機的部件是否發(fā)生報警,當發(fā)電機的某部件發(fā)生故障或越限時,監(jiān)控主系統(tǒng)發(fā)出報警。實時監(jiān)測內(nèi)容包括:輸出相電壓、輸出相 電流、功率、油壓、水壓等;電池是否充電、電池工作模式、系統(tǒng)報警等。3.1.4 ATS監(jiān)測 監(jiān)控對象ATS 柜。 監(jiān)控實現(xiàn)設(shè)備已經(jīng)帶有串行接口。按樓層、房間劃分區(qū)域,將每一個房間內(nèi)的 ATS 采用手拉手的接法將監(jiān)控信號接起來連至區(qū)域匯總采集箱,最終接至監(jiān)控主機。監(jiān)控主機通過實時不間斷的輪詢采集將信息傳送給監(jiān)控平臺進行顯示、 報警。 監(jiān)控性能實時顯示 ATS 柜兩路輸入的三相電壓、頻率、相序、切換開關(guān)位置及告警狀態(tài)等。設(shè)定告警條件,當監(jiān)測超過設(shè)定的允許值時,系統(tǒng)診斷為有故障(報警)事件發(fā)生,監(jiān)控主系統(tǒng)發(fā)出報警。3.1.5 STS監(jiān)測 監(jiān)控對象STS 柜。 監(jiān)控實現(xiàn)設(shè)備已經(jīng)帶有串行接口。按樓層劃分區(qū)域,將每個樓層內(nèi)的 STS 采用手拉手的接法將監(jiān)控信號接起來連至區(qū)域匯總采集箱,最終接至監(jiān)控主機。 監(jiān)控主機通過實時不間斷的輪詢采集將信息傳送給監(jiān)控平臺進行顯示、報警。 監(jiān)控性能實時顯示 STS 柜三相電壓、頻率、功率、電能、負載率、旁路狀 態(tài)、開關(guān)狀態(tài)及告警狀態(tài)等。設(shè)定告警條件,當監(jiān)測超過設(shè)定的允許值時,系統(tǒng) 診斷為有故障(報警)事件發(fā)生,監(jiān)控主系統(tǒng)發(fā)出報警。3.1.6 UPS監(jiān)控子系統(tǒng) 監(jiān)控對象UPS。 監(jiān)控實現(xiàn)設(shè)備已經(jīng)帶有串行接口。將每一個串口總線回路的 UPS 智能接口 采用手拉手的接法將監(jiān)控信號接起來連至區(qū)域匯總采集箱,最終接至監(jiān)控主機。 監(jiān)控主機通過實時不間斷的輪詢采集將信息傳送給監(jiān)控平臺進行顯示、報警。 監(jiān)控性能實時監(jiān)測各 UPS 通訊協(xié)議所提供的能遠程監(jiān)測的運行參數(shù)和各部 件狀態(tài)。實時判斷 UPS 的部件是否發(fā)生報警,當 UPS 的某部件發(fā)生故障或越限時, 監(jiān)控主系統(tǒng)發(fā)出報警通知。實時監(jiān)測內(nèi)容包括:輸入相電壓,輸出相電壓,旁路 相電壓,輸入相電流,輸出相電流,旁路相電流,電池電壓,電池電流,輸出頻 率,系統(tǒng)負載,電池充電程度,電池后備時間等,過載,電池工作模式,旁路工 作模式,電池電壓高/低,系統(tǒng)報警,整流器報警,逆變器報警,系統(tǒng)關(guān)機,旁 路電壓超限等。3.2 統(tǒng)一門戶子系統(tǒng)提供一個統(tǒng)一的綜合運維平臺入口,將使運維人員能夠基于統(tǒng)一的整合管理界面,進行運維管理的信息查看和相關(guān)操作:1) 用戶管理:實現(xiàn)用戶集中管理、單點登陸功能;可為每個不同角色提供不同的功能模塊,用戶通過統(tǒng)一登錄頁面進入系統(tǒng),訪問權(quán)限范圍內(nèi)的功能模塊。 2) 門戶展現(xiàn):提供基于WEB靈活多樣的信息發(fā)布形式,將各功能(如監(jiān)控、流程、知識庫)產(chǎn)生的管理信息進行統(tǒng)一的發(fā)布。改善運維人員的使用體驗,提升日常運維管理效率。3) 門戶管理:提供動態(tài)靈活的展現(xiàn)模型編輯工具,用戶可按照自身需要隨意拖動并保存最終布局。3.2.1 信息主管領(lǐng)導內(nèi)容展示1) 運行維護統(tǒng)計報表,資源監(jiān)控統(tǒng)計報表。2) 重大故障信息、升級來的故障信息的展示。3) 重要業(yè)務系統(tǒng)的拓撲展現(xiàn)。4) 主管領(lǐng)導的其他展示需求。3.2.2 運維人員內(nèi)容展現(xiàn)1) 門戶針對不同的小組(如:網(wǎng)絡、業(yè)務、安全等),展示不同的管理內(nèi)容和操作配置界面,如網(wǎng)絡維護人員查看網(wǎng)絡的web拓撲;業(yè)務系統(tǒng)維護人員查看業(yè)務系統(tǒng)的拓撲;安全管理員查看安全系統(tǒng)拓撲;機房管理人員查看機房方位圖進行監(jiān)控。監(jiān)控圖除了能夠反映設(shè)備的狀態(tài)外,還實時反映監(jiān)控到的事件,在拓撲圖上監(jiān)控到的事件按照設(shè)備進行歸類。2) 各組維護人員可以查看自己類別的知識庫記錄,可以通過事件查看關(guān)聯(lián)到的知識庫記錄,也可以直接通過搜索關(guān)鍵字來查找知識庫記錄。3) 在維護人員的登錄界面,醒目的位置提供公告信息。4) 維護人員處理事件時,展現(xiàn)維護界面,維護界面包括維護人、維護時間、維護設(shè)備、事件內(nèi)容、維護過程、維護結(jié)果、是否解決、轉(zhuǎn)發(fā)給第三人處理等等,對事件處理完畢后能夠?qū)κ录脿顟B(tài),表示事件已經(jīng)處理完畢,在維護人員的事件處理窗口,維護人員可以以灰色顯示或不顯示。3.2.3 一般用戶內(nèi)容展現(xiàn)1) 提交設(shè)備、業(yè)務系統(tǒng)的服務請求,可以跟蹤服務請求的處理進度。2) 可以檢索知識庫,能夠自助解決問題,查詢知識庫可以按照關(guān)鍵字進行查詢,顯示知識庫的編碼、主題、故障現(xiàn)象、處理方法、聯(lián)系人等內(nèi)容。3) 可以查詢歷史服務請求記錄。4) 在普通用戶的登錄界面,在醒目的位置提供系統(tǒng)公告信息。3.3 IT運行監(jiān)控子系統(tǒng)IT運行監(jiān)控系統(tǒng)功能包括故障、性能、配置等基礎(chǔ)功能,以及面向網(wǎng)絡設(shè)備、主機、存儲、數(shù)據(jù)庫、中間件、基礎(chǔ)應用、IP地址、信息點等監(jiān)控管理功能。針對以上各個功能模塊詳細說明如下:3.3.1 基礎(chǔ)平臺功能(1) 故障管理故障管理主要實現(xiàn)對IT資源故障的監(jiān)視功能,包括對告警信息進行采集、配置、處理、呈現(xiàn)及相關(guān)的統(tǒng)計分析等功能。通過故障管理功能,用戶可對網(wǎng)絡中的告警進行實時的監(jiān)控,對告警信息進行處理和查詢統(tǒng)計等相關(guān)操作。系統(tǒng)提供了故障智能診斷功能,通過此功能,用戶可以對網(wǎng)絡中的故障進行實時的監(jiān)控,提高故障發(fā)現(xiàn)、故障處理的效率,減小故障對網(wǎng)絡造成的影響,更加有效的保障網(wǎng)絡安全運行;在故障診斷的基礎(chǔ)上,系統(tǒng)提供網(wǎng)絡預警的功能,通過對現(xiàn)有網(wǎng)絡進行性能分析,根據(jù)預先設(shè)定的門限值,以預警的形式進行提示,使網(wǎng)絡的維護工作由被動轉(zhuǎn)為主動,從而實現(xiàn)網(wǎng)絡運行維護的高級管理功能。故障管理應包含以下功能。另外,故障管理支持對Unix、liunx、Windows服務器、各種網(wǎng)絡設(shè)備syslog關(guān)鍵字告警功能,能夠自定義日志消息告警的關(guān)鍵字,一旦在日志消息中發(fā)現(xiàn)有自定義的關(guān)鍵字,如Interface Down、UP等關(guān)鍵字,可通過告警快速通知運維人員進行處理。(2) 配置管理IT運行監(jiān)控系統(tǒng)提供參數(shù)化配置功能,如配置歷史數(shù)據(jù)在系統(tǒng)中保存期限等,提供對系統(tǒng)資源的配置管理功能。本系統(tǒng)的配置數(shù)據(jù)采集支持自動采集、手工采集和數(shù)據(jù)導入等三種方式。配置數(shù)據(jù)管理主要包括:配置基本信息:包括配置的內(nèi)部標識、名稱、類型、IP地址、物理地址、廠商等基本信息;配置管理信息:包括配置的管理分類、用途分類、管理部門、管理人、安裝位置、購買時間、終止使用時間等;配置屬性信息:配置的附加配置屬性,不同類型的配置的配置屬性有所不同,例如網(wǎng)絡設(shè)備的固件版本、設(shè)備模塊組成、端口種類、服務器的操作系統(tǒng)類型、硬件配置、存儲設(shè)備、軟件配置的Licence、服務端口、模塊組成等;配置維護信息:包括資產(chǎn)編號、資產(chǎn)的負責人,資產(chǎn)的集成商,以及產(chǎn)品支持廠商、當前質(zhì)保期、歷次故障記錄、歷次購保記錄、歷次維護記錄,為資產(chǎn)維護提供數(shù)據(jù)的支持。對于即將過保的設(shè)備配置進行告警通知。(3) 性能管理IT運行監(jiān)控系統(tǒng)的性能數(shù)據(jù)處理與分析功能,提供了用戶及時發(fā)現(xiàn)關(guān)鍵點的異常情況,從而有效的保障系統(tǒng)正常運行,并為分析優(yōu)化工作提供必要的依據(jù)。本系統(tǒng)支持多種協(xié)議、標準和接口方式采集各種性能數(shù)據(jù),如SNMP、Agent、Telnet、JDBC、FTP、CORBA等。性能數(shù)據(jù)采集處理可以支持以下2種方式:定時模式:采用循環(huán)定時主動式采集,定時時間間隔可配置;系統(tǒng)對性能數(shù)據(jù)進行數(shù)據(jù)庫保存,保留時間可定制;系統(tǒng)采集到的性能數(shù)據(jù)可以根據(jù)配置定義,以多種方式進行顯示。實現(xiàn)對數(shù)據(jù)的定時采集和呈現(xiàn)。實時模式:由使用者通過界面操作,有針對性地(選擇對象、數(shù)據(jù)內(nèi)容等)對被管對象的性能數(shù)據(jù)進行即時的主動采集,獲得對象的當前性能數(shù)據(jù),采集的數(shù)據(jù)馬上送回用戶界面,由用戶界面處理。3.3.2 網(wǎng)絡設(shè)備管理(1) 設(shè)備自動發(fā)現(xiàn)系統(tǒng)支持思科、華三、華為、北電、銳捷、邁普等業(yè)界主流廠商網(wǎng)絡設(shè)備的自動發(fā)現(xiàn)和性能采集,系統(tǒng)通過SNMP、ICMP、ARP等協(xié)議自動發(fā)現(xiàn)設(shè)備基本信息、設(shè)備接口配置信息、設(shè)備之間物理連接關(guān)系等,對于不同廠商不同型號的設(shè)備,系統(tǒng)可自動標識不同的圖標。對于無法自動識別生產(chǎn)廠家及產(chǎn)品類型的網(wǎng)絡,提供手工方式加以定義。對于網(wǎng)絡設(shè)備提供設(shè)備面板視圖的管理。系統(tǒng)支持SNMP V1、V2、V3的拓撲自動發(fā)現(xiàn)功能,對于不支持SNMP的設(shè)備,提供通過telnet的方式,進行拓撲發(fā)現(xiàn)。對于路由時延、抖動等異常情況的監(jiān)控和告警,提供路由監(jiān)測功能,可由監(jiān)控管理系統(tǒng)自動計算出任意兩點間的最短路徑。采集指標包括支持網(wǎng)絡設(shè)備的CPU利用率、內(nèi)存利用率、網(wǎng)絡端口的吞吐量和丟包率、接收和發(fā)送的ICMP包率,端口ARP包率、單播包率、出入帶寬利用率、出入丟包率、出入錯包率、出入速率、廣播包率、組播包率等指標??蓪Σ煌木W(wǎng)絡節(jié)點根據(jù)影響程度不同設(shè)置不同的輪訓時間。系統(tǒng)能夠?qū)δ骋痪W(wǎng)段、IP地址等限定條件進行拓撲發(fā)現(xiàn),并且可以設(shè)定更新周期,自動排列生成網(wǎng)元設(shè)備圖及網(wǎng)元設(shè)備之間的連線。(2) Web網(wǎng)絡拓撲管理支持網(wǎng)絡節(jié)點的二層、三層和基于協(xié)議的三種視圖的自動發(fā)現(xiàn),自動生成不同圖標,生成整個網(wǎng)絡的拓撲結(jié)構(gòu)圖及各個節(jié)點的工作狀態(tài)信息,網(wǎng)絡節(jié)點狀態(tài)可以不同顏色區(qū)別。對于自動發(fā)現(xiàn)的網(wǎng)絡設(shè)備和不同平臺的主機以不同的圖標顯示出來,便于直觀的觀察和監(jiān)控。對于無法自動識別生產(chǎn)廠家及產(chǎn)品類型的網(wǎng)絡和主機設(shè)備,提供手工方式加以定義。對于不能監(jiān)視的設(shè)備能夠通過SNMP代理方式進行管理,支持加載其MIB的方式對其進行監(jiān)視。拓撲圖能夠顯示設(shè)備、線路的類型,線路及設(shè)備的通斷情況。故障設(shè)備和線路能夠清楚地在拓撲圖上顯示??勺詣铀⑿戮W(wǎng)絡拓撲結(jié)構(gòu)圖,當網(wǎng)絡中網(wǎng)絡設(shè)備數(shù)量發(fā)生變化時,能夠自動添加或刪除對應圖標;并動態(tài)監(jiān)控網(wǎng)絡設(shè)備的狀態(tài)。在拓撲圖中,對每個管理對象,可提供詳細的管理屬性內(nèi)容與當前告警與性能信息。對同一個管理對象,在不同的拓撲視圖中,保持相同的狀態(tài)。(3) 網(wǎng)絡拓撲鏈路流量監(jiān)控基于自動生成的網(wǎng)絡拓撲圖,根據(jù)網(wǎng)絡帶寬利用率(單位時間流量/帶寬*100%)不斷地修改連接符號的填充百分比,使連接符號以不同粗細代表和數(shù)字標注方式顯示當前時刻的流量情況,使用戶對網(wǎng)絡鏈路流量的了解變得更為方便和直觀。當用戶點擊選中某連接符號后,可以顯示該條鏈路的詳細流量情況。包括:1) 在拓撲圖的線上(鏈路)可以標注對應的入帶寬利用率、出帶寬利用率、出流量、出流速、入流量、入流速、總流量、總流速等內(nèi)容;2) 在拓撲圖的線上,以線條粗細直觀顯示鏈路的流量大小,以線條的顏色直觀顯示鏈路的告警狀態(tài)等;3) 流量閥值或者帶寬利用率閥值設(shè)置,進行不斷閃爍,生成閥值告警消息。(4) 網(wǎng)絡設(shè)備接口面板管理按照設(shè)備的實際接口情況,以模擬設(shè)備面板的方式,直觀展現(xiàn)各個接口的狀態(tài),并可向下關(guān)聯(lián)挖掘到所連主機情況。(5) 網(wǎng)絡設(shè)備樹圖與單點網(wǎng)元管理按日常維護習慣或指定的方式進行導航/查詢,如按職能部門、按地理區(qū)域、按設(shè)備廠商、按設(shè)備類型等組織數(shù)據(jù)導航樹。并針對每個節(jié)點查看其配置、告警、流量、性能等相應內(nèi)容提供一站式的綜合監(jiān)控管理,包括本臺設(shè)備的基本配置、當前時刻主要性能指標、最近一天主要性能運行趨勢、設(shè)備各個接口的狀態(tài)與流量、設(shè)備實時與歷史告警信息等。(6) 網(wǎng)絡性能管理系統(tǒng)能夠周期性地自動采集性能數(shù)據(jù),采集周期和采集時間可按照一天內(nèi)的采集時間,和每周內(nèi)的采集天數(shù)進行配置,最小的數(shù)據(jù)采集時間周期為1分鐘,默認時間是5分鐘。數(shù)據(jù)采集可安裝不同的廠商,不同的地理位置,不同的職能部門進行批量的停止和啟動。對用戶所關(guān)心的主干鏈路流量,可生成流量、流速、包數(shù)、會話數(shù)變化曲線表,并通過設(shè)定閥值產(chǎn)生告警消息。按照應用流量、端到端流量、主機流量、目標流量進行統(tǒng)計,生成日、周、月統(tǒng)計報告等。(7) 網(wǎng)絡故障監(jiān)控網(wǎng)絡故障監(jiān)控,分為定時輪詢和接收Trap兩種方式。系統(tǒng)提供友好界面對各類不同對象,不同方式的告警進行不同的分組、描述已經(jīng)不同告警級別的定制。1) 定時輪詢設(shè)置相應的時間對網(wǎng)絡設(shè)備進行輪詢監(jiān)控。對不同的網(wǎng)絡設(shè)備可以指定不同的輪詢時間間隔。定時輪詢能夠通過ping方式看設(shè)備是否可達,通過SNMP去檢索網(wǎng)絡設(shè)備相關(guān)指標,形成各種報表數(shù)據(jù)。同時還可對不同采集指標進行閾值比對,當超過閾值后就會產(chǎn)生報警信息,轉(zhuǎn)發(fā)到郵箱中或在上層界面呈現(xiàn)。2) trap事件接收對于客戶關(guān)注的設(shè)備接口通斷,鏈路通斷可采用Trap方式進行故障事件的發(fā)送和接收,此方式大大的提高了告警的實時性,在日常運維工作中廣泛使用,將設(shè)備接口狀態(tài)的告警控制在10秒鐘之內(nèi)。3.3.3 服務器監(jiān)控管理(1) 服務器單點綜合監(jiān)控在一個界面中,綜合展現(xiàn)某臺具體服務器的配置、性能、歷史數(shù)據(jù)和故障信息。服務器性能重點顯示包括實時和最近24小時 CPU平均利用率、MEM利用率、文件系統(tǒng)利用率。(2) 服務器性能管理實現(xiàn)對主機性能、故障、進程、磁盤、文件系統(tǒng)、日志的監(jiān)控,并生成報表和告警信息,主要的性能管理內(nèi)容包括:服務器CPU性能 (5分鐘、小時、日、周)服務器內(nèi)存性能 (5分鐘、小時、日、周)服務器磁盤性能 (日、周)服務器流量性能 (5分鐘、小時、日、周)服務器CPU峰值分析CPU峰值分析(小時/日)磁盤I/O繁忙分析服務器I/O性能統(tǒng)計(小時/日)(3) 服務器接口流量管理提供服務器小時、日、周、月流量趨勢分析,并提供流量閥值告警,當服務器接口流量達到閥值時,產(chǎn)生相應閥值級別的告警事件。(4) 服務器進程管理包括對服務器各進程性能的TOPN排名和進程性能趨勢分析。包括進程占用cpu利用率、占用cpu的時間、駐留內(nèi)存和虛擬內(nèi)存的大小。(5) 服務器監(jiān)控管理主要指標服務器監(jiān)控管理的主要指標包括:1) 基本信息:主機名稱、操作系統(tǒng)名稱、操作系統(tǒng)版本、操作系統(tǒng)位數(shù)、機器開機運行時間等基本信息;2) 性能:CPU利用率,內(nèi)存利用率,文件系統(tǒng)利用率, 磁盤IO,硬盤讀寫速率、虛擬內(nèi)存使用率、網(wǎng)卡使用率、內(nèi)存頁交互速率等;3) 進程:可對指定進程資源占用情況進行采集??砂磻帽O(jiān)控多個進程的匯總的CPU、內(nèi)存利用率。默認可對每個主機top10進程進行記錄??杀O(jiān)控進程、服務是否正常運行,進程數(shù)量是否發(fā)生變化;異常將產(chǎn)生告警信息;4) 日志:實現(xiàn)日志關(guān)鍵字、日志文件大小、日志文件是否丟失等指標的監(jiān)控,異常將產(chǎn)生告警信息;5) 配置變更:當主機的硬盤、CPU、內(nèi)存等信息發(fā)生變化時,系統(tǒng)會產(chǎn)生告警,發(fā)給指定的管理員;6) 特定文件:監(jiān)控系統(tǒng)中文件和目錄的相關(guān)屬性,包括名稱、文件大小、擁有者、訪問權(quán)限以及鏈接等。如發(fā)現(xiàn)文件被修改或其他異常時(包括非法訪問、大小異常等)產(chǎn)生報警;7) 用戶:監(jiān)測與用戶有特定關(guān)聯(lián)的信息,主要包括用戶名、用戶ID、登錄時間、登錄終端IP信息等;8) 服務器網(wǎng)絡接口監(jiān)控:監(jiān)控服務器網(wǎng)絡端口的輸入、輸出、錯包
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 水平定向鉆機司機班組評比測試考核試卷含答案
- 石英晶體振蕩器制造工安全知識評優(yōu)考核試卷含答案
- 帶式球團焙燒工崗前價值創(chuàng)造考核試卷含答案
- 墨汁制造工崗前環(huán)保競賽考核試卷含答案
- 光繪畫與服裝設(shè)計的深度交互-舞臺視覺藝術(shù)的突破-洞察及研究
- 2025韓國人工智能芯片產(chǎn)業(yè)發(fā)展現(xiàn)狀技術(shù)創(chuàng)新趨勢市場需求分析報告
- 2025鞋服行業(yè)投資機會研究及融資渠道研究報告
- 2025鞋服互聯(lián)網(wǎng)行業(yè)競爭格局分析及市場發(fā)展方向評估報告
- 拖拉機駕駛員風險識別測試考核試卷含答案
- 2025長沙負離子粉行業(yè)市場現(xiàn)狀供需分析評估投資規(guī)劃分析研究報告
- 鋼板租賃合同條款(2025版)
- 輻射性白內(nèi)障的發(fā)現(xiàn)與研究
- 珠海市產(chǎn)業(yè)和招商扶持政策匯編(2025年版)
- 國開機考 答案2人力資源管理2025-06-21
- 物理●山東卷丨2024年山東省普通高中學業(yè)水平等級考試物理試卷及答案
- 提升會計職業(yè)素養(yǎng)的試題及答案
- 電動吸盤出租合同協(xié)議
- 胃穿孔的相關(guān)試題及答案
- 制藥行業(yè)清潔生產(chǎn)標準
- 教育學原理知到智慧樹章節(jié)測試課后答案2024年秋浙江師范大學
- 醫(yī)學影像技術(shù)技士題庫
評論
0/150
提交評論