版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
網(wǎng)絡綜合管理系統(tǒng)
技術(shù)方案
文檔修改記錄
版本號修改內(nèi)容描述修改人修改日期
V0.1建立
VI.0修訂
目錄
1.項目概況.......................................................1
2.項目建設目標...................................................7
3.系統(tǒng)需求分析.........................................9
3.1.建設技術(shù)先進、端到端的集中運維管理平臺.....................9
3.2.主動及時地發(fā)現(xiàn)問題,扭轉(zhuǎn)被動服務局面.......................9
3.3.n"系統(tǒng)網(wǎng)絡拓撲結(jié)構(gòu)的管理分析..............................10
3.4.建立智能的綜合監(jiān)控系統(tǒng)....................................10
3.5.建立智能的趨勢運行分析系統(tǒng)................................11
3.6.IT系統(tǒng)性能的監(jiān)控分析......................................11
3.7.建立綜合報表發(fā)布平臺......................................11
3.8.建立綜合的服務器管理機制..................................12
4.綜合R"管理系統(tǒng)建設任務........................................12
4.1.建立統(tǒng)一靈活的管理平臺....................................12
4.2.建立與管理區(qū)域匹配的分級管理模式..........................12
4.3.實現(xiàn)故障信息采集和統(tǒng)一處理................................13
4.4.實現(xiàn)管理流程整合和統(tǒng)一管理................................13
4.5.建立統(tǒng)一的信息展示和運行考核..............................14
5.綜合IT管理系統(tǒng)方案選擇以及環(huán)境要求............................14
5.1.1.方案模塊選擇........................................14
5.1.2.網(wǎng)絡環(huán)境要求........................................14
5.1.3.硬件運行環(huán)境........................................14
5.1.4.系統(tǒng)運行軟件環(huán)境....................................15
6.項目方案設計...................................................15
6.1.設計原則.................................................15
6.2.系統(tǒng)架構(gòu)................................................17
6.2.1.邏輯架構(gòu)...........................................17
6.2.2.產(chǎn)品架構(gòu)..........................................19
6.2.3.技術(shù)路線..........................................21
6.3.功能設計.................................................21
6.3.1.系統(tǒng)概述............................................21
6.3.2.網(wǎng)絡拓樸管理........................................23
6.3.3.真實的背板..........................................24
6.3.4.跨地域的分布式管理..................................24
6.3.5.豐富的網(wǎng)絡分析工具..................................25
6.3.6.詳細的性能監(jiān)測指標..................................26
6.3.7.IP地址管理..........................................26
6.3.8.性能管理............................................26
6.3.9.帶寬資源監(jiān)控........................................27
6.3.10.事件管理...........................................28
6.3.11.故障智能告警.......................................28
6.3.12.高效資產(chǎn)管理.......................................29
6.3.13.安全管理...........................................30
6.3.14.告警管理...........................................31
6.3.15.故障管理流程.......................................35
6.3.16.綜合報表...........................................37
6.3.17.運行維護管理人員考核管理...........................44
6.3.18.用戶權(quán)限管理.......................................45
6.3.19.建立數(shù)據(jù)管理.......................................46
63.20.服務器管理功能....................................46
6.4.系統(tǒng)要求響應............................................47
6.4.1.軟件通用設計........................................47
6.4.2.系統(tǒng)特性設計........................................48
6.4.3.系統(tǒng)接口設計........................................52
6.4.4.系統(tǒng)內(nèi)部集成接口...................................53
6.4.5.與基礎(chǔ)運維管理工具的集成接口......................53
6.4.6.與綜合運維平臺的集成接口..........................53
6.4.7.統(tǒng)一身份認證與單點登錄接口........................54
7.方案特點與優(yōu)勢.................................................54
7.1.綜合IT管理系統(tǒng)功能優(yōu)勢...................................55
7.1.1.統(tǒng)一靈活的管理平臺..................................55
7.1.2.系統(tǒng)適合分布式管理應用模式..........................55
7.1.3.3.1.3適合多用戶管理..................................56
7.1.4.3.1.4合理分配網(wǎng)絡負載...............................56
7.1.5.3.1.5跨平臺管理.....................................56
7.1.6.3,1.6智能的事件管理..................................56
7.1.7.3.1.7采用簡單易用、直觀的操作和管理..................58
7.1.8.3.1.8智能報表準確反映真實運行情況....................58
7.1.9.3.1.9可定制的管理業(yè)務視圖............................61
7.1.10.3.1.10監(jiān)控業(yè)務領(lǐng)域全面化............................62
7.1.11.3.1.11具有豐富的接口易于擴展........................62
7.2.綜合IT管理系統(tǒng)平臺優(yōu)勢...................................63
7.2.1.由面向集中到面向分布................................63
7.2.2.面向設備到面向整體..................................63
7.2.3.系統(tǒng)反應快捷........................................63
7.2.4.強大的擴展性........................................64
7.2.5.適合各種復雜的網(wǎng)絡情況..............................64
7.2.6.和原廠網(wǎng)管接口......................................64
7.2.7.強碩的平臺級系統(tǒng)....................................64
7.2.8.強大的安全管理措施..................................65
7.3.綜合n"管理系統(tǒng)整體價值...................................65
7.3.1.建立統(tǒng)一的信息分析和發(fā)布平臺........................65
7.3.2.提高信息標準化一一避免信息孤島......................67
7.3.3.提供決策分析、歷史數(shù)據(jù)分析依據(jù)......................67
7.3.4.降低管理成本-提高系統(tǒng)可靠性、可用性.................67
7.3.5.降低管理難度…增加實用性.............................68
7.3.6.實現(xiàn)統(tǒng)一管理,提高工作效率..........................68
7.3.7.實現(xiàn)對全網(wǎng)的統(tǒng)籌規(guī)劃和管理,提高資源利用率..........69
7.3.8.保障全網(wǎng)健康穩(wěn)定運行,避免嚴重系統(tǒng)故障造成損失......69
8.系統(tǒng)培訓、維護、升級和二次開發(fā).................................70
8.1.系統(tǒng)培訓................................................70
8.1.1.培訓體系............................................70
8.1.2.培訓組織............................................70
8.1.3.培訓理念.......................................71
8.1.4.培訓目標............................................71
8.15培訓計劃安排.......................................72
8.2.系統(tǒng)維護升級.............................................72
8.2.1.遠程支持服務流程...................................73
8.2.2.現(xiàn)場服務流程.......................................74
8.2.3.應急維護方案...................................76
8.3.二次開發(fā)................................................77
9.系統(tǒng)實施計劃..................................................78
9.1.實施步驟.................................................78
9.1.1.實施指導思想.........................................78
9.1.2.實施方案...........................................78
9.2.項目團隊..................................................87
9.2.1.項目領(lǐng)導小組........................................87
9.2.2.項目指導小組........................................87
9.2.3.運維總負責人........................................87
9.2.4.總協(xié)調(diào)人............................................88
9.2.5.項目管理組..........................................88
9.2.6.現(xiàn)場負責人..........................................89
9.2.7.項目軟件經(jīng)理........................................89
10.項目經(jīng)費預算.................................................92
10.1.項目預算表.............................................92
10.2.項目預算明細表.........................................94
10.2.1.設計費明細表.......................................94
10.2.2.材料費明細表.......................................95
10.2.3.燃料動力費預算明細表(專項).......................96
10.2.4.差旅費概算明細表...................................97
10.2.5.會議費概算明細表...................................99
10.2.6.出版/文獻/信息傳播/知識產(chǎn)權(quán)事務費..................100
10.2.7.測試化驗加工費預算明細表..........................101
10.2.8.固定人員費概算明細表..............................102
11.項目進度規(guī)劃................................................103
12.售后服務及技術(shù)支持..........................................104
1.項目概況
作為ABCD-1234信息化基礎(chǔ)工程建設的一部分,網(wǎng)絡綜合管理系統(tǒng)是數(shù)據(jù)中
心網(wǎng)絡設備運維管理和性能監(jiān)控平臺,它從硬件設施和性能的不同層次,采集和
監(jiān)測網(wǎng)絡設備性能信息、網(wǎng)絡鏈路質(zhì)量信息等指標型數(shù)據(jù),并通過可視化方式向
運維管理用戶提供管理、維護與監(jiān)控接口,提供與設備無關(guān)的網(wǎng)絡設施通用監(jiān)測
管理平臺,在此基礎(chǔ)上為網(wǎng)絡設備的管理、評估,統(tǒng)計分析和決策支持,幫助定
位故障,預測故障以及上層應用提供服務支持。
經(jīng)過多年的建設,現(xiàn)有數(shù)據(jù)中心IT設施已具有一定的規(guī)模,各類不同廠商、
不同型號的設備和各種各樣的應用系統(tǒng)已上線運行。由于應用的錯綜復雜,各個
廠商、不同型號的設備都有自己的標準、自己的接口,數(shù)據(jù)無法得到統(tǒng)一的匯總,
給信息中心的日常管理、維護帶來很大的障礙。如何才能保證保證計算機系統(tǒng)及
應用系統(tǒng)的正常運行,并實現(xiàn)高效安全的運轉(zhuǎn)變成了一個艱巨的任務。目前網(wǎng)絡
內(nèi)包含有華為、思科、烽火、Juniper等不同廠商的網(wǎng)絡設備以及不同架設有不
同平臺的服務器。需要對整體網(wǎng)絡、各類操作系統(tǒng)以及網(wǎng)絡設備的運行狀況進行
監(jiān)測。對于網(wǎng)管的要求,客戶希望對交換機性能及端口信息進行監(jiān)控,在網(wǎng)絡發(fā)
生中斷或端口有異常的情況下自動向網(wǎng)絡維護人員發(fā)送告警信息,同時網(wǎng)管軟件
拓撲圖中相應設備或地點名稱有告警顯示。
網(wǎng)絡綜合管理系統(tǒng)提供面向網(wǎng)絡傳輸平臺的網(wǎng)絡運行態(tài)勢管理、故障管理、
網(wǎng)絡資源管理、網(wǎng)絡安全管理、運維力量管理和系統(tǒng)管理等功能,分別針對通信
指揮人員和網(wǎng)絡值勤維護人員提供綜合網(wǎng)絡管理功能。
功能和接口要求包括:
拓撲管理功能,呈現(xiàn)所有網(wǎng)絡設備關(guān)聯(lián)關(guān)系,可以查看每一個拓撲節(jié)點的信
息、在線狀態(tài)、使用狀態(tài)、邏輯拓撲和地理分布等信息。
拓撲節(jié)點信息展示功能,用戶可通過拓撲管理視圖查看節(jié)點相關(guān)信息,如節(jié)
點名稱、節(jié)點所屬單位、節(jié)點設備型號、節(jié)點設備生產(chǎn)廠家、節(jié)點IP地址、節(jié)
點端口等。
拓撲節(jié)點在線狀態(tài)信息展示功能,用戶基于已存在的拓撲視圖查看當前拓撲
中所有節(jié)點的在線狀態(tài),也可以通過導航樹上的狀態(tài)信息判斷是否在線。(狀態(tài):
1
在線、離線)
拓撲節(jié)點使用狀態(tài)信息展示功能,用戶基于已存在的拓撲視圖查看當前拓撲
中所有節(jié)點的使用狀態(tài),也可以通過導航樹上的狀態(tài)信息判斷是否在用。(狀態(tài):
在用、未用)
邏輯拓撲定義功能,根據(jù)相關(guān)方式進行定義邏輯拓撲
拓撲圖操作功能,拓撲管理提供生成拓撲圖的功能,方便用戶根據(jù)實際情況,
形成自定義的邏輯管理域。拓撲管理提供視圖控制功能,進行拓撲表示和拓撲操
作,增強拓撲管理的可操作性。
設備定位功能,根據(jù)設備IP、設備MAC、主機名等定位交換機及其端口,
并能在拓撲圖中顯示其具體位置,達到故障的快速定位。
實時狀態(tài)監(jiān)視功能,網(wǎng)絡流量等動態(tài)信息顯示更新等。
性能管理功能,性能管理監(jiān)測網(wǎng)絡傳輸平臺的承載網(wǎng)和綜合接入網(wǎng)的運行和
服務質(zhì)量,并對性能管理信息進行分析處理、存貯,產(chǎn)生輸出報表。當性能參數(shù)
超過門限時,系統(tǒng)產(chǎn)生告警信息。
性能管理系統(tǒng)功能包括收集、處理和統(tǒng)計網(wǎng)絡數(shù)據(jù)流量、綜合接入網(wǎng)接通率
等指標。
網(wǎng)絡設備管理功能,網(wǎng)絡設備管理可提供一個面向網(wǎng)絡傳輸平臺中各承載網(wǎng)
和綜合接入網(wǎng)的資源管理功能,提供設備資源、信道資源和文檔資源等多種資源
數(shù)據(jù)采集、匯總和呈現(xiàn),并對設備資源進行多種形式的分類統(tǒng)計。所有網(wǎng)絡設備
通過列表方式呈現(xiàn),可以對設備進行增加,修改,刪除,查詢等操作,同時要體
現(xiàn)出網(wǎng)絡設備當前的狀態(tài)信息。
網(wǎng)絡設備新增功能,用戶可以通過手動方式錄入網(wǎng)絡設備,對于錄入的數(shù)據(jù)
需要進行前端腳本驗證和后臺代碼驗證,當驗證通過后方可入庫,同時新增的網(wǎng)
絡設備會記錄到日志中。
可以通過日志將新增的數(shù)據(jù)進行撤銷操作。
網(wǎng)絡設備修改功能,用戶可以通過手動方式修改網(wǎng)絡設備信息,對于修改的
數(shù)據(jù)需要進行前端腳本驗證和后臺代碼驗證,驗證通過后修改數(shù)據(jù)庫中的數(shù)據(jù)信
息,同時修改的網(wǎng)絡設備會記錄到日志中??梢酝ㄟ^日志將修改的數(shù)據(jù)進行還原
操作。
2
網(wǎng)絡設備刪除功能,用戶可以選擇刪除或徹底刪除,刪除只是邏輯上刪除數(shù)
據(jù),即數(shù)據(jù)庫中只需修改刪除標識即可,對于徹底刪除操作的數(shù)據(jù),需要從物理
上刪除該數(shù)據(jù),同時刪除的網(wǎng)絡設備會記錄到日志中??梢酝ㄟ^日志將刪除的數(shù)
據(jù)進行恢復操作。
網(wǎng)絡設備查詢功能,對網(wǎng)絡設備提供根據(jù)設備類型、設備名稱、設備IP、設
備端口、設備所屬單位等信息進行查詢。
網(wǎng)絡設備列表展示功能,將網(wǎng)絡設備信息通過列表方式進行呈現(xiàn),包含內(nèi)容
有:編號、設備名稱、設備IP、設備主機名、設備類型、設備MAC地址、設備
所屬單位、設備當前狀態(tài)等信息。
網(wǎng)絡設備狀態(tài)維護功能功能,可以通過手動方式對網(wǎng)絡設備狀態(tài)進行修改,
也可以通過重新點名測試獲取設備當前狀態(tài)信息或設備狀態(tài)信息有變更時會自
動更新設備信息狀態(tài)。
信道資源管理功能,信道資源管理提供信道資源的采集、匯總、呈現(xiàn)等功能,
主要完成承載網(wǎng)聯(lián)網(wǎng)、綜合接入網(wǎng)等信道相關(guān)資源的管理維護操作,提供增加、
刪除、修改和查詢等功能。
文檔資源管理功能,文檔資源管理提供文檔資源的采集、匯總、呈現(xiàn)等功能,
管理內(nèi)容主要包括:在通信網(wǎng)絡設計、建設、使用、維護過程中設備、信道的文
檔資料等,提供上傳、下載、刪除等功能。
資源分類統(tǒng)計功能,對設備資源進行分類統(tǒng)計,包括設備數(shù)量容量統(tǒng)計、容
量分類統(tǒng)計、運行機型分類統(tǒng)計、來源分類統(tǒng)計、運行時間分類統(tǒng)計等,以圖形
和表格形式顯示,為管理人員準確掌握資源情況提供幫助。
網(wǎng)絡設備狀態(tài)維護功能功能,設備點名測試主要包含:服務器(獲取cpu、內(nèi)
存、磁盤、某端口是否打開等)、路由器(獲取接口狀態(tài)、接口丟包率等)、交換
器(獲取接口狀態(tài)、接口丟包率等)、數(shù)據(jù)庫(獲取連接數(shù)、性能等)、Web應用服
務器(獲取服務在線狀態(tài)、訪問狀況等)等
測試計劃維護功能、測試記錄管理功能、測試實時展示功能、網(wǎng)絡訪問壓力
測試、設備已部署業(yè)務系統(tǒng)訪問壓力測試、壓力測試計劃維護功能、壓力測試記
錄管理功能、壓力測試實時分析展示功能。
網(wǎng)絡安全管理功能,網(wǎng)絡安全管理提供網(wǎng)絡傳輸平臺有關(guān)的非法接入記錄管
3
理和綜合接入規(guī)范性校驗管理,并能提供與之相關(guān)的配置、查詢、匯總、呈現(xiàn)等
功能。
非法接入記錄管理功能,提供對非法接入的采集、匯總、統(tǒng)計分析、呈現(xiàn)等,
主要包括非法接入的來源、去向、時段等,為管理人員進一步分析和決策提供支
撐。用戶登陸功能(與用戶管理子系統(tǒng)對接信息);用戶權(quán)限驗證功能(與用戶管
理子系統(tǒng)對接信息);用戶信息展示功能(與用戶管理子系統(tǒng)對接信息)。
綜合接入規(guī)范性校驗管理功能,提供綜合接入規(guī)范性校驗,發(fā)現(xiàn)配置異?;?/p>
不符合規(guī)范時,產(chǎn)生告警。
專項任務管理功能,專項任務管理主要提供專項任務性能分析、專項任務定
制功能,可以通過專項定制的方式,對所關(guān)注的重點區(qū)域、重點局進行綜合監(jiān)測
和分析,建立針對專項任務的細粒度監(jiān)測視圖,并可保存、發(fā)布。
專項任務性能分析功能,建立流量分析評估指標體系,能夠?qū)Τ休d網(wǎng)、綜合
接入網(wǎng)流量進行統(tǒng)計分析。
專項任務管理功能,專項任務管理包括專項任務定制、專項任務查詢等功能,
能夠?qū)崟r監(jiān)測承擔專項任務的網(wǎng)絡流量、接通率和可用率等指標。
點名測試功能,通過點名測試查看被測設備的服務器(獲取CPU、內(nèi)存、磁
盤、某端口是否打開等)、路由器(獲取接口狀態(tài)、接口丟包率等)、交換器(獲
取接口狀態(tài)、接口丟包率等)、數(shù)據(jù)庫(獲取連接數(shù)、性能等)、Web應用服務
器(獲取服務在線狀態(tài)、訪問狀況等)等信息。
測試計劃維護功能功能,用戶可以通過列表方式查看測試計劃,測試計劃包
含:測試對象、測試內(nèi)容、測試時間、測試結(jié)果等信息
測試記錄管理功能功能,對于測試過程中產(chǎn)生的信息,進行統(tǒng)一的記錄管理。
提供查詢,刪除等操作。記錄包含內(nèi)容:測試時間、測試對象、測試結(jié)果等
測試實時展示功能功能,用戶通過點名測試,可以實時查看當前被測對象的
狀態(tài)信息。包含信息:CPU利用率、內(nèi)存利用率、鏈路通斷情況等
運維力量管理功能,運維力量管理主要提供對值勤維護力量的信息綜合查詢
和統(tǒng)計,同時提供與其他系統(tǒng)的互聯(lián)互通接口,實現(xiàn)本系統(tǒng)與其他綜合網(wǎng)管系統(tǒng)
的資源數(shù)據(jù)傳輸,包括資源數(shù)據(jù)的上報、查詢等功能,為綜合網(wǎng)絡管理系統(tǒng)的資
源動態(tài)更新、資源變動情況、規(guī)劃等功能提供支撐。與其他系統(tǒng)的接口功能主要
4
通過消息中間件實現(xiàn)。
告警管理功能,告警信息以數(shù)據(jù)列表的形式展示,還提供告警閾值的設置、
根據(jù)條件查詢告警、告警信息推送等功能。
告警信息閾值設置功能功能,用戶可以設置告警信息的閾值,對告警信息進
行一定的過濾。告警信息閾值包含設備在線狀態(tài)、設備資源使用率(CPU、內(nèi)存、
磁盤)、網(wǎng)絡設備丟包率、網(wǎng)絡設備接口狀態(tài)、數(shù)據(jù)庫連接數(shù)、數(shù)據(jù)庫性能、Web
應用服務器訪問狀態(tài)等內(nèi)容
告警信息查詢展示功能功能,用戶可以通過列表方式查看告警信息,同時提
供根據(jù)告警級別、告警類型、告警時間等條件進行查詢。
告警信息實時推送功能功能,當設備產(chǎn)生告警后,將告警信息以可視化的方
式推送至系統(tǒng)顯眼部分,同時給予聲音提示或者顏色改變等提示。
告警信息詳情展示功能功能,用戶可以通過點擊告警信息列表中詳情按鈕,
查看告警的具體信息,包括告警對象、告警類型等。
告警上報功能,告警信息實時上報、告警信息實時推送。
歷史告警查詢統(tǒng)計功能,告警信息查詢展示功能、告警信息詳情展示功能、
設備信息維護功能、設備信息查詢展示功能、設備年度信息圖表展示功能(包含
采集類型、告警維度)、設備季度信息圖表展示功能(包含采集類型、告警維度)、
設備月度信息圖表展示功能(包含采集類型、告警維度)。
告警屏蔽功能,能夠按照一定的規(guī)則進行相關(guān)告警信息的屏蔽。
報警報表功能,可幫助管理員有效地預防或發(fā)現(xiàn)故障,警報將通過聲音、短
信、顯示報警框、發(fā)送Mail等方式及時發(fā)送相關(guān)人員,或自動運行相應的程序
進行故障處理;提供全方位的告警監(jiān)測、統(tǒng)計分析和報警定位。
統(tǒng)計分析功能,用戶通過選擇年度、季度、月度、周度、天等不同粒度的條
件對設備信息進行餅狀圖、柱狀圖、折線圖等圖形圖表化的統(tǒng)計呈現(xiàn)。
壓力測試功能,通過對系統(tǒng)進行網(wǎng)絡訪問壓力測試、系統(tǒng)訪問壓力測試,讓
用戶更好的了解系統(tǒng)當前的運行狀態(tài)。用戶可以通過列表方式查看壓力測試,壓
力測試包含:測試對象、測試內(nèi)容、測試時間、測試結(jié)果等信息,對于測試過程
中產(chǎn)生的信息,進行統(tǒng)一的記錄管理。提供查詢、刪除等操作。記錄包含內(nèi)容:
測試時間、測試對象、測試結(jié)果等
5
日志管理功能,日志管理記錄系統(tǒng)運行過程中系統(tǒng)的問題信息,監(jiān)測系統(tǒng)發(fā)
生事件,記錄系統(tǒng)用戶登錄登出信息、敏感數(shù)據(jù)操作、系統(tǒng)異常信息等,以方便
管理員查看系統(tǒng)運行狀況。
用戶管理功能,用戶管理是針對系統(tǒng)用戶進行增刪改查的一個界面,并且在
頁面左邊點擊部門,可查看部門下的所有人員,以及該人員的角色等信息。提供
登錄、授權(quán)、驗證、用戶信息展示、用戶信息維護。
時間校準功能,將指定機器的時間與服務器時間進行校準
進程管理功能,用戶可以對所有設備上運行的進程信息進行查看,同時提供
模糊查詢、殺死進行等操作。
軟件分發(fā)功能,用戶可以將需要的軟件發(fā)送至某一臺或多臺機器上。若軟件
為壓縮包則系統(tǒng)可以自動解壓,并刪除原壓縮包以保證硬盤容量。
遠程開關(guān)機功能,將每一臺設備的狀態(tài)用表格呈現(xiàn)出來,可對每一臺設備進
行開關(guān)機操作操作
接口要求功能,支持單點登錄接口、網(wǎng)絡信息報警接口、網(wǎng)絡設備查詢接口。
通過集成平臺前臺界面框架嵌入網(wǎng)絡管理系統(tǒng)的設備信息列表界面,展示設備分
類、名稱及位置信息以及設備的運行狀態(tài)等(與外部綜合運維平臺之間的接口)。
本方案通過網(wǎng)絡綜合管理項目建設,將做到網(wǎng)絡系統(tǒng)故障早發(fā)現(xiàn)、早解決,
確保計算機網(wǎng)絡的連續(xù)、可靠、安全運行,降低發(fā)生故障的可能性,提高數(shù)據(jù)中
心的網(wǎng)絡設備運行管理水平和服務保障能力,為相關(guān)業(yè)務工作提供高效、貼身服
務。具體而言,網(wǎng)絡綜合管理管理系統(tǒng)應滿足如下的管理需求:
1)以業(yè)務的角度將傳統(tǒng)的技術(shù)設備的管理整合到基于業(yè)務的管理平臺上
來,不僅能完成對網(wǎng)絡設備監(jiān)控的需求同時能滿足根據(jù)業(yè)務的組成定位問題
根源,定位性能瓶頸,預測業(yè)務發(fā)展趨勢和穩(wěn)定性。
2)采用的技術(shù)成熟、先進,并具有較強的集成性和可擴充性的管理平臺;
3)解放人力,依靠智能化技術(shù)化的管理手段,降低故障發(fā)生率,降低維護
成本,并同時提高維護效率。
4)易于使用和維護。管理軟件本身的作用就是為了降低運維成本、提高運
維效率。這就要求管理軟件本身必須是易于使用和維護的。
5)統(tǒng)一的報告和報表,多臺設備性能比較,其它格式導出,柱圖、XY坐標、
6
餅圖、折線圖,定期的運維報告等等
6)系統(tǒng)的自管理,系統(tǒng)的自我管理功能,包括角色管理,權(quán)限視圖管理,
資源管理等。
2.項目建設目標
加強網(wǎng)絡綜合管理系統(tǒng)建設,提高網(wǎng)絡設備運行管理水平,通過運維體系的
建設,結(jié)合構(gòu)建集中式的服務熱線、運維流程、系統(tǒng)監(jiān)控和綜合展示系統(tǒng),通過
系統(tǒng)聯(lián)動,及時、準確、全面反映與掌握數(shù)據(jù)中心各網(wǎng)絡設備運行狀態(tài),保障各
業(yè)務系統(tǒng)的正常運行,應達成如下目標:
需要實現(xiàn)網(wǎng)絡管理工作還包括:
(1)網(wǎng)絡故障排查。
當出現(xiàn)網(wǎng)絡故障時,迅速定位網(wǎng)絡故障發(fā)生的位置,分析出現(xiàn)網(wǎng)絡故障的原
因,解決網(wǎng)絡故障,使網(wǎng)絡與業(yè)務系統(tǒng)運行正常;
(2)新增設備、線路的網(wǎng)絡調(diào)整
包括新增接入者,新增備份設備與線路時的網(wǎng)絡調(diào)整;
(3)網(wǎng)絡配置的調(diào)整。
當網(wǎng)絡應用需求變化時,對網(wǎng)絡設備如路由器、防火墻、交換機的設置情況
進行調(diào)整;
(4)日常巡檢。
對網(wǎng)絡設備、線路的日常檢查利于及時發(fā)現(xiàn)網(wǎng)絡故障,發(fā)現(xiàn)系統(tǒng)入侵,發(fā)現(xiàn)
病毒危害等情況;
(5)網(wǎng)絡設備管理。
網(wǎng)絡在用設備與冷備設備的管理,向總行報送在用設備與備用設備的相關(guān)配
置情況,以便于更好地管理網(wǎng)絡,例如出現(xiàn)故障時迅速找到替用設備;
7
(6)整體業(yè)務情況。
對整體業(yè)務設備制定指標健康度,能夠直觀了解當前業(yè)務狀況;
(7)強化主動監(jiān)控,實現(xiàn)集中管理。
以網(wǎng)絡設備和網(wǎng)絡資源的可用性監(jiān)控為主線,構(gòu)建統(tǒng)一集成的網(wǎng)絡資源及應
用服務監(jiān)控平臺,能夠主動、及時地發(fā)現(xiàn)問題,并調(diào)度資源解決問題,形成IT
運維管理主動服務的新格局。
(8)幫助定位故障,快速恢復系統(tǒng)運行。
建立集中的告警分析及展現(xiàn)平臺,提供靈活、自動化的事件處理能力。當網(wǎng)
絡故障產(chǎn)生時,可以進行故障的快速定位,發(fā)現(xiàn)故障原因,調(diào)度資源快速恢復系
統(tǒng)服務,從而縮短故障解決時間,降低維護成本,提高系統(tǒng)整體可用性。
(9)掌握運行質(zhì)量與效率,合理利用資源。
實時了解全部網(wǎng)絡資源的負載與使用情況,根據(jù)需要從整體角度考慮資源的
使用,同時可以根據(jù)業(yè)務高峰期的不同來調(diào)劑業(yè)務系統(tǒng)對網(wǎng)絡資源的使用。
(10)規(guī)范運行管理,有序開展維護。
參照ITIL規(guī)范,對網(wǎng)絡運維管理工作進行優(yōu)化,對服務管理進行改善,將
管理數(shù)據(jù)電子化,管理過程規(guī)范化。根據(jù)相關(guān)制度進行運行維護管理,對內(nèi)完善
流程,對外提高服務,加強管理,使流程更規(guī)范更合理,使技術(shù)人員具備更高的
工作效率,提高業(yè)務技術(shù)能力和解決實際問題的能力。
(11)共享運維經(jīng)驗,完善知識庫。
把運維過程中產(chǎn)生的豐富經(jīng)驗進行積累和總結(jié),形成有效的知識庫,建立知
識的共享機制,提供信息共享和交流的平臺,提高運維人員的工作效率。
8
3.系統(tǒng)需求分析
31建設技術(shù)先進、端到端的集中運維管理平臺
在IT運維管理平臺系統(tǒng)中,所有系統(tǒng)的用戶對系統(tǒng)的操作都將通過接入平
臺來完成。從系統(tǒng)用戶的視圖能看到的是某一種業(yè)務,而這種業(yè)務在系統(tǒng)中對應
的是跨越系統(tǒng)三層結(jié)構(gòu)的很多環(huán)節(jié),任何一個環(huán)節(jié)出現(xiàn)問題都將導致在用戶看來
的系統(tǒng)不可用。因此就要將這些環(huán)節(jié)作為一個整體,統(tǒng)一加以管理。
在成功實現(xiàn)了上述的管理功能后,就可以對整個IT運維管理平臺系統(tǒng)進行
統(tǒng)一、全面的管理,保證數(shù)據(jù)中心的IT系統(tǒng)網(wǎng)絡系統(tǒng)可靠、高效地運行,保證
各個IT系統(tǒng)協(xié)調(diào)一致的提供更好的服務,實現(xiàn)如下系統(tǒng)管理目標:
能夠全面詳細地監(jiān)視系統(tǒng)中所有IT資源的運行情況,提供一致的系統(tǒng)管理
風格
能夠?qū)崟r監(jiān)視網(wǎng)絡和業(yè)務的性能狀況,能夠通過客觀數(shù)據(jù)分析當前系統(tǒng)性能
狀況和長期系統(tǒng)性能變化規(guī)律和趨勢,為系統(tǒng)升級和擴容提供科學的依據(jù)。
具有全面而深入的數(shù)據(jù)庫管理功能,保證數(shù)據(jù)庫系統(tǒng)的可靠和高性能運作,
從而使數(shù)據(jù)庫變成最優(yōu)的后臺支撐系統(tǒng)。
提供運營商級IT系統(tǒng)中所需要的各種功能,及集成化的管理模式,可降低
系統(tǒng)管理的成本
機房實現(xiàn)智能管理管理,分析深層次原因等問題
總之,通過實施系統(tǒng)管理,應該把各個IT系統(tǒng)和涉及到的所有計算機網(wǎng)絡
資源統(tǒng)一的管理起來,把現(xiàn)在靠經(jīng)驗、靠規(guī)章制度進行的管理自動化,減少系統(tǒng)
維護的成本,改善系統(tǒng)可用性和安全性,更好的管理內(nèi)部系統(tǒng)。
32主動及時地發(fā)現(xiàn)問題,扭轉(zhuǎn)被動服務局面
建成信息資源管理平臺后,將采用設備主動向監(jiān)控中心報告故障與監(jiān)控中心
向設備定時發(fā)巡檢指令兩種形式。以電子巡檢代替人工巡檢,可以大大縮短巡檢
周期。技術(shù)人員可以搶在業(yè)務人員發(fā)現(xiàn)系統(tǒng)故障前知道系統(tǒng)故障并完成系統(tǒng)的維
護任務,改變被動服務的局面。
9
3.3.IT系統(tǒng)網(wǎng)絡拓撲結(jié)構(gòu)的管理分析
數(shù)據(jù)中心的IT系統(tǒng)管理網(wǎng)絡拓撲結(jié)構(gòu)的自動生成和管理是一切其他管理的
基礎(chǔ)。網(wǎng)絡軟件不僅應該自動地發(fā)現(xiàn)網(wǎng)絡中IT資源和設備,形成網(wǎng)絡拓撲結(jié)構(gòu)
圖,而且應該能夠以非常直觀的形式反映網(wǎng)絡設備之間的網(wǎng)絡連接情況、網(wǎng)絡線
路的故障和性能狀況、甚至網(wǎng)絡設備在不同地區(qū)的分布情況。
只有這樣,網(wǎng)絡人員才能簡單高效地對網(wǎng)絡進行深入的監(jiān)控和管理,即使對
環(huán)境不是很熟悉的人員,也能迅速看出系統(tǒng)的結(jié)構(gòu)和狀況。對網(wǎng)絡拓撲結(jié)構(gòu)的管
理還應該與具體的IT系統(tǒng)結(jié)合,安裝不同的業(yè)務對網(wǎng)絡設備進行分類,建立所
謂的“業(yè)務處理視圖”。這樣,如果某設備或某設備的某些端口發(fā)生故障,管理
人員就能輕而易舉地確定該故障影響了哪些IT系統(tǒng),從而根據(jù)IT系統(tǒng)的關(guān)鍵程
度確定應首先解決的問題。
拓撲管理應該首先能夠讓管理者從全局角度了解全行設備運行的情況,如果
某個區(qū)域發(fā)生問題,則能方便進入到具體發(fā)生問題的地方查看實時真實的運行和
連接情況。
實時動態(tài)拓撲圖通過不同的顏色和圖標反映了網(wǎng)絡設備不同的狀態(tài),當拓撲
圖的設備圖標或鏈路圖標變紅時,網(wǎng)管員就能知道當前這些設備或鏈路的負載比
較大,需要重點關(guān)注這些情況;
34建立智能的綜合監(jiān)控系統(tǒng)
對于運營需求功能的不斷加多加深,IT系統(tǒng)的管理功能約來越多,管理者
得到的信息將是海量的,如何分析那些是重要緊急的事件,那些事件需要自己處
理,這些事件之間有沒有關(guān)聯(lián),這些事件背后的運行趨勢是怎么樣的,要解決這
些問題,單純依靠管理者的經(jīng)驗是不夠的,同時如果完全依靠人工方式
而完成這些工作不應該繼續(xù)成為用戶信息運維管理的負擔,因此,智能化是
建設網(wǎng)絡管理信息系統(tǒng)一個重要的要求。所謂智能,對于網(wǎng)絡管理應用軟件來說,
代表著高效的系統(tǒng)分析和處理能力,甚至支持企業(yè)戰(zhàn)略的實施。具體的智能化就
是需要具備告警的自動壓縮、自動合并、自動關(guān)聯(lián)到相關(guān)管理者、告警的根源定
10
位以及告警的趨勢預警等。
35建立智能的趨勢運行分析系統(tǒng)
通過監(jiān)控系統(tǒng)記錄系統(tǒng)運行的各項重要指標,將這些運行指標跟據(jù)管理和業(yè)
務的需要生成歷史運行趨勢分析圖,幫助運維系統(tǒng)管理人員了解重要的業(yè)務系統(tǒng)
在哪些時段,哪些區(qū)域會對IT系統(tǒng)資源占用率比較高,規(guī)律性的表現(xiàn)在什么地
方,如果業(yè)務部門在做業(yè)務促銷時,IT系統(tǒng)的資源是否能夠保障相關(guān)聯(lián)的業(yè)務
穩(wěn)定增長運行。這些都會為數(shù)據(jù)中心信息管理部門分析業(yè)務的健康程度和系統(tǒng)擴
容或改造調(diào)整做準確的科學判斷依據(jù)。
3.6.IT系統(tǒng)性能的監(jiān)控分析
IT系統(tǒng)性能分析是IT系統(tǒng)管理以至整個系統(tǒng)管理體系非常重要的一個環(huán)節(jié)。
有些IT系統(tǒng)的故障并不是由于設備或線路的故障引起的,而是由于系統(tǒng)性能問
題造成的。通過性能管理,一方面可以及時掌握性能狀況,排除由于性能問題造
成的故障,保障系統(tǒng)的正常運行,另一方面,可以通過對性能的歷史分析,調(diào)整
網(wǎng)絡、服務器配置。
37建立綜合報表發(fā)布平臺
為了提高科技處信息管理部門的服務水平,提高相關(guān)業(yè)務部門的滿意度,
需要一個綜合的報表發(fā)布平臺來發(fā)布各項關(guān)鍵業(yè)務和關(guān)鍵指標的健康度、可用性
的報表。報表的內(nèi)容應該包括:系統(tǒng)設備的性能統(tǒng)計、系統(tǒng)設備故障統(tǒng)計、系統(tǒng)
資源使用情況統(tǒng)計、應用統(tǒng)計、服務水平統(tǒng)計報表等。
同時,當要訪問報表時,不同部門,不同角色的用戶組都有不同的需求,作
為綜合的IT監(jiān)控,平臺提供的報表可以讓用戶很方便的訪問和使用大量信息,
通過它可以訪問大量數(shù)據(jù)源一一業(yè)務信息系統(tǒng)與交換系統(tǒng)、Excel電子表格、XML
文件,因此用戶可以將數(shù)據(jù)整合,劃分和分割,執(zhí)行高級排列和分類,創(chuàng)建計算
方法,進行復雜的繪圖等。
11
3.8.建立綜合的服務器管理機制
伴隨著信息化建設事業(yè)的不斷發(fā)展,信息中心IT設施已具有一定的規(guī)模,各
類不同廠商、不同型號的服務器和各種各樣的應用系統(tǒng)已上線運行。服務器承載
著的各個應用系統(tǒng)的運行,如何才能保證服務器及應用系統(tǒng)的正常運行,并實現(xiàn)
高效安全的運轉(zhuǎn)變成了一個艱巨的任務。
4.綜合IT管理系統(tǒng)建設任務
IT管理解決方案能對用戶所有的網(wǎng)絡設備、服務器、安全設備、應用系統(tǒng)
等各種軟硬件以及業(yè)務系統(tǒng)進行端到端的一體化管理,并克服了其它網(wǎng)管系統(tǒng)只
是提高大量數(shù)據(jù)而沒有業(yè)務建模和智能分析展現(xiàn)的弱點,真正幫助用戶化繁為
簡,解決目前綜合IT管理系統(tǒng)遇到的各種問題,解決網(wǎng)絡復雜性和人員不足的
矛盾。要實現(xiàn)以上目標,綜合IT管理系統(tǒng)建設的主要任務如下
41建立統(tǒng)一靈活的管理平臺
IT管理系統(tǒng)實現(xiàn)了三個統(tǒng)一:統(tǒng)一登錄界面、統(tǒng)一資源管理、統(tǒng)一展現(xiàn)。
系統(tǒng)從純C/S(Client/server)或B/S+C/S模式帶入到嶄新的B/S時代。用戶界
面方面提供基于行業(yè)標準的純?yōu)g覽器B/S(Browser/Server)方式的操作界面,
保證了使用上簡單、靈活、方便。
同時基于成熟的網(wǎng)絡技術(shù)所用的電子簽名技術(shù)給靈活多樣的瀏覽器界面提
供了充分全面的安全保證。管理者還可以根據(jù)自己的使用習慣和不同的管理范圍
定制個性化的登陸界面,極大的方便了管理者的使用。
4.2.建立與管理區(qū)域匹配的分級管理模式
具有一級權(quán)限的管理員登陸到ITMaster后,就能看所有區(qū)域的設備運行情
況,包括拓撲、告警、性能分析、報表等;每個二級權(quán)限的管理員可以通過WEB
方式方便的登陸到中心服務器上,通過身份驗證后,只能管理自己區(qū)域內(nèi)的設備,
完成的管理工作也是在管理員授權(quán)范圍內(nèi)的功能,可以是拓撲管理、告警管理、
12
性能分析、報表分析等功能,或其中一項。
43實現(xiàn)故障信息采集和統(tǒng)一處理
即將網(wǎng)絡管理、系統(tǒng)管理、安全管理、機房環(huán)境管理等功能整合在一起,實
現(xiàn)統(tǒng)一的監(jiān)控數(shù)據(jù)采集、一體化的報警數(shù)據(jù)處理、統(tǒng)一的故障流程處理。逐步建
立一個功能齊全、面向未來的綜合網(wǎng)絡監(jiān)控管理平臺,以解決由于分別建立多個
專業(yè)網(wǎng)管系統(tǒng)而造成互相分割的問題,實現(xiàn)對網(wǎng)絡資源集中監(jiān)控、集中管理和集
中維護,包括全網(wǎng)故障分析和故障定位以及全網(wǎng)性能綜合分析等功能。
B
/
S
開
料
放
、S
S網(wǎng)管基礎(chǔ)平臺總線a
結(jié)f
構(gòu)i
交
互
Oracle|應用管理模|主機管理模||網(wǎng)絡管理模
SQL、DB2、Sybase、存儲管理模
塊Agent、塊及子網(wǎng)管
Mysqlveblogic、塊
webspheredonino_Snr?3^.系統(tǒng)接口
數(shù)據(jù)庫/中間存儲應用服務服務器網(wǎng)絡桌面終端機房+空調(diào)
件
44實現(xiàn)管理流程整合和統(tǒng)一管理
建立統(tǒng)一網(wǎng)絡管理、系統(tǒng)管理、安全管理、機房環(huán)境相關(guān)的各個業(yè)務流,如
值班、工單、資產(chǎn)管理等,形成信息中心運行維護的規(guī)范化流程。網(wǎng)絡監(jiān)控子系
統(tǒng)實時監(jiān)控網(wǎng)絡及系統(tǒng)的運行情況,一旦出現(xiàn)異常情況,系統(tǒng)將根據(jù)工作流管理
子系統(tǒng)預定的流程,自動生成并派發(fā)工單,并根據(jù)值班管理子系統(tǒng)的設定,將工
單下達給相應人員。處理人員可以調(diào)用知識庫子系統(tǒng)的內(nèi)容,查詢以往的歷史記
錄和處理辦法,對本次情況處理提供全面幫助。整個工作完成后,所有操作和記
錄自動歸檔,相關(guān)知識自動記錄在知識庫子系統(tǒng)。同時,統(tǒng)一用戶管理子系統(tǒng)實
現(xiàn)對用戶的權(quán)限管理,資產(chǎn)管理幫助管理員錄入資產(chǎn)信息,查詢資產(chǎn)使用情況,
加強對IT資源的內(nèi)部控制;其它系統(tǒng)入口子系統(tǒng),提供在ITMASTER上訪問其它
系統(tǒng)的入口,建立運維管理的統(tǒng)一門戶。
13
4.5.建立統(tǒng)一的信息展示和運行考核
我們可以看到,綜合的系統(tǒng)管理的目標,已經(jīng)由進行個別資源監(jiān)控、系統(tǒng)及
網(wǎng)絡管理、應用可用性方面階段,正向著業(yè)務流程的優(yōu)化方向發(fā)展;業(yè)務系統(tǒng)管
理工具的功能,已經(jīng)從數(shù)據(jù)收集、發(fā)現(xiàn)、狀態(tài)監(jiān)控、配置管理、實時性能監(jiān)控,
向著歷史數(shù)據(jù)分析、決策分析、自動響應和高度容錯方向發(fā)展。綜合管理系統(tǒng)應
該根據(jù)系統(tǒng)采集的各類數(shù)據(jù),開發(fā)運行維護的信息管理、網(wǎng)絡、應用的信息展示
功能,并與運行管理的績效考核相結(jié)合。綜合的系統(tǒng)管理的管理目標和管理功能
也是不斷發(fā)展、變化的。
5.綜合IT管理系統(tǒng)方案選擇以及環(huán)境要求
5.1.1.方案模塊選擇
結(jié)合目前IT系統(tǒng)管理的需求,滿足對網(wǎng)絡資源的管理需求,我們選擇如下
模塊:
基礎(chǔ)平臺(其中包括:拓撲管理模塊、動態(tài)背板管理模塊網(wǎng)絡預警模塊、網(wǎng)
絡告警模塊、性能分析模塊、資源管理模塊、運行管理模塊、系統(tǒng)工具模塊、日
志管理模塊、報表模塊)、網(wǎng)絡設備管理節(jié)點模塊、服務器管理管理模塊、、設
備集/地域管理模塊、桌面管理系統(tǒng)模塊、流量分析模塊。
5.1.2.網(wǎng)絡環(huán)境要求
1、網(wǎng)絡設備管理地址允許Ping。
2、需要管理的設備SNMP已經(jīng)全部配置完成。
3、防火墻、訪問列表上<UDP161>端口是允許通過的。
5.1.3.硬件運行環(huán)境
為了能更好的完成IT運維管理系統(tǒng)的各項模塊功能,我們建議用如下配置
服務器來完成各項功能,具體硬件要求如下:
14
網(wǎng)絡系統(tǒng)管理服務器要求
類型指標要求
Cpu2XXEON2.8GHZ二級緩存L2Cache2M
內(nèi)存4GB
硬盤SCSI硬盤180G
網(wǎng)卡千兆網(wǎng)卡
5.1.4.系統(tǒng)運行軟件環(huán)境
操作系統(tǒng)平臺:
Linux或WindowsXP/2003或Unix
6.項目方案設計
6.1.設計原則
數(shù)據(jù)中心運維管理平臺作為數(shù)據(jù)中心未來運維工作的核心支撐系統(tǒng),需要系
統(tǒng)本身具有高可靠、易擴展、易維護等特點,并且在系統(tǒng)功能應用上要具備一定
的技術(shù)先進性和實用性。所以,本次項目的方案設計遵循以下設計原則:
(1)規(guī)范性
規(guī)范性原則規(guī)定系統(tǒng)的設計、開發(fā)、實施和維護管理必須遵循中國國家標準、
工業(yè)和信息化部有關(guān)通信行業(yè)通用的規(guī)范以及通用的國際規(guī)范,保證系統(tǒng)的正常
使用。
(2)先進實用
平臺注重先進性和實用性的統(tǒng)一,以實用為目的,合理選用各類成熟、先進
技術(shù)。在體系結(jié)構(gòu)、功能算法等諸多方面都采用先進計算機技術(shù)和理論,應用功
能體現(xiàn)實用性。
(3)可靠性
在系統(tǒng)結(jié)構(gòu)、設計方案、設備選擇、技術(shù)服務等方面綜合考慮,保證系統(tǒng)能
15
夠7*24安全無故障運行,系統(tǒng)有很好的容錯功能;對IT資源的監(jiān)測應保證不影
響相關(guān)設備和系統(tǒng)的正常良好運行,并實現(xiàn)最好的響應效率及最小的資源占用。
(4)安全性
注重安全方面的設計,確保IT運維監(jiān)控管理平臺的穩(wěn)定、安全運行。系統(tǒng)
要保證數(shù)據(jù)的安全,不會增加現(xiàn)有應用系統(tǒng)的復雜性,更不會降低現(xiàn)有應用系統(tǒng)
的穩(wěn)定性。
(5)開放性
采用符合國際國內(nèi)標準的通用協(xié)議,為實現(xiàn)與其他系統(tǒng)監(jiān)控軟硬件互聯(lián)或接
入本系統(tǒng)進行監(jiān)控提供接口,支持各種主流計算機平臺、操作系統(tǒng)以及數(shù)據(jù)庫廠
商的各類軟硬件產(chǎn)品。
(6)可擴展、易集成
系統(tǒng)需具備很好的擴展性,能適應不斷發(fā)展的業(yè)務需求。隨著IT資源種類
和數(shù)量的擴大,系統(tǒng)也應能適應新的系統(tǒng)的對IT運維管理的需求。系統(tǒng)具備高
度集成性,可以和第三方產(chǎn)品進行集成,進行功能擴展。系統(tǒng)提供開發(fā)工具和接
口,方便其他監(jiān)控系統(tǒng)集成和統(tǒng)一管理。
(7)易用性
易用性原則規(guī)定系統(tǒng)在兩個方面容易使用。一方面是方便普通的客戶,另
一方面是方便客戶服務系統(tǒng)的系統(tǒng)管理員。
(8)業(yè)務獨立性
業(yè)務獨立性原則規(guī)定用戶系統(tǒng)的接入部分與業(yè)務實現(xiàn)相關(guān)的處理部分之間
必須相互獨立。
(9)服務位置透明性
在業(yè)務邏輯層,所有的應用程序都以服務的形式分布在多臺機器節(jié)點上,
這些機器節(jié)點既可以是同構(gòu)的,也可以是異構(gòu)的(不同的操作系統(tǒng))。在開
發(fā)應用時,任何服務中都不能出現(xiàn)有關(guān)機器節(jié)點位置(如IP地址)和異構(gòu)平
臺的信息。而要實現(xiàn)位置的透明性與平臺的無關(guān)性。
16
6.2.系統(tǒng)架構(gòu)
6.2.1.邏輯架構(gòu)
建設數(shù)據(jù)中心運維管理體系包括四個層次的工作:
一是實現(xiàn)數(shù)據(jù)中心數(shù)據(jù)中心系統(tǒng)的故障信息采集和統(tǒng)一處理。即對網(wǎng)絡、服
務器、數(shù)據(jù)庫、中間件、磁盤陣列、應用系統(tǒng)及機房環(huán)境進行有效的管理和監(jiān)控,
將網(wǎng)絡管理、數(shù)據(jù)中心運維管理、安全管理、數(shù)據(jù)中心基礎(chǔ)環(huán)境管理等功能整合
在一起,實現(xiàn)統(tǒng)一的監(jiān)控數(shù)據(jù)采集、一體化的報警數(shù)據(jù)處理、統(tǒng)一的故障流程處
理。
二是管理流程整合和統(tǒng)一管理。統(tǒng)一網(wǎng)絡管理、數(shù)據(jù)中心運維管理、安全管
理、IT基礎(chǔ)環(huán)境管理相關(guān)的各個業(yè)務流,如值班管理、工單管理、資產(chǎn)管理、
知識庫管數(shù)據(jù)中心數(shù)據(jù)中心運維系統(tǒng)解決方案理等,形成數(shù)據(jù)中心運行維護的規(guī)
范化流程。
三是統(tǒng)一的信息展示和運行考核。根據(jù)資源監(jiān)控系統(tǒng)采集的各類數(shù)據(jù),提供
網(wǎng)絡、業(yè)務應用的信息展示功能,并與運行管理的績效考核相結(jié)合。
四是實現(xiàn)數(shù)據(jù)中心運維管理平臺向綜合運維管理平臺系統(tǒng)的數(shù)據(jù)上報,可以
全盤掌握各子系統(tǒng)軟件/硬件設備的運行情況,并生成各種統(tǒng)計分析報表。
數(shù)據(jù)中心運維管理平臺將是一個完整的網(wǎng)絡與系統(tǒng)管理、安全管理、數(shù)據(jù)中
心基礎(chǔ)環(huán)境管理、運維流程管理解決方案,可以最大限度的保護網(wǎng)絡中的投資,
并充分考慮到將來管理需求擴展。其中每一個層次之間的如下圖所示:
17
規(guī)則管理統(tǒng)一數(shù)據(jù)顯示系統(tǒng)數(shù)據(jù)交換接口
網(wǎng)絡管理應用管理設備管理桌面管理數(shù)據(jù)接口
(一)對象層
對象層能夠管理數(shù)據(jù)中心信息平臺,涵蓋了機房動力環(huán)境設備、網(wǎng)絡設備、
服務器系統(tǒng)、系統(tǒng)應用軟件、網(wǎng)絡安全設備等。同時系統(tǒng)可以管理由網(wǎng)絡設備和
線路構(gòu)成的多種鏈路。
(-)系統(tǒng)監(jiān)測層
監(jiān)測層包括網(wǎng)絡管理、應用管理、設備管理、桌面管理,是監(jiān)測底層的被管
對象層,實現(xiàn)對網(wǎng)絡、主機、存儲設備、安全設備、數(shù)據(jù)庫、中間件及應用軟件
等IT資源的全面監(jiān)控管理;同時自動收集、過濾、關(guān)聯(lián)和分析各種管理功能產(chǎn)
生的故障事件,實現(xiàn)對故障的快速定位和處理;對網(wǎng)絡和業(yè)務應用等IT資源的
性能進行監(jiān)控,定期提供性能報表和趨勢報表,為網(wǎng)絡性能優(yōu)化提供科學依據(jù)。
系統(tǒng)監(jiān)測層通過各類探針獲得各類被管對象的數(shù)據(jù)。采集方式支持多種網(wǎng)絡協(xié)議
和采集方式,對于不符合標準網(wǎng)絡協(xié)議的設備,系統(tǒng)提供二次開發(fā)的數(shù)據(jù)采集接
□o采集協(xié)議與方式主要包括:SNMP、SNMPTRAP、Agent.WKSocket等。
(三)用戶層
用戶層是整個系統(tǒng)呈現(xiàn),是運維管理平臺的人機交互接口,系統(tǒng)集中運行展
現(xiàn)提供集中的直觀的監(jiān)控呈現(xiàn)、快速發(fā)現(xiàn)和分析各類運行隱患,提供了運行一覽、
網(wǎng)絡拓撲、業(yè)務拓撲、負載分析、告警臺、統(tǒng)計分析等多種監(jiān)測視圖,通過集中
18
化的有機的組合各種視圖,為不同角色的人員提供完整的運維管理工作界面。運
維服務管理層將人、技術(shù)與流程進行有效地融合,實現(xiàn)日常運維工作的自動化、
信息化和標準化。
(四)事件層
事件層的設計目標是通過歷史大數(shù)據(jù)分析,建立起運維知識庫。知識庫能自
動實現(xiàn)運維知識的積累、沉淀和共享,從而降低IT運維管理對個人的依賴。至
上而下的IT運維管理平臺能為IT服務管理提供足夠的管理元素,幫助管理者從
不同的角度、不同層面去了解系統(tǒng)運維狀況,為領(lǐng)導決策提供科學依據(jù),同時生
成多種工作記錄,領(lǐng)導可對IT運維管理人員的績效進行客觀的評估,從而幫助
用戶實現(xiàn)對IT服務基礎(chǔ)支撐系統(tǒng)的透徹管控。
監(jiān)測層和用戶層通過統(tǒng)一的資源庫和子系統(tǒng)接口來進行有機的融合,同時系
統(tǒng)提供了單點登錄和統(tǒng)一認證的支持,確保從上到下的操作是必須經(jīng)過統(tǒng)一登錄
認證和操作審計的。其他集成接口系統(tǒng)包括系統(tǒng)數(shù)據(jù)交換接口和分布式數(shù)據(jù)采集
接口,通過系統(tǒng)數(shù)據(jù)交換接口,可以建立多層系統(tǒng)部署的數(shù)據(jù)交換,同時也可以
和異構(gòu)系統(tǒng)集成,通過分布式數(shù)據(jù)采集接口可以實現(xiàn)數(shù)據(jù)的遠程采集。
6.2.2.產(chǎn)品架構(gòu)
本系統(tǒng)面對用戶日益復雜的數(shù)據(jù)中心環(huán)境,整合對網(wǎng)絡、服務器與業(yè)務應用、
安全設備、和機房基礎(chǔ)環(huán)境等的分割管理,實現(xiàn)了對數(shù)據(jù)中心系統(tǒng)的集中、統(tǒng)一、
全面的監(jiān)控與管理;系統(tǒng)通過融入ITIL等運維管理理念,達到了技術(shù)、功能、
服務三方面的完全整合,實現(xiàn)了數(shù)據(jù)中心服務支持過程的標準化、流程化、規(guī)范
化,極大地提高了故障應急處理能力,提升了數(shù)據(jù)中心的管理效率和服務水平。
19
運
行
W
理
煲
源
監(jiān)
控
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中職種子生產(chǎn)與經(jīng)營(種子生產(chǎn)技術(shù))試題及答案
- 2025年中職機電技術(shù)(設備調(diào)試)試題及答案
- 2025年大學倫理學(生命倫理研究)試題及答案
- 2025年中職汽車車身修復(汽車鈑金技術(shù))試題及答案
- 國開電大專科《管理學基礎(chǔ)》期末紙質(zhì)考試判斷題題庫2026珍藏版
- 2026廣西北海市海城區(qū)海洋局招聘編外人員1人備考題庫及答案詳解參考
- 2026四川成都軌道交通集團有限公司招聘3人備考題庫及答案詳解(奪冠系列)
- 2026年中國水產(chǎn)科學研究院第一批招聘備考題庫(78人)及一套完整答案詳解
- 2025年下學期望城二中高一期末考試語文試題-教師用卷
- 2026廣西壯族自治區(qū)計量檢測研究院招聘2人備考題庫及答案詳解參考
- 日文常用漢字表
- QC003-三片罐206D鋁蓋檢驗作業(yè)指導書
- 舞臺機械的維護與保養(yǎng)
- 運輸工具服務企業(yè)備案表
- 醫(yī)院藥房醫(yī)療廢物處置方案
- 高血壓達標中心標準要點解讀及中心工作進展-課件
- 金屬眼鏡架拋光等工藝【省一等獎】
- 《藥品經(jīng)營質(zhì)量管理規(guī)范》的五個附錄
- 試論如何提高小學音樂課堂合唱教學的有效性(論文)
- 機房設備操作規(guī)程
- ASMEBPE介紹專題知識
評論
0/150
提交評論