版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
企業(yè)IT統(tǒng)一監(jiān)控運(yùn)維平臺(tái)建設(shè)方案4平臺(tái)特性目錄1項(xiàng)目背景3實(shí)施內(nèi)容2建設(shè)目標(biāo)4項(xiàng)目實(shí)施計(jì)劃5項(xiàng)目背景-子公司建設(shè)OMC的必要性考核壓力越來(lái)越大運(yùn)維成本越來(lái)越高運(yùn)維難度越來(lái)越大構(gòu)建標(biāo)準(zhǔn)化的運(yùn)維體系母公司對(duì)各子公司自有系統(tǒng)運(yùn)維能力的要求不斷提升,考核力度逐年增長(zhǎng);各類監(jiān)管規(guī)范與集中行動(dòng)越來(lái)越多,包括:業(yè)務(wù)大會(huì)戰(zhàn)、應(yīng)急預(yù)案、HW行動(dòng)、業(yè)務(wù)連續(xù)性,運(yùn)維管理要求等;對(duì)系統(tǒng)監(jiān)控質(zhì)量標(biāo)準(zhǔn)日益提高,必須要做到定期巡檢、可用性探測(cè)、漏洞掃描、備份等。隨著業(yè)務(wù)發(fā)展子公司系統(tǒng)故障影響面越來(lái)越大,解決問(wèn)題的成本越來(lái)越高;當(dāng)前子公司各系統(tǒng)應(yīng)用規(guī)范日益增大,其中WLAN平臺(tái)已接入**客戶,涉及**網(wǎng)點(diǎn);視頻監(jiān)控平臺(tái)已接入**客戶,涉及**路視頻,智慧社區(qū)已承載**社區(qū),連接設(shè)備**個(gè),上述系統(tǒng)一旦出現(xiàn)故障波及面無(wú)法估量。隨著新技術(shù)引入、新模塊迭代,系統(tǒng)復(fù)雜度顯著增強(qiáng),單靠人工的被動(dòng)維護(hù)無(wú)以為繼;目前智慧社區(qū)平臺(tái)、某著名企業(yè)OA平臺(tái)、視頻監(jiān)控和分析平臺(tái)、項(xiàng)目管人工手理系統(tǒng)等都使用了不同的最新技術(shù),系統(tǒng)復(fù)雜度日益增高,新的故障類型也在不斷涌現(xiàn)。子公司運(yùn)維基礎(chǔ)薄弱、專業(yè)人員稀缺,在明確運(yùn)維流程基礎(chǔ)上通過(guò)系統(tǒng)固化有助于短期內(nèi)快速實(shí)現(xiàn)日常操作的標(biāo)準(zhǔn)化,避免因人而宜產(chǎn)生較大波動(dòng);通過(guò)本系統(tǒng)建設(shè)可以構(gòu)建標(biāo)準(zhǔn)的運(yùn)維體系,包括:告警處置流程的標(biāo)準(zhǔn)化,日常巡檢流程的標(biāo)準(zhǔn)化,系統(tǒng)作業(yè)流程的標(biāo)準(zhǔn)化等。項(xiàng)目背景-子公司IT運(yùn)維的現(xiàn)狀與問(wèn)題監(jiān)控深度有限只有硬件、端口,缺少對(duì)中間件、應(yīng)用、網(wǎng)絡(luò)等可靠性、安全性的全面監(jiān)控。監(jiān)控廣度有限目前只能安排專人照顧重點(diǎn)平臺(tái)和重要系統(tǒng),子公司涉及運(yùn)維的所有系統(tǒng)僅能覆蓋約60%。問(wèn)題處理無(wú)標(biāo)準(zhǔn)應(yīng)急處置方法沒有沉淀渠道和手段,發(fā)生同類問(wèn)題取決于誰(shuí)處理,而不是大家都能按標(biāo)準(zhǔn)操作處理。定位故障缺信息故障診斷中運(yùn)維人員很難獲取定位異常點(diǎn)等全面的信息;事后診斷發(fā)現(xiàn)某一平臺(tái)問(wèn)題焦點(diǎn)的手段不便捷?;诘托У默F(xiàn)場(chǎng)人工模式監(jiān)控管理缺乏抓手告警處置進(jìn)度和結(jié)果非顯性化,作為班組長(zhǎng)或管理者缺少掌握問(wèn)題、推進(jìn)問(wèn)題解決的抓手。無(wú)法達(dá)到母公司監(jiān)管要求母公司要求日益增高母公司對(duì)各子公司對(duì)系統(tǒng)的監(jiān)管與運(yùn)維要求在“集中監(jiān)控、集中維護(hù)和集中管理”三個(gè)層面實(shí)現(xiàn)信息化和自動(dòng)化。當(dāng)前管理基礎(chǔ)薄弱公司目前基本是處在零起步,停留在粗線條的人工管理階段;無(wú)法達(dá)到母公司的監(jiān)管要求?,F(xiàn)狀問(wèn)題基于統(tǒng)一規(guī)劃分步完善的思路現(xiàn)階段急需的是滿足母公司對(duì)子公司系統(tǒng)可用性、安全性的考核和檢查,確保系統(tǒng)運(yùn)行穩(wěn)定服務(wù)好甲方客戶本期項(xiàng)目的重點(diǎn)是實(shí)現(xiàn)集中監(jiān)控項(xiàng)目背景-當(dāng)前IT運(yùn)維在集中監(jiān)控方向的總體趨勢(shì)隨著企業(yè)數(shù)字化的迅猛發(fā)展,給IT運(yùn)維帶來(lái)了全新的挑戰(zhàn),主要體現(xiàn)在:隨著業(yè)務(wù)對(duì)IT運(yùn)維提出的要求越來(lái)越高,原來(lái)被動(dòng)救火式的IT運(yùn)維模式已不能滿足企業(yè)要求,無(wú)法為業(yè)務(wù)發(fā)展提供保障。只有構(gòu)建主動(dòng)巡防式的IT監(jiān)控與運(yùn)維體系,能夠提前預(yù)防并處理系統(tǒng)各類故障,才能為業(yè)務(wù)的快速發(fā)展保駕護(hù)航,滿足企業(yè)對(duì)IT的要求。業(yè)務(wù)變化越來(lái)越快系統(tǒng)變更越來(lái)越頻新系統(tǒng)上線越來(lái)越多業(yè)務(wù)訪問(wèn)量快速增長(zhǎng)用戶體驗(yàn)要求越來(lái)越高業(yè)務(wù)處理時(shí)效性更高業(yè)務(wù)中斷容忍度更低高層對(duì)IT部門考核更嚴(yán)……系統(tǒng)架構(gòu)越來(lái)越復(fù)雜故障類型越來(lái)越多系統(tǒng)負(fù)載更大、故障風(fēng)險(xiǎn)高故障排查、修復(fù)更難技術(shù)快速演進(jìn)與新技術(shù)應(yīng)用人員技術(shù)能力與經(jīng)驗(yàn)不足人員成本越來(lái)越高知識(shí)經(jīng)驗(yàn)無(wú)法沉淀……因此,構(gòu)建主動(dòng)式的IT監(jiān)控與運(yùn)維將成為必然所趨&外部壓力挑戰(zhàn)案例找方案&找標(biāo)準(zhǔn)找方案微信(掃第一個(gè)碼)每日分享各個(gè)領(lǐng)域高質(zhì)量專業(yè)的解決方案,內(nèi)容包括某省市、鄉(xiāng)村振興、智慧城管、智慧園區(qū)、智慧公安、智慧水務(wù)(水利)、智慧林草、社會(huì)綜合治理、智慧旅游、智慧工地、智慧環(huán)衛(wèi)、智慧醫(yī)院、智慧環(huán)保、智慧安監(jiān)等領(lǐng)域,結(jié)合數(shù)字孿生、人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù),分享行業(yè)售前方案、設(shè)計(jì)方案、技術(shù)方案和項(xiàng)目信息等。找標(biāo)準(zhǔn)微信(掃第二個(gè)碼)每日分享各個(gè)智慧領(lǐng)域國(guó)家和地方標(biāo)準(zhǔn)規(guī)范,國(guó)家和地方政策指導(dǎo)文件,讓各個(gè)智慧方案有據(jù)可依,內(nèi)容包括找方案中的各個(gè)行業(yè)的政策和規(guī)范,內(nèi)容在不斷的收集和完善中。找方案知識(shí)星球(掃第三個(gè)碼)會(huì)員可下載所有資料,并每日上新(注:所有資料均通過(guò)互聯(lián)網(wǎng)等公開渠道獲取,個(gè)人學(xué)習(xí)使用,請(qǐng)勿用于商業(yè)用途)。找標(biāo)準(zhǔn)知識(shí)星球(掃第四個(gè)碼)會(huì)員可下載所有資料,并每日上新(注:所有資料均通過(guò)互聯(lián)網(wǎng)等公開渠道獲取,個(gè)人學(xué)習(xí)使用,請(qǐng)勿用于商業(yè)用途)。找方案星球優(yōu)惠券(掃第五個(gè)碼)掃描69元價(jià)格優(yōu)惠加入,1W+方案任意下載,資源不斷的豐富完善中......找方案微信找方標(biāo)準(zhǔn)信2平臺(tái)特性1項(xiàng)目背景3實(shí)施內(nèi)容4建設(shè)目標(biāo)項(xiàng)目實(shí)施計(jì)劃5總體目標(biāo)是搭建智能化IT運(yùn)維管理平臺(tái),協(xié)助子公司售后團(tuán)隊(duì)構(gòu)建主動(dòng)巡防式的IT運(yùn)維體系,提升IT運(yùn)維效率,保障業(yè)務(wù)可用性,滿足母公司對(duì)子公司各項(xiàng)考核和檢查要求。結(jié)合運(yùn)維能力短板和能力需要的迫切性,本期項(xiàng)目的重點(diǎn)是實(shí)現(xiàn)集中的監(jiān)控管理。具體建設(shè)目標(biāo)包括:通過(guò)實(shí)施統(tǒng)一IT監(jiān)控運(yùn)維平臺(tái),不僅打造了一體化、標(biāo)準(zhǔn)化的監(jiān)控運(yùn)維體系,并注入了主動(dòng)的IT監(jiān)控?cái)?shù)據(jù)采集與自動(dòng)的故障風(fēng)險(xiǎn)能力,可以為公司打造更加完善的IT監(jiān)控能力,滿足運(yùn)維團(tuán)隊(duì)對(duì)監(jiān)控深度和廣度的訴求。打造完善監(jiān)控能力實(shí)現(xiàn)監(jiān)控與故障數(shù)據(jù)的可視化展示,對(duì)監(jiān)控與故障數(shù)據(jù)進(jìn)行全面、深度的分析,分析故障特征,輔助發(fā)現(xiàn)問(wèn)題根源,定期輸出分析報(bào)告,支持我們從傳統(tǒng)運(yùn)維統(tǒng)計(jì)轉(zhuǎn)向自動(dòng)化運(yùn)維分析。實(shí)現(xiàn)可視化IT監(jiān)控與分析統(tǒng)一IT監(jiān)控運(yùn)維平臺(tái)會(huì)全面采集被監(jiān)控系統(tǒng)各項(xiàng)運(yùn)行數(shù)據(jù),可以為運(yùn)維團(tuán)隊(duì)提供有效的故障信息和原因定位輔助,幫助運(yùn)維人員及時(shí)發(fā)現(xiàn)系統(tǒng)故障并迅速、準(zhǔn)確定位故障原有,進(jìn)而可快速修復(fù)系統(tǒng)故障,保障業(yè)務(wù)的可用性和連續(xù)性。提供有效故障信息和定位輔助利用平臺(tái)的自動(dòng)化故障處理能力,幫助我們構(gòu)建更加完善的IT故障處理機(jī)制,沉淀IT應(yīng)急預(yù)案,提升故障處置的準(zhǔn)確性。今后,對(duì)于一般系統(tǒng)故障可由人工進(jìn)行標(biāo)準(zhǔn)化處理,而對(duì)于關(guān)鍵平臺(tái)的服務(wù)不可用或功能故障則由平臺(tái)自動(dòng)進(jìn)行處置。沉淀應(yīng)急預(yù)案提升處置準(zhǔn)確性1項(xiàng)目背景5建設(shè)目標(biāo)42平臺(tái)特性項(xiàng)目實(shí)施計(jì)劃實(shí)施內(nèi)容3總體解決方案人員支撐運(yùn)維工程師技術(shù)工程師CIO業(yè)務(wù)主管運(yùn)維主管信息推送工作支撐數(shù)據(jù)采集故障探測(cè)采集信息應(yīng)用服務(wù)中間件底層系統(tǒng)基礎(chǔ)設(shè)施業(yè)務(wù)狀態(tài)連接系統(tǒng)某著名企業(yè)辦公智慧社區(qū)視頻監(jiān)控WLAN…系統(tǒng)數(shù)據(jù)采集異常檢測(cè)主動(dòng)預(yù)警信息通知郵件通知聲音告警報(bào)告推送可視化報(bào)表可視展示主動(dòng)告警智能IT監(jiān)控與運(yùn)維平臺(tái)指標(biāo)配置數(shù)據(jù)采集探傷檢測(cè)智能監(jiān)控自動(dòng)修復(fù)消息通知可視展示基于項(xiàng)目的背景與建設(shè)目標(biāo),本期將通過(guò)部署、實(shí)施一套智能化的IT監(jiān)控平臺(tái)系統(tǒng)。為公司注入全面采集IT系統(tǒng)各級(jí)資源數(shù)據(jù)能力,智能化的故障與風(fēng)險(xiǎn)分析能力、主動(dòng)故障告警能力,讓IT維護(hù)人員能夠及時(shí)發(fā)現(xiàn)、甚至提前預(yù)測(cè)系統(tǒng)故障,進(jìn)而幫助公司建立主動(dòng)式的IT監(jiān)控運(yùn)維告警模式。規(guī)則配置主動(dòng)告警數(shù)據(jù)分析總體系統(tǒng)架構(gòu)與應(yīng)用藍(lán)圖智能IT監(jiān)控與運(yùn)維平臺(tái)IT物聯(lián)網(wǎng)大數(shù)據(jù)云計(jì)算智能故障分析數(shù)據(jù)統(tǒng)計(jì)、分析快速故障修復(fù)信息推送與告警故障報(bào)告數(shù)據(jù)匯集深度分析發(fā)現(xiàn)故障/風(fēng)險(xiǎn)數(shù)據(jù)分析信息展示信息推送報(bào)表管理指標(biāo)配置故障配置告警配置監(jiān)控任務(wù)處理日志調(diào)整算法查收?qǐng)?bào)告整體監(jiān)控信息配置處理告警處理故障設(shè)置任務(wù)數(shù)據(jù)采集主動(dòng)探測(cè)告警、修復(fù)識(shí)別、預(yù)測(cè)實(shí)時(shí)任務(wù)定時(shí)全面多維智能本期新建的IT監(jiān)控平臺(tái)主要由數(shù)據(jù)采集平臺(tái)、數(shù)據(jù)處理平臺(tái)、自動(dòng)告警引擎以及數(shù)據(jù)分析系統(tǒng)組成。數(shù)據(jù)采集平臺(tái)會(huì)自動(dòng)采集被監(jiān)控系統(tǒng)的各項(xiàng)運(yùn)行數(shù)據(jù),再由統(tǒng)一處理平臺(tái)根據(jù)配置的規(guī)則對(duì)數(shù)據(jù)進(jìn)行分析。當(dāng)發(fā)現(xiàn)了故障或風(fēng)險(xiǎn)時(shí)由告警引擎負(fù)責(zé)告知維護(hù)人員,而系統(tǒng)管理員則可以通過(guò)可視化報(bào)表及時(shí)掌握各系統(tǒng)的整體運(yùn)行與故障情況。以下就是公司智能IT監(jiān)控與運(yùn)維平臺(tái)的整體架構(gòu)與應(yīng)用藍(lán)圖:統(tǒng)一處理平臺(tái)統(tǒng)一采集平臺(tái)統(tǒng)一采集平臺(tái)業(yè)務(wù)應(yīng)用WLAN視頻監(jiān)控核心平臺(tái)業(yè)務(wù)應(yīng)用項(xiàng)目管理系統(tǒng)重要系統(tǒng)業(yè)務(wù)應(yīng)用核心內(nèi)網(wǎng)業(yè)務(wù)外網(wǎng)關(guān)鍵網(wǎng)絡(luò)業(yè)務(wù)應(yīng)用物理機(jī)存儲(chǔ)、…基礎(chǔ)設(shè)施系統(tǒng)功能架構(gòu)一期建設(shè)的IT監(jiān)控平臺(tái)的建設(shè)目標(biāo)是為公司注入系統(tǒng)運(yùn)行狀態(tài)監(jiān)控、數(shù)據(jù)采集能力,實(shí)現(xiàn)主動(dòng)式的IT系統(tǒng)故障監(jiān)控告警。二期主要目標(biāo)為加強(qiáng)監(jiān)控的自動(dòng)化故障識(shí)別、處理能力以及應(yīng)用的部署管理能力,進(jìn)一步提升IT系統(tǒng)監(jiān)控與運(yùn)維的自主性。具體系統(tǒng)功能架構(gòu)如下:用戶管理權(quán)限管理認(rèn)證管理日志管理通知接口基礎(chǔ)功能模塊主機(jī)配置中間件配置應(yīng)用配置前端配置資產(chǎn)配置模塊資產(chǎn)配置模塊調(diào)用鏈管理監(jiān)控配置故障類型配置故障模型定義阻斷式不可用監(jiān)控監(jiān)控管理模塊主機(jī)監(jiān)控中間件監(jiān)控應(yīng)用監(jiān)控前端監(jiān)控日志監(jiān)控資產(chǎn)配置模塊WLAN阻斷式不可用處理視頻系統(tǒng)阻斷式不可用處理智慧社區(qū)阻斷式不可用處理項(xiàng)目管理系統(tǒng)阻斷式不可用處理自動(dòng)告警運(yùn)維告警配置告警通知配置告警通知告警歷史查詢自動(dòng)故障處理任務(wù)管理數(shù)據(jù)統(tǒng)計(jì)報(bào)表分析統(tǒng)計(jì)分析模塊系統(tǒng)監(jiān)控指標(biāo)規(guī)劃搭建一套IT系統(tǒng)監(jiān)控運(yùn)維平臺(tái),基于該平臺(tái)實(shí)現(xiàn)對(duì)子公司自有各應(yīng)用系統(tǒng)的統(tǒng)一、集中監(jiān)控與維護(hù),為子公司提供系統(tǒng)運(yùn)行信息采集、分析、告警與自恢復(fù)能力,確保對(duì)應(yīng)系統(tǒng)的穩(wěn)定性與可用性。搭建智能IT系統(tǒng)監(jiān)控運(yùn)維平臺(tái)子公司自有各系統(tǒng)新增監(jiān)控已有監(jiān)控系統(tǒng)主機(jī)監(jiān)控CPU使用率內(nèi)存使用率磁盤使用率磁盤I/O網(wǎng)絡(luò)丟包率網(wǎng)絡(luò)I/Olinux/windows中間件監(jiān)控端口監(jiān)控性能監(jiān)控nginx/tomcat/https系統(tǒng)日志分析日志分析日志告警日志集中查詢應(yīng)用日志/組件日志/服務(wù)器日志系統(tǒng)前端監(jiān)控頁(yè)面性能監(jiān)控接口性能監(jiān)控監(jiān)控告警管理告警策略設(shè)置告警聯(lián)系人設(shè)置告警歷史管理鏈路狀態(tài)監(jiān)控鏈路訪問(wèn)狀態(tài)信息安全監(jiān)控綠盟漏掃服務(wù)結(jié)果監(jiān)控?cái)?shù)據(jù)庫(kù)監(jiān)控mysql/oracle/redis/mongo中間表積壓監(jiān)控端口監(jiān)控性能監(jiān)控定時(shí)任務(wù)監(jiān)控任務(wù)調(diào)度進(jìn)程監(jiān)控任務(wù)守護(hù)進(jìn)程監(jiān)控2實(shí)施內(nèi)容1項(xiàng)目背景4平臺(tái)特性3建設(shè)目標(biāo)項(xiàng)目實(shí)施計(jì)劃5打造一體化監(jiān)控運(yùn)維體系,全面提升運(yùn)維能力基于統(tǒng)一平臺(tái),打造一體化監(jiān)控運(yùn)維體系,集中監(jiān)控各應(yīng)用系統(tǒng),實(shí)施統(tǒng)一監(jiān)控策略,實(shí)現(xiàn)統(tǒng)一故障告警并統(tǒng)一故障處理、集中的監(jiān)控信息展示以及全面、深入的IT系統(tǒng)監(jiān)控與故障數(shù)據(jù)分析,由此全面規(guī)范化公司的IT運(yùn)維工作、提升公司的IT運(yùn)維能力。統(tǒng)一智能IT監(jiān)控與運(yùn)維平臺(tái)統(tǒng)一策略統(tǒng)一告警統(tǒng)一操作集中展示全面分析集中監(jiān)控所有系統(tǒng)都納入到統(tǒng)一個(gè)平臺(tái)進(jìn)行監(jiān)控監(jiān)控信息集中管理統(tǒng)一故障與指標(biāo)定義故障的分析策略設(shè)置故障監(jiān)控與預(yù)測(cè)策略統(tǒng)一告警能力支持統(tǒng)一告警規(guī)范設(shè)置集中告警策略配置統(tǒng)一故障告警處理統(tǒng)一故障自動(dòng)修復(fù)處理統(tǒng)一自動(dòng)部署操作統(tǒng)一信息與報(bào)表展示統(tǒng)一的信息發(fā)布集中數(shù)據(jù)存儲(chǔ)與管理集中的IT故障分析全面的故障與預(yù)警報(bào)告分析,優(yōu)化IT運(yùn)維知識(shí)沉淀、經(jīng)驗(yàn)傳遞、能力提升找方案&找標(biāo)準(zhǔn)找方案微信(掃第一個(gè)碼)每日分享各個(gè)領(lǐng)域高質(zhì)量專業(yè)的解決方案,內(nèi)容包括某省市、鄉(xiāng)村振興、智慧城管、智慧園區(qū)、智慧公安、智慧水務(wù)(水利)、智慧林草、社會(huì)綜合治理、智慧旅游、智慧工地、智慧環(huán)衛(wèi)、智慧醫(yī)院、智慧環(huán)保、智慧安監(jiān)等領(lǐng)域,結(jié)合數(shù)字孿生、人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù),分享行業(yè)售前方案、設(shè)計(jì)方案、技術(shù)方案和項(xiàng)目信息等。找標(biāo)準(zhǔn)微信(掃第二個(gè)碼)每日分享各個(gè)智慧領(lǐng)域國(guó)家和地方標(biāo)準(zhǔn)規(guī)范,國(guó)家和地方政策指導(dǎo)文件,讓各個(gè)智慧方案有據(jù)可依,內(nèi)容包括找方案中的各個(gè)行業(yè)的政策和規(guī)范,內(nèi)容在不斷的收集和完善中。找方案知識(shí)星球(掃第三個(gè)碼)會(huì)員可下載所有資料,并每日上新(注:所有資料均通過(guò)互聯(lián)網(wǎng)等公開渠道獲取,個(gè)人學(xué)習(xí)使用,請(qǐng)勿用于商業(yè)用途)。找標(biāo)準(zhǔn)知識(shí)星球(掃第四個(gè)碼)會(huì)員可下載所有資料,并每日上新(注:所有資料均通過(guò)互聯(lián)網(wǎng)等公開渠道獲取,個(gè)人學(xué)習(xí)使用,請(qǐng)勿用于商業(yè)用途)。找方案星球優(yōu)惠券(掃第五個(gè)碼)掃描69元價(jià)格優(yōu)惠加入,1W+方案任意下載,資源不斷的豐富完善中......找方案微信找方標(biāo)準(zhǔn)信打造IT監(jiān)控工作的信息化,實(shí)現(xiàn)關(guān)鍵故障的自動(dòng)處理信息化標(biāo)準(zhǔn)化自動(dòng)化模型化建立故障識(shí)別模型基于體系標(biāo)準(zhǔn)庫(kù)建立定義故障的數(shù)據(jù)模型確定關(guān)鍵故障、風(fēng)險(xiǎn)、問(wèn)題的識(shí)別數(shù)學(xué)模型可以從不同維度建立多種關(guān)鍵故障識(shí)別模型梳理故障指標(biāo)體系標(biāo)準(zhǔn)基于保障業(yè)務(wù),確保系統(tǒng)正常運(yùn)行的目標(biāo),梳理出金阿卡指標(biāo)與故障體系標(biāo)準(zhǔn)構(gòu)建監(jiān)控指標(biāo)庫(kù)構(gòu)建故障與風(fēng)險(xiǎn)類型庫(kù)構(gòu)建事件、問(wèn)題與任務(wù)類型庫(kù)關(guān)鍵故障自動(dòng)分析基于關(guān)鍵故障模型設(shè)計(jì)自動(dòng)故障分析算法任務(wù)創(chuàng)建IT監(jiān)控與分析任務(wù)(監(jiān)控的系統(tǒng)與內(nèi)容)設(shè)置自動(dòng)化算法的執(zhí)行與調(diào)度策略自動(dòng)執(zhí)行任務(wù),識(shí)別關(guān)鍵故障與風(fēng)險(xiǎn)基于實(shí)際效果技術(shù)優(yōu)化、調(diào)整算法全面采集系統(tǒng)運(yùn)行的各項(xiàng)數(shù)據(jù)只是實(shí)現(xiàn)主動(dòng)式監(jiān)控運(yùn)維的基礎(chǔ),更關(guān)鍵的是要能對(duì)這些數(shù)據(jù)進(jìn)行準(zhǔn)確的分析,以自動(dòng)發(fā)現(xiàn)系統(tǒng)的故障或故障風(fēng)險(xiǎn),進(jìn)而及時(shí)對(duì)故障進(jìn)行處理。本次建設(shè)的IT監(jiān)控與運(yùn)維平臺(tái)將具備關(guān)鍵故障的識(shí)別能力,它要由標(biāo)準(zhǔn)化故障體系配置、故障識(shí)別模型化設(shè)計(jì)及故障分析算法組成。主動(dòng)探測(cè)與故障告警,提升運(yùn)維效率并降低故障風(fēng)險(xiǎn)平臺(tái)在全面采集系統(tǒng)各項(xiàng)運(yùn)行數(shù)據(jù)后,進(jìn)行智能化的分析,可以及時(shí)識(shí)別出各類故障和故障風(fēng)險(xiǎn),基于此平臺(tái)會(huì)進(jìn)一步采取自主化的處理方式,及時(shí)修復(fù)故障,提前解除風(fēng)險(xiǎn),以保障業(yè)務(wù)的可用性和連續(xù)性。平臺(tái)會(huì)主動(dòng)對(duì)系統(tǒng)進(jìn)行各項(xiàng)指標(biāo)的探測(cè)和巡檢,以便及時(shí)發(fā)現(xiàn)系統(tǒng)故障平臺(tái)會(huì)基于智能化數(shù)據(jù)風(fēng)險(xiǎn),給出故障風(fēng)險(xiǎn)預(yù)測(cè)提前判斷潛在的故障任何故障或風(fēng)險(xiǎn)信息,平臺(tái)都會(huì)及時(shí)給予告警(支持郵件、短信、信息、聲音、警燈等方式),通知相關(guān)人員平臺(tái)在發(fā)現(xiàn)故障后可以自動(dòng)生成并派發(fā)故障修復(fù)處理任務(wù)主動(dòng)探測(cè)+預(yù)防主動(dòng)進(jìn)行系統(tǒng)應(yīng)用巡檢和探傷檢測(cè)主動(dòng)預(yù)測(cè)故障風(fēng)險(xiǎn)并告知維護(hù)人員自動(dòng)告警+任務(wù)自動(dòng)告知相關(guān)人員故障與風(fēng)險(xiǎn)信息自動(dòng)生成、下發(fā)故障修復(fù)任務(wù)自主化監(jiān)控運(yùn)維實(shí)現(xiàn)可視化IT系統(tǒng)監(jiān)控以及深度的IT運(yùn)維數(shù)據(jù)分析平臺(tái)提供了可視化報(bào)表監(jiān)控系統(tǒng),讓管理人員可以直觀、及時(shí)的掌握各系統(tǒng)的整體運(yùn)行與故障情況,并進(jìn)行對(duì)應(yīng)的工作安排。同時(shí),系統(tǒng)還會(huì)對(duì)所采集到的指標(biāo)數(shù)據(jù)、故障數(shù)據(jù)、故障風(fēng)險(xiǎn)等數(shù)據(jù)進(jìn)行深度的分析,發(fā)現(xiàn)故障的原因,指導(dǎo)系統(tǒng)的優(yōu)化,幫助公司實(shí)現(xiàn)從傳統(tǒng)的IT運(yùn)維統(tǒng)計(jì)轉(zhuǎn)向智能運(yùn)維運(yùn)營(yíng)。數(shù)據(jù)分析信息展示信息推送平臺(tái)具備強(qiáng)大的大數(shù)據(jù)分析能力與可視化展示能力平臺(tái)將整合當(dāng)前與歷史監(jiān)控?cái)?shù)據(jù)進(jìn)行深度分析,分析故障特征,輔助發(fā)現(xiàn)問(wèn)題根源平臺(tái)將對(duì)IT監(jiān)控?cái)?shù)據(jù)全面的分析,定期輸出分析報(bào)告,支持企業(yè)從傳統(tǒng)運(yùn)維統(tǒng)計(jì)轉(zhuǎn)向智能運(yùn)維分析平臺(tái)具備強(qiáng)大的圖形化數(shù)據(jù)展示開發(fā)能力,支持個(gè)性化數(shù)據(jù)展示開發(fā)支持各類圖形化的數(shù)據(jù)展示提供數(shù)據(jù)與信息推送功能,支持各種方式的數(shù)據(jù)推送方式亮點(diǎn)及成果亮點(diǎn)標(biāo)準(zhǔn)化:構(gòu)建標(biāo)了準(zhǔn)化的IT監(jiān)控與運(yùn)維體系,包括:標(biāo)準(zhǔn)化的告警處置流程、應(yīng)急處理方案以及系統(tǒng)監(jiān)控部署要求,進(jìn)而為公司注入高效、規(guī)范的故障與風(fēng)險(xiǎn)察覺能力及可靠的故障處理能力。實(shí)施一套標(biāo)準(zhǔn)化的IT監(jiān)控平臺(tái)系統(tǒng),為公司注入高效、規(guī)范的故障與風(fēng)險(xiǎn)察覺能力以及可靠的故障處理能力,為公司建立主動(dòng)式、體系化的IT監(jiān)控運(yùn)維模式奠定了基礎(chǔ)。實(shí)現(xiàn)了對(duì)子公司的各個(gè)核心平臺(tái)(WLAN、視頻監(jiān)控)、重要系統(tǒng)(項(xiàng)目管理系統(tǒng))、關(guān)鍵網(wǎng)絡(luò)以及基礎(chǔ)設(shè)施(物理機(jī)、存儲(chǔ))實(shí)時(shí)、全面的監(jiān)控,可有效的降低了系統(tǒng)的故障率,保障系統(tǒng)的運(yùn)行效率?;谄脚_(tái)大大提高了IT系統(tǒng)監(jiān)控與運(yùn)維工作的自主化程度,極大提高了整個(gè)IT運(yùn)維工作的效率,并降低了IT運(yùn)維工作量以及人力成本。利用平臺(tái)實(shí)現(xiàn)主動(dòng)式的系統(tǒng)監(jiān)控與告警,保障了系統(tǒng)可用性,更好的服務(wù)業(yè)務(wù)的運(yùn)營(yíng),彰顯了IT部門價(jià)值。成果主動(dòng)式:利用硬件可用性探測(cè)、系統(tǒng)業(yè)務(wù)可用性測(cè)試、系統(tǒng)狀態(tài)巡檢等一系列手段,主動(dòng)對(duì)系統(tǒng)故障進(jìn)行檢測(cè),及時(shí)發(fā)現(xiàn)系統(tǒng)故障風(fēng)險(xiǎn),實(shí)現(xiàn)主動(dòng)式IT監(jiān)控與告警??梢暬夯诩蛇\(yùn)維管理界面讓管理員可以對(duì)被監(jiān)控系統(tǒng)實(shí)現(xiàn)全面的監(jiān)控配置、告警管理及處置、并對(duì)監(jiān)控?cái)?shù)據(jù)實(shí)現(xiàn)深度分析,并為智能化運(yùn)維奠定基礎(chǔ)。實(shí)施效益通過(guò)本次OMC平臺(tái)的實(shí)施,提升子公司的系統(tǒng)運(yùn)維能力,進(jìn)而可以滿足母公司對(duì)子公司各項(xiàng)運(yùn)維動(dòng)作的要求,避免在日??己酥惺Х?。降低運(yùn)維人力成本醫(yī)療行業(yè)發(fā)展方向提升日常考核表現(xiàn)提升內(nèi)外客戶滿意度提升ICT收入利用系統(tǒng)實(shí)現(xiàn)運(yùn)維指標(biāo)顯性化和故障告警流程化,可某省市運(yùn)維團(tuán)隊(duì)的工作量,降低人力成本;按現(xiàn)有系統(tǒng)規(guī)模初步估算,通過(guò)人工實(shí)現(xiàn)同樣程度監(jiān)控和處置所需投入人力,OMC平臺(tái)建設(shè)后可減少約30%的人力投入。通過(guò)OMC+配套運(yùn)維流程的落地,可顯著改善系統(tǒng)售后服務(wù)的質(zhì)量;可以更好的保障各類系統(tǒng)的可用性與服務(wù)連續(xù)性,為業(yè)務(wù)提供更好的保障,由此可以大大提升內(nèi)外部客戶滿意度。當(dāng)前服務(wù)的存量客戶中有不少運(yùn)維能力也有欠缺,在子公司相關(guān)能力成熟后可適當(dāng)對(duì)外輸出,為公司創(chuàng)收,提升社會(huì)ICT收入;基于當(dāng)前長(zhǎng)期合作的存量客戶進(jìn)行初步估算,若向其輸出OMC能力,預(yù)計(jì)每年可產(chǎn)生100W的收入。1項(xiàng)目背景5建設(shè)目標(biāo)42平臺(tái)特性項(xiàng)目實(shí)施計(jì)劃實(shí)施內(nèi)容3設(shè)計(jì)階段開發(fā)階段測(cè)試階段上線試運(yùn)行階段V1.0發(fā)布按照規(guī)劃功能完成V1.0版本發(fā)布2021.7.102021.7.302021.8.42021.9.62021.9.152021.9.30需求階段V1.1發(fā)布根據(jù)測(cè)試情況完成優(yōu)化,發(fā)布V1.1版監(jiān)控配置與告警主機(jī)監(jiān)控中間件/數(shù)據(jù)庫(kù)監(jiān)控應(yīng)用監(jiān)控日志監(jiān)控項(xiàng)目立項(xiàng)采購(gòu)比選2021.8.10系統(tǒng)服務(wù)器清單軟件部署架構(gòu)服務(wù)器用途Cpu內(nèi)存存儲(chǔ)數(shù)量備注監(jiān)控、日志門戶2核8G200G1部署監(jiān)控門戶WEB服務(wù)、Nginx服務(wù)、接口服務(wù)監(jiān)控計(jì)算Prometheus監(jiān)控?cái)?shù)據(jù)存儲(chǔ)InfluxDB鏈路追蹤服務(wù)Skywalking鏈路追蹤數(shù)據(jù)存儲(chǔ)4核16G500G1部署Prometheus監(jiān)控?cái)?shù)據(jù)采集服務(wù)日志緩沖kafka日志處理logstash日志存儲(chǔ)Elasticsearch4核16G1T1部署ES服務(wù)集群,用于日志查詢、監(jiān)控?cái)?shù)據(jù)查詢監(jiān)控push網(wǎng)關(guān)監(jiān)控收集collector日志推送網(wǎng)關(guān)4核16G500G1接入機(jī)元數(shù)據(jù)存儲(chǔ)Mysql4核16G500G1Mysql數(shù)據(jù)庫(kù),定期備份數(shù)據(jù)項(xiàng)目成本估算一級(jí)模塊二級(jí)模塊功能描述資產(chǎn)配置主機(jī)配置設(shè)置主機(jī)基本信息、引導(dǎo)接入主機(jī)監(jiān)控中間件配置設(shè)置中間件基本信息、引導(dǎo)接入中間件監(jiān)控應(yīng)用配置設(shè)置應(yīng)用基本信息、引導(dǎo)接入應(yīng)用監(jiān)控前端配置設(shè)置前端基本信息、引導(dǎo)接入前端監(jiān)控監(jiān)控配置管理監(jiān)控指標(biāo)配置采集指標(biāo)裁剪配置采集參數(shù)設(shè)置采集方式、采集時(shí)間配置主機(jī)監(jiān)控CPU監(jiān)控空閑、占用、用戶、等待、使用率、進(jìn)程數(shù)等內(nèi)存監(jiān)控使用率、交換次數(shù)、換頁(yè)換進(jìn)率、交換頁(yè)換出率、等待頁(yè)進(jìn)程數(shù)、系統(tǒng)內(nèi)存使用率、用戶內(nèi)存使用率、緩沖命中率等磁盤IO操作速率、請(qǐng)求量、磁盤占用、忙綠、平均等待時(shí)間、線程數(shù)等網(wǎng)絡(luò)利用率、流入流出利用率、誤碼率、丟包率等狀態(tài)交換區(qū)使用率、主機(jī)存活狀態(tài)等中間件監(jiān)控Nginx監(jiān)控連接數(shù)、訪問(wèn)量、請(qǐng)求結(jié)果狀態(tài)分類和占比、耗時(shí)、錯(cuò)誤占比等Mysql數(shù)據(jù)庫(kù)監(jiān)控存活狀態(tài)、事務(wù)、鏈接、連接數(shù)、SQL響應(yīng)速度、平均耗時(shí)等Redis存活;連接數(shù)、使用量、權(quán)限、組、阻塞、TPS、耗時(shí)等Tomcat存活、CPU、內(nèi)存、磁盤、IO、網(wǎng)絡(luò)等的利用情況(包括資源總量、使用量、和占用量等);Apache連接數(shù)、訪問(wèn)量、請(qǐng)求結(jié)果狀態(tài)分類和占比、耗時(shí)、錯(cuò)誤占比等mongoDB存活;連接數(shù)、使用量、權(quán)限、組、阻塞、TPS、耗時(shí)等Oracle監(jiān)控內(nèi)存利用、命中、使用率、鎖和會(huì)話等;應(yīng)用監(jiān)控應(yīng)用監(jiān)控應(yīng)用服務(wù)可用性、響應(yīng)時(shí)長(zhǎng)接口監(jiān)控
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《GB-T 25129-2010制冷用空氣冷卻器》專題研究報(bào)告
- 2026年河南推拿職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)及答案詳解一套
- 在線體檢預(yù)約服務(wù)合同
- 2026屆江蘇省南京市七校聯(lián)合體高三上學(xué)期12月聯(lián)考地理含答案
- 中醫(yī)康復(fù)治療師崗位招聘考試試卷及答案
- 2025年城管崗面試題目及答案解析
- 辦公室主任2025年工作計(jì)劃(3篇)
- 2025年安全生產(chǎn)工作總結(jié)及2026年思路計(jì)劃(第3篇)
- 2025年網(wǎng)絡(luò)接口適配器合作協(xié)議書
- 2025年液位雷達(dá)項(xiàng)目建議書
- 智能采血管理系統(tǒng)功能需求
- 【基于PLC的自動(dòng)卷纜機(jī)結(jié)構(gòu)控制的系統(tǒng)設(shè)計(jì)10000字(論文)】
- 資產(chǎn)移交使用協(xié)議書
- 腦器質(zhì)性精神障礙護(hù)理查房
- GB/T 45481-2025硅橡膠混煉膠醫(yī)療導(dǎo)管用
- GB/T 32468-2025銅鋁復(fù)合板帶箔
- 山西交控集團(tuán)招聘筆試內(nèi)容
- 大窯校本教材合唱的魅力
- 《建筑測(cè)繪》課件
- 《健康體檢報(bào)告解讀》課件
- 前臺(tái)電話禮儀培訓(xùn)
評(píng)論
0/150
提交評(píng)論