版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書專注云原生引領(lǐng)新IT云監(jiān)控平臺(HC-CloudMonitor)產(chǎn)品說明書第1頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書目錄諧云科技云監(jiān)控解決方案錯誤!未定義書簽。HYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINKHYPERLINK\l"br144"磁盤清理HYPERLINK\l"br144"第5頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書第1章公司簡介1.1.公司介紹杭州諧云科技有限公司成立于2016年7月,核心團隊來自浙江大學(xué)超大規(guī)模信息系統(tǒng)實驗室,團隊從2001年開始與美國道富銀行合作,為道富銀行重構(gòu)和建設(shè)了新一代股票交易系統(tǒng)等系統(tǒng),贏得了華爾街的贊譽。2008年開始歷時兩年為美國道富銀行建設(shè)了私有云并承載心為依托成立浙江大學(xué)軟件工程實驗室(SEL),專業(yè)從事開源云計算相關(guān)研究工作。實驗室位博士、碩士研究生共同研發(fā)云計算平臺相關(guān)技術(shù),并于2013年,成為CloudFoundry中國唯一兩家核心代碼貢獻組織,在2015年成為成為谷歌發(fā)起的云原生計算組織CloudNativeComputingFoundation(CNCF)創(chuàng)始成員。諧云與浙江大學(xué)建立了戰(zhàn)略合作關(guān)系,確保公司人才與技術(shù)始終保持創(chuàng)新。個國內(nèi)大型云平臺落地實踐,是國內(nèi)云原生領(lǐng)域的布道者,并出版了國內(nèi)第一本深度分析Docker為Kubernetes等項目貢獻代碼1400多萬行,代碼貢獻量排行國內(nèi)第一,國際第四。自主可控的企業(yè)級智能化容器云平臺(觀云臺),超強的技術(shù)研發(fā)實力獲得知名云計算廠商、中第6頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書物聯(lián)網(wǎng)領(lǐng)域,邊緣設(shè)備和邊緣服務(wù)器等場景下輕量級容器平臺的應(yīng)用。1.2.團隊介紹公司核心團隊來自于浙江大學(xué)SEL實驗室,公司員工400+。諧云團隊在云計算及相關(guān)領(lǐng)略重點扶植云計算前沿企業(yè),獲得浙大人才方面的大力支持。陳純(董事長),教授,中國工程院信息與電子工程學(xué)部院士,兼任浙江省計算機學(xué)會理事長。楊小虎(副董事長),教授,浙江大學(xué)計算機軟件研究所副所長,互聯(lián)網(wǎng)金融研究院副院長。蔡亮(董事),教授,浙江大學(xué)軟件學(xué)院副院長,浙江省重大科技專項專家,分布式系統(tǒng)與信息安全。12年以上金融信息化系統(tǒng)建設(shè)經(jīng)驗,在網(wǎng)新期間為公司創(chuàng)造了數(shù)億元以上的營收,獲CEO特殊貢獻獎。丁軼群(首席技術(shù)官),畢業(yè)于浙江大學(xué),浙大SEL實驗室創(chuàng)始人&帶隊老師。浙江省第一電商云平臺,智慧城市云平臺,具備豐富高性能分布式系統(tǒng)工程經(jīng)驗。第7頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書萇程(副總裁),畢業(yè)于浙江大學(xué),曾就職于道富銀行、浙大網(wǎng)新,有7年以上大型金融系布式事件處理引擎機制、國內(nèi)PaaS平臺首批實踐者。才振功(副總裁):畢業(yè)于浙江大學(xué),主要從事云計算與智能化運維相關(guān)技術(shù)研發(fā),先后承擔(dān)和參與了阿里巴巴前沿技術(shù)研發(fā)合作及與IBM、CFETS等國內(nèi)外知名企業(yè)在智能運維領(lǐng)域的聯(lián)合研發(fā)項目,提出了面向企業(yè)級數(shù)據(jù)中心的智能故障治理、性能優(yōu)化及容量規(guī)劃解決方案,申請和完成發(fā)明專利5項。1.3.融資情況公司注冊資本2013.647058海,成都等。222016年9月,獲城云科技,信雅達和風(fēng)旗投資1500萬人民幣Pre-A輪融資。017年12月,獲新湖智腦,如般量子和蘭石投資數(shù)千萬元人民幣A輪融資。020年1月,獲阿里巴巴數(shù)千萬元人民幣B輪融資。1.4.資產(chǎn)情況序號類型軟件著作權(quán)證書名稱諧云應(yīng)用性能監(jiān)控APMv1.0諧云容器云平臺系統(tǒng)軟件v1.012345678軟件著作權(quán)證書軟件著作權(quán)證書軟件著作權(quán)證書軟件著作權(quán)證書軟件著作權(quán)證書軟件著作權(quán)證書軟件著作權(quán)證書諧云在線用戶行為分析UAMv1.0SDN交換機控制平臺軟件v1.0諧云應(yīng)用系統(tǒng)性能容量規(guī)劃平臺軟件V1.0諧云應(yīng)用支撐系統(tǒng)軟件V1.0諧云持續(xù)集成系統(tǒng)軟件(簡稱:諧云CI系統(tǒng))V1.0諧云開放第8平臺軟件V1.0云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書910111213141516171819軟件著作權(quán)證書軟件著作權(quán)證書軟件著作權(quán)證書軟件著作權(quán)證書軟件著作權(quán)證書軟件著作權(quán)證書軟件著作權(quán)證書軟件產(chǎn)品評估證書軟件產(chǎn)品評估證書軟件產(chǎn)品評估證書軟件產(chǎn)品評估證書CMMI3諧云網(wǎng)絡(luò)性能管理系統(tǒng)軟件V1.0諧云微服務(wù)支撐平臺軟件V1.0諧云項目生命周期流程管理軟件V1.0諧云業(yè)務(wù)流程監(jiān)控系統(tǒng)軟件V1.0諧云移動端性能監(jiān)控系統(tǒng)軟件V1.0諧云智能異常檢測平臺V1.0諧云自動化運維平臺軟件V1.0諧云應(yīng)用性能監(jiān)控APMv1.0諧云容器云平臺系統(tǒng)軟件v1.0諧云在線用戶行為分析UAMv1.0諧云應(yīng)用系統(tǒng)性能容量規(guī)劃平臺軟件V1.0軟件能力成熟度集成模型ISO9001管理體系認證證書ISO27001信息安全管理體系認證證書ISO20000信息技術(shù)服務(wù)管理體系認證證書環(huán)境管理體系認證證書ISO14001ISO18001職業(yè)健康安全管理體系認證證書雙軟企業(yè)認證杭州市高新技術(shù)企業(yè)認證國家高新技術(shù)企業(yè)已認證CNCF基金會可信云認證KCSP1.9/1.12/1.13/1.14(k8s版本)KTPCNCFKTP培訓(xùn)合作伙伴第2章云監(jiān)控產(chǎn)品概述2.1.產(chǎn)品背景和價值第9頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書雜交互的業(yè)務(wù)故障。體宏觀的監(jiān)控以及缺乏業(yè)務(wù)應(yīng)用之間故障定界手段;云監(jiān)控平臺同時也集成了prometheus和云監(jiān)控平臺提供的動態(tài)java彈性探針,在不重啟應(yīng)用的前提下,加強捕獲應(yīng)用運行時性能問題的能力,實現(xiàn)云上性能代碼級監(jiān)控。2.2.云內(nèi)應(yīng)用訪問流量采集器介紹內(nèi)應(yīng)用訪問流量的采集器。它采用使用ebpf技術(shù)獲取系統(tǒng)調(diào)用,通過分析系統(tǒng)調(diào)用獲取應(yīng)用訪問指標(biāo)。hcmine采集器和當(dāng)前主流的網(wǎng)絡(luò)流量鏡像方式有著本質(zhì)上的區(qū)別。當(dāng)前主流的網(wǎng)絡(luò)探針使用的是pcap等網(wǎng)絡(luò)包復(fù)制攔截技術(shù),原理是將被監(jiān)控機器上的指定端口的網(wǎng)絡(luò)數(shù)據(jù)linuxlinux系統(tǒng)調(diào)用記錄的方式的網(wǎng)絡(luò)探針hcmine,是從內(nèi)核空間內(nèi)獲取到linux系統(tǒng)的系統(tǒng)調(diào)用記錄,然后過濾出linux內(nèi)核在處理網(wǎng)絡(luò)數(shù)據(jù)時量訪問圖。第10頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書2.3.功能架構(gòu)務(wù)訪故障追蹤能力。云監(jiān)控功能架構(gòu)圖主要功能項如下,彈性探針對應(yīng)的應(yīng)用分析以及平臺功能參考下面章節(jié)功能描述。模塊名稱功能名稱功能點支持該項目下所有業(yè)務(wù)集群告警等數(shù)據(jù)的統(tǒng)計展示。包括業(yè)務(wù)概覽可展示該項目下所有業(yè)務(wù)的指標(biāo)數(shù)據(jù)包括反映段內(nèi)新增的應(yīng)用信息,支持跳轉(zhuǎn)配置。集群概況分為容器狀態(tài)指標(biāo)。告警概覽為項目告警的數(shù)量及告警登記的統(tǒng)一展示??傆[總覽支持在頁面展示包括k8s集群的資源及集群狀態(tài)信息,包括CPU,內(nèi)存,磁盤,GPU等資源信息資源k8s集群第11頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書支持在頁面展示包括傳統(tǒng)主機集群的資源及集群狀態(tài)信息,包括CPU,內(nèi)存,磁盤,GPU等資源信息主機集群資源列表在內(nèi)的集群資源。支持在頁面以3D的形式展示機房機柜服務(wù)器之間的3D建模視圖。3D機房支持在頁面以拓撲形式呈現(xiàn)當(dāng)前集群內(nèi)應(yīng)用之間的交互關(guān)系,同時支持多條件篩選應(yīng)用拓撲全局應(yīng)用拓撲業(yè)務(wù)列表支持呈現(xiàn)不同時間區(qū)間的業(yè)務(wù)狀態(tài)支持通過業(yè)務(wù)名稱、健康度對業(yè)務(wù)進行篩選支持用戶在全局應(yīng)用拓撲上,新增、編輯業(yè)務(wù)支持按照租戶視角呈現(xiàn)拓撲調(diào)用包括夸租戶甚至跨集群調(diào)用,展示各個租戶節(jié)點的狀態(tài)與告警支持節(jié)點間呈現(xiàn)網(wǎng)絡(luò)流量、延時數(shù)據(jù),并按照延時呈現(xiàn)狀態(tài)支持分析業(yè)務(wù)節(jié)點之間請求的具體調(diào)用,包括發(fā)送端,接收端,發(fā)送數(shù)據(jù)量,發(fā)送耗時,接收數(shù)據(jù)量,接收耗時,服務(wù)端處理時間等指標(biāo)租戶拓撲支持按照時間控件選擇不同時間區(qū)間的聚合數(shù)據(jù)支持回溯功能,實現(xiàn)對業(yè)務(wù)拓撲的歷史狀態(tài)追蹤支持按集應(yīng)用服務(wù)兩個維度橫向展示支持按集群命名空間歸并等維度縱向分組聚合展示業(yè)務(wù)監(jiān)控態(tài)與告警支持回溯功能,實現(xiàn)對業(yè)務(wù)拓撲的歷史狀態(tài)追蹤支持按集應(yīng)用服務(wù)兩個維度橫向展示支持按集群命名空間歸并等維度縱向分組聚合展示支持分析業(yè)務(wù)節(jié)點之間請求的具體調(diào)用,包括發(fā)送端,接收端,發(fā)送數(shù)據(jù)量,發(fā)送耗時,接收數(shù)據(jù)量,接收耗時,服務(wù)端處理時間等指標(biāo)業(yè)務(wù)拓撲支持按照時間控件選擇不同時間區(qū)間的聚合數(shù)據(jù)支持下鉆查看詳細告警、業(yè)務(wù)狀態(tài)指標(biāo)趨勢圖支持與系統(tǒng)分層信息功能聯(lián)動,按照相同業(yè)務(wù)視角,呈現(xiàn)系統(tǒng)分層信息拓撲支持以分層拓撲展示應(yīng)用依賴的運行時環(huán)境,用戶能夠可視化查看k8s或者虛擬機運行環(huán)境的資源使用情況第12頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書支持用戶點擊分層故障信息,下鉆到對應(yīng)節(jié)點的詳情,呈現(xiàn)節(jié)點詳情信息、告警等支持按照不同時間維度,篩選業(yè)務(wù)–應(yīng)用的狀態(tài),支持再拓撲圖上呈現(xiàn)消亡、存活的節(jié)點支持點擊全屏,呈現(xiàn)拓撲儀表板概覽儀表板列表自定義儀表能夠總覽的查看整個容器云集群的概覽dashboard支持對dashboard進行管理容器監(jiān)控支持創(chuàng)建監(jiān)控dashboard、修改監(jiān)控dashboard、刪除監(jiān)控dashboard、查看監(jiān)控dashboard內(nèi)的圖表支持通過Prometheus、mysql、ES、OpenTSDB等方式導(dǎo)入其他數(shù)據(jù)源,自定義儀表盤盤支持在拓撲視圖中默認顯示當(dāng)前項目最近30分鐘內(nèi)的應(yīng)用拓撲情況拓撲視圖支持全局拓撲及調(diào)用時間、節(jié)點異常顯示支持節(jié)點歸并及下鉆支持列表展示調(diào)用關(guān)系及節(jié)點狀態(tài)支持展示30mins內(nèi)實例中每個請求的響應(yīng)時間散點圖支持平均執(zhí)行時間、訪問的總次數(shù)(吞吐量)、apdex指數(shù)和訪問該應(yīng)用的錯誤率的監(jiān)控監(jiān)控概覽應(yīng)用拓撲支持應(yīng)用調(diào)用鏈路完整展示,包括外部服務(wù)、負載均衡、中間件,異步調(diào)用并展示節(jié)點狀態(tài),支持下鉆支持節(jié)點異常及調(diào)用時間的監(jiān)控支持展示指定時間區(qū)間內(nèi)耗時最長的100個Web事務(wù)圖表及其響應(yīng)時間和吞吐量支持查看URL目顯示其中最慢的幾次事務(wù)支持請求的trace信息顯示事務(wù)追蹤支持每條請求中慢事務(wù)顯示及分析支持歷史慢方法顯示支持慢堆棧慢方法抓取支持軟硬件及網(wǎng)絡(luò)關(guān)聯(lián)分析支持通過transactionid來查看異常分析,顯示該條鏈路的拓撲圖和詳細信息級別及debug級別異常分析慢方法法第13頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書支持慢方法調(diào)用鏈功能支持展示所選時間段最慢的5個慢方法的平均響應(yīng)時間及吞吐量應(yīng)用監(jiān)控支持展示該應(yīng)用所訪問數(shù)據(jù)庫的詳情情況,數(shù)據(jù)庫包括mysql、redis、mongodb等支持圖表形式展示平均耗時最長的100條SQL據(jù)響應(yīng)時間和吞吐量進行排序數(shù)據(jù)庫詳情Nosql支持單條SQL事務(wù)的響應(yīng)時間和吞吐率支持慢SQL追蹤及下鉆分析展示實例中的nosql及慢nosql的trace信息支持展示mango、redis和cassandra三種類型的nosql,看到平均耗時和吞吐量,可切換為圖表展示展示所有了調(diào)用類型(內(nèi)部、外部),包括調(diào)用的錯誤率、吞吐量和響應(yīng)時間,有助于分析服務(wù)質(zhì)量支持展示平均響應(yīng)時間最久和錯誤率最高的服務(wù)調(diào)用曲線圖服務(wù)調(diào)用分析支持展示應(yīng)用中消息隊列整體情況及慢消息的詳情支持從生產(chǎn)者和消費者的不同角度展示消息隊列的地址、平均消息處理時間),整體把握消息隊列的健康情況消息隊列監(jiān)控支持jdk5及以上的jvm內(nèi)存池監(jiān)控JVM概況線程剖析用戶管理租戶管理支持線程信息、死鎖線程展示、實例信息、GC算法監(jiān)控支持按時間段下載線程的jstack信息支持設(shè)定未來時間下載線程的jstack信息用戶可在此處新增人員并分配權(quán)限,可修改,可刪除用戶可在此處新增租戶并分配權(quán)限,可修改,可刪除支持應(yīng)用探針的下載探針管理包追蹤開關(guān)操作配置中心集成管理全局配置集群配置業(yè)務(wù)配置支持對RancherRancher同步集群信息支持對組件地址,部署地,數(shù)據(jù)中心相關(guān)配置的設(shè)置支持對進程探活相關(guān)進行配置,可修改過濾功能進行配置第14頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書支持設(shè)置項目下應(yīng)用的網(wǎng)絡(luò)探針開關(guān)、應(yīng)用探針過濾異常類型及數(shù)據(jù)處理參數(shù)支持配置項目下不同應(yīng)用的請求超時的閾值設(shè)置,超時后展示次數(shù)及平均延時應(yīng)用配置組件監(jiān)控支持url重命名功能支持自定義健康指數(shù)分值的比重載對應(yīng)日志進行分析支持對云監(jiān)控部署主機進行監(jiān)控,當(dāng)主機出現(xiàn)異常時,進行相關(guān)提示磁盤清理告警事件告警規(guī)則通知對象通知對象組DNS異常事件檢索日志檢索資源檢索操作審計TCPdump支持對平臺歷史數(shù)據(jù)進行定時清理以及手動清理支持查看每一條已發(fā)出的告警概要信息,可點擊查看具體告警支持配置告警對象及通知方式、配置告警觸發(fā)閾值、查看并修改已有告警規(guī)則告警支持新增修改查看相應(yīng)告警發(fā)生所需要通知的單個對象支持新增修改查看相應(yīng)告警發(fā)生所需要通知的對象組支持對DNS及列表展示網(wǎng)絡(luò)監(jiān)控支持對集群事件進行分維度查詢,以列表展示支持對集群日志進行分維度查詢支持以關(guān)鍵字查詢,結(jié)果高亮關(guān)鍵字日志檢索工具支持查詢集群中pod資源,結(jié)果以列表展示支持查詢平臺系統(tǒng)的一些關(guān)鍵操作記錄支持arp,tcp,udp,lcmps四種通信協(xié)議2.4.技術(shù)架構(gòu)第15頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書云監(jiān)控技術(shù)架構(gòu)圖平臺整體結(jié)構(gòu)說明:量,延時,錯誤率),最終實現(xiàn)業(yè)務(wù)關(guān)系調(diào)用分析和訪問流量分析。.彈性java探針(javaagent):通過應(yīng)用不重啟方式發(fā)現(xiàn)代碼層面問題:實時感知系統(tǒng)12語句執(zhí)行時間,數(shù)據(jù)庫連接池。3彈性java探針的情況下信息處理層通過traceid快速定位,異常問題全息排查,多維度、全方位還原錯誤問題現(xiàn)場。第16頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書4.可視化展示層。提供面向業(yè)務(wù)和運維場景的可視化分析能力。2.5.部署架構(gòu)圖應(yīng)用訪問交互數(shù)據(jù)采集器Hcmine采用daemonset部署方式,以獨立于業(yè)務(wù)容器的方式允許在容器云主機,對業(yè)務(wù)pod無侵入,探針資源消耗通過容器技術(shù)進行有效隔離。平臺高可用組件部署架構(gòu)圖2.6.案例展示已上線主要應(yīng)用及應(yīng)用類型序號類型案例名稱集群規(guī)模部署環(huán)境當(dāng)前狀態(tài)第17頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書測試環(huán)境1.600多個,pod3000多個,物理機云主機20國網(wǎng)核心業(yè)務(wù)上線準(zhǔn)備中pod達5000,云主機2.浦發(fā)銀行物理機測試環(huán)境互聯(lián)網(wǎng)業(yè)務(wù)達400多第18頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書第3章云監(jiān)控產(chǎn)品功能介紹云監(jiān)控平臺模塊架構(gòu)圖分析的監(jiān)控數(shù)據(jù)云平臺。通過總覽,實現(xiàn)“集群一體化”,對不同集群的重要指標(biāo)數(shù)據(jù)進行統(tǒng)一展示;通過資源監(jiān)控,對多集群進行資源監(jiān)控;通過業(yè)務(wù),以業(yè)務(wù)視角對云上運行應(yīng)用整體宏觀的監(jiān)控;通過應(yīng)用,實現(xiàn)對應(yīng)用性能代碼級監(jiān)控;通過告警,對多集群異常指標(biāo)率進行篩選,及時通知;通過儀表盤,對集群內(nèi)容器進行監(jiān)控,圖形化展示容器指標(biāo);第19頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書通過網(wǎng)絡(luò),對網(wǎng)絡(luò)請求DNS異常進行監(jiān)控;通過檢索,對集群內(nèi)日志信息進行智能檢索,提供保留歷史現(xiàn)場的能力;通過工具,對集群內(nèi)網(wǎng)絡(luò)請求進行抓包,通過報文級別的網(wǎng)絡(luò)異常信息;通過配置,對平臺及探針進行參數(shù)設(shè)置,實現(xiàn)數(shù)據(jù)動態(tài)配置。3.1.及資源占用情況。可以對業(yè)務(wù)運行所需資源進行監(jiān)控,做到及時調(diào)整和處理。狀態(tài)進行評估。如圖所示,總覽模塊包括4個部分:業(yè)務(wù)概覽、新增應(yīng)用列表、集群概覽、告警概覽。3.1.1.業(yè)務(wù)概覽第20頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書看更多跳轉(zhuǎn)至業(yè)務(wù)列表,從而獲取業(yè)務(wù)更詳細的指標(biāo)數(shù)據(jù)。如下圖所示:3.1.2.新增應(yīng)用列表便用戶及時了解集群內(nèi)新增的應(yīng)用,進而對相關(guān)應(yīng)用進行業(yè)務(wù)配置,方便快捷。的運行時間及一鍵加入業(yè)務(wù)配置操作。如下圖所示:第21頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書3.1.3.集群概覽集群狀態(tài)及資源使用情況進行了匯總展示,集群相關(guān)重要指標(biāo)一目了然。集群概覽以集群的類型進行了2標(biāo)信息:集群名稱、集群狀態(tài)、類型、CPU、內(nèi)存、磁盤、節(jié)點數(shù)、服務(wù)數(shù)、pod數(shù)及工作負載數(shù)。如下圖所示:第22頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書3.1.4.告警概覽于應(yīng)相關(guān)人員維護集群正常運行往往是必須且有幫助的。告警概覽從三個方向統(tǒng)一展示了集群的告警信息:未處理告警:展示從告警產(chǎn)生到目前位置還未處理告警數(shù)量的總數(shù)告警等級分布圖:展示告警等級的分布情況高等級告警信息:展示高等級的告警信息如下圖所示:第23頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書3.2.資源監(jiān)控資源分配的不合理對于整個集群的正常工作都會巨大影響。第24頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書在資源監(jiān)控中,劃分出以k8s集群資源監(jiān)控、主機集群資源監(jiān)控、資源列表、3D機房4個模塊為主的具體監(jiān)控面。3.2.1.機房資源監(jiān)控通過抽象機房機柜坐標(biāo)位置進行觀緯度查看機房服務(wù)器的狀態(tài)及資源使用情況。D機房模塊從機房機柜服務(wù)器三個緯度,清晰地展示了機房服務(wù)器的可視化圖像。.機房多角度觀察。如下圖所示:.機柜服務(wù)器本身有異常。第25頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.服務(wù)器點擊服務(wù)器進入具體服務(wù)器層面,可查看單臺服務(wù)器基本具體信息:服務(wù)器基本信息:展示服務(wù)器的基本信息正在運行的pod:展示此臺服務(wù)器內(nèi)正在運行的pod未處理的告警:展示此臺服務(wù)器未處理的告警切換成圖表界面,可查看服務(wù)CPU、內(nèi)存、磁盤使用情況。第26頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書如下圖所示:第27頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書3.2.2.集群資源監(jiān)控由此,平臺提供了集群資源監(jiān)控模塊統(tǒng)一對多集群數(shù)據(jù)進行展示。CPU、內(nèi)存、告警等多方面確認集群健康狀態(tài)。平臺對不同類型的集群進行了劃分,分為K8s集群及主機集群。.K8s集群監(jiān)控第28頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.1.集群列表選擇進入k8s集群tabk8s名稱、數(shù)據(jù)中心、狀態(tài)、類型、CPU、內(nèi)存、磁盤、節(jié)點、服務(wù)、pod工作負載等信息在列表內(nèi)一目了然。如下圖:集群列表也提供了集群新增編輯刪除功能,因與集群新增類似故此處對于編輯功能省略,具體可參考集群新增模塊。如下圖:第29頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書輸入集群的一些相關(guān)信息之后保存便可新建一個集群。斷集群狀態(tài)情況及資源使用情況、可查看集群、節(jié)點數(shù)據(jù)、資源使用情況等詳細數(shù)據(jù)。第30頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.2.概覽包括了集群的CPU、內(nèi)存、磁盤當(dāng)前使用值及pod啟動率,并用圖表的方式展示了CPU、內(nèi)存、磁盤、GPU等相關(guān)資源的歷史使用情況。如下圖:.3.詳情展示集群的基本信息第31頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.4.告警3.5.主機切換主機頁,可查看此集群相關(guān)的主機列表。關(guān)于主機監(jiān)控,可見主機資源監(jiān)控章節(jié),此處不做詳述。..服務(wù)切換服務(wù)頁,可查看此集群相關(guān)的服務(wù)列表。關(guān)于服務(wù)監(jiān)控,可見服務(wù)監(jiān)控章節(jié),此處不做詳述。..工作負載切換工作負載頁,可查看此集群相關(guān)的工作負載列表。關(guān)于工作負載監(jiān)控,可見工作負載監(jiān)控章節(jié),此處不做詳述。第32頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.8.Pod切換Pod頁,可查看此集群相關(guān)的pod列表。關(guān)于pod監(jiān)控,可見pod監(jiān)控章節(jié),此處不做詳述。..管理組件展示kube-system命名空間下的pod信息.主機集群資源監(jiān)控..主機集群列表選擇進入主機集群tab信息:集群的名稱、數(shù)據(jù)中心、狀態(tài)、類型、CPU、內(nèi)存、磁盤、節(jié)點等信息。如下圖:第33頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書與k8s集群相比,主機集群的類型為虛擬機集群,且少了命名空間,pod等k8s集群特有的資源。tab頁。.2.概覽展示了主機集群的CPU、內(nèi)存、磁盤使用率的當(dāng)前數(shù)值及歷史折線圖。.3.告警展示主機集群相關(guān)的告警信息第34頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.4.節(jié)點切換主機頁,可查看此主機集群相關(guān)的主機列表。關(guān)于主機監(jiān)控,可見主機資源監(jiān)控章節(jié),此處不做詳述。3.2.3.主機資源監(jiān)控k8s集群及主機集群。.主機列表在主機列表頁面,可以查看到主機層面的CPU、內(nèi)存、磁盤等資源使用情況。K8s集群:K8s主機列表展示了k8s主機相關(guān)的重要指標(biāo),包括了主機名稱、主機狀態(tài)、CPU、內(nèi)存、磁盤、IP、是否污點及運行業(yè)務(wù)。如下圖:第35頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書主機集群:內(nèi)存、磁盤、主機IP、宿主機IP及運行業(yè)務(wù)。并提供了對主機的移除功能。告警信息等信息。.概覽K8s第36頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書K8s主機概覽展示了k8s的使用情況。主機集群主機集群主機概覽展示了主機相關(guān)的重要指標(biāo),包括了CPU、內(nèi)存、磁盤的使用情況.詳情第37頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書平臺只展示了k8s集群的詳情,主機集群無需展示。.告警展示主機相關(guān)的告警信息.Pod切換Pod頁,可查看此集群相關(guān)的pod列表。關(guān)于pod監(jiān)控,可見pod監(jiān)控章節(jié),此處不做詳述。.2.3.6.進程展示主機集群主機的進程信息第38頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書3.2.4.命名空間監(jiān)控各個命名空間的狀態(tài)及資源使用情況。.命名空間列表的狀態(tài)、CPU、內(nèi)存、磁盤使用和運行情況及命名空間相關(guān)的及工作負載數(shù)量關(guān)系信息如下圖:第39頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.概覽CPU、內(nèi)存、磁盤、GPU的當(dāng)前及歷史使用情況及當(dāng)前命名空間下的pod啟動率。.詳情第40頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書切換tab頁轉(zhuǎn)換到命名空間詳情頁,可查看此命名空間的yaml信息:.告警切換到告警頁,可以查看此命名空間緯度下的告警信息列表:.服務(wù)切換到服務(wù)頁,可查看此命名空間相關(guān)的服務(wù)列表。關(guān)于服務(wù)監(jiān)控,可見服務(wù)監(jiān)控章節(jié),此處不做詳述。.2.4.6.工作負載切換到工作負載頁,可查看此命名空間相關(guān)的工作負載列表。第41頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書關(guān)于工作負載監(jiān)控,可見工作負載監(jiān)控章節(jié),此處不做詳述。.pod3.2.5.服務(wù)監(jiān)控務(wù)模塊統(tǒng)一提供服務(wù)相關(guān)信息數(shù)據(jù)。.服務(wù)列表IP可初步判斷服務(wù)的運行是否正常及相關(guān)端點數(shù)是否符合預(yù)期:第42頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.概覽在服務(wù)概覽頁面,可以看到多個服務(wù)運行情況以及查看服務(wù)相關(guān)端點數(shù)量信息如下圖:.yaml信息第43頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書跳轉(zhuǎn)yamlyaml下圖:.告警展示與此服務(wù)相關(guān)的告警信息.2.5.5.工作負載切換工作負載頁,可查看此服務(wù)相關(guān)的工作負載列表。關(guān)于工作負載監(jiān)控,可見工作負載監(jiān)控章節(jié),此處不做詳述。.Pod切換Pod頁,可查看此服務(wù)相關(guān)的pod列表。第44頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書關(guān)于pod監(jiān)控,可見pod監(jiān)控章節(jié),此處不做詳述。.分層拓撲展示與此服務(wù)相關(guān)的分層拓撲,從命名空間->服務(wù)->工作負載->節(jié)點->POD->容器等緯度的數(shù)量、名稱及狀態(tài)。支持回溯功能,如下圖:點擊各個緯度的節(jié)點可查看各個緯度的詳細信息:命名空間詳情:第45頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書服務(wù)詳情工作負載詳情第46頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書第47頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書節(jié)點詳情第48頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書pod詳情容器詳情第49頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書第50頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書3.2.6.工作負載監(jiān)控行快速排查。.工作負載列表跳轉(zhuǎn)只工作負載tab作負載:deployment、daemonset、statefulset。工作負載列列表指標(biāo)涵蓋了工作負載名稱、工作負載狀態(tài)、相關(guān)的命名空間、相關(guān)期望pod數(shù)與實際可用pod數(shù)及CPU、內(nèi)存的request值。如下圖:第51頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書pod及實際運行pod負載健康狀態(tài)。.概覽進入某個工作負載概覽層面,通過查看單個工作負載的啟動率等更加詳細的使用情況及此個工作負載的相關(guān)告警信息。.yaml信息切換到y(tǒng)amlyaml文件內(nèi)容,如下圖:第52頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.告警切換到告警頁面,可查看此工作負載相關(guān)的告警信息.2.6.5.服務(wù)切換到服務(wù)頁,可查看此工作負載相關(guān)的服務(wù)列表。關(guān)于服務(wù)監(jiān)控,可見服務(wù)監(jiān)控章節(jié),此處不做詳述。.Pod切換Pod頁,可查看此工作負載相關(guān)的pod列表。關(guān)于pod監(jiān)控,可見pod監(jiān)控章節(jié),此處不做詳述。3.2.7.pod監(jiān)控第53頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書podpodpodpod信息的快速準(zhǔn)確的查看。.pod列表在podpod的狀態(tài)運行階段以及相關(guān)容器情況進而判斷pod健康程度。如下圖:pod列表頁包括了pod名稱、ip、狀態(tài)、階段、命名空間、所屬工作負載、期望容器數(shù)、可用容器數(shù)、重啟次數(shù)、運行時間、CPUrequest、內(nèi)存request、CPU使用量、內(nèi)存使用量等指標(biāo)信息。.概覽在pod概覽層面,通過查看單個pod的CPU、內(nèi)存、磁盤、重啟次數(shù)等更加詳細的指標(biāo)信息判斷pod運行狀態(tài)及資源使用情況。第54頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.詳情可查看此Pod相關(guān)的yaml信息,包括標(biāo)簽、注釋、yaml文件內(nèi)容,如下圖:.告警切換到告警頁面,可查看此pod相關(guān)的告警信息:第55頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.事件切換到事件頁面,可查看此pod相關(guān)的事件信息.2.7.6.容器切換容器頁,可查看此pod相關(guān)的容器列表。關(guān)于容器監(jiān)控,可見容器監(jiān)控章節(jié),此處不做詳述。3.2.8.容器監(jiān)控儀表盤模塊。.容器列表在容器列表里可用看到容器的一些指標(biāo),包括容器的名稱、狀態(tài)、命名空間、CPU使用量及內(nèi)存使用量。第56頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.概覽容器概覽層面,可通過查看容器的狀態(tài)運行階段來判斷容器是否正常,可通過查看CPU,內(nèi)存的使用量來判斷容器運行是否符合期望。.詳情容器詳情頁面展示了容器的yaml文件:第57頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書進入單個容器層面,可查看此容器的CPU、內(nèi)存、磁盤使用及重啟次數(shù)等詳細信息。3.2.9.管理組件監(jiān)控平臺將kube-system命名空間相關(guān)的pod整個k8s集群的正常運作,所有對管理逐漸的監(jiān)控也是有很大的必要性。通過查看管理組件的pod狀況,判斷系統(tǒng)管理組件是否異常。.管理組件列表第58頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書3.3.業(yè)務(wù)監(jiān)控及中間件等。需要支持對上下層平臺間服務(wù)調(diào)用關(guān)系及健康度、調(diào)用頻率等進行全鏈路監(jiān)控。并能提供動態(tài)構(gòu)建業(yè)務(wù)調(diào)用鏈路監(jiān)控,以便輕松定位失敗點和瓶頸。3.3.1.業(yè)務(wù)列表數(shù),判定算法優(yōu)劣。.業(yè)務(wù)列表第59頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書目前針對算法的響應(yīng)時間、錯誤率、Apdex指數(shù)和Pod運行情況綜合評估后,得出算法的運行情況是否滿足需求點。如下圖:聚合了業(yè)務(wù)下所有應(yīng)用。每行顯示業(yè)務(wù)的一些基本信息:1.業(yè)務(wù)名稱:配置好的業(yè)務(wù)名稱;2.健康評分:業(yè)務(wù)入口的健康度,應(yīng)用評分,根據(jù)響應(yīng)時間,網(wǎng)絡(luò)錯誤率,apdex值指標(biāo)進行計算;3.業(yè)務(wù)狀態(tài):業(yè)務(wù)下業(yè)務(wù)節(jié)點的狀態(tài),包含正常、異常、故障三種狀態(tài),呈現(xiàn)狀態(tài)下的5XX、建聯(lián)失敗、宕機;4.所屬租戶:業(yè)務(wù)所屬的租戶;5.總請求量:以業(yè)務(wù)和時間為維度,計算業(yè)務(wù)的被請求的數(shù)量;6.平均響應(yīng)時間:所選時間范圍內(nèi),業(yè)務(wù)入口的平均響應(yīng)時間;7.錯誤率:業(yè)務(wù)入口所有實例發(fā)生狀態(tài)碼錯誤的比率平均值;第60頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書8.所屬集群:業(yè)務(wù)里面所涉及到的集群,支持多集群;9.Apdex指數(shù):根據(jù)業(yè)務(wù)入口下所有實例的平均響應(yīng)時間來計算;10.Pod重啟次數(shù):按照業(yè)務(wù)維度統(tǒng)計業(yè)務(wù)關(guān)聯(lián)應(yīng)用的Pod重啟次數(shù)信息11.健康檢查URL錯誤次數(shù):實時統(tǒng)計該業(yè)務(wù)下所有應(yīng)用的健康檢查錯誤次數(shù);12.編輯、刪除按鈕;對業(yè)務(wù)進行編輯刪除操作,刪除業(yè)務(wù)不可恢復(fù);.新建業(yè)務(wù)點擊新建業(yè)務(wù)按鈕可跳轉(zhuǎn)到新建業(yè)務(wù)拓撲的頁面:當(dāng)前視圖通過7天的網(wǎng)絡(luò)調(diào)用數(shù)據(jù),搭建應(yīng)用間調(diào)用關(guān)系,生成拓撲,k8s環(huán)境節(jié)點是以工作負責(zé)為最小單元,虛擬機環(huán)境以ip:port為最小單元。根據(jù)當(dāng)前所選的租戶,提供給邊的圖標(biāo)對節(jié)點進行名稱修改。雙擊所需要加入業(yè)務(wù)的節(jié)點,即可將所選節(jié)點加入到業(yè)務(wù)預(yù)創(chuàng)建視圖:第61頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書選擇之后點擊保存可彈出下一個頁面:第62頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書口,則調(diào)整后的業(yè)務(wù)節(jié)點為業(yè)務(wù)入口。選擇評分規(guī)則,系統(tǒng)將根據(jù)所選評分規(guī)則內(nèi)設(shè)置的權(quán)重進行健康分數(shù)計算。點擊確定之后即可新建一個新的業(yè)務(wù)。3.3.2.業(yè)務(wù)節(jié)點列表業(yè)務(wù)節(jié)點列表對所有業(yè)務(wù)的節(jié)點進行統(tǒng)一展示,使節(jié)點統(tǒng)計更加清晰,如下圖:列表提供了對應(yīng)用節(jié)點的編輯(k8s節(jié)點不可刪除)、刪除功能。點擊新建按鈕,跳轉(zhuǎn)至新建應(yīng)用界面:第63頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書新增應(yīng)用類型提供了四種應(yīng)用類型:F5設(shè)備、SLB、微網(wǎng)關(guān)、虛擬機應(yīng)用。F5設(shè)備、SLB、微網(wǎng)關(guān)三類需輸入對應(yīng)VIP,單平臺匹配到對應(yīng)的VIP地址將將ip替換為對應(yīng)的名稱,從而用具體的設(shè)備名稱替換抽象的ip:port。節(jié)歸并展開詳細說明:第64頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書3.3.3.業(yè)務(wù)詳情在業(yè)務(wù)列表也選擇一個業(yè)務(wù)名稱點擊進入即可跳轉(zhuǎn)到業(yè)務(wù)詳情頁面,業(yè)務(wù)詳情頁面劃分為:調(diào)用拓撲、概覽、服務(wù)、工作負載、告警5個模塊。.調(diào)用拓撲此模塊將顯示此業(yè)務(wù)的節(jié)點調(diào)用拓撲圖:第65頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書如圖所示:時間、錯誤率、請求量等數(shù)據(jù)。點擊當(dāng)個節(jié)點,可顯示此節(jié)點做為服務(wù)端所關(guān)聯(lián)的網(wǎng)絡(luò)數(shù)據(jù):包括:響應(yīng)時間、錯誤率、請求量健康檢查錯誤數(shù)。點擊回溯按鈕,可回溯所選時間內(nèi)的業(yè)務(wù)節(jié)點數(shù)據(jù)拓撲,支持自動播放:第66頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.概覽概覽模塊統(tǒng)一將統(tǒng)計該業(yè)務(wù)的CPU、內(nèi)存、磁盤、健康檢測URL錯誤數(shù)。并根據(jù)響應(yīng)時間、錯誤率、吞吐量三個緯度篩選出響應(yīng)的TOP5應(yīng)用。第67頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.服務(wù)點擊服務(wù)Tab可跳轉(zhuǎn)入服務(wù)列表頁面,此頁面所展示的是此業(yè)務(wù)內(nèi)涉及到的服務(wù)。如圖所示:求量、錯誤率等指標(biāo)。.工作負載點擊工作負載Tab負載。第68頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書如圖所示:工作負載列表包括:工作負責(zé)名稱、命名空間、所屬集群、所在業(yè)務(wù)數(shù)、工作負載類型、響應(yīng)時間、請求量、錯誤率等指標(biāo)。.告警點擊告警Tab可跳轉(zhuǎn)入告警列表頁面,此頁面所展示的是此業(yè)務(wù)內(nèi)涉及到的告警。如圖所示:時間、狀態(tài)等指標(biāo)。3.3.4.節(jié)點詳情在調(diào)用拓撲上點擊當(dāng)個節(jié)點的彈出框中,再點擊查看更多可跳轉(zhuǎn)如當(dāng)節(jié)點的詳情界面:第69頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.概覽錯誤率、相應(yīng)時間等網(wǎng)絡(luò)數(shù)據(jù)。查看節(jié)點下pod發(fā)起與接收網(wǎng)絡(luò)請求及pod異常數(shù)據(jù),包括:pod發(fā)起的錯誤請求,檢查、pod消亡原因及消亡時間8個層面。第70頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書1)發(fā)起的錯誤請求:統(tǒng)計了4xx錯誤,5xx錯誤及總錯誤次數(shù)。點擊某個錯誤請求的url,可下鉆查看單個url報文分析層面,如下圖:第71頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書根據(jù)錯誤請求列表可判斷此url發(fā)生錯誤請求的相關(guān)信息。根據(jù)請求調(diào)用鏈可判斷此url發(fā)生錯誤請求時的調(diào)用方與被調(diào)用方的信息,由此類信息可接各個階段的耗時。2)發(fā)起的慢請求:統(tǒng)計了發(fā)生慢請求時<3s,3-5s,>5s及慢請求總數(shù)。點擊某個錯誤慢的url,可下鉆查看單個url報文分析層面,如下圖:第72頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書根據(jù)慢請求列表可判斷此url發(fā)生慢請求的相關(guān)信息。根據(jù)請求調(diào)用鏈可判斷此url發(fā)生時的調(diào)用方與被調(diào)用方的信息,由此類信息可判斷網(wǎng)絡(luò)請求報文級別的異常原因。包括請求、響應(yīng)、時間線及包追蹤。3)連接失敗:統(tǒng)計了連接失敗時源pod、源IP、目標(biāo)IP、目標(biāo)POD、目標(biāo)服務(wù)及連接數(shù)。點擊連接失敗的單個pod,可進入pod發(fā)生網(wǎng)絡(luò)請求發(fā)生連接失敗的具體信息:第73頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書如圖所示:位。4)收到錯誤請求:統(tǒng)計了4xx錯誤,5xx錯誤及總錯誤次數(shù)。點擊某個錯誤請求的url,可下鉆查看單個url報文分析層面,如下圖:第74頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書根據(jù)錯誤請求列表可判斷此url響應(yīng)錯誤請求的相關(guān)信息。根據(jù)請求調(diào)用鏈可判斷此url發(fā)生錯誤請求時的調(diào)用方與被調(diào)用方的信息,由此類信息可次連接各個階段的耗時。5)收到慢請求:統(tǒng)計了發(fā)生慢請求時<3s,3-5s,>5s及慢請求總數(shù)。點擊某個錯誤慢的url,可下鉆查看單個url報文分析層面,如下圖:第75頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書根據(jù)慢請求列表可判斷此url收到慢請求的相關(guān)信息。根據(jù)請求調(diào)用鏈可判斷此url發(fā)生時的調(diào)用方與被調(diào)用方的信息,由此類信息可判斷網(wǎng)絡(luò)請求報文級別的異常原因。包括請求、響應(yīng)、時間線及包追蹤。6)包追蹤需在卡的數(shù)據(jù)包信息。包追蹤功能開啟時對性能需求較大,勿長時間開啟。可展示skb_addr、源pod、源IP、目標(biāo)服務(wù)、通過網(wǎng)卡數(shù)量、發(fā)起時間等信息??赏ㄟ^各個信息關(guān)鍵字進行篩選查詢。點擊單條數(shù)據(jù)包可展示數(shù)據(jù)包相關(guān)網(wǎng)卡的信息:第76頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書如圖,懸浮某個網(wǎng)卡圖表上,可彈出此網(wǎng)卡的信息及出棧數(shù)據(jù)包。)健康檢查7展示健康檢查相關(guān)url、4xx、5xx及調(diào)用總次數(shù)。)Pod消亡8展示相關(guān)pod消亡的原因及消亡時間。.3.4.2.調(diào)用鏈3進入調(diào)用鏈層面,k8s可查看pod調(diào)用pod(含service調(diào)用)的調(diào)用狀態(tài)及調(diào)用數(shù)據(jù),可判斷異常調(diào)用發(fā)生時pod間的調(diào)用關(guān)系及調(diào)用雙方的狀態(tài),虛擬機可查看ip:port調(diào)用ip:port的調(diào)用關(guān)系。以下介紹k8s環(huán)境:第77頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書點擊某個節(jié)點可顯示作為服務(wù)端的網(wǎng)絡(luò)數(shù)據(jù):包括響應(yīng)時間、錯誤率、請求量。第78頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.分層拓撲關(guān)于分層拓撲,可見分層拓撲,此處不做詳述。3.3.5.租戶拓撲集群管理往往是以租戶緯度進行隔離的。站在租戶角度對整個權(quán)限范圍內(nèi)的應(yīng)用訪問圖為單個租戶內(nèi)的應(yīng)用訪問拓撲:節(jié)點與節(jié)點之間的有向線段的方向即表示應(yīng)用之間的調(diào)用方向。線上的小黑點多少表示客戶端到服務(wù)端的流量大小,黑點越多流量越大。每個節(jié)點如果有故障或者異常則顯示紅色故障及黃色異常。點擊節(jié)點間的調(diào)用線段,彈出框顯示客戶端到服務(wù)端的調(diào)用數(shù)據(jù):響應(yīng)時間、錯誤率請求量。如圖:第79頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書錯誤數(shù),如下圖:3.3.6.歸并在虛擬機環(huán)境中,應(yīng)用是以ip:port的形式對外提供服務(wù)的,當(dāng)同一個功能應(yīng)用擁有多個ip:portip:port某些ip:port進行歸并后,拓撲圖上將做出對應(yīng)的歸并變化,更加簡練。歸并包括全局歸并、業(yè)務(wù)內(nèi)歸并兩個歸并緯度。.全局歸并第80頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書全局歸并:歸并之后對所有新建業(yè)務(wù)拓撲、租戶拓撲都生效。在節(jié)應(yīng)用節(jié)點。如圖:將兩個ip:port歸并為一個名稱為:測試虛擬機應(yīng)用的應(yīng)用節(jié)點。點擊保存之后在節(jié)點列表中顯示:第81頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書租戶拓撲顯示:新建業(yè)務(wù)拓撲:點擊藍色框可展開收縮,默認為收縮。.3.6.2.業(yè)務(wù)歸并3效范圍只限制與本業(yè)務(wù)。第82頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書歸并流程:123.雙擊選中要歸并的節(jié)點。.點擊右上角歸并按鈕,彈出左上角歸并菜單。.輸入歸并的名稱,類型默認為虛擬機應(yīng)用,雙擊拓撲以選中的節(jié)點,圖中黃色節(jié)點,即可自動添加到左側(cè)關(guān)聯(lián)端點ip:port輸入框內(nèi)。如下圖:點擊保存即可保存設(shè)置:第83頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書開可展示歸并內(nèi)部具體的端點:點擊取消歸并可取消業(yè)務(wù)節(jié)點歸并。3.4.應(yīng)用監(jiān)控生故障的時候,能夠快速定位和解決問題。3.4.1.應(yīng)用列表第84頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書如上,在應(yīng)用列表視圖,顯示當(dāng)前項目下的應(yīng)用列表和應(yīng)用查詢框,每行代表一個應(yīng)用,此應(yīng)用聚合了應(yīng)用下所有實例。每行顯示應(yīng)用的一些基本信息:1.應(yīng)用名稱:探針獲取的應(yīng)用名稱,聚合了應(yīng)用下所有實例,此處不顯示IP和端口號。.應(yīng)用健康指數(shù):非容器應(yīng)用根據(jù)應(yīng)用內(nèi)所有實例的健康指數(shù)計算平均值;容器應(yīng)用只2根據(jù)活著的實例計算健康指數(shù)。評分>80分為綠色,60-80分為黃色,<60分為紅色。.應(yīng)用狀態(tài):顯示應(yīng)用狀態(tài)。顯示應(yīng)用下各狀態(tài)的實例總個數(shù)。應(yīng)用狀態(tài)包括:正常、異常、宕機。34.探針狀態(tài):顯示應(yīng)用下各探針狀態(tài)的實例個數(shù)。探針狀態(tài)包括:啟動、暫停、熔斷、掉線。達到用戶配置的熔斷條件時,探針會熔斷。實例宕機時,探針狀態(tài)為掉線。5應(yīng)用語言:顯示應(yīng)用使用語言,支持java、.net、PHP語言的應(yīng)用。6.響應(yīng)時間:應(yīng)用下所有實例響應(yīng)時間平均值。7.Apdex指數(shù):衡量服務(wù)性能的標(biāo)準(zhǔn),根據(jù)應(yīng)用下所有實例的平均響應(yīng)時間來計算。.吞吐量:應(yīng)用訪問次數(shù)。89.錯誤率:應(yīng)用狀態(tài)碼大于等于400的請求次數(shù)除以總請求次數(shù)。第85頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書示;刪除應(yīng)用會刪除應(yīng)用下所有實例,可在設(shè)置中恢復(fù)。1.點擊表格行中除刪除按鈕以外的區(qū)域,都可進入該行應(yīng)用的詳情頁。13.4.2.應(yīng)用實例例按照應(yīng)用名稱合并為一個標(biāo)簽。例數(shù)量,當(dāng)健康指數(shù)>80分為綠色,60-80分為黃色,<60分為紅色。點擊某個標(biāo)簽,會分頁展示使用該標(biāo)簽的實例列表和實例查詢框,如下圖:響應(yīng)時間等指標(biāo)。點擊左上角的標(biāo)簽列表按鈕,可返回;實例列表后面的詳情/刪除按鈕功能與應(yīng)用列表的按鈕功能一致。注意:實例宕機后,健康指數(shù)=0。3.4.3.拓撲視圖第86頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書在拓撲視圖,默認顯示當(dāng)前項目最近分鐘內(nèi)的應(yīng)用拓撲情況,以一個測試項目為例,拓撲圖顯示如下:拓撲圖顯示了客戶每一次點擊的鏈路詳情和所選時間段內(nèi)對每個應(yīng)用訪問的平均響應(yīng)時間。界面分為左上角狀態(tài)圖標(biāo)、右上角功能圖標(biāo)、中間拓撲圖展示及右側(cè)節(jié)點歸并展開按鈕。1.左上角狀態(tài)圖標(biāo):應(yīng)用實例的顏色及個數(shù):綠色代表服務(wù)正常的實例的數(shù)量,黃色代表服務(wù)有異常的實例的數(shù)量,紅色代表服務(wù)不可用(宕機)的實例的數(shù)量,灰色代表服務(wù)未監(jiān)控的實例的數(shù)量。的平均響應(yīng)時間大于200ms小于11分鐘。2.右上角狀態(tài)圖標(biāo):縱向展示:切換中間拓撲圖的方向,如下圖是縱向展示:第87頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書點擊橫向展示仍可切換成橫向。圖例:鼠標(biāo)上移圖例,展示對圖標(biāo)的說明。列表展示:點擊列表展示,會在拓撲圖區(qū)域分頁展示拓撲圖中兩節(jié)點之間的訪問情況列表,包括發(fā)起方、被調(diào)用方、平均調(diào)用時間及響應(yīng)次數(shù),發(fā)起方和被調(diào)用方前面的圓圈顏色代表應(yīng)用實例的狀態(tài),含義與拓撲圖上一致,如果沒有圓圈則代表該節(jié)點沒有狀態(tài),同時還可以對發(fā)起方和被調(diào)用方進行模糊搜索,如下圖:第88頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書3.中間拓撲圖展示如上圖,以橫向拓撲圖為例,首先是以歸并后的結(jié)果展示的(應(yīng)用實例按應(yīng)用名稱合并,非應(yīng)用實例按類型歸并),該拓撲結(jié)構(gòu)圖清晰的展現(xiàn)了每個應(yīng)用分別訪問了哪些服務(wù),每個應(yīng)用訪問各個服務(wù)的次數(shù)和平均訪問延時。如果一項服務(wù)中斷,就可以立即看到其它服務(wù)遭受的影響。第89頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書如上圖,鼠標(biāo)上移到拓撲圖的節(jié)點上,會高亮展示跟該節(jié)點有直接關(guān)系的所有數(shù)據(jù),同時會以氣泡的形式展示該應(yīng)用的詳情:如果是應(yīng)用的話,會分別展示該應(yīng)用下正常、異點擊某個應(yīng)用節(jié)點會進入該應(yīng)用的詳情頁,默認展示該應(yīng)用下第一個應(yīng)用實例的數(shù)據(jù);當(dāng)應(yīng)用展開成實例時,點擊可直接跳轉(zhuǎn)到該實例的詳情。節(jié)點右上角的數(shù)字圖標(biāo)表示歸并的實例數(shù)量,點擊后可展示該節(jié)點下的實例。鼠標(biāo)上移拓撲圖可拖動整個拓撲,上移到節(jié)點上也可拖動節(jié)點的位置,更方便用戶對數(shù)據(jù)的查看。同時利用鼠標(biāo)滾輪,可放大縮小整個拓撲圖。4.右側(cè)節(jié)點歸并第90頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書當(dāng)拓撲圖上通過點擊節(jié)點右上角的數(shù)字展開后,可通過節(jié)點歸并功能重新歸并。打勾表示已經(jīng)歸并,反之表示未歸并,可相互切換。3.4.4.應(yīng)用詳情.監(jiān)控概覽指數(shù)和訪問該應(yīng)用的錯誤率。將鼠標(biāo)放到圖上的某個點可以獲得具體的條數(shù)。列表展示了該實例的事務(wù)和數(shù)據(jù)庫事務(wù)。第91頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.應(yīng)用拓撲的次數(shù)及平均耗時。此外,還可以拖動圖標(biāo)來改變動態(tài)他們的位置。下圖為一周內(nèi)內(nèi)以application@6:9191為標(biāo)識的應(yīng)用的拓撲結(jié)構(gòu)。Java第92頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.net應(yīng)用拓撲的功能基本與.拓撲視圖保持一致,增加了對非應(yīng)用節(jié)點的點擊功能,mysql例的數(shù)據(jù)庫事務(wù)頁面)。同時不對當(dāng)前應(yīng)用的實例做歸并。.事務(wù)業(yè)務(wù)系統(tǒng)所有層級事件的關(guān)聯(lián),提供面向業(yè)務(wù)和場景的運維可見度,幫助理解系統(tǒng)行為、用于分析性能問題的工具,以便發(fā)生故障的時候,能夠快速定位和解決問題。該欄目主要展示指定時間段耗時最長的100個Web還提供了慢事務(wù)追蹤的功能,讓您精準(zhǔn)定位慢事務(wù)。WEB事務(wù)頁面顯示中主要分為三個區(qū)塊:URL總覽(列表形式展示耗時最長的100條web事務(wù),可切換成圖展示,默認按響應(yīng)時間倒序排序,也可根據(jù)耗時百分比、apdex、錯誤率和WEBWEB可根據(jù)開始時間排序)。第93頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.1.URL總覽對應(yīng)用組件運行的請求事務(wù)進行分類、確認訪問量較大且響應(yīng)時間較慢的事務(wù)進行優(yōu)化,請求事務(wù)的名稱、耗時百分比、apdex、錯誤率、響應(yīng)時間和吞吐量等信息。.2.單條WEB事務(wù)的響應(yīng)時間和吞吐量對應(yīng)用組件運行的請求事務(wù)詳情、確認訪問量較大且響應(yīng)時間較慢的單次事務(wù)進行優(yōu)化,第94頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.3.慢事務(wù)鉆取碼級別的可見性以便輕松定位失敗點和瓶頸。點擊URL示:的分析頁,如下圖所示:第95頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書鉆取頁詳細展示了trace信息,同時多個tab欄可查看不同信息。)追蹤路徑:在追蹤路徑點擊三角形會顯示異常信息及異常代碼棧:12)慢方法堆棧:展示該事務(wù)中該應(yīng)用的慢方法列表及其堆棧。第96頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書(應(yīng)用中無慢方法的展示歷史慢方法數(shù)據(jù)))拓撲:3最長。當(dāng)有安裝netsniffer時,鼠標(biāo)上浮在拓撲線上時間展示的地方,會有懸浮框出現(xiàn),展enduser調(diào)用AA展示該新節(jié)點的事務(wù)詳情頁如下圖:第97頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書4)自定義方法:暫無圖表)系統(tǒng)消息:5點擊系統(tǒng)消息可以查看該次請求消耗的系統(tǒng)資源信息:.異常分析該模塊對應(yīng)用實例下存在的異常及異常詳情進行分析。第98頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.1.異常列表異常,排序展示了異常名稱、占比和數(shù)量。.2.某類型異常數(shù)量走勢圖.3.異常詳情鉆取點擊異常類型的某種異常,就會在異常詳細列表顯示該異常的每一次發(fā)生,如下圖所示:第99頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書頁,代碼異常和網(wǎng)絡(luò)異常詳情分別如下圖所示:可以看到異常代碼、異常?;蛲負湫畔?。.慢方法該模塊主要展示所選時間段耗時最長的100供了慢方法調(diào)用鏈,幫助精準(zhǔn)定位慢方法。第100頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書100個慢方應(yīng)時間和吞吐量)、底部為慢方法調(diào)用鏈。.1.慢方法總覽1.最慢top5方法堆疊該界面主要展示了所選時間段最慢的5個慢方法的平均響應(yīng)時間及吞吐量。如下圖所示,清晰的展現(xiàn)了該方法的響應(yīng)時間和吞吐量。.2.慢方法調(diào)用鏈程,如下圖所示:第101頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.數(shù)據(jù)庫事務(wù)通過對數(shù)據(jù)庫SQL運行情況查看,形成問題記錄。.1.SQL總覽對應(yīng)用組件運行的SQLSQLSQL語SQL排序。如下圖第102頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書1.單條SQL事務(wù)的響應(yīng)時間和吞吐率對應(yīng)用組件運行的SQLSQL事務(wù)進SQL語句在所選時間段內(nèi)的響應(yīng)時間和吞吐率進行現(xiàn)場保留及監(jiān)控。點擊SQL總覽中的某條SQLSQL語句在所選時間段內(nèi)的響應(yīng)時間和吞吐率,如下圖所示:第103頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.2.慢SQL詳情頁當(dāng)存在慢sql時會在列表顯示,點擊鉆取后可展示詳情,如下:可展示該條sql的基礎(chǔ)信息、詳細SQL語句和trace信息。.數(shù)據(jù)庫連接池第104頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書等獲取數(shù)據(jù)庫連接池情況,快速定位數(shù)據(jù)庫連接池情況。數(shù)據(jù)庫連接池總覽如上圖,可展示該時間段內(nèi)連接池最新一次數(shù)據(jù)的數(shù)據(jù)源名稱、數(shù)據(jù)源類型、jdbc地址、應(yīng)用容器類型、可用連接數(shù)、活躍連接數(shù)和連接池最大連接數(shù)。點擊表格中的某一條數(shù)據(jù),可在下方展示其詳情。.1.數(shù)據(jù)源詳情主要展示該數(shù)據(jù)源時間段內(nèi)的歷史使用信息和歷史使用趨勢圖。.NoSQL越發(fā)重要,特別是對慢nosql的監(jiān)控。第105頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.1.nosql總覽如上圖,可展示mango、redis和cassandra三種類型的nosql,看到平均耗時和吞吐量??汕袚Q為圖表展示:.2.單條NoSQL事務(wù)的響應(yīng)時間和吞吐率該模塊主要展示了所選時間段內(nèi)某條nosql的平均響應(yīng)時間及吞吐率。如下圖所示,清晰的展現(xiàn)了每個事務(wù)的響應(yīng)時間和吞吐率。第106頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.3.慢nosql詳情頁當(dāng)存在慢nosql時會在列表顯示,點擊鉆取后可展示詳情,如下:可展示該條nosql的基礎(chǔ)信息和trace信息。.服務(wù)調(diào)用應(yīng)用的URL調(diào)用監(jiān)控為提升應(yīng)用服務(wù)質(zhì)量提供了非常必要的數(shù)據(jù)依托。..服務(wù)調(diào)用總覽該列表展示了所有了調(diào)用類型(內(nèi)部、外部),展示了調(diào)用的錯誤率、吞吐量和響應(yīng)時間,有助于分析服務(wù)質(zhì)量。第107頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.2.調(diào)用情況匯總圖該圖表展示了平均響應(yīng)時間最久和錯誤率最高的服務(wù)調(diào)用曲線圖..服務(wù)調(diào)用詳情3在服務(wù)調(diào)用列表中點擊查看可顯示此條調(diào)用服務(wù)的詳情,響應(yīng)時間、吞吐率;若本次調(diào)用為慢服務(wù),會對其開始時間、響應(yīng)時間及trace信息進行分析。第108頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書0.消息隊列里的消息進行監(jiān)控數(shù)據(jù)就成為了排查的新方向。0.1.MQ一覽和平均消息發(fā)送時間(消費者為平均消息處理時間),整體把握消息隊列的健康情況0.2.單個消息隊列的詳情追蹤列表。點擊鉆取一條具體的慢消息追蹤,展示詳細的慢消息分析信息。第109頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書1.JVM概況當(dāng)應(yīng)用出現(xiàn)異常如oomJVM的內(nèi)存使用情況的信息。該模塊主要展示了系統(tǒng)參數(shù)、JVM堆內(nèi)存各區(qū)域內(nèi)存使用情況、線程信息、垃圾收集及類加載等相關(guān)信息。..系統(tǒng)參數(shù)和內(nèi)存池3javaJIT編譯器名稱、用戶主目錄等信息。第110頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書欄目右側(cè)展示了JVM堆內(nèi)存的使用情況,包括Eden、Survior、OldGen及PermGen等存總量(used)、可使用的內(nèi)存量(commited)、可用的最大內(nèi)存量(max)。此外將鼠標(biāo)放到曲線圖上還可以查看具體的數(shù)值。1.2.線程信息程的詳細信息,包括線程名稱、線程的ID、CPU占用率、線程狀態(tài)等信息,當(dāng)某個線程處于WAITING狀態(tài)時,可以看到當(dāng)前線程所等待鎖的名稱。此外,點擊某個線程后,可以從右側(cè)獲得該線程更加詳細的信息。點擊死鎖線程tab,下方列表變更為死鎖線程的詳情展示。第111頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書1.3.GC詳情如下圖所示,通過GC詳情可以得知JVM使用了哪些垃圾收集器,同時還可以得到每個垃圾收集器執(zhí)行的次數(shù)和總時間。第112頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書2.線程剖析jstack來分析線程狀態(tài)。然而對于不熟悉jstack的人員來說,其提供的信息晦澀而難以理解。平臺此模塊為用戶提供了下載線程信息并剖析jstack信息的功能。3.5.第113頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書過郵件短信等方式及時通知相關(guān)人員。告警模塊通過多個緯度對告警事件進行查詢及配置:3.5.1.告警事件支持pod異常告警、主機節(jié)點異常告警、工作負載異常告警、應(yīng)用異常告警等多種告警,可快速定位告警原因,解決告警問題。3.5.2.告警規(guī)則可根據(jù)實際情況設(shè)置告警的規(guī)則,單系統(tǒng)匹配到設(shè)置的告警規(guī)則時,將觸發(fā)告警信息的發(fā)送,及時提示用戶。第114頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.告警規(guī)則列表如下圖:.告警規(guī)則詳情點擊某條告警規(guī)則,可查看此條告警規(guī)則的詳情:第115頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書.新建告警規(guī)則點擊新建告警按鈕,可進行告警規(guī)則的新建。第116頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書->設(shè)置觸發(fā)條件->設(shè)置告警內(nèi)容與通知對象之后即可創(chuàng)建新的告警規(guī)則。3.5.3.通知對象.通知對象列表通知對象列表展示了所有的通知對象:.通知對象新建點擊新建通知對象按鈕,可跳轉(zhuǎn)新建通知對象界面,輸入相關(guān)通知對象信息即可新建可收到相應(yīng)通知。第117頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書3.5.4.通知對象組對象組是一個合理的選擇。.通知對象組列表.1.通知對象組新建點擊新建通知對象組按鈕,可跳轉(zhuǎn)至新建通知對象組界面:第118頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書警規(guī)則中配置了該通知對象組之后,對應(yīng)發(fā)生的告警即可通知到該對象組下面的所有對象人員。3.6.儀表盤表形式的表現(xiàn)方式,是容器狀態(tài)與指標(biāo)變得一目了然。3.6.1.面板列表第119頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書data整體情況。循環(huán)視圖模式以及時間控件等,實現(xiàn)對當(dāng)前dashboard的操作。3.6.2.創(chuàng)建儀表盤第120頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書點擊創(chuàng)建儀表盤可跳轉(zhuǎn)如下頁面:點擊查詢查看此儀表盤的一系列數(shù)據(jù):點擊可視化:第121頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書如上圖,通過添加查詢以及選擇可視化方式,實現(xiàn)對dashboard圖表的添加,選擇一個數(shù)據(jù)源,在“查詢”選項卡的第一行中,單擊下拉列表以查看所有可用的數(shù)據(jù)源。在“面板”選項卡的“可視化”部分中,單擊一種可視化類型,保存儀表盤。3.6.3.創(chuàng)建文件夾dashboard下圖:3.6.4.導(dǎo)入第122頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書通過Upload.jsonfile按鈕,導(dǎo)入本地yaml文件,實現(xiàn)dashboard的創(chuàng)建。3.6.5.添加數(shù)據(jù)源第123頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書Prometheus數(shù)據(jù)舉例,點擊Prometheus,進入Prometheus配置界面如下圖:需配置數(shù)據(jù)源名稱、Prometheus服務(wù)器的URL、默認服務(wù)器、對Prometheus數(shù)據(jù)源啟用基本身份驗證、基本身份驗證的用戶名、基本身份驗證的密碼等信息,完成Prometheus數(shù)據(jù)dashboard面板的數(shù)據(jù)源,實現(xiàn)可視化配置及呈現(xiàn)。.1.DNS異常第124頁云監(jiān)控(HC-CloudMonitor)產(chǎn)品說明書DNSDNS請求進行監(jiān)控并且對DNS異常信息進行收集優(yōu)化,通過統(tǒng)一模塊頁面對異常DNS數(shù)據(jù)進行展示。.DNS異常概覽在DNS概覽頁面,可通過查詢響應(yīng)時間、請求數(shù)、錯誤數(shù)等排查出網(wǎng)絡(luò)請求D
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年汽車維修技師汽車構(gòu)造與維修技術(shù)預(yù)測模擬題
- 2026年銀行從業(yè)人員培訓(xùn)試題銀行金融風(fēng)險控制與合規(guī)操作
- 基礎(chǔ)護理學(xué):患者安全防護
- 2026年皖西衛(wèi)生職業(yè)學(xué)院單招綜合素質(zhì)筆試模擬試題含詳細答案解析
- 2026年江西工程職業(yè)學(xué)院單招職業(yè)技能考試備考題庫含詳細答案解析
- 2026年常州機電職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試模擬試題含詳細答案解析
- 2026年浙江警官職業(yè)學(xué)院單招綜合素質(zhì)筆試備考題庫含詳細答案解析
- 2026年新疆建設(shè)職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試備考題庫含詳細答案解析
- 2026內(nèi)蒙古呼和浩特市劍橋中學(xué)高中部教師招聘2人考試重點試題及答案解析
- 2026年河南信息統(tǒng)計職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試備考試題及答案詳細解析
- 2025湖南銀行筆試題庫及答案
- 廣東省佛山市順德區(qū)2026屆高一數(shù)學(xué)第一學(xué)期期末檢測模擬試題含解析
- 新河北省安全生產(chǎn)條例培訓(xùn)課件
- 【初高中】【假期學(xué)習(xí)規(guī)劃】主題班會【寒假有為彎道超車】
- 鐵路聲屏障施工方案及安裝注意事項說明
- 2026年及未來5年市場數(shù)據(jù)中國超細銅粉行業(yè)發(fā)展趨勢及投資前景預(yù)測報告
- (新教材)2026年人教版八年級下冊數(shù)學(xué) 21.2.2 平行四邊形的判定 21.2.3 三角形的中位線 課件
- 繼承農(nóng)村房屋協(xié)議書
- 2025-2026學(xué)人教版八年級英語上冊(全冊)教案設(shè)計(附教材目錄)
- 2026年全年日歷表帶農(nóng)歷(A4可編輯可直接打?。╊A(yù)留備注位置
- 天然藥物化學(xué)教學(xué)大綱
評論
0/150
提交評論