版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
云優(yōu)化治理白皮書第二部分云資源效益優(yōu)化(2022年)云計算開源產(chǎn)業(yè)聯(lián)盟OpenSourceCloudAllianceforindustry,OSCAR云優(yōu)化能力提升計劃CloudOptimizationCapabilityEnhancementInitiative,COCEI2022年7月版權(quán)聲明本白皮書版權(quán)屬于云計算開源產(chǎn)業(yè)聯(lián)盟,并受法律保護。轉(zhuǎn)載、摘編或利用其它方式使用本調(diào)查報告文字或者觀點的,應(yīng)注明“來源:云計算開源產(chǎn)業(yè)聯(lián)盟”或“來源:云優(yōu)化能力提升計劃”。違反上述聲明者,本聯(lián)盟將追究其相關(guān)法律責(zé)任。前言近年來,隨著我國云計算領(lǐng)域的不斷發(fā)展以及政策的大力推動,企業(yè)在云端部署業(yè)務(wù)系統(tǒng)已經(jīng)成為重要趨勢,越來越多的企業(yè)開始著手關(guān)鍵業(yè)務(wù)系統(tǒng)上云,用云逐步邁入深水區(qū)。云計算業(yè)務(wù)的快速發(fā)展催化了企業(yè)對云資源的巨大需求,云計算為企業(yè)IT基礎(chǔ)設(shè)施帶來敏捷性和效率提升的同時,深度用云環(huán)境下企業(yè)用云資源成本浪費、資源配置不合理、穩(wěn)定性不足、安全合規(guī)不規(guī)范等現(xiàn)象普遍存在,加速了企業(yè)對云的優(yōu)化和治理需求。本白皮書是云優(yōu)化治理系列白皮書的第二部分云資源效益優(yōu)化。云資源效益是衡量企業(yè)上云用云成效的關(guān)鍵因素,可以理解為企業(yè)使用各類云資源為業(yè)務(wù)發(fā)展帶來的貢獻度。本白皮書首先總結(jié)提出資源效益優(yōu)化參考框架,明確資源效益影響因素及對應(yīng)優(yōu)化路徑,從降低業(yè)務(wù)資源成本和提升資源業(yè)務(wù)價值兩個維度進行資源效益優(yōu)化,在項目云TCO、業(yè)務(wù)性能、業(yè)務(wù)安全三個方面給出了優(yōu)化策略和方法,引導(dǎo)企業(yè)結(jié)合自身業(yè)務(wù)特性構(gòu)建專屬高效的資源效益優(yōu)化體系,通過合理的資源優(yōu)化治理,提升業(yè)務(wù)的整體資源效益。參與編寫單位中國信息通信研究院、富通云騰科技有限公司、中國移動通信集團浙江有限公司、北京聚云科技有限公司、阿里云計算有限公司、中移動信息技術(shù)有限公司、中電信數(shù)智科技有限公司、廣州青蓮網(wǎng)絡(luò)科技有限公司、浪潮云信息技術(shù)股份公司、聯(lián)通(廣東)產(chǎn)業(yè)互聯(lián)網(wǎng)有限公司、優(yōu)刻得科技股份有限公司、廣州市品高軟件股份有限公司主要撰稿人栗蔚、馬飛、李哲、劉學(xué)森、王向花、張凌、邢毅彬、金天驕、朱艷濤、李彥超、劉建、阮前、馮詩淳、范麗麗、石泱泱、蘇超、穆國華、王明賢、江峰、劉鑫、孫紅立、梁高翔、茅曉清、陳侯炳,李劍君目錄TOC\o"1-2"\h\u一、云資源效益優(yōu)化背景 一、云資源效益優(yōu)化背景低碳時代到來,企業(yè)降本增效成為剛需我國高度重視低碳發(fā)展,云計算助力企業(yè)進入低碳時代。低碳意指較低的溫室氣體(二氧化碳為主)排放,隨著世界工業(yè)經(jīng)濟的發(fā)展、人口的劇增、生產(chǎn)生活方式的變革等,二氧化碳排放量越來越大。我國高度重地低碳發(fā)展,制定2030年“碳達峰”與2060年“碳中和”目標(biāo)之后,“雙碳”被正式寫入2021年的政府工作報告。2022年的全國兩會,政府工作報告再次就“雙碳”提出了多項具體任務(wù)。在“低碳”目標(biāo)實現(xiàn)的過程中,技術(shù)創(chuàng)新起著至關(guān)重要的作用。云計算作為IT資源的新型服務(wù)形式,正加速成為各行業(yè)企業(yè)數(shù)字化與低碳發(fā)展的新引擎。云計算提高了計算、存儲、網(wǎng)絡(luò)等資源利用率,提高了社會整體的算力利用率,全面提升了全社會資源效能,為傳統(tǒng)企業(yè)變革軟件架構(gòu)、創(chuàng)新管理模式、賦能業(yè)務(wù)生產(chǎn)加速提質(zhì)。企業(yè)用云效果不及預(yù)期,降本增效成為轉(zhuǎn)型剛需。隨著“雙碳”目標(biāo)的推進,更多企業(yè)愿意選擇成本更低、更綠色的云計算代替?zhèn)鹘y(tǒng)IT基礎(chǔ)設(shè)備,讓企業(yè)生產(chǎn)效率、運維效率、能源效率最大化。然而隨著企業(yè)云化進程的不斷推進,資源效益問題日益顯現(xiàn)——云資源投入與產(chǎn)出收益不匹配,其中較為典型的是工業(yè)行業(yè)。麥肯錫2021調(diào)查數(shù)據(jù)顯示,74%的企業(yè)云轉(zhuǎn)型未能獲取預(yù)期價值,受訪者認(rèn)為,云技術(shù)比他們最初預(yù)期的更復(fù)雜,40%的受訪者認(rèn)為云資源成本超出了企業(yè)的預(yù)算,而云轉(zhuǎn)型所帶來的IT價值與預(yù)期價值卻存在較大差距。優(yōu)化資源效益,助力企業(yè)充分釋放云效能云資源效益是衡量企業(yè)上云用云成效的關(guān)鍵因素。效益通常指效果和收益,是指消耗與收獲成果之間的比較,或者是消耗對成果的貢獻度。云資源效益可以理解為企業(yè)使用各種云資源為業(yè)務(wù)發(fā)展所帶來的貢獻度,或者理解為云資源投入與收益比。在企業(yè)用云過程中,云資源為上層業(yè)務(wù)提供支撐,云資源的使用與運營關(guān)乎著云平臺整體效能水平、云業(yè)務(wù)敏捷性、創(chuàng)新性和安全性等。優(yōu)化云資源使用效益,可以使云資源為業(yè)務(wù)提供優(yōu)質(zhì)的支持,是企業(yè)用云管云能力提升的重要標(biāo)志。企業(yè)云資源效益釋放不足,優(yōu)化與治理勢在必行。企業(yè)云資源的盲目配置與運營導(dǎo)致企業(yè)云資源效益釋放不足。據(jù)公開數(shù)據(jù)整理,上云后有72%的企業(yè)不清楚云最佳實踐,有67%的企業(yè)云成本高出預(yù)期,80%的企業(yè)按云服務(wù)商默認(rèn)的配置選購,只有10%的企業(yè)經(jīng)過內(nèi)部審核評估后采購云資源。企業(yè)雖然認(rèn)識到了云資源效益會對用云效果產(chǎn)生重要影響,但因為其業(yè)務(wù)關(guān)聯(lián)度的復(fù)雜性,企業(yè)很難對眾多因素進行量化分析,結(jié)合業(yè)務(wù)狀態(tài)形成完整和準(zhǔn)確的資源效益優(yōu)化手段迫在眉睫。資源效益構(gòu)成復(fù)雜,優(yōu)化方向無法確定。當(dāng)前企業(yè)已逐步重視資源效益,然而對于資源效益的理解仍然處于初期階段。資源效益對企業(yè)而言是一個相對復(fù)雜的概念,牽扯到資源價值、資源成本、業(yè)務(wù)價值、業(yè)務(wù)特性等多個層面,因此企業(yè)無法確定資源效益內(nèi)各因素的構(gòu)成和關(guān)系,導(dǎo)致企業(yè)無法確定資源效益優(yōu)化的方向和方法。資源效益提升面臨多重挑戰(zhàn),可變成本和低效資源加速企業(yè)云優(yōu)化治理難度。一方面,企業(yè)云資源體量龐大,各成本中心、業(yè)務(wù)線積累的云資源日益增多,需要有效使用和管理,且企業(yè)有些云資源較隱蔽,容易產(chǎn)生閑置和低效率的情況。另一方面,云環(huán)境下存在共享資源,成本統(tǒng)計口徑難以精確,成本的健康度分析難度較大。且共享資源與可變成本帶來成本分?jǐn)?、核銷和健康度分析等挑戰(zhàn)。二、資源效益優(yōu)化參考框架明確影響因素是資源效益優(yōu)化重點,優(yōu)化參考框架助力企業(yè)優(yōu)化體系構(gòu)建。企業(yè)用云的最終目標(biāo)是提升業(yè)務(wù)運行的績效,所以談到資源效益分析就不能只看用云的成本,也需要從用云業(yè)務(wù)性能和安全的變化同步進行分析才符合企業(yè)用云的總目標(biāo)。企業(yè)需先摸清資源效益中各影響因素構(gòu)成情況,結(jié)合業(yè)務(wù)需求環(huán)境,針對每個因素規(guī)劃合理的優(yōu)化方案,自建資源效益優(yōu)化框架。本白皮書研究提出資源效益優(yōu)化參考框架,旨在幫助企業(yè)明確資源效益優(yōu)化方向,了解針對每一個資源效益優(yōu)化因素的優(yōu)化手段,為企業(yè)業(yè)務(wù)資源效益優(yōu)化體系建設(shè)提供參考。圖SEQ圖\*ARABIC1資源效益優(yōu)化參考框架資源效益優(yōu)化公式資源效益優(yōu)化公式明確效益因素構(gòu)成與關(guān)系,為資源優(yōu)化指明方向。業(yè)務(wù)效益的通常是指業(yè)務(wù)效果和收益,是消耗與收獲成果之間的比較,或是消耗對成果的貢獻度。資源效益則是將業(yè)務(wù)效益的概念限定在資源范圍之內(nèi),通過收益比支出的形式得出資源效益的比值。資源效益優(yōu)化公式將業(yè)務(wù)的資源效益進行拆解,為企業(yè)整體資源優(yōu)化方向提供指導(dǎo),其中包含兩個組成部分,一是資源效益中的云資源價值指云資源為業(yè)務(wù)帶來的價值,資源價值主要體現(xiàn)在云資源的使用對業(yè)務(wù)性能和安全性的提升。二是資源效益中的業(yè)務(wù)云成本指業(yè)務(wù)中的云成本總支出,包含項目中所涉及的云計算相關(guān)所有費用的項目云TCO(項目用云總成本)。資源效益可以理解為云資源價值與成本比值,云資源價值的提升或業(yè)務(wù)云成本的下降都將直接提高資源效益。業(yè)務(wù)人員實施優(yōu)化工作可將資源效益優(yōu)化公式為指導(dǎo)方向,規(guī)劃實施以降低云業(yè)務(wù)成本與提升云資源價值為目的的優(yōu)化方案,持續(xù)提升資源效益。云資源效益測算因素項目云TCO 項目云TCO通常由資源、人力和運營成本三個部分組成,對業(yè)務(wù)資源效益產(chǎn)生直接影響。項目云TCO的是指以業(yè)務(wù)項目為單位涉及的用云總體成本,項目云TCO的變化將會直接對業(yè)務(wù)資源效益產(chǎn)生影響,然而項目云TCO的提高并不一定代表資源效益的下降,還需要業(yè)務(wù)人員根據(jù)成本價值、成本健康度等維度進行評估確定具體資源效益的變化情況。 資源成本涵蓋企業(yè)公有云資源采購和私有云資源建設(shè)。企業(yè)公有云資源采購成本根據(jù)業(yè)務(wù)所需云資源用量和時長不同、云服務(wù)采購模式、計費方式、付費模式和商務(wù)策略各不相同。公有云隨租隨用的資源成本使得成本支出變化幅度較大,具備較高靈活度的同時,如果管控不好將會無形之中增加大量資源成本浪費。企業(yè)私有云資源建設(shè)成本根據(jù)企業(yè)資源建設(shè)、虛機部署、資源分配、系統(tǒng)搭建等方面影響產(chǎn)生相應(yīng)變化。私有云資源成本應(yīng)綜合考慮構(gòu)建云平臺的軟硬件成本,包括IDC建設(shè)(或租用)成本、云平臺相關(guān)軟硬件設(shè)備的采購成本以及維持其持續(xù)運行的運維成本(如軟硬件維保費用、耗材、耗電費用等),一般來講私有云的建設(shè)成本與傳統(tǒng)的數(shù)據(jù)中心建設(shè)成本構(gòu)成較為一致。 人力成本需包含人員雇傭成本與人員培訓(xùn)管理成本兩個部分。資源相關(guān)人員通常包括負責(zé)使用云資源的業(yè)務(wù)或開發(fā)人員、負責(zé)資源日常運行維護和優(yōu)化管理工作的運維人員、以及負責(zé)分析規(guī)劃業(yè)務(wù)資源需求與發(fā)展的運營人員。人力資成本除了包含以上所有人員的雇傭總體費用以外,還需包括對資源相關(guān)人員投入的培訓(xùn)與管理費用,提升資源優(yōu)化人員技術(shù)能力,建設(shè)資源優(yōu)化團隊。 資源管理相關(guān)工具和咨詢是企業(yè)無法忽略的運營成本。企業(yè)通過購買或租用云服務(wù)商的資源運維工具如云管理平臺、成本優(yōu)化工具等,可以有效支持對資源使用情況監(jiān)控與統(tǒng)一運維管理。同時,企業(yè)對于資源使用和管理的咨詢費用能夠通過服務(wù)商的咨詢服務(wù)幫助企業(yè)調(diào)研業(yè)務(wù)優(yōu)化需求,給予業(yè)務(wù)資源使用管理的建議和方案。運營成本成為當(dāng)前企業(yè)重要的資源管理支出,依靠工具服務(wù)能力提升資源運營效率。業(yè)務(wù)性能業(yè)務(wù)性能是資源價值的直接體現(xiàn),是資源效益評估的重要因素。業(yè)務(wù)性能是業(yè)務(wù)判斷資源價值時優(yōu)先考慮的因素,資源的使用為業(yè)務(wù)帶來的性能提升能夠直接體現(xiàn)資源價值在資源效益中的影響,明確并提升資源價值對于資源效益優(yōu)化起到至關(guān)重要的作用。資源帶來的業(yè)務(wù)性能主要體現(xiàn)在敏捷性和創(chuàng)新性兩個方面:業(yè)務(wù)敏捷性:業(yè)務(wù)敏捷性是指業(yè)務(wù)快速、經(jīng)濟高效地適應(yīng)業(yè)務(wù)環(huán)境變化的能力。在當(dāng)今充滿挑戰(zhàn)的商業(yè)環(huán)境中,現(xiàn)代化進程與變化比以前更快更頻繁,云資源能夠幫助業(yè)務(wù)現(xiàn)有IT系統(tǒng)的工作變得更加簡單快捷,提升運營效率的同時提升業(yè)務(wù)的敏捷性。資源帶來的業(yè)務(wù)敏捷性通常表現(xiàn)在:一是相比物理服務(wù)器的長時間配置流程,資源的快捷的采購與分配流程減少了業(yè)務(wù)IT基礎(chǔ)設(shè)施的準(zhǔn)備時間,從而加快了重要IT項目的交付時間。二是資源自動化技術(shù)的使用,節(jié)省了IT人員的時間并且提升了信息傳遞的效率,加快業(yè)務(wù)環(huán)境適應(yīng)時間。三是云計算資源擴展和縮減的自由度,使業(yè)務(wù)能夠更好的應(yīng)對突發(fā)性的流量變化,提升業(yè)務(wù)應(yīng)用的敏捷性。業(yè)務(wù)創(chuàng)新性:業(yè)務(wù)創(chuàng)新性是指業(yè)務(wù)在服務(wù)、運營、產(chǎn)品等層面提升創(chuàng)新和產(chǎn)出的能力。數(shù)據(jù)中心的建造與規(guī)劃是一個耗時耗力的高成本工作,云計算資源的運用能夠有效地減少企業(yè)數(shù)字化轉(zhuǎn)型成本,降低企業(yè)轉(zhuǎn)型門檻,為企業(yè)提供基礎(chǔ)設(shè)施加快業(yè)務(wù)的創(chuàng)新能力。資源帶來的業(yè)務(wù)創(chuàng)新性通常表現(xiàn)在:一是服務(wù)模式通過資源可逐步從線下轉(zhuǎn)為線上,服務(wù)平臺的搭建與用戶溝通的形式通過資源不斷進行創(chuàng)新。二是業(yè)務(wù)可以利用資源構(gòu)建新型的運營模式和管理模式,打破物理場所的限制,利用自動化等技術(shù)實現(xiàn)更加精細化的業(yè)務(wù)運營。三是資源的可擴展性保障業(yè)務(wù)產(chǎn)品研發(fā)資源充足,另外云資源的使用也可以幫助業(yè)務(wù)進行實驗數(shù)據(jù)的全方位分析,提升產(chǎn)品的創(chuàng)新和產(chǎn)出能力。業(yè)務(wù)安全保障業(yè)務(wù)安全往往不會對資源效益產(chǎn)生直接的正面作用,但如果安全無法保障則一定會產(chǎn)生負面作用。業(yè)務(wù)安全是對業(yè)務(wù)運行效能評價的的前提,而在對在云平臺上運行的業(yè)務(wù)安全進行評估時則離不開云計算對業(yè)務(wù)安全所帶來的總體影響評估。業(yè)務(wù)安全的提升通常從數(shù)據(jù)安全、資源隔離、權(quán)限控制、業(yè)務(wù)可用四個方面定義。數(shù)據(jù)安全:數(shù)據(jù)安全性主要包括數(shù)據(jù)保密、數(shù)據(jù)備份和恢復(fù)等方向。數(shù)據(jù)泄露、損毀對業(yè)務(wù)來說往往是致命的,因為業(yè)務(wù)數(shù)據(jù)最終會寫入云平臺所提供的存儲服務(wù),所以云平臺在數(shù)據(jù)安全性保障則是數(shù)據(jù)安全的基礎(chǔ)保障。資源隔離:隔離性主要是指云平臺提供的租戶隔離或業(yè)務(wù)隔離特性,確保不同租戶或業(yè)務(wù)所使用的云資源相互獨立。多業(yè)務(wù)之間的資源隔離性、權(quán)限隔離性保障了各業(yè)務(wù)系統(tǒng)雖然同時運行在一個云平臺上但也不會相互產(chǎn)生影響,這是云服務(wù)的基本安全原則。權(quán)限控制:權(quán)限控制包括用戶認(rèn)證、資源使用權(quán)管理、數(shù)據(jù)權(quán)限控制等方面。各種權(quán)限隔離、權(quán)限控制以及授權(quán)管理機制方案,使業(yè)務(wù)安全得以保障。服務(wù)可用:服務(wù)可用性是指業(yè)務(wù)所使用的各類云資源和相關(guān)服務(wù)是否持續(xù)可用,是否達到可靠性指標(biāo)要求,保障業(yè)務(wù)持續(xù)穩(wěn)定運行。同時,在業(yè)務(wù)需要時,云平臺也可以持續(xù)提供更多資源。項目云TCO優(yōu)化手段資源用量治理分析業(yè)務(wù)特性,決策部署模式根據(jù)業(yè)務(wù)特性決策合理的部署方式是資源用量治理的第一步。企業(yè)在上云前,應(yīng)結(jié)合自身業(yè)務(wù)形態(tài)和云計算的技術(shù)特征,明確用公有云還是私有云的部署模式。兩種部署模式在成本構(gòu)成、安全性、可擴展性等方面存在明顯差異。成本構(gòu)成方面:采用公有云的企業(yè)用云成本通常是購買云服務(wù)的運營性成本。公有云的資源或服務(wù)的種類、計價邏輯和優(yōu)惠策略的復(fù)雜度導(dǎo)致企業(yè)對公有云成本管理與優(yōu)化難度增大;采用私有云的企業(yè)用云成本通常包括運營性成本和資本性成本,運營性成本包括人工成本、維修維護成本、電費、公網(wǎng)等費用,這類費用屬于數(shù)據(jù)中心建設(shè)后的持續(xù)性投入,資本性成本包括機房建設(shè)、設(shè)備采購、專線鋪設(shè)、安全設(shè)備等費用,這類費用屬于前期一次性投入,通??梢允褂脭?shù)年。運營性與資本性成本的組合導(dǎo)致私有云的成本較高。安全性方面:公有云上的資源分布于云端,不再處于數(shù)據(jù)中心邊界的防護屏障內(nèi),面臨更多安全信任危機,此外,公有云共享資源的特性,流量峰值期間容易出現(xiàn)性能問題(如網(wǎng)絡(luò)阻塞問題);私有云資源獨享,單個企業(yè)是唯一可以訪問它的指定實體,能通過企業(yè)防火墻和內(nèi)部托管提供更高級別的安全和隱私,確保第三方提供商無法訪問操作和敏感數(shù)據(jù),同時可以有效避免外部流量峰值的沖擊??蓴U展性方面:使用公有云,客戶可以快速訂購計算、存儲和網(wǎng)絡(luò)資源來應(yīng)對激增的業(yè)務(wù)需求,而無需購買和部署新的硬件,公有云上的新技術(shù)、新產(chǎn)品、新工具不斷出現(xiàn),企業(yè)可以快速購買和使用新技術(shù)架構(gòu)和產(chǎn)品類型,來達到云效益的提高;私有云可以基于企業(yè)需求,產(chǎn)品和服務(wù)有更多的個性化定制,但擴展性受到了硬件資源、底層架構(gòu)等限制。關(guān)注最新技術(shù),做好技術(shù)選型做好技術(shù)選型是資源用量治理的技術(shù)底座。企業(yè)需關(guān)注云計算相關(guān)技術(shù)的最新發(fā)展趨勢,利用好技術(shù)紅利帶來的資源用量和成本治理。伴隨云計算的發(fā)展,新技術(shù)、新產(chǎn)品、新工具會不斷出現(xiàn),無論是最新的硬件機型還是最新款的PaaS產(chǎn)品亦或是最新的SaaS軟件,往往都會帶來性能或效率上的提升,從而提升企業(yè)用云性價比和管理效率。如服務(wù)器、數(shù)據(jù)庫的升級,研發(fā)效能平臺的推出等,企業(yè)利用新技術(shù)架構(gòu)或產(chǎn)品類型適配自身業(yè)務(wù)發(fā)展可提升用云效能。以下幾種技術(shù)架構(gòu)是成本優(yōu)化中的常見方案,包括在線/離線混合部署、冷熱數(shù)據(jù)分級存儲、采用云原生技術(shù)棧。在線/離線混部是通過在在線業(yè)務(wù)運行過程中填充離線業(yè)務(wù),來提高資源利用率。對于企業(yè)同時存在多種業(yè)務(wù)場景時,可以采取混布方式,可以幫助企業(yè)提高云資源的利用率從而降低成本。在線型業(yè)務(wù)和離線業(yè)務(wù)具備資源互補的特點,從時間上和對資源的容忍度上可以結(jié)合互補。冷熱數(shù)據(jù)分級存儲技術(shù)通過合理配置業(yè)務(wù)冷熱數(shù)據(jù)存儲資源位置,在保證數(shù)據(jù)存儲效率和應(yīng)用運行性能的基礎(chǔ)上,節(jié)省存儲資源成本。根據(jù)被訪問頻率的高低,數(shù)據(jù)可以被分為熱數(shù)據(jù)、溫數(shù)據(jù)和冷數(shù)據(jù),其中,冷數(shù)據(jù)是指活動不頻繁或不會被訪問,但仍然需要保留的數(shù)據(jù)。企業(yè)大部分?jǐn)?shù)據(jù)受到業(yè)務(wù)特征、用戶行為或監(jiān)管政策的影響,都會在短時間內(nèi)變“冷”,這一部分?jǐn)?shù)據(jù)集合通常占所有數(shù)據(jù)的60%至80%,然而并不代表它們失去了價值,企業(yè)仍需大量資源來對其進行存儲。因此,通過數(shù)據(jù)分級存儲進行成本優(yōu)化的重點是將冷數(shù)據(jù)識別并儲存在低性能存儲資源中。企業(yè)采用云原生技術(shù)可以構(gòu)建彈性、松耦合應(yīng)用系統(tǒng),通過彈性擴縮容與資源調(diào)度機制提升企業(yè)用成本效率。一方面,云原生具有多維度彈性能力,容器啟停都在秒級,可以高效敏捷的進行擴縮容;且容器共享操作系統(tǒng)內(nèi)核的設(shè)計,可以有效提升資源整體利用率。另一方面,Kubernetes調(diào)度機制可保證資源合理分配,為每個集群找到最適合它的節(jié)點,動態(tài)調(diào)度機制幫助實現(xiàn)了應(yīng)用層彈性伸縮到資源層彈性伸縮的過渡。通過合理利用Kubernetes提供的調(diào)度能力,根據(jù)業(yè)務(wù)特性配置合理的調(diào)度策略,也能有效提高集群中的資源利用率。綜合資源特點,規(guī)劃資源類型合理的資源類型規(guī)劃為資源用量治理提供保障。同樣配置的實例,但由于類型不同則可能價格不同,如通用型、計算型、內(nèi)存型等,這將直接導(dǎo)致用云成本產(chǎn)生很大差異。需要注意的是:評估時除了成本外更需要考慮云上技術(shù)紅利,包括IaaS層的更新?lián)Q代帶來的性價比提升,PaaS層帶來的穩(wěn)定性、性能、研發(fā)效率的提升。企業(yè)應(yīng)提前做好云資源的容量規(guī)劃,避免資源過度配置。企業(yè)云資源的申請普遍存在過度申請的情況,通常情況下,企業(yè)可以通過壓測方式獲取單機和集群的最大容量,通過調(diào)研業(yè)務(wù)部門未來一段時間的業(yè)務(wù)規(guī)劃,梳理并列出適合業(yè)務(wù)并留有一定冗余量的資源規(guī)格和用量。同時設(shè)置容量水位線來實時監(jiān)控集群負荷,一旦達到最高水位線,及時購買云資源或者提高資源配置。結(jié)合業(yè)務(wù)流量的周期性,用好彈性資源。業(yè)務(wù)的資源使用量會根據(jù)負載情況出現(xiàn)波動,所以在選擇云資源規(guī)格時應(yīng)充分考慮其周期性特點,選擇更加合理或具備彈性的資源,以便在業(yè)務(wù)運行的低谷時間段可以降低資源使用成本,而在高峰期之前又能及時提升能力。這不僅關(guān)系到資源采購選擇,也需要與業(yè)務(wù)架構(gòu)設(shè)計進行綜合考慮。兼顧業(yè)務(wù)模式,選擇靈活計費根據(jù)業(yè)務(wù)特性選擇靈活的付費方式是資源采購階段優(yōu)化成本的直接手段。公有云服務(wù)有包年包月、按量付費、搶占式等多種計費模式,在選擇資源時應(yīng)結(jié)合業(yè)務(wù)運行特性選擇長期、低成本的云服務(wù),綜合測算選擇更低成本的資源。長期使用的穩(wěn)定性服務(wù),可以使用包年包月的低成本計費方式,臨時測試、使用周期較短的服務(wù)可以使用按需付費的靈活計費方式,服務(wù)負載存在明顯的波峰波谷,可以采用彈性資源來應(yīng)對業(yè)務(wù)高峰期。用云過程中,及時調(diào)整計費方式,獲取最高效益。在業(yè)務(wù)用云過程中,計費方式并不是一成不變的。隨著業(yè)務(wù)特性的變化,及時調(diào)整計費方式可以有效降低成本支出。例如,針對CPU利用率一直較高的后付費類(按量計費)云服務(wù)器,其連續(xù)兩個月使用時長產(chǎn)生的費用超過同規(guī)格預(yù)付費類(包年包月計費)費用,改變其計費模式為預(yù)付費。企業(yè)可以配置多種資源類型的組合來節(jié)約成本。根據(jù)服務(wù)的特性,選擇按需、預(yù)留、競價多種資源組合的形式來達到最低價的組合。最后,業(yè)務(wù)采用公有云時應(yīng)充分考慮業(yè)務(wù)是否可以拆分運行在多個公有云上,除了保障業(yè)務(wù)連續(xù)性,在資源采購成本過程中企業(yè)擁有更大的靈活性和主動性。貫穿用云周期,構(gòu)建運營體系構(gòu)建資源監(jiān)控體系,根據(jù)監(jiān)控數(shù)據(jù)分析存在優(yōu)化空間的資源單元。云資源監(jiān)控,持續(xù)監(jiān)控系統(tǒng)與資源對應(yīng)的各項指標(biāo),首先,需要監(jiān)控各類云資源的使用情況,如監(jiān)控云主機CPU使用率、內(nèi)存使用率等指標(biāo),通過時間等維度配置策略。其次,需要根據(jù)監(jiān)控數(shù)據(jù)分析出資源優(yōu)化單元和優(yōu)化空間,如某類云主機從創(chuàng)建后,一直處于關(guān)機狀態(tài),此類云主機可判定為閑置資源,運維管理員可將云主機進行回收,釋放對應(yīng)的CPU、內(nèi)存等資源,避免云資源浪費。此外,在監(jiān)控的基礎(chǔ)上,企業(yè)可分析以往數(shù)據(jù),有效預(yù)測云平臺容量未來變化,提前預(yù)警提醒企業(yè)運維人員??梢暬某杀痉治龉ぞ呤蔷毣\營的工具抓手,企業(yè)應(yīng)通過可視化的分析工具,及時洞察成本使用情況,發(fā)現(xiàn)資源優(yōu)化點。可視化一方面應(yīng)包括對賬單可視化的能力,查看賬單的各個分類明細,支持導(dǎo)出進行統(tǒng)一匯總,另一方面應(yīng)包括賬單歸屬劃分,按照事前的規(guī)劃,把賬單按照部門、業(yè)務(wù)進行劃分,從而精細化洞察支出是否與預(yù)期符合一致。加強IT資源運營管理,健全IT云運營管理體系,形成“事前、事中、事后”全生命周期運營管理機制,并持續(xù)進行優(yōu)化。事前提供上云應(yīng)用輔導(dǎo),制定系統(tǒng)高可用模版與上云評估模型,優(yōu)化部署方案,合理評估,按需分配,采用資源配額,實現(xiàn)資源自服務(wù)開通,賬號、資源、權(quán)限、配額合理分配。事中強化資源使用跟蹤,監(jiān)控資源運行性能數(shù)據(jù),按日發(fā)布資源利用率情況,按月發(fā)布租戶運營分析報告及綜合效能評分,協(xié)助租戶優(yōu)化資源部署,提升資源效能。事后回收低效冗余資源,對達到回收標(biāo)準(zhǔn)的冗余資資源督促租戶進行回收,并凍結(jié)該業(yè)務(wù)系統(tǒng)資源申請權(quán)限,督促租戶通過容器化、虛擬化等技術(shù)優(yōu)化低效資源使用。人力成本規(guī)劃企業(yè)合理規(guī)劃資源相關(guān)人員建設(shè),利用技術(shù)管理手段減少人力成本,提升資源管理效率。為了滿足業(yè)務(wù)平穩(wěn)運行的需求,企業(yè)需要在云計算資源持續(xù)投入人力成本,由于人力成本也是業(yè)務(wù)云計算運營的成本之一,所以提升云資源效益同樣需要對相關(guān)人力成本進行治理優(yōu)化。人力成本優(yōu)化工作主要通過技術(shù)和管理兩個層面進行:技術(shù)層面主要通過利用電子化管理和自動化流程減少人力成本需求。采用更多云管理平臺或優(yōu)化平臺的電子化管理在業(yè)務(wù)資源運營人員需求,降低長期的資源人力成本。自動化技術(shù)與電子化管理平臺的結(jié)合將更多的固化知識、方案與流程從線下轉(zhuǎn)為線上,提升人員資源管理處理效率和信息傳達的準(zhǔn)確率,減少線下文件流程處理人員需求。管理層面通過定期的培訓(xùn)與資源優(yōu)化團隊建設(shè)對人力成本進行優(yōu)化。當(dāng)前企業(yè)業(yè)務(wù)人員對于資源優(yōu)化的認(rèn)識和技術(shù)并未成熟,資源相關(guān)人員的技術(shù)和能力建設(shè)依舊有很大的提升空間。通過定期的培訓(xùn),員工學(xué)習(xí)資源使用管理知識、熟悉資源優(yōu)化工作流程。運營成本分配企業(yè)業(yè)務(wù)合理分配運營成本,全周期支撐企業(yè)資源使用效益。相關(guān)運營成本包括對企業(yè)用云的規(guī)劃、建設(shè)及優(yōu)化等方面,涵蓋了企業(yè)用云前、中、后各階段的云運營工作,主要目標(biāo)是通過咨詢服務(wù)、云資源服務(wù)、云管理服務(wù)等提升企業(yè)用云收益。企業(yè)應(yīng)更多的將人力和資源投入運營方面,確保用云績效的不斷提升。企業(yè)在用云、管云過程中應(yīng)考慮采購第三方專業(yè)咨詢服務(wù)的成本,借助云專業(yè)服務(wù)對企業(yè)的云規(guī)劃、云建設(shè)和云運營等工作設(shè)定長期和階段性目標(biāo),明確相關(guān)工作的開展方案,降低云建設(shè)使用過程中產(chǎn)生失誤的可能性。采購專業(yè)服務(wù)一方面可以吸收業(yè)內(nèi)的經(jīng)驗和專業(yè)技術(shù),另一方面可以通過咨詢達到鍛煉自己的隊伍,提升企業(yè)人員的能力和績效。工欲善其事,必先利其器,采用恰當(dāng)?shù)倪\營工具將對運營效率產(chǎn)生很大的影響。企業(yè)應(yīng)采用適合自身云環(huán)境的管理工具,通過有效的數(shù)據(jù)采集和管控能力,實現(xiàn)對云資源、云業(yè)務(wù)運行的狀態(tài)監(jiān)控、數(shù)據(jù)跟蹤、大數(shù)據(jù)及人工智能分析等技術(shù)手段,實現(xiàn)持續(xù)性的云使用和運營可視化分析,擁有敏捷快速的調(diào)整能力和各層面聯(lián)動的協(xié)調(diào)能力。四、業(yè)務(wù)性能優(yōu)化手段現(xiàn)代化改造原則現(xiàn)代化改造逐漸成為企業(yè)提升業(yè)務(wù)性能的關(guān)鍵工作。隨著業(yè)務(wù)上云范圍越來越廣泛,企業(yè)數(shù)字化轉(zhuǎn)型導(dǎo)致商業(yè)模式正在被重塑,業(yè)務(wù)間的競爭也在以更快的速度和更意想不到的來源出現(xiàn)。業(yè)務(wù)的敏捷性以及創(chuàng)新性的壓力不斷增加,對于云資源價值的需求也不斷提高,現(xiàn)代化改造成為企業(yè)解決業(yè)務(wù)性能問題的關(guān)注重點。現(xiàn)代化改造主要是通過新興技術(shù)或管理手段深度改造業(yè)務(wù)云計算的使用,發(fā)揮更高的云資源價值。現(xiàn)代化改造這一概念的產(chǎn)生和發(fā)展主要依賴于兩個方面:一是近年來云計算相關(guān)技術(shù)不斷突破,新的創(chuàng)新性技術(shù)幫助企業(yè)更好的釋放云計算資源的價值,將云資源更便宜、更靈活、更快等特點釋放的更加充分。二是企業(yè)對于云資源的認(rèn)識不斷加深,對于云資源的運用也逐漸熟悉,先進的資源管理體系的形成幫助業(yè)務(wù)更好的管理使用云資源?,F(xiàn)代化改造成功的規(guī)劃和執(zhí)行需要遵循以下五大原則:關(guān)注長期價值,而不是短期成本?,F(xiàn)代化改造是一個需要經(jīng)過仔細規(guī)劃的過程,它需要對業(yè)務(wù)現(xiàn)有的情況進行評估,以便對未來的目標(biāo)進行規(guī)劃。除了短期的成本降低以外,考慮未來的資源價值才是至關(guān)重要的。長期分階段進行,而不是短期改造。業(yè)務(wù)通常具備大量的資源和復(fù)雜的架構(gòu)框架,現(xiàn)代化改造是一個長期的過程,短時間的大量改造會導(dǎo)致業(yè)務(wù)不兼容等一系列問題。將改造工作分步進行,能夠保證現(xiàn)代化改造的效果以及業(yè)務(wù)的穩(wěn)定性。獲得業(yè)務(wù)團隊支持,而不是獨立工作。IT與業(yè)務(wù)的協(xié)調(diào)統(tǒng)一是業(yè)務(wù)性能的重要保障,在進行現(xiàn)代化改造的過程中,若無業(yè)務(wù)團隊的支持,便會導(dǎo)致云資源無法與業(yè)務(wù)適配。業(yè)務(wù)團隊的全程支持能夠在規(guī)劃、測試和運行各個階段保證現(xiàn)代化改造的成效。合理安排改造優(yōu)先級,而不是亂序?qū)嵤T谝?guī)劃現(xiàn)代化改造工作時需要根據(jù)業(yè)務(wù)實際情況進行改造工作的先后順序,可以先從直接給業(yè)務(wù)性能帶來切實利益的方面進行規(guī)劃。同時,還需要盡可能避免后期的改造對前期的改造產(chǎn)生影響。按需選擇第三方工具,而不是完全依賴。第三方工具提供的技術(shù)和自動化能力可以有效地提升現(xiàn)代化改造速度,但是完全依賴于工具帶來的便利,業(yè)務(wù)人員的介入能夠更好的保障現(xiàn)代化改造的效果?,F(xiàn)代化改造五大手段性能瓶頸洞察,感知現(xiàn)狀與預(yù)測未來性能瓶頸洞察能力是業(yè)務(wù)性能保障的前提。在上云后業(yè)務(wù)持續(xù)演進以及優(yōu)化迭代中,企業(yè)人員需隨時感知業(yè)務(wù)的性能現(xiàn)狀,以及具有發(fā)現(xiàn)業(yè)務(wù)性能瓶頸的能力,同時參考未來的業(yè)務(wù)預(yù)估規(guī)模量,進行應(yīng)用的性能容量預(yù)估??捎^測性改造,感知性能現(xiàn)狀,定位性能瓶頸??捎^測性的價值在于快速排障,通過metrics(指標(biāo))、logs(日志)、traces(跟蹤)等數(shù)據(jù),實現(xiàn)對系統(tǒng)的精確度量。業(yè)務(wù)應(yīng)用自頂向下,從面向終端用戶到進入應(yīng)用的內(nèi)部,如前端、網(wǎng)關(guān)、集群運行環(huán)境、各微服務(wù)的分布式請求、以及底層數(shù)據(jù)庫、各中間件應(yīng)用的調(diào)用等,業(yè)務(wù)真實性能瓶頸往往可能出現(xiàn)在以上鏈路的任意一環(huán)。可觀測性不僅了解到性能問題何時發(fā)生,還能進而分析出問題發(fā)生的原因。根據(jù)性能問題的不同,一般可以根據(jù)問題原因考慮從云資源角度、應(yīng)用架構(gòu)角度進行優(yōu)化。云資源的優(yōu)化,是從解決資源瓶頸的角度來優(yōu)化系統(tǒng)的訪問性能。一般通過云監(jiān)控的一系列指標(biāo),分析得出垂直擴展或者水平擴展。垂直擴展指提升單機處理的能力,如升級云服務(wù)器、云數(shù)據(jù)庫等云資源的規(guī)格配置,提示CPU、磁盤、帶寬、存儲等配置,水平擴展指增加云資源實例數(shù)量,從而線性提升系統(tǒng)性能。對于非資源問題導(dǎo)致的性能瓶頸,由于分布式架構(gòu)中一個業(yè)務(wù)請求通常要經(jīng)過多個服務(wù)節(jié)點后返回結(jié)果,定位問題難度增大,對可觀測性的要求更高。一般要通過一系列的監(jiān)控日志數(shù)據(jù),聯(lián)合上下游鏈路排查從而診斷出問題瓶頸和根因,從而進行針對性的優(yōu)化。如修改底層代碼邏輯、優(yōu)化慢SQL語句、增加異常限流策略、讀寫分離架構(gòu)優(yōu)化等等。業(yè)務(wù)流量壓測,預(yù)估未來業(yè)務(wù)規(guī)模,針對性進行資源性能規(guī)劃。云平臺提供分布式性能壓測服務(wù),模擬復(fù)雜的業(yè)務(wù)場景,并快速精準(zhǔn)地調(diào)度不同規(guī)模的流量,同時提供壓測過程中多維度的監(jiān)控指標(biāo)和日志記錄。通常企業(yè)無需準(zhǔn)備資源,即可按需發(fā)起壓測任務(wù),監(jiān)控壓測指標(biāo),獲取壓測報告,進而能夠高效率、全方位地驗證業(yè)務(wù)站點的性能、容量和穩(wěn)定性。應(yīng)用架構(gòu)改造,云原生擴大增效空間采用云原生技術(shù)保證業(yè)務(wù)性能的提升空間,充分利用和發(fā)揮云平臺能力。業(yè)務(wù)系統(tǒng)采用微服務(wù)架構(gòu)設(shè)計,其運行環(huán)境應(yīng)配合采用云原生容器化部署,通過容器集群的高彈性和業(yè)務(wù)感知能力,實現(xiàn)微服務(wù)與底層容器資源的聯(lián)動,屏蔽底層差異,大大簡化了開發(fā)工作量。依托于容器編排工具與微服務(wù)的組合,應(yīng)用提升了自動恢復(fù)能力、容錯能力、故障隔離能力。微服務(wù)降低應(yīng)用耦合,提升故障隔離能力和可擴展性。在業(yè)務(wù)系統(tǒng)設(shè)計時將業(yè)務(wù)系統(tǒng)拆分為獨立功能的微服務(wù),各個服務(wù)是相互獨立和自治的系統(tǒng),微服務(wù)之間通過服務(wù)調(diào)用,形成松耦合結(jié)構(gòu)。一方面,當(dāng)微服務(wù)架構(gòu)隔離功能時,一個微服務(wù)中的問題也將被隔離在這個微服務(wù)區(qū)域中,而其他微服務(wù)將繼續(xù)運行。另一方面,微服務(wù)提升程序的擴展性,可以輕松地從應(yīng)用中提取獨立功能,幫助在其他應(yīng)用程序中重新利用,開發(fā)團隊可以輕松地實施和部署代碼,無需花費較大的IT團隊或部門的時間。容器化部署輕量小巧,充分利用資源提高效益。應(yīng)用形態(tài)改造,由傳統(tǒng)的單體應(yīng)用改造為彈性和輕量的容器化應(yīng)用。一方面,基于容器化部署,輕量級的容器腳本可以從性能和大小兩個方向使開銷更低,性能更優(yōu),系統(tǒng)負載更低,同等條件下可以運行更多的應(yīng)用實例,可以更充分地利用系統(tǒng)資源,提升資源效益。另一方面,容器良好的跨平臺和可移植性,使企業(yè)在云端的遷入和遷出更加便捷,無需擔(dān)心受到云平臺的捆綁,同時也極大的促進了多云混合部署效率。資源選型策略,資源產(chǎn)品高效率使用結(jié)合業(yè)務(wù)特性合理適配資源使用類型與云產(chǎn)品服務(wù)能力,是提升業(yè)務(wù)性能方案的首要選擇。云資源適配與云產(chǎn)品選型是在保障業(yè)務(wù)系統(tǒng)正常運行的前提下來優(yōu)化云資源使用效益,進而提升云資源效益,所以在云資源選配和產(chǎn)品選型時必須根據(jù)業(yè)務(wù)的不同特性進行分析,發(fā)現(xiàn)業(yè)務(wù)對資源需求的規(guī)律、趨勢或特點,然后在從云資源供給策略和能力上給予滿足,讓云資源與業(yè)務(wù)協(xié)同運行,確保業(yè)務(wù)性能的同時降低云資源的使用成本。業(yè)務(wù)系統(tǒng)種類多樣,需按照業(yè)務(wù)類型選擇對應(yīng)資源與產(chǎn)品配置。從業(yè)務(wù)云資源使用角度來分析,可以按照以下類型進行基本區(qū)分并選擇對應(yīng)資源和產(chǎn)品:敏態(tài)/穩(wěn)態(tài):一般對敏態(tài)的理解是不確定性高、不可預(yù)測,穩(wěn)態(tài)的理解是確定性高、可預(yù)測。業(yè)務(wù)的敏態(tài)或穩(wěn)態(tài)導(dǎo)致了他們對云資源使用量、使用趨勢的確定性和可預(yù)測性方面是不同的。敏態(tài)業(yè)務(wù)可以選擇靈活性高的公有云資源與對應(yīng)的動態(tài)調(diào)整工具產(chǎn)品來提升業(yè)務(wù)的綜合性能。穩(wěn)態(tài)業(yè)務(wù)則可以使用穩(wěn)定性高的資源來保障業(yè)務(wù)平穩(wěn)運行。資源使用特性:業(yè)務(wù)或業(yè)務(wù)內(nèi)的不同組件對不同類型的資源使用要求是不同的,有的偏重于CPU處理能力,有的偏重于內(nèi)存或緩存能力,而集群環(huán)境或依賴業(yè)務(wù)間處理的又對網(wǎng)絡(luò)負載或負載均衡的要求很高。所以在資源和產(chǎn)品配置時,應(yīng)該針對業(yè)務(wù),選擇合適的資源與產(chǎn)品,解決業(yè)務(wù)關(guān)鍵需求。業(yè)務(wù)周期性:無論業(yè)務(wù)是敏態(tài)或穩(wěn)態(tài),從長期來看業(yè)務(wù)一般都會存在周期性特點,如每天、每月或年度周期、季節(jié)因素、生產(chǎn)訂單等,業(yè)務(wù)的周期性導(dǎo)致其對資源使用要求也存在周期性,資源與產(chǎn)品的采購和使用周期也需對應(yīng)進行調(diào)整。業(yè)務(wù)的關(guān)聯(lián)性:業(yè)務(wù)之間是存在關(guān)聯(lián)關(guān)系的,企業(yè)內(nèi)或企業(yè)間的業(yè)務(wù)關(guān)聯(lián)變動也會造成具體的業(yè)務(wù)系統(tǒng)對資源使用的變化,需要在云資源供給方面進行分析和判斷。業(yè)務(wù)的重要程度:不同業(yè)務(wù)的重要程度主要是從其影響范圍和可能造成的損失這兩部分來評估的。企業(yè)應(yīng)該區(qū)分不同業(yè)務(wù)的重要程度,對業(yè)務(wù)進行分級別的云資源和產(chǎn)品選配,這樣可以集中更多的資源來解決主要問題,實現(xiàn)快速效益提升。多云混合部署,混合云全面釋放價值多云混合部署綜合各云優(yōu)勢,全面提升資源的業(yè)務(wù)性能釋放。公有云在資源擴展能力、敏捷型、網(wǎng)絡(luò)能力、PaaS或SaaS服務(wù)等方面具有更大的優(yōu)勢,私有云則在安全性、私密性、可控性等方面更具優(yōu)勢。業(yè)務(wù)根據(jù)需要將不同的組件部署在混合云架構(gòu)上,如對公眾服務(wù)的網(wǎng)站、運營門戶等部署在公有云資源上,充分利用其資源彈性和平臺總體性能來承擔(dān)可能會產(chǎn)生較大波動的并發(fā)服務(wù)。而對于需要穩(wěn)定安全運行的數(shù)據(jù)庫等高度私密性服務(wù)組件部署在私有云資源中,之間通過業(yè)務(wù)架構(gòu)的設(shè)計采用多級緩存等模式確保業(yè)務(wù)性能。這樣,企業(yè)就同時擁有了更多的用云的選擇,可以在不同的云之間進行資源的調(diào)配,提升業(yè)務(wù)的靈活性。特別是針對業(yè)務(wù)呈峰谷交替的場景建議采用混合云部署,應(yīng)用資源部署在云端通過云專線等網(wǎng)絡(luò)產(chǎn)品能力打通云上云下的網(wǎng)絡(luò)互聯(lián),可以很好的解決傳統(tǒng)數(shù)據(jù)中心靈活交付、快速部署的問題,極大的減少費用支出和效率提升。組織團隊建設(shè),業(yè)務(wù)資源雙團隊協(xié)同業(yè)務(wù)能力與資源能力雙團隊協(xié)作,IT全力輔助業(yè)務(wù)達成性能目標(biāo)?,F(xiàn)代化改造不僅包括在資源技術(shù)層面的優(yōu)化,業(yè)務(wù)組織團隊的建設(shè)也同樣需要符合現(xiàn)代化改造特點,提升業(yè)務(wù)性能。業(yè)務(wù)資源的使用不是單純的一次性工作,而是長期的運營管理,所以團隊的建設(shè)在這個流程中十分必要。未來使IT的工作與業(yè)務(wù)目標(biāo)有更好的一致性,業(yè)務(wù)內(nèi)需包括兩個種類團隊的協(xié)作:一是業(yè)務(wù)能力團隊,由業(yè)務(wù)利益關(guān)系人結(jié)合而成,負責(zé)業(yè)務(wù)服務(wù)和產(chǎn)品交付,專注于達成內(nèi)外部客戶的需求,是業(yè)務(wù)性能的主要受益方。二是資源能力團隊,由資源使用管理和資源使用優(yōu)化的負責(zé)人組成,主要對業(yè)務(wù)內(nèi)資源相關(guān)的IT事務(wù)進行管理,不直接負責(zé)處理客戶的業(yè)務(wù)要求。這兩種類型的團隊需要在業(yè)務(wù)性能驅(qū)動下協(xié)作,注重長期的業(yè)務(wù)性能提升和資源管理。資源能力團隊將業(yè)務(wù)能力團隊視為客戶,負責(zé)滿足業(yè)務(wù)能力團隊的需求,朝著業(yè)務(wù)共同目標(biāo)前進。五、業(yè)務(wù)安全優(yōu)化手段網(wǎng)絡(luò)資源安全優(yōu)化網(wǎng)絡(luò)資源安全是業(yè)務(wù)安全的第一道安全屏障,網(wǎng)絡(luò)資源安全優(yōu)化從內(nèi)外部保障業(yè)務(wù)安全。網(wǎng)絡(luò)資源安全需要從不同維度進行優(yōu)化進而對網(wǎng)絡(luò)竊聽、網(wǎng)絡(luò)嗅探、網(wǎng)絡(luò)截獲、網(wǎng)絡(luò)篡改等攻擊行為進行防御,同時避免內(nèi)部網(wǎng)絡(luò)串聯(lián)導(dǎo)致的信息安全風(fēng)險。首先,安裝開啟防火墻能夠有效提升資源的安全防護等級,根據(jù)業(yè)務(wù)特點開啟防火墻的不同功能,通過防火墻的入侵檢測(IPS)功能和威脅情報能力,及時發(fā)現(xiàn)和清理危險流量的流入和流出,可以有效降低帶寬使用費用。另外因為云防火墻本身是根據(jù)相關(guān)安全法規(guī)制定,所以基本滿足網(wǎng)安法和等保2.0的相關(guān)要求,減少了在等保檢測和加固上的成本。其次,利用網(wǎng)絡(luò)資源冗余保證網(wǎng)絡(luò)資源穩(wěn)定性,規(guī)避業(yè)務(wù)停滯風(fēng)險。云廠商擁有大量BGP帶寬,不僅全面覆蓋國內(nèi)主流及中小運營商,帶來極速、穩(wěn)定的訪問體驗,還結(jié)合云廠商安全技術(shù)優(yōu)勢、算法優(yōu)勢、以及AI識別的優(yōu)勢,提供了一整套的精準(zhǔn)識別和自動防護規(guī)則,保證網(wǎng)絡(luò)資源的穩(wěn)定性,可以攻擊持續(xù)不斷的情況下,仍可以對外提供業(yè)務(wù)服務(wù)。在選擇防護等級時,可以先選擇一個低級別的防護,一般是2G的量,如果遇到了大量DDOS攻擊,再升配或是遷移。最后,通過網(wǎng)絡(luò)資源劃分進行資源安全隔離,避免網(wǎng)絡(luò)串聯(lián)導(dǎo)致的內(nèi)外部安全問題。根據(jù)業(yè)務(wù)特點創(chuàng)建VPC,通過VPC劃分對網(wǎng)絡(luò)資源做安全隔離,在云平臺資源中構(gòu)建出多個獨立網(wǎng)絡(luò)空間,并自定義網(wǎng)段劃分和IP地址、自定義路由策略等。數(shù)據(jù)資源安全優(yōu)化數(shù)據(jù)資源安全是業(yè)務(wù)安全的重點方向,運用資源優(yōu)化手段避免數(shù)據(jù)安全泄露風(fēng)險帶來的成本損失。近年來,企業(yè)數(shù)據(jù)竊取和泄露的案件數(shù)量不斷升高,數(shù)據(jù)資源安全逐漸成為企業(yè)關(guān)注重點,在數(shù)據(jù)的傳輸與存儲過程中的安全措施應(yīng)用至關(guān)重要,安全優(yōu)化手段可以有效地避免數(shù)據(jù)泄露和異常風(fēng)險,防御數(shù)據(jù)竊取。首先對數(shù)據(jù)的傳輸進行加密是數(shù)據(jù)資源安全的基礎(chǔ)防護,包括云產(chǎn)品為用戶訪問數(shù)據(jù)提供了SSL/TLS協(xié)議來保證數(shù)據(jù)傳輸?shù)陌踩?,滿足敏感數(shù)據(jù)加密傳輸需求。還可以通過VPN將本地和云端連接起來,在傳輸過程中使用IKE和IPsec協(xié)議對數(shù)據(jù)進行加密,從而防止數(shù)據(jù)包在傳輸過程中被劫持、竊取,最大限度的保護了數(shù)據(jù)安全,降低數(shù)據(jù)泄露的風(fēng)險。其次,在數(shù)據(jù)傳輸前后通過分類脫敏對業(yè)務(wù)隱私數(shù)據(jù)進行可靠保護,從海量數(shù)據(jù)中找出需要保護的敏感數(shù)據(jù),劃分級別,采取不同的措施進行保護。為保護數(shù)據(jù)隱私,用戶往往需要根據(jù)不同的業(yè)務(wù)場景對相關(guān)敏感數(shù)據(jù)進行脫敏后的使用,保留原有數(shù)據(jù)特征和分布,確保數(shù)據(jù)的有效性和可用性。用戶可以低成本、高效率、安全地使用脫敏數(shù)據(jù)完成業(yè)務(wù)需求。最后企業(yè)可以直接利用數(shù)據(jù)存儲服務(wù)提升數(shù)據(jù)資源的安全性能,業(yè)務(wù)相關(guān)文件存儲安全可以使用基于密鑰的云存儲服務(wù),如加密強度在256位密鑰,使得數(shù)據(jù)訪問更加安全。數(shù)據(jù)庫數(shù)據(jù)安全的提升可以通過采用主從數(shù)據(jù)熱備、冗余存儲、多地備份等提高服務(wù)可靠性,同時數(shù)據(jù)存儲服務(wù)還能夠?qū)?shù)據(jù)庫做實例隔離、數(shù)據(jù)庫身份鑒別和訪問控制和安全審計助力業(yè)務(wù)數(shù)據(jù)資源安全性提升。應(yīng)用資源安全優(yōu)化應(yīng)用資源安全是保證業(yè)務(wù)安全運行的基礎(chǔ)保障,通過工具服務(wù)維護業(yè)務(wù)應(yīng)用平穩(wěn)運行。應(yīng)用的平穩(wěn)運行是在業(yè)務(wù)運行過程中較為直觀的安全表現(xiàn),應(yīng)用安全方面的風(fēng)險將直接會反映出業(yè)務(wù)應(yīng)用的問題。通過資源安全優(yōu)化手段維護業(yè)務(wù)應(yīng)用的平穩(wěn)安全運行,企業(yè)首先利用漏洞掃描服務(wù)對應(yīng)用漏洞進行安全掃描與修復(fù)避免應(yīng)用安全風(fēng)險,幫助用戶進行高效精準(zhǔn)的自動化漏洞滲透測試和敏感內(nèi)容監(jiān)測,保障上線前和線上應(yīng)用環(huán)境的安全性。同時針對掃描的結(jié)果會形成專業(yè)的風(fēng)險掃描報告,對掃描出來的安全漏洞進行歸類,并提出修復(fù)建議。檢查源代碼中的缺點和錯誤信息,分析并找到這些問題引發(fā)的安全漏洞并提供代碼修訂措施和建議。此外,應(yīng)用安全配置也是避免應(yīng)用安全風(fēng)險不可或缺的手段,從身份認(rèn)證、網(wǎng)絡(luò)訪問控制、數(shù)據(jù)安全、日志審計、基礎(chǔ)安全防護五個維度,為用戶提供最佳安全配置實踐。對主機進行安全配置掃描,包括賬號安全、系統(tǒng)配置、數(shù)據(jù)庫風(fēng)險、合規(guī)性等方面,提前修補系統(tǒng)潛在的各種高危漏洞和安全威脅,出具先關(guān)報告,在此技術(shù)上可以對基線進行修復(fù),滿足總體安全合規(guī)要求。資源安全管理優(yōu)化企業(yè)在進行網(wǎng)絡(luò)、數(shù)據(jù)、應(yīng)用資源技術(shù)安全優(yōu)化工作的同時,資源安全管理優(yōu)化是配合技術(shù)提升業(yè)務(wù)安全性的強力支撐。資源安全管理通常是從業(yè)務(wù)內(nèi)部開展組織資源安全管理并建立完善的資源安全管理體系,從責(zé)任權(quán)限管理與審計監(jiān)控管理兩大方向進行體系建設(shè)與運營,合理的管理體系建設(shè)能夠為企業(yè)提供平穩(wěn)的業(yè)務(wù)資源安全保障。合理規(guī)劃資源使用業(yè)務(wù)各方的責(zé)任與權(quán)限,是業(yè)務(wù)應(yīng)對和避免安全風(fēng)險的基本條件。責(zé)任權(quán)限管理是企業(yè)對業(yè)務(wù)內(nèi)人員、賬號等維度進行的安全責(zé)任權(quán)限分配管理,一方面細化資源安全責(zé)任人員,從組織個人角度對資源的使用安全進行管理,業(yè)務(wù)主管部門需對資源使用相關(guān)人員進行責(zé)任分配,針對安全風(fēng)險問題設(shè)置對應(yīng)責(zé)任人,對主動或被動安全風(fēng)險進行及時性、針對性相應(yīng)。另一方面限制賬號操作權(quán)限,避免各賬號因操作不當(dāng)導(dǎo)致的資源安全風(fēng)險。部門負責(zé)人需對資源管理平臺、操作系統(tǒng)、數(shù)據(jù)庫及應(yīng)用系統(tǒng)中各類賬號權(quán)限的分配以及分級授權(quán),系統(tǒng)管理人員負責(zé)信息系統(tǒng)的具體用戶權(quán)限管理。信息系統(tǒng)的用戶管理需指定專人負責(zé),根據(jù)用戶對系統(tǒng)資源的需求與最小授權(quán)原則進行授權(quán)。嚴(yán)格執(zhí)行資源管理審計流程并對資源操作進行監(jiān)控,是建設(shè)長效資源安全管理體系的必要手段。審計監(jiān)控管理是保證業(yè)務(wù)平穩(wěn)運行的重要方式,對業(yè)務(wù)決策的審計和人員操作的監(jiān)控能夠有效避免業(yè)務(wù)內(nèi)部因為錯誤決策或操作失誤導(dǎo)致的安全問題。一方面,資源審計流程的設(shè)置能夠進一步保障資源使用管理的合理與合規(guī)。用戶對資源的增、刪、改需依據(jù)各系統(tǒng)業(yè)務(wù)主管部門或系統(tǒng)使用部門的審計流程進行。負責(zé)人根據(jù)決策的類型與等級設(shè)計清晰的審計流程,將決策相關(guān)人員納入流程中,保證決策的合理性避免資源使用和管理過程中的安全風(fēng)險,同時,審計流程中安全合規(guī)人員的加入能夠保障決策的合規(guī)性,防止因合規(guī)問題帶來的處罰或損失。另一方面,對資源操作日志的監(jiān)控能夠隨時對資源業(yè)務(wù)安全情況進行診斷,以便實施資源安全優(yōu)化方案。資源管理平臺應(yīng)具備符合要求的日志文件,日志文件至少應(yīng)記錄各公有云、私有云、業(yè)務(wù)平臺、APP應(yīng)用的用戶操作時間、重要數(shù)據(jù)的增刪改等內(nèi)容。系統(tǒng)管理人員應(yīng)定期檢查日志文件,并書面記錄檢查結(jié)果。資源安全監(jiān)督管理人員至少每月對操作系統(tǒng)日志及直接訪問數(shù)據(jù)庫的操作日志進行審核,發(fā)現(xiàn)異常情況及時上報負責(zé)人,同時查明原因并提出處理意見,記錄處理情況。云資源效益優(yōu)化案例展示政務(wù)行業(yè):云資源效益優(yōu)化實踐案例背景某政府大數(shù)據(jù)中心搭建了私有云平臺,方便各委辦使用資源的同時,但也給中心的領(lǐng)導(dǎo)帶來諸多管理問題。雖然私有云屬于一次性固定費用,但隨著委辦申請資源的數(shù)量不斷增多,承載的宿主機面臨需要擴容的成本。同時中心缺乏對各委辦整體使用情況的了解,當(dāng)各委辦申請資源時,粗放的審批流程導(dǎo)致過量的資源購買,造成了資源的浪費??蛻粜枨螅焊鶕?jù)內(nèi)部制定的價格清單配置查看各委辦每月使用情況低效率和閑置資源自動發(fā)現(xiàn),及時回收當(dāng)委辦申請資源時,查看該委辦所有資源近1個月的使用情況,判斷是否予以批準(zhǔn)。根據(jù)真實使用情況,進行周報匯報,了解每周資源變化情況云資源效益優(yōu)化實施關(guān)鍵環(huán)節(jié)首先我們把各委辦以二級組織的形式進行管理。在平臺內(nèi)部配置計費規(guī)則,用于了解各委辦資源使用情況,進行內(nèi)部結(jié)算,同時也一定程度上限制了資源的過量申請。其次在UCMP平臺中對應(yīng)制定優(yōu)化策略:監(jiān)測30天內(nèi)使用率低下的云資源,及時進行回收或降配操作。最大程度上減少云資源的浪費。除此之外,為配合中心的周報內(nèi)容,UCMP也制定了一定的數(shù)據(jù)匯報的內(nèi)容,包括周期內(nèi)每個委辦資源變化的數(shù)量、整體CPU、內(nèi)存、硬盤的使用率。形成匯報稅局,協(xié)助中心對各委辦資源使用情況進行監(jiān)督。效果描述借助UCloud云管平臺成本優(yōu)化的模塊,中心有效的控制資源的閑置率,資源的數(shù)量從原先的900多臺,控制到了如今的800多臺,減少了10%;在平臺使用的3個月內(nèi),委辦申請的資源數(shù)量比使用之前的3個月減少了60次;UCMP作為云資源線上統(tǒng)一入口,不斷融入新功能、資源,重新定義云業(yè)務(wù)價值。金融行業(yè):云資源效益優(yōu)化實踐案例背景客戶運行各類證券交易、資產(chǎn)管理、金融產(chǎn)品代銷等應(yīng)用系統(tǒng),除了自身的數(shù)據(jù)中心外,逐步創(chuàng)新的引入AWS、Azure等在內(nèi)的公有云資源作為快速響應(yīng)外部和周期性服務(wù)的基礎(chǔ)設(shè)施,但隨著金融產(chǎn)品增加帶來應(yīng)用系統(tǒng)的增多,眾多業(yè)務(wù)系統(tǒng)需求產(chǎn)生了大量的跨數(shù)據(jù)中心虛擬機、虛擬存儲等資源,一度達到數(shù)千臺規(guī)模,龐大IT系統(tǒng)資源存在管理、運營復(fù)雜繁瑣的難題,迫使公司從頂層設(shè)計考慮,構(gòu)建統(tǒng)一管理的可持續(xù)運營的混合云平臺。經(jīng)慎重考察選擇,客戶最終選擇品高部署云管理平臺,來提升IT管理效能。截至目前,品高已為客戶提供了6年穩(wěn)定、可靠的服務(wù)。需求與挑戰(zhàn):資源分散,難以整合:客戶一開始擁有3個數(shù)據(jù)中心,約五千臺虛擬機,并且率先使用公有云AWS運行線上交易業(yè)務(wù),后期又引入Azure等公有云,在混合云使用中走在了前列,但資源的分散造成了IT管理更大的困難和挑戰(zhàn)。同時不同的云資源平臺又提供了“各自為政”的資源管理工具需要重新熟悉,而客戶針對自己數(shù)據(jù)中心運維的風(fēng)控、備份和安全等工具又沒有辦法與之聯(lián)動起來,產(chǎn)生了潛在的安全風(fēng)險與資產(chǎn)建設(shè)浪費。業(yè)務(wù)需求增多,IT人員有心無力:面對金融市場的激烈競爭和公司業(yè)務(wù)規(guī)模的增長,開發(fā)測試和業(yè)務(wù)部門對IT資源的需求越來越多,對IT部門交付效率要求也越來越高。但此前客戶IT資源交付主要依賴人工完成,無法滿足迅速交付資源需求,IT人員日常維護量大,造成IT環(huán)境資源交付緩慢,難以應(yīng)對新業(yè)務(wù)上線的緊迫要求。云資源效益優(yōu)化實施關(guān)鍵環(huán)節(jié)1)構(gòu)建異構(gòu)混合云,實現(xiàn)資源統(tǒng)一管理構(gòu)建統(tǒng)一的管理平臺,將分布在多家公有云廠商(AWS、Azure)、公司內(nèi)部各數(shù)據(jù)中心不同的云計算資源(Vmware、KVM)進行統(tǒng)一封裝,通過品高云管理平臺引入可靈活擴展的中間抽象層,屏蔽各類資源管理的差異性,構(gòu)建具有業(yè)務(wù)交付能力的高級云服務(wù),實現(xiàn)資源的統(tǒng)一調(diào)度管理,將各類資源作為模塊,形成可靈活插拔、可橫向擴展的模式,使得運維人員從繁瑣工作中脫離出來,更關(guān)注上層業(yè)務(wù)發(fā)展。結(jié)合私有云的對業(yè)務(wù)個性化,將交易系統(tǒng)支撐平滑延伸向公有云,滿足金融業(yè)務(wù)快速上線要求。2)提供IaaS+及部分PaaS服務(wù)。通過平臺的云服務(wù)編排和設(shè)計功能,設(shè)計構(gòu)建的部署方案,創(chuàng)造高級服務(wù)。除了虛擬資源外,還支持對軟件進行編排,實現(xiàn)諸如軟件高可用、集群、升級等自動化能力。編排后的服務(wù),可以上架服務(wù)目錄,形成企業(yè)獨有的個性化云服務(wù)。可以直接交付多種常用的彈性計算實例、數(shù)據(jù)庫實例(Sqlserver、Mysql、Oracle等)、開源中間件實例(包括Tomcat、Nginx等)、存儲(包括分布式對象存儲,分布式塊存儲,F(xiàn)C存儲)、數(shù)據(jù)備份(包括磁帶離線備份、一體機在線備份)等一系列IaaS+及PaaS服務(wù),用戶通過簡單的圖形界面上的勾選即可迅速獲得IT服務(wù)。3)用戶自助獲取資源,實現(xiàn)業(yè)務(wù)快速交付。利用平臺,業(yè)務(wù)和開發(fā)部門可以隨時申請資源配額,通過流程審批的方式自助式獲取所需要的資源和服務(wù)目錄中的各項高級服務(wù),實現(xiàn)業(yè)務(wù)的快速化交付。4)和企業(yè)自動化運維生態(tài)圈高度整合,實現(xiàn)開發(fā)測試、生產(chǎn)、運維一體化。作為客戶運維平臺體系的重要組成部分,混合云管理平臺和客戶新型CMDB、持續(xù)交付平臺高度集成,構(gòu)建自動化的基礎(chǔ)資源交付、應(yīng)用編排部署、持續(xù)發(fā)布的流水線,真正做到IT資源按需獲取、彈性伸縮,解決軟件快速高質(zhì)量交付,應(yīng)用代碼快速迭代等需求,同時推動應(yīng)用從Scale-up到Scale-out,為后續(xù)進一步實現(xiàn)基于DevOps的持續(xù)交付打下基礎(chǔ),將傳統(tǒng)虛擬化的效率提升到更高層次。5)自動化運維,提升資產(chǎn)ROI,增強多云安全保護力。利用品高云提供的自動化編排部署,自定義運維方案,實現(xiàn)自動化運維功能。同時接入客戶原有的ITIL流程,將風(fēng)控、備份和安全等工具通過編排能力有效的集成融合起來,共同作用于不同的云平臺資源,帶來資源ROI的提升,減少運維壓力的同時,更重要的是提升了整體多云資源的安全保護能力。效果描述平臺于2016年正式上線,支持大規(guī)模的跨云資源管理。云平臺具有技術(shù)前瞻性和開放性,解決了客戶多年積累的多年、規(guī)模龐大、內(nèi)部異構(gòu)的基礎(chǔ)設(shè)施資源難以管理的問題,其中包括大量的X86服務(wù)器、VMware/KVM虛擬機、各類存儲設(shè)備(FC-SAN和分布式存儲)、網(wǎng)絡(luò)設(shè)備、三大公有云(AWS、Azure、阿里云)、信創(chuàng)云(華為云、深信服云)。在平臺的管理能力方面,支持多種主流CPU架構(gòu)和國產(chǎn)服務(wù)器硬件設(shè)備。具有完備的云服務(wù)目錄,具備windows、Linux等各種操作系統(tǒng)、多種常用的數(shù)據(jù)庫和中間件產(chǎn)品的標(biāo)準(zhǔn)化和自助化交付能力,包括:具備跨地域、跨平臺、跨云的管理能力,實現(xiàn)異構(gòu)IT資源的整合;節(jié)省成本經(jīng)濟效益明顯、節(jié)約資源、減少排放、更加充分利用資源,統(tǒng)一管理資源及全自動化交付節(jié)省運維成本,降低TCO(TotalCostofOwnership,總擁有成本);標(biāo)準(zhǔn)化、自動化運維能力,提升運維資產(chǎn)ROI(ReturnonInvestment,投資回報率),增強多云安全保護力;11項集群化(數(shù)據(jù)庫、中間件)服務(wù)和大數(shù)據(jù)服務(wù)自動化交付,優(yōu)化了周期性、突發(fā)性的業(yè)務(wù)使用成本,交付周期大大縮短,從原來的“2天”時間,到“15分鐘”完成基礎(chǔ)環(huán)境和集群服務(wù)交付,節(jié)約人力成本和減少交付周期;與VMware對接架構(gòu)升級后節(jié)省126臺集群控制服務(wù)器,416核CPU、1160G內(nèi)存、19T內(nèi)存。通信行業(yè):云優(yōu)化效益優(yōu)化實踐案例背景隨著云計算技術(shù)、大數(shù)據(jù)、容器等新技術(shù)的發(fā)展,業(yè)務(wù)云化部署已經(jīng)成為主流方向,業(yè)務(wù)上云數(shù)量持續(xù)增多,云資源規(guī)模迅速擴大,云資源運營管理壓力日趨凸顯,且各業(yè)務(wù)系統(tǒng)的資源配置方式復(fù)雜多樣,且資源利用率參差不齊,運營人員整體資源管控難度較大,現(xiàn)有的評估方法效率較低、手段單一、缺乏多維度指標(biāo)綜合分析機制,租戶無法實時了解業(yè)務(wù)系統(tǒng)所部屬資源的效能情況。因此急需構(gòu)建一套科學(xué)高效的資源使用效能評估方案,助力提升云資源運營管理能力,提云資源升資源使用效能。云資源效益優(yōu)化實施關(guān)鍵環(huán)節(jié)結(jié)合用戶和業(yè)務(wù)系統(tǒng)維度計算資源的CPU與內(nèi)存的均峰值和均值,利用AI技術(shù)對多維指標(biāo)集進行綜合分析和建模,并基于模型對各用戶和業(yè)務(wù)系統(tǒng)的資源使用情況進行效能評估,并定期面向用戶發(fā)布評估等級和成績,同時給出優(yōu)化建議。優(yōu)化流程分為數(shù)據(jù)獲取、AI智能評估、評估結(jié)果展示及優(yōu)化建議推送。1)數(shù)據(jù)獲?。簭馁Y源運營平臺獲用戶、業(yè)務(wù)系統(tǒng)每日CPU和內(nèi)存的性能相關(guān)數(shù)據(jù)。2)AI智能評估:將以獲取的數(shù)據(jù)輸入AI智能評估模型,輸出評估等級和評估分?jǐn)?shù),評估等級分為優(yōu)、良、中、差四個等級,評估成績?yōu)閷嶋H得分,評估的時間維度與數(shù)據(jù)源同步,目前是按月面向用戶發(fā)布。3)評估結(jié)果展示:與運營月報同步發(fā)布,用戶可從用戶和業(yè)務(wù)系統(tǒng)兩個維度對資源使用情況和資源使用效能評估結(jié)果進行全方位展示,有效增強運營可視化程度。4)優(yōu)化建議推送:結(jié)合一定周期內(nèi)用戶及業(yè)務(wù)系統(tǒng)的資源效能評估結(jié)果,利用AI預(yù)測模型對未來一個時間段用戶及業(yè)務(wù)系統(tǒng)資源效能情況進行預(yù)測,并給出關(guān)于資源擴縮的建議,通過頁面展示、短信、郵件等方式推送給用戶。效果描述云資源效能AI智能評估模型,為云資源管理的自動化工具,輔助云資源運營人員、用戶、業(yè)務(wù)系統(tǒng)管理管理人員等了解云資源使用情況以及如何進一下提升云資源效能。一方面可有效解決當(dāng)前云資源效能評估方法半手工化、分析方法單一、效率低、可視化程度差等實際問題,節(jié)省人工分析成本,助力提升IT云資源運營管理能力;另一方面,評估結(jié)果可為云資源配置優(yōu)化提供依據(jù),從根本上提升IT云資源使用效率,推動資源挖潛增效。同時評估結(jié)果也可以為業(yè)務(wù)系統(tǒng)擴容申請新資源提供評估依據(jù),避免申請資源過多,節(jié)約投資成本。物聯(lián)網(wǎng)行業(yè):云資源效益優(yōu)化實踐案例背景某全球化IoT整體方案服務(wù)商,其業(yè)務(wù)覆蓋全球數(shù)十個國家,為數(shù)千家品牌客戶提供技術(shù)服務(wù),為客戶解決成本高、效率低、運營弱等問題,深受客戶歡迎,業(yè)務(wù)也得到飛速發(fā)展。隨著業(yè)務(wù)快速發(fā)發(fā)展,其在AWS云上的各種資源使用量也大副增加,導(dǎo)致云資源效益下降,客戶降本增效的需求非常迫切??偨Y(jié)起來客戶的需求集中在降低云上資源成本和提升云資源利用率兩個方面。云資源效益優(yōu)化實施關(guān)鍵環(huán)節(jié)針對客戶痛點,我們?yōu)榭蛻糁贫ǖ某杀緝?yōu)化方案以FinOps思想做為指導(dǎo),從調(diào)整資源規(guī)格、清理閑置資源、優(yōu)化出向流量、優(yōu)化應(yīng)用架構(gòu)、提升資源運行效率等幾個維度進行優(yōu)化,大幅降低運營成本和提升資源利用率。分析賬單通過列出客戶所有公有云賬單,找出費用過高的云賬號。分析總體成本拿到客戶最近半年的詳細賬單后,分別按照月賬單趨勢、云服務(wù)費用排名、Region費用排名、購買方式的維度進行分析。提供成本優(yōu)化建議1.非服務(wù)器實例優(yōu)化經(jīng)對帳單費用分析,首先發(fā)現(xiàn)跨區(qū)域流量費用過高,將流量過高的實例進行業(yè)務(wù)分析,改成單AZ的訪問模式。其次發(fā)現(xiàn)磁盤費用過高,根據(jù)過高的的磁盤卷ID進行業(yè)務(wù)分析,建議客戶根據(jù)不同業(yè)務(wù)特點,對碰盤的訪問需求,更換磁盤類型或縮減磁盤容量。最后是對NAT網(wǎng)關(guān)費用過高進行優(yōu)化,經(jīng)分析NAT形成的原因,我們建議在不同可用區(qū)創(chuàng)建獨立的NAT,配置VPC終端節(jié)點等方式可以降低費用。2.存儲架構(gòu)優(yōu)化列出s3總費用、存儲、Requests、Retrieval的top費用清單,建議客戶根據(jù)業(yè)務(wù)特點,將歷史數(shù)據(jù)進行分類、分級,根據(jù)不同優(yōu)先級制定不同存儲策略,將低優(yōu)先級數(shù)據(jù)進行有效清理,從而大幅降存儲空間,降低存儲成本。3.實例架構(gòu)優(yōu)化因客戶部分服務(wù)器是按需實例,建議客戶優(yōu)化工作負載,減少按需的比例,同時建議根據(jù)業(yè)務(wù)峰值特點,將低峰資源加入資源池,抵消高峰業(yè)務(wù)壓力,從而有效降低實例成本。4.數(shù)據(jù)庫優(yōu)化部分?jǐn)?shù)據(jù)庫還是按需實例,建議客戶優(yōu)化工作負載,減少按需的比例。找出非數(shù)據(jù)庫實例費用TOP20的資源ID,包括數(shù)據(jù)庫存儲費、備份費、存儲IO費,供客戶評估數(shù)據(jù)庫使用情況。5.負載均衡優(yōu)化列出負載均衡費用類型和地區(qū)分布,找出近期低流量負載均衡的實例ID,供客戶評估是否可將負載均衡復(fù)用或回收。6.Redis優(yōu)化Redis按需費用較高,RI覆蓋率低,建議購買一定比例的RI。根據(jù)業(yè)務(wù)模型評估是否可以用數(shù)據(jù)分層的r6gd系列。7、費用周期優(yōu)化列出lambda中Savingplan覆蓋率,供客戶評估是否可以購買部分Savingplan,合理安排資源周期,降低成本。8、出向流量優(yōu)化出向流量優(yōu)化,從CDN入手,列出TOP20費用資源ID,建議客戶提高CDN緩存命中率,同時開啟壓縮功能,從而有效降低CDN節(jié)點回源帶寬成本。9.大數(shù)據(jù)資源優(yōu)化根據(jù)客戶不同需求,配置不同實例。核心工作負載選擇按需實例,任務(wù)節(jié)點或成本敏感類工作負載選擇一定比例的spot實例,從而節(jié)省了大數(shù)據(jù)平臺的實例成本。10.監(jiān)控成本優(yōu)化降低第三方監(jiān)控工具頻繁調(diào)用云監(jiān)控服務(wù),通過控制臺執(zhí)行ListMetrics調(diào)用,而不要使用AWSCLI。將多個請求批量轉(zhuǎn)換為一個API調(diào)用。使用這些最佳實踐可以減少API調(diào)用量,并減少相應(yīng)的費用。另外,還對監(jiān)控日志進行優(yōu)化,為了降低提取成本,建議客戶可以重新評估日志記錄級別并消除不必要的日志提取,并按需重新評估日志保留時長效果描述經(jīng)過以上成本優(yōu)化操作,不僅清理了部分閑置資源、降低了部分資源規(guī)格和配置,還把出向流量做了優(yōu)化,加之?dāng)?shù)據(jù)庫和大數(shù)據(jù)等高消費資源的優(yōu)化,客戶在AWS云上資源成本至少降低15%,每年節(jié)省數(shù)百萬成本支出,客戶的收益如下:云資源使用成本降低15%,每年節(jié)省數(shù)百萬因為有架構(gòu)的優(yōu)化,技術(shù)團隊的效率得到提升零售行業(yè):云優(yōu)化效益優(yōu)化實踐案例背景XX生鮮連鎖有限公司是一個農(nóng)副產(chǎn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年企業(yè)不動產(chǎn)自查自糾報告及整改措施
- 五星級酒店智能化系統(tǒng)升級方案
- 酒店行業(yè)客戶滿意度提升實施方案
- 施工方案報審范文(3篇)
- 軍校暑假活動策劃方案(3篇)
- 教師補充應(yīng)急預(yù)案(3篇)
- 樣板工地施工方案(3篇)
- 機電人防施工方案(3篇)
- 患者休克應(yīng)急預(yù)案(3篇)
- 應(yīng)急預(yù)案方案審核(3篇)
- 2026廣西出版?zhèn)髅郊瘓F有限公司招聘98人備考題庫新版
- 2025年廈門大學(xué)生命科學(xué)學(xué)院工程系列專業(yè)技術(shù)中初級職務(wù)人員公開招聘3人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 2026屆廣東省廣州市高三上學(xué)期12月零模英語試題含答案
- EBER原位雜交檢測技術(shù)專家共識解讀(2025)課件
- 健身房塑膠地面施工方案
- NCCN臨床實踐指南:肝細胞癌(2025.v1)
- 2025年12月個人財務(wù)工作總結(jié)與年度財務(wù)報告
- 心肺復(fù)蘇(CPR)與AED使用實戰(zhàn)教程
- 當(dāng)兵智力考試題目及答案
- 國家管網(wǎng)集團安全生產(chǎn)管理暫行辦法
- 三位數(shù)加減兩位數(shù)口算計算題大全2000道(帶答案)下載A4打印
評論
0/150
提交評論