阿里異地多活與同城雙活的架構(gòu)演進(jìn)_第1頁
阿里異地多活與同城雙活的架構(gòu)演進(jìn)_第2頁
阿里異地多活與同城雙活的架構(gòu)演進(jìn)_第3頁
阿里異地多活與同城雙活的架構(gòu)演進(jìn)_第4頁
阿里異地多活與同城雙活的架構(gòu)演進(jìn)_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 阿里異地多活與同城雙活的架構(gòu)演進(jìn)CIO之家 微信號 imciow功能介紹 CIO(首席信息官)必備的公眾號 CIO知識平臺 CIO交流平臺 企業(yè)IT人員知識平臺(信息化資訊 活動(dòng) 招聘信息 文檔分享 IT應(yīng)用實(shí)踐 IT選型 IT實(shí)施 分享) CIO之家 踐行,見未來.對于阿里的交易以及支付來講,我們做異地多活最重要的目的除了災(zāi)備之外,更重要的點(diǎn)是追求持續(xù)可用,整個(gè)支付交易的體量對于用戶來講是持續(xù)可用。我們可以看一下業(yè)界比較主流的災(zāi)備是怎么做的,以及阿里在這方面整個(gè)的演進(jìn)。業(yè)界最重要的很多人都知道,最主流的災(zāi)備技術(shù)是兩地三中心,數(shù)據(jù)中心A和數(shù)據(jù)中心B在同城作為生產(chǎn)級的機(jī)房,當(dāng)用戶訪問的時(shí)候隨機(jī)

2、訪問到數(shù)據(jù)中心A或B。之所以隨便訪問,因?yàn)锳和B會同步做數(shù)據(jù)復(fù)制,所以兩邊的數(shù)據(jù)是完全一樣的。但是因?yàn)槭峭綇?fù)制的,所以只能在同城去做兩個(gè)數(shù)據(jù)中心,否則太遠(yuǎn)的話同步復(fù)制的延時(shí)會太長。在兩地三中心的概念里,一定會要求這兩個(gè)生產(chǎn)級的數(shù)據(jù)中心是必須在同一個(gè)城市,或者在距離很近的另外一個(gè)城市也可以,但是距離是有要求的。異地備份數(shù)據(jù)中心通過異步復(fù)制去走,但是兩地三中心很明顯的是異地備份的數(shù)據(jù)中心是不起用的,正常情況下不對外服務(wù),所以用戶不會訪問到異地的點(diǎn)。原因是因?yàn)閿?shù)據(jù)從生產(chǎn)級數(shù)據(jù)中心到異地的節(jié)點(diǎn)是異步去復(fù)制,所以整個(gè)有延時(shí)。這是整個(gè)業(yè)界目前用的比較多的業(yè)界。兩地三中心對于阿里來講看到的問題,最重要的問

3、題:1、這個(gè)模式不一定Work。大家可能都看到某些新聞里講過,比如說某些地方用了兩地三中心之后,當(dāng)一地的數(shù)據(jù)中心出問題的時(shí)候,是不敢流量切往異地的備份數(shù)據(jù)中心,原因是異地的備份數(shù)據(jù)中心是冷的,平時(shí)是沒有用戶流量進(jìn)去的。如果要把流量切到那邊起來之后,其實(shí)沒有人有多強(qiáng)的信心能夠保障起用以后是可以正常服務(wù)的,畢竟平時(shí)都是冷的。因?yàn)槭抢涞?,就意味著整個(gè)起用的過程需要時(shí)間,不可能說起用就起用,一定會有時(shí)間周期。這是兩地三中心的最大問題,看起來模式是很安全的,也是可用的,但是事實(shí)上不一定是這樣。2、異地備份中心因?yàn)椴粚ν馓峁┓?wù),所以整個(gè)資源會處于浪費(fèi)狀態(tài),成本比較高及3、對于阿里的規(guī)模來講有一個(gè)很大的問

4、題,在兩地三中心中,數(shù)據(jù)一定是單點(diǎn)去寫。其實(shí)數(shù)據(jù)只在一個(gè)地方去寫,這個(gè)時(shí)候如果整個(gè)壓力比較高,比如像“雙十一”的場景中壓力非常高的情況下,就意味著在兩地三中心的情況下所有的數(shù)據(jù)還是寫上的單個(gè)點(diǎn),對于存儲成本壓力會不斷增加。比如去年8萬、今年14萬意味著每年壓力都在增加,這時(shí)候數(shù)據(jù)庫整個(gè)伸縮和外層業(yè)務(wù)的伸縮都面臨著更大挑戰(zhàn)。對于我們來講這三個(gè)問題是比較明顯的。阿里在整個(gè)高可用上也經(jīng)歷過了一段時(shí)間,主要是做了三個(gè)步驟。第一個(gè)是做了同城的雙活,第二個(gè)做了異地只讀及冷備,第三個(gè)是做了異地多活,經(jīng)歷了三代體系的演進(jìn)才走到了今天。異地多活對于我們來講,其實(shí)很多人都可以看到異地多活最大的挑戰(zhàn)是什么?1、距離

5、。看起來距離沒有什么,比如說1000公里以上也就是30毫秒的網(wǎng)絡(luò)延遲,來回一次是30毫秒左右。30毫秒對于用戶來講,如果只是給你增加30毫秒,用戶其實(shí)沒有感受。但是當(dāng)你打開一個(gè)淘寶頁面的時(shí)候,事實(shí)上當(dāng)你在商品頁面看到一個(gè)商品點(diǎn)立刻購買的時(shí)候,頁面的背后大概有100多次以上的后端交互,如果100多次全部跨地域完成的話,就意味著頁面的響應(yīng)時(shí)間將增加3秒。如果增加3秒,用戶絕對會有明顯感受。因?yàn)閷τ诎⒗飦碇v,很多頁面就出不來了,3秒已經(jīng)超時(shí)了。對于我們來講,這第一點(diǎn)是直接帶來用戶體驗(yàn)的不可用。成本,當(dāng)系統(tǒng)響應(yīng)時(shí)間增高的時(shí)候,意味著每年“雙十一”增加的QPS將付出更大的成本,因?yàn)橥掏铝吭谙陆?,這個(gè)時(shí)候

6、的成本也是很難接受的。距離帶來的延時(shí)問題是最大的問題。2、既然要解決掉距離的問題,多點(diǎn)寫是解決距離的問題,如果沒有延時(shí)問題可以不多點(diǎn)寫。只要開始多點(diǎn)寫了就會帶來第二個(gè)最復(fù)雜的問題,其實(shí)我們認(rèn)為第一點(diǎn)延時(shí)問題一定程度也許可以強(qiáng)制接受,也就是能夠打開,打不開就有問題了。如果一旦出現(xiàn)多點(diǎn)寫帶來的數(shù)據(jù)正確性問題,這對我們來講是最致命的。多點(diǎn)寫,比如說出現(xiàn)這一次訪問在A數(shù)據(jù)中心寫的數(shù)據(jù),然后再訪問的時(shí)候到B數(shù)據(jù)中心又寫了一條數(shù)據(jù),兩條數(shù)據(jù)如果合不到一起的話。對于大家最直觀的感受是有可能買了一個(gè)東西付了錢,然后看到可能是沒付錢?;蛘吒纱噘I了一個(gè)東西,壓根就沒有看到購買。對于阿里來講,這是最大的一個(gè)問題。對

7、于我們來講,當(dāng)阿里整個(gè)架構(gòu)能力進(jìn)一步提升到了異地多活時(shí)代以后,對于我們來講帶來了兩個(gè)好處:第一、有極強(qiáng)的水平伸縮能力。以前做“雙十一”的時(shí)候,都必須去算,比如去年8萬筆,今年14萬筆的時(shí)候,必須要算增加的6萬。還有因?yàn)槊磕陿I(yè)務(wù)模式的變化需要算每個(gè)應(yīng)用加多少機(jī)器。但是在單元的情況下,一組單元就是多大的能力,然后只要按照單元擴(kuò)充就結(jié)束了。假設(shè)一個(gè)單元可以做到2萬筆,其實(shí)14萬筆對于我們來講是建設(shè)7個(gè)單元就結(jié)束了,整個(gè)伸縮能力會比以前強(qiáng)大非常多。而且每個(gè)單元都是寫自己的數(shù)據(jù)庫和存儲層,包括cache全部寫自己的,這個(gè)時(shí)候伸縮規(guī)模是可控的,不像以前不斷加,數(shù)據(jù)庫有可能抗不住。在抗不住的時(shí)候可能會做分布等等,但其實(shí)也是比較復(fù)雜的,現(xiàn)在我們改變了伸縮力度的模式。第二、異地多活怎么去應(yīng)對故障。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論