《公有云技術(shù)與應(yīng)用》課件-38.實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS_第1頁(yè)
《公有云技術(shù)與應(yīng)用》課件-38.實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS_第2頁(yè)
《公有云技術(shù)與應(yīng)用》課件-38.實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS_第3頁(yè)
《公有云技術(shù)與應(yīng)用》課件-38.實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS_第4頁(yè)
《公有云技術(shù)與應(yīng)用》課件-38.實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

公有云技術(shù)與應(yīng)用實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS目錄CATALOG定義核心技術(shù)組成核心優(yōu)勢(shì)應(yīng)用場(chǎng)景實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS的定義01

實(shí)時(shí)數(shù)據(jù)接入服務(wù)(DIS)DIS通過(guò)輕量化接入、高吞吐傳輸和靈活轉(zhuǎn)發(fā)能力,成為實(shí)時(shí)數(shù)據(jù)從產(chǎn)生到分析的“第一站”,為后續(xù)實(shí)時(shí)計(jì)算、監(jiān)控預(yù)警提供穩(wěn)定的數(shù)據(jù)通道。01實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS的定義

定義實(shí)時(shí)數(shù)據(jù)接入服務(wù)是云廠商提供的托管式實(shí)時(shí)數(shù)據(jù)采集與傳輸服務(wù),支持從各類數(shù)據(jù)源實(shí)時(shí)采集數(shù)據(jù),通過(guò)高可用的分布式架構(gòu)實(shí)現(xiàn)TB級(jí)/天的數(shù)據(jù)吞吐,再按需轉(zhuǎn)發(fā)至數(shù)據(jù)倉(cāng)庫(kù)、流處理引擎、消息隊(duì)列等目標(biāo)系統(tǒng),全程確保數(shù)據(jù)不丟失、低延遲。

01實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS的定義

核心價(jià)值“實(shí)時(shí)性與可靠性”:例如,某智能工廠的10萬(wàn)臺(tái)設(shè)備每秒鐘產(chǎn)生50萬(wàn)條運(yùn)行數(shù)據(jù),DIS可將這些數(shù)據(jù)實(shí)時(shí)接入并轉(zhuǎn)發(fā)至流處理平臺(tái),確保異常數(shù)據(jù)在1秒內(nèi)被檢測(cè)并觸發(fā)停機(jī)預(yù)警,避免設(shè)備故障擴(kuò)大,就像為實(shí)時(shí)數(shù)據(jù)打造了一條“高速專用通道”,既保證傳輸速度,又確保數(shù)據(jù)完整。01實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS的定義

核心解決“數(shù)據(jù)洪流”場(chǎng)景下的三大挑戰(zhàn):?

高吞吐:?jiǎn)瓮ǖ乐С?0GB/s數(shù)據(jù)吞吐?

低延遲:端到端延遲<1秒?

多源適配:支持設(shè)備/IoT/日志/數(shù)據(jù)庫(kù)等多源數(shù)據(jù)統(tǒng)一接入

01實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS的定義

與傳統(tǒng)方案對(duì)比01實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS的定義

Kafka自建方案DIS服務(wù)需部署Zookeeper集群開箱即用,零運(yùn)維成本分區(qū)擴(kuò)展需手動(dòng)干預(yù)自動(dòng)彈性伸縮,秒級(jí)響應(yīng)流量波動(dòng)數(shù)據(jù)安全需自實(shí)現(xiàn)金融級(jí)加密

+跨AZ容災(zāi)核心優(yōu)勢(shì)02單分區(qū)支持每秒萬(wàn)級(jí)數(shù)據(jù)寫入,集群可擴(kuò)展至每秒百萬(wàn)級(jí)并發(fā),滿足高流量場(chǎng)景;數(shù)據(jù)從采集到轉(zhuǎn)發(fā)的端到端延遲<1秒,比傳統(tǒng)批量同步(如每小時(shí)一次)快3600倍。

1.高吞吐與低延遲

02核心優(yōu)勢(shì)支持設(shè)備側(cè)(MQTT協(xié)議)、應(yīng)用側(cè)(HTTP/HTTPS、SDK)、日志側(cè)(Filebeat、Logstash)等多類型接入,兼容結(jié)構(gòu)化(JSON)、非結(jié)構(gòu)化(二進(jìn)制流)數(shù)據(jù),無(wú)需改造數(shù)據(jù)源即可接入,適配效率提升80%。

2.全類型數(shù)據(jù)源適配02核心優(yōu)勢(shì)數(shù)據(jù)寫入時(shí)自動(dòng)多副本存儲(chǔ)(3副本跨可用區(qū)),單節(jié)點(diǎn)故障不影響數(shù)據(jù)完整性;支持?jǐn)?shù)據(jù)重放(重新消費(fèi)歷史數(shù)據(jù)),當(dāng)目標(biāo)系統(tǒng)故障恢復(fù)后,可從斷點(diǎn)處繼續(xù)接收數(shù)據(jù),確保零丟失。

3.數(shù)據(jù)可靠與容錯(cuò)02核心優(yōu)勢(shì)支持分區(qū)動(dòng)態(tài)擴(kuò)容(如從5個(gè)分區(qū)擴(kuò)至20個(gè)),吞吐能力隨業(yè)務(wù)增長(zhǎng)線性提升;按實(shí)際數(shù)據(jù)量和存儲(chǔ)時(shí)長(zhǎng)計(jì)費(fèi),避免資源閑置,成本比自建接入系統(tǒng)降低60%。

4.彈性擴(kuò)展與按需付費(fèi)

02核心優(yōu)勢(shì)核心技術(shù)組成031.分布式接入架構(gòu)

基于分區(qū)(Partition)實(shí)現(xiàn)數(shù)據(jù)分片存儲(chǔ)與并行處理,每個(gè)分區(qū)對(duì)應(yīng)獨(dú)立的讀寫隊(duì)列;通過(guò)負(fù)載均衡將數(shù)據(jù)源請(qǐng)求分發(fā)至不同分區(qū),避免單點(diǎn)瓶頸。

03核心技術(shù)組成2.數(shù)據(jù)傳輸協(xié)議

設(shè)備端:支持MQTT協(xié)議(輕量級(jí)IoT協(xié)議),適配低帶寬、高延遲的設(shè)備網(wǎng)絡(luò);

應(yīng)用端:提供RESTfulAPI和多語(yǔ)言SDK(Java、Python),方便業(yè)務(wù)系統(tǒng)集成;

日志端:兼容開源采集工具(如Fluentd),支持日志文件實(shí)時(shí)監(jiān)聽與上傳。

03核心技術(shù)組成3.數(shù)據(jù)轉(zhuǎn)發(fā)與處理

支持實(shí)時(shí)轉(zhuǎn)發(fā)至多種目標(biāo)系統(tǒng):流處理引擎(Flink、SparkStreaming)、消息隊(duì)列(Kafka)、數(shù)據(jù)倉(cāng)庫(kù)(DWS)、對(duì)象存儲(chǔ)(OSS);

內(nèi)置簡(jiǎn)單數(shù)據(jù)轉(zhuǎn)換功能(如JSON格式校驗(yàn)、字段過(guò)濾),復(fù)雜處理可聯(lián)動(dòng)流計(jì)算服務(wù)。

03核心技術(shù)組成4.監(jiān)控與運(yùn)維

實(shí)時(shí)監(jiān)控接入量、轉(zhuǎn)發(fā)成功率、延遲等指標(biāo),支持閾值告警(如寫入失敗率>1%時(shí)觸發(fā)通知);提供數(shù)據(jù)接入軌跡查詢,可追溯每條數(shù)據(jù)的來(lái)源、轉(zhuǎn)發(fā)狀態(tài)與處理結(jié)果。03核心技術(shù)組成應(yīng)用場(chǎng)景04

(一)物聯(lián)網(wǎng)實(shí)時(shí)監(jiān)控需求:智慧園區(qū)需接入5萬(wàn)臺(tái)智能設(shè)備的實(shí)時(shí)數(shù)據(jù),實(shí)現(xiàn)異常行為(的秒級(jí)預(yù)警。

方案:

設(shè)備通過(guò)MQTT協(xié)議接入DIS,攝像頭視頻流與傳感器數(shù)據(jù)分別寫入不同分區(qū);

DIS實(shí)時(shí)將數(shù)據(jù)轉(zhuǎn)發(fā)至Flink流處理引擎,溫濕度數(shù)據(jù)超過(guò)閾值或攝像頭識(shí)別到異常時(shí),立即觸發(fā)聲光告警;

歷史數(shù)據(jù)同步至對(duì)象存儲(chǔ)歸檔,用于事后追溯與優(yōu)化預(yù)警模型,預(yù)警響應(yīng)時(shí)間從分鐘級(jí)縮短至秒級(jí)。

04典型應(yīng)用場(chǎng)景

(二)電商實(shí)時(shí)交易分析需求:電商平臺(tái)需實(shí)時(shí)接入每秒10萬(wàn)筆訂單數(shù)據(jù),計(jì)算實(shí)時(shí)銷售額、熱門商品排行,支撐運(yùn)營(yíng)決策。

方案:

訂單系統(tǒng)通過(guò)SDK將交易數(shù)據(jù)寫入DIS,按地區(qū)分區(qū)確保數(shù)據(jù)均衡分布;

DIS將數(shù)據(jù)轉(zhuǎn)發(fā)至Kafka和Flink;

計(jì)算結(jié)果實(shí)時(shí)推送至運(yùn)營(yíng)大屏,大促期間可動(dòng)態(tài)調(diào)整庫(kù)存和營(yíng)銷策略,熱門商品補(bǔ)貨響應(yīng)速度提升50%。

04典型應(yīng)用場(chǎng)景

(三)日志實(shí)時(shí)分析與故障定位

需求:云服務(wù)商需實(shí)時(shí)采集thousands臺(tái)服務(wù)器的系統(tǒng)日志,檢測(cè)異常登錄、磁盤滿等故障,縮短故障排查時(shí)間。

方案:

服務(wù)器通過(guò)Filebeat采集日志并發(fā)送至DIS,日志數(shù)據(jù)按服務(wù)器集群分區(qū);

DIS轉(zhuǎn)發(fā)日志至Elasticsearch和流處理引擎,關(guān)鍵詞匹配觸發(fā)告警;

運(yùn)維人員通過(guò)日志檢索快速定位故障服務(wù)器,平均排查時(shí)間從2小時(shí)縮短至10分鐘。

04典型應(yīng)用場(chǎng)景總結(jié)與實(shí)踐任務(wù)05

實(shí)時(shí)數(shù)據(jù)接入服務(wù)DIS是實(shí)時(shí)數(shù)據(jù)處理鏈路的“第一道關(guān)口”,通過(guò)高吞吐、低延遲、高可靠的傳輸能力,為實(shí)時(shí)監(jiān)控、實(shí)時(shí)分析等場(chǎng)景提供堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。

其核心價(jià)值在于讓企業(yè)聚焦數(shù)據(jù)應(yīng)用,而非復(fù)雜的接入與傳輸細(xì)節(jié)。

05總結(jié)與實(shí)踐任務(wù)

1.設(shè)計(jì)一個(gè)基于DIS的環(huán)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論