版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、基于MongoDB的數(shù)據(jù)中臺(tái)技術(shù)實(shí)現(xiàn)AGENDA內(nèi)容大綱1. 現(xiàn)代企業(yè)數(shù)據(jù)架構(gòu)及痛點(diǎn)5問題1:客戶最常用什么方式和航空公司交互?回答時(shí)間: 數(shù)天?數(shù)周?PSDP行程訂單主動(dòng)營銷 行為訂單觸點(diǎn)系統(tǒng) 事件數(shù)據(jù)FFP旅客信息投訴、行李、 不正常航班大數(shù)據(jù) 旅客標(biāo)簽手機(jī)APP6問題2:某險(xiǎn)企新開發(fā)保單貸小程序,對(duì)接數(shù)據(jù)需要多少時(shí)間?所需時(shí)間: 數(shù)周?數(shù)月?生命 人壽重疾 保險(xiǎn)財(cái)產(chǎn) 保險(xiǎn)推薦 系統(tǒng)客戶 標(biāo)簽微信小程序 后臺(tái)數(shù)據(jù)庫一次性導(dǎo)入+腳本定期增量一次性導(dǎo)入+腳本定期增量一次性導(dǎo)入+腳本定期增量7數(shù)據(jù)孤島:低效率和利用困難的根源形成原因事業(yè)部門各自建設(shè) 數(shù)據(jù)庫性能無法支撐 分庫分表數(shù)據(jù)孤島的影響數(shù)據(jù)
2、開發(fā)低效:需要大量對(duì)接及同步 用戶體驗(yàn)下降:數(shù)據(jù)不完整,不實(shí)時(shí) 成本增加:重復(fù)建設(shè),復(fù)用率低8目前解決方案: 數(shù)據(jù)倉庫/大數(shù)據(jù)平臺(tái)生命 人壽汽車 保險(xiǎn)運(yùn)動(dòng) 保險(xiǎn)旅游 保險(xiǎn)重疾 保險(xiǎn)T+ 1數(shù)據(jù)倉庫數(shù)據(jù)湖9數(shù)據(jù)倉庫和大數(shù)據(jù)平臺(tái)的不足生命 人壽汽車 保險(xiǎn)運(yùn)動(dòng) 保險(xiǎn)旅游 保險(xiǎn)重疾 保險(xiǎn)數(shù)據(jù)湖T+ 1數(shù)據(jù)倉庫數(shù)據(jù)抽取不及時(shí)!交付方式太粗放面向場(chǎng)景偏分析2. 理解數(shù)據(jù)中臺(tái)11什么是數(shù)據(jù)中臺(tái)生命 人壽汽車 保險(xiǎn)運(yùn)動(dòng) 保險(xiǎn)旅游 保險(xiǎn)重疾 保險(xiǎn)T+ 012數(shù)據(jù)中臺(tái)定義以打通部門或數(shù)據(jù)孤島的統(tǒng)一數(shù)據(jù)平臺(tái)為基礎(chǔ),構(gòu)建統(tǒng)一 數(shù)據(jù)資產(chǎn)體系,并以API服務(wù)方式為全渠道業(yè)務(wù)(分析+應(yīng)用) 提供即時(shí)交付能力的企業(yè)級(jí)數(shù)據(jù)架構(gòu)
3、13金融數(shù)據(jù)中臺(tái)參考架構(gòu)PC 網(wǎng)銀資料治理 資料質(zhì)量 資料目錄資料同步 資料開發(fā) 資料建模資料去重行動(dòng)APP金融商城社交化系統(tǒng)第三方支付數(shù) 據(jù) 平 臺(tái)服 務(wù)開放API應(yīng) 用貼源層業(yè)務(wù) 模型 庫客 戶標(biāo)籤庫推薦模型資料運(yùn)算 建模資 料 採 集批量導(dǎo)入基於日誌的CDCDB2TXT/CSVSQLServerOracleLegacyIoTAPI 集成分析 模型 庫賬 戶交 易產(chǎn) 品EDWHadoop風(fēng) 控資 產(chǎn)RESTful APISTREAMING APISQL API客戶中心產(chǎn)品中心營銷中心賬戶中心營銷中心清算中心支付中心精準(zhǔn)營銷內(nèi)部分析數(shù)據(jù)大屏監(jiān)管報(bào)表數(shù)據(jù)發(fā)現(xiàn)14數(shù)據(jù)中臺(tái)的主要價(jià)值數(shù)據(jù)協(xié)同 效率
4、數(shù)據(jù)復(fù)用 效率數(shù)據(jù)交付 速度3. 數(shù)據(jù)中臺(tái)的技術(shù)模塊16數(shù)據(jù)中臺(tái)的模塊數(shù)據(jù)即服務(wù) | Data as a Service數(shù)據(jù)資產(chǎn)體系 數(shù)據(jù)統(tǒng)一平臺(tái)T+ 0ETLT+ 1數(shù)據(jù)同步與匯聚17數(shù)據(jù)中臺(tái)技術(shù)產(chǎn)品數(shù)據(jù)平臺(tái)數(shù)據(jù)同步數(shù)據(jù)治理數(shù)據(jù)服務(wù)Hadoop / HDFS / HiveKafkaApache AtlasSpringTeradataKettleInformaticaKongMongoDBFlinkErwinKafkaGreenplumSpark ETLOracleLoopbackMySQL ClusterTalendWhereHowMulesoftOracleInformaticaTapda
5、taCATranswarpGolden GateAPIGeeElastic SearchFlinkTapdataTapdata18數(shù)據(jù)平臺(tái)產(chǎn)品分類90s00s10s20s關(guān)系型數(shù)據(jù)庫 RDBMS大數(shù)據(jù)數(shù)據(jù)倉庫 MPPNoSQL/NewSQL19關(guān)系數(shù)據(jù)庫/RDBMS 數(shù)據(jù)庫之鼻祖主要特點(diǎn)1980s 1990s取代文件方式數(shù)據(jù)存 儲(chǔ)基于關(guān)系模型與 SQL最主流的數(shù)據(jù)庫主要場(chǎng)景交互式業(yè)務(wù) 資源計(jì)劃 ERP 客戶關(guān)系 CRM 業(yè)務(wù)流程 BPM主要局限嚴(yán)格模式不夠靈活 難以橫向擴(kuò)展 難以支持非結(jié)構(gòu)化 40歲了!20數(shù)據(jù)倉庫/MPP 解決關(guān)系型數(shù)據(jù)庫的擴(kuò)展能力問題主要特點(diǎn)2000s突破關(guān)系型數(shù)據(jù)庫的 性
6、能及容量瓶頸主要場(chǎng)景批量分析歷史數(shù)據(jù) Archive 商業(yè)智能 BI數(shù)據(jù)分析 Analytics主要局限解決了90年代的大 數(shù)據(jù),但是解決不了 手機(jī)時(shí)代的大數(shù)據(jù) 結(jié)構(gòu)嚴(yán)格,不支持非 結(jié)構(gòu)化數(shù)據(jù)21大數(shù)據(jù)/Big Data 處理移動(dòng)時(shí)代的海量數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)主要特點(diǎn)2010s突破數(shù)據(jù)倉庫容量瓶頸 有效管理非結(jié)構(gòu)化數(shù)據(jù)主要場(chǎng)景批量處理歷史數(shù)據(jù) Archive標(biāo)簽系統(tǒng) Personalize 推薦系統(tǒng) Recommend主要局限架構(gòu)復(fù)雜難懂基于HDFS文件系統(tǒng) 批處理為主要目標(biāo) 性能無法滿足交互式22NoSQL 海量,非結(jié)構(gòu)化數(shù)據(jù)及交互式性能)主要特點(diǎn)2010s分布式架構(gòu)靈活模型(JSON主要場(chǎng)景
7、實(shí)時(shí)交互全文搜索 Elastic 高速緩存 Redis 高并發(fā)讀寫 MongoDB日志處理 Cassandra主要局限大部分缺乏事務(wù) 性功能不夠全面23數(shù)據(jù)統(tǒng)一平臺(tái)選型參考海量數(shù)據(jù) VOLUME響應(yīng)時(shí)間與并發(fā) VELOCITY多結(jié)構(gòu)數(shù)據(jù) VARIETY選型參考RDBMS長板: 短板性能快,人力現(xiàn)成 橫向擴(kuò)展能力MPP長板:短板:基于SQL,分析成本高,開發(fā)周期長Hadoop長板:短板:海量能力,大量生態(tài) 人力成本,性能低MongoDB長板: 型短板:分布式高性能靈活模多表關(guān)聯(lián)能力NewSQL長板:短板:分布式SQL,低學(xué)習(xí) 只支持結(jié)構(gòu)化數(shù)據(jù)4. 基于MongoDB + Tapdata 數(shù)據(jù)中臺(tái)
8、落地方案25MongoDB作為中臺(tái)架構(gòu)的數(shù)據(jù)平臺(tái)優(yōu)勢(shì):多模數(shù)據(jù)庫PrimarySecondarySecondaryPrimarySecondarySecondaryPrimarySecondarySecondaryShard 1Shard 2Shard N路由節(jié)點(diǎn)路由節(jié)點(diǎn)多工況支持多模多態(tài)自動(dòng)擴(kuò)展TB PB 海量數(shù)據(jù)支持無縫擴(kuò)容應(yīng)用全透明毫秒級(jí)響應(yīng)時(shí)間API 友好目錄節(jié)點(diǎn)目錄節(jié)點(diǎn)目錄節(jié)點(diǎn)26MongoDB對(duì)象模型的優(yōu)勢(shì)數(shù)據(jù)采集數(shù)據(jù)治理ODS貼源傳統(tǒng)模式:專業(yè)數(shù)據(jù)工程師數(shù)周概念建模邏輯建模物理建模CDMDWSDWD業(yè)務(wù)數(shù)據(jù)模型(關(guān)系模型)REST APIMongoDB方案: 普通開發(fā)工程師 數(shù)天
9、基于類似邏輯模型存儲(chǔ)業(yè)務(wù)數(shù)據(jù)模型(對(duì)象模型)REST API27MongoDB: HTAP 全渠道業(yè)務(wù)支持(交易 + 分析)分析型PrimarySecondarySecondarySecondaryuse = analytics交易型Predictive Analytics & Data ScienceAggregatio nsSecondaryuse = analyticsBI & ReportingCompassBIConnector28MongoDB 觸發(fā)器APIChange Streams APIBusiness AppsUser DataSensorsClickstreamReal-
10、Time Event NotificationsMessage Queue29Tapdata: 為MongoDB量身定做的中臺(tái)構(gòu)建工具集數(shù)據(jù)建模 數(shù)據(jù)治理同步機(jī)器人 實(shí)時(shí)采集業(yè)務(wù)應(yīng)用移動(dòng)端/網(wǎng)頁端開放數(shù)據(jù) 數(shù)據(jù)共享AI 數(shù)據(jù)底座MongoDB實(shí)時(shí)分析 自助BI智能API服務(wù)數(shù)據(jù)庫權(quán)限認(rèn)證教 師學(xué) 生用戶班級(jí)業(yè)務(wù)邏輯作業(yè)系統(tǒng)前端數(shù)據(jù)庫網(wǎng)上課堂前端數(shù)據(jù)庫教師發(fā)展前端權(quán)限認(rèn)證教 師學(xué) 生用戶班級(jí)業(yè)務(wù)邏輯權(quán)限認(rèn)證教 師學(xué) 生用戶班級(jí)業(yè)務(wù)邏輯聯(lián)通數(shù)據(jù)孤島 統(tǒng)一認(rèn)證 統(tǒng)一用戶 統(tǒng)一權(quán)限教師學(xué)生班級(jí)權(quán)限認(rèn)證用戶數(shù) 據(jù) 中 臺(tái)Excel/CSV/XML/Json音頻/視頻PDF/Word/PPT等等圖片教育新
11、聞班級(jí)通訊 錄從傳統(tǒng)的孤島模式開發(fā)數(shù)據(jù)庫作業(yè)系統(tǒng)前端數(shù)據(jù)庫網(wǎng)上課堂前端已有系統(tǒng)單向日志同步到顛覆式的中臺(tái)模式開發(fā)主數(shù)據(jù)管理前端業(yè)務(wù)邏輯雙向讀寫API教室發(fā)展 2.0前端業(yè)務(wù)邏輯雙向讀寫API31數(shù)據(jù)同步及處理能力實(shí)時(shí)異構(gòu)數(shù)據(jù)庫同步支持?jǐn)?shù)據(jù)源 OracleSQL Server Sybase MySQLMongoDB DB2Excel CSV32數(shù)據(jù)建模能力可視化建模關(guān)系型到文檔模型 自動(dòng)轉(zhuǎn)型平臺(tái)內(nèi)數(shù)據(jù)模型 實(shí)時(shí)聯(lián)動(dòng)33數(shù)據(jù)治理能力元數(shù)據(jù)管理數(shù)據(jù)目錄 數(shù)據(jù)溯源 數(shù)據(jù)質(zhì)量34數(shù)據(jù)API發(fā)布能力無代碼直接發(fā)布APIOpenAPI 兼容 行級(jí)及列級(jí)過濾 自動(dòng)文檔及測(cè)試 詳盡的權(quán)限管控前端數(shù)據(jù)庫權(quán)限認(rèn)證教
12、 師學(xué) 生用戶班級(jí)業(yè)務(wù)邏輯辦公 OA數(shù)據(jù)庫圖書管理前端數(shù)據(jù)庫教師發(fā)展前端學(xué)生班級(jí)權(quán)限認(rèn)證用戶 教師權(quán)限認(rèn)證教 師學(xué) 生用戶班級(jí)業(yè)務(wù)邏輯權(quán)限認(rèn)證教 師學(xué) 生用戶班級(jí)業(yè)務(wù)邏輯打破數(shù)據(jù)孤島 統(tǒng)一認(rèn)證 統(tǒng)一用戶 統(tǒng)一權(quán)限數(shù) 據(jù) 中 臺(tái)前端數(shù)據(jù)庫辦公 OA業(yè)務(wù)邏輯。數(shù)據(jù)庫圖書管理前端業(yè)務(wù)邏輯。前端數(shù)據(jù)庫教師發(fā) 展業(yè)務(wù)邏輯。Excel/CSV/XML/JsonPDF/Word/PPT等等圖片音頻/視頻班級(jí)通訊錄學(xué)校通知教育新聞單向日志同步主數(shù)據(jù)管理前端業(yè)務(wù)邏輯雙向讀寫API業(yè)務(wù)邏輯雙向讀寫API教育中臺(tái)業(yè)務(wù)創(chuàng)新:無數(shù)據(jù)庫開發(fā)36MongoDB Cluster Scale on DemandOracleSQ
13、LServerPostgresMongoDBMongoDBMongoDBMongoDBMongoDBMongoDBmongosmongosmongosMobile AppWeb AppReport UserReal time DashboardSMSTSPLegacyTXT/CSVAPI ServerSQLIoTLogsTapdata參考小型中臺(tái)物理部署ReplicatorAPI ServerTapdataHA & Load Balancing5. 中臺(tái)方案選型38我的選型建議如果:基于MongoDB方案適用度基于Hadoop / 數(shù)倉 方案適用度你已經(jīng)有Hadoop 或者數(shù)倉統(tǒng)一平 臺(tái)一般,有重復(fù)建設(shè)之嫌疑理想你尚未構(gòu)建數(shù)據(jù)統(tǒng)一平臺(tái)理想一般(投入大,技術(shù)復(fù)雜)你的中臺(tái)數(shù)據(jù)主要為前端交互式應(yīng) 用服務(wù)理想不合適你的中臺(tái)數(shù)據(jù)只是為BI分析服務(wù)不適合做太多表關(guān)聯(lián)(如10),或 者配合Spark合適你希望有個(gè)比較輕的解決方案,快 速見效快速迭代理想一般你們沒有專門的數(shù)據(jù)工程師理想不合適39基于MongoDB數(shù)據(jù)中臺(tái)的優(yōu)勢(shì)無縫橫向擴(kuò)展能力TB 到PB級(jí)存儲(chǔ)能力,支撐一站式企業(yè)級(jí)數(shù)據(jù)平臺(tái) 無下線時(shí)間橫向擴(kuò)展能力,始終保證秒級(jí)響應(yīng)能力多類型結(jié)構(gòu)數(shù)據(jù)模型結(jié)構(gòu)化,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 擋土墻工程施工技術(shù)方案
- 霧化吸入在兒科呼吸道疾病治療的體會(huì)
- 核心制度培訓(xùn)試題及答案2025年
- 商場(chǎng)員工福利待遇制度
- 醫(yī)院醫(yī)療廢物管理制度
- 2025年音樂理論考核方案規(guī)范試題及答案
- 三級(jí)公路建設(shè)施工方案及技術(shù)標(biāo)準(zhǔn)
- 青少年心理健康關(guān)愛實(shí)施方案
- 道路硬化工程施工及質(zhì)量控制方案
- 一年級(jí)趣味數(shù)學(xué)拓展訓(xùn)練方案
- 老年人安寧療護(hù)護(hù)理計(jì)劃制定與實(shí)施指南
- 線性代數(shù)課件 第6章 二次型 第2節(jié)
- 餐飲餐具消毒安全培訓(xùn)課件
- 心理科治療咨詢方案模板
- (2021-2025)5年高考1年模擬物理真題分類匯編專題04 機(jī)械能守恒、動(dòng)量守恒及功能關(guān)系(廣東專用)(解析版)
- 2025年車間核算員考試題及答案
- 2026年高考作文備考之提高議論文的思辨性三大技法
- 南寧市人教版七年級(jí)上冊(cè)期末生物期末考試試卷及答案
- 項(xiàng)目安全生產(chǎn)管理辦法
- 小學(xué)美術(shù)科組匯報(bào)
- 手術(shù)室膽囊結(jié)石護(hù)理查房
評(píng)論
0/150
提交評(píng)論