版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、大數(shù)據(jù)分析技術(shù)架構(gòu)解決方案,技術(shù)基礎(chǔ)研究方向,-技術(shù)基礎(chǔ)研究方向,開創(chuàng)了基于人類視覺智能的動態(tài)目標(biāo)捕捉、跟蹤和行為分析的研究,在國內(nèi)外雜志、會議發(fā)表了多篇高水平論文。 獲得視頻識別,知識學(xué)習(xí)與推理相關(guān)發(fā)明專利2項,申請發(fā)明專利7項。,大數(shù)據(jù)環(huán)境下的無重疊視域跟蹤,大數(shù)據(jù)技術(shù),解決視頻領(lǐng)域的知識識別,知識發(fā)現(xiàn),知識集成與跟蹤,推理等關(guān)鍵技術(shù)問題。,多項國家自然科學(xué)基金,大數(shù)據(jù)技術(shù)來實現(xiàn)國家經(jīng)濟(jì)免疫系統(tǒng),審計跨12個行業(yè),跨地區(qū)數(shù)據(jù)源,審計行業(yè)大數(shù)據(jù)知識推理系統(tǒng),房地產(chǎn)大數(shù)據(jù),利用大數(shù)據(jù)建模技術(shù),實現(xiàn)房地產(chǎn)價格指數(shù)、房地產(chǎn)評估模型,碳交易,利用大數(shù)據(jù)建模技術(shù),建立全省碳排放計量監(jiān)測體系的數(shù)據(jù)體系、
2、技術(shù)體系、模型體系和評估體系,形成滿足碳排放計量關(guān)系方程和參數(shù),目錄,數(shù)據(jù)挖掘越來越多的應(yīng)用到了各個領(lǐng)域中,主要包括與客戶關(guān)系管理相關(guān)的模型、與風(fēng)險控制相關(guān)的模型、與生產(chǎn)銷售預(yù)測相關(guān)的模型等,數(shù)據(jù)挖掘應(yīng)用領(lǐng)域,產(chǎn)品名,產(chǎn)品,ETHINK可視化挖掘,概要,通過在瀏覽器內(nèi),鼠標(biāo)拖拽形式實現(xiàn)加載數(shù)據(jù)、轉(zhuǎn)換、建模、評估、圖形以及結(jié)果輸出,特點,通過視覺工作方式輕松獲得此界面可以保障操作的靈活性 在最短的時間內(nèi)形成最多樣的模型大數(shù)據(jù)挖掘,速度快,關(guān)系型數(shù)據(jù)庫,數(shù)據(jù)挖掘模型算法庫/語義分析,Hbase/Hive/Hdfs,可視化數(shù)據(jù) 挖掘平臺,多維自助分析,調(diào) 度 管 理,SQL接口 JDBC/ODBC,
3、內(nèi)存計算服務(wù) Scala /Java/Python,OLAP Server,手機(jī),平板,電腦,批處理,實時流處理,交互式查詢,統(tǒng)計分析平臺,ETHINK產(chǎn)品架構(gòu),特點一,豐富建模方法,特點,可拖拽式建模,JDBC Web Services Restful api,可擴(kuò)展性強(qiáng) 自定義模型,擴(kuò)充組件,特點,傳統(tǒng)的關(guān)系型數(shù)據(jù)(mysql、Oracle等) 列式數(shù)據(jù)庫(Hbase) 非結(jié)構(gòu)化數(shù)據(jù)(Hdfs、文件系統(tǒng)) 大數(shù)據(jù)(Hbase、Hive),特點二,大數(shù)據(jù)處理,特點,開放型平臺,BS結(jié)構(gòu),一站式建模、評估、部署,基于Spark平臺 內(nèi)存計算 運(yùn)算速度快,特點,GB,PB,特點三,大數(shù)據(jù)處理能力
4、,特點,基于Spark平臺 內(nèi)存計算,執(zhí)行數(shù)據(jù)挖掘時,方法論非常重要. 因為準(zhǔn)確的方法論能夠提高作業(yè)速度, 能系統(tǒng)地減少各種進(jìn)展?fàn)顩r,所以選擇正確的方法論是很重要的. CRISP-DM 方法論是全球認(rèn)可的數(shù)據(jù)挖掘的標(biāo)準(zhǔn)執(zhí)行方法論.,場景應(yīng)用(實驗室模擬實驗課題),目錄,基于spark內(nèi)存的計算模型,同時支持批處理、交互式處理、流處理。,技術(shù)架構(gòu)解決方案-要解決的問題,技術(shù)架構(gòu)解決方案-分布式內(nèi)存計算,批處理應(yīng)用 (分鐘級別小時級別),OLTP/在線事務(wù)處理應(yīng)用 (毫秒秒級別),OLAP/在線交互式分析應(yīng)用 (秒級別),實時流處理 (持續(xù)不斷),技術(shù)架構(gòu)解決方案-交互式查詢,通常的時間跨度在數(shù)十
5、秒到數(shù)分鐘之間 按數(shù)據(jù)維度進(jìn)行統(tǒng)計、聚合 根據(jù)歷史數(shù)據(jù)進(jìn)行擬合和預(yù)測 計算數(shù)據(jù)之間的相關(guān)性和模式等 適合提供高速在線分析服 典型應(yīng)用場景 政府各部門數(shù)據(jù) 證券交易 銀行保險 企業(yè)ERP/CRM等 適用于數(shù)據(jù)量在GB到TB的高速數(shù)據(jù)分析,技術(shù)架構(gòu)解決方案-實時在線處理,通常的時間跨度在數(shù)百毫秒到數(shù)秒之間 數(shù)據(jù)來源多、高并發(fā)、數(shù)據(jù)處理量達(dá) 分析結(jié)果快速響應(yīng) 典型應(yīng)用場景 社交網(wǎng)絡(luò)分析、關(guān)聯(lián)關(guān)系分析 用戶分類、用戶行為預(yù)測 高并發(fā)查詢 按主鍵毫秒級檢索 按多維度秒級檢索 按照關(guān)鍵字秒級檢索,事件驅(qū)動計算模型,系統(tǒng)處于持續(xù)不斷計算之中,事件響應(yīng)延遲在毫秒秒級。 流式計算系統(tǒng)處理應(yīng)用的處理邏輯是由源源不
6、斷的數(shù)據(jù)流驅(qū)動。 典型應(yīng)用場景 有金融在線欺詐預(yù)警 廣告CTR 推薦系統(tǒng),技術(shù)架構(gòu)解決方案-實時流處理,技術(shù)架構(gòu)解決方案-批處理及離線挖掘,時間跨度在數(shù)十分鐘到數(shù)小時之間。 離線挖掘主要用于,多維統(tǒng)計預(yù)測,準(zhǔn)實時分析以及對客戶進(jìn)行聚類、分類等數(shù)據(jù)挖掘應(yīng)用。 典型應(yīng)用場景 電子商務(wù)推薦引擎 流失客戶預(yù)測挽留 日志清洗、ETL 用戶行為分析,目錄,項目需求 將總行下發(fā)的數(shù)據(jù)及核心業(yè)務(wù)數(shù)據(jù),經(jīng)過數(shù)據(jù)整理、加載到省級數(shù)據(jù)中心,并進(jìn)行各項業(yè)務(wù)快速應(yīng)用開發(fā) 數(shù)據(jù)源 某省公積金中心,近五年的操作、交易記錄,共10億條左右。 系統(tǒng)環(huán)境 4臺X86架構(gòu)的PC服務(wù)器,共128G內(nèi)存 單臺服務(wù)器,8核CPU,32G
7、內(nèi)存 解決方案 Hbase導(dǎo)入海量數(shù)據(jù),并支撐大數(shù)據(jù)查詢 可視化設(shè)計、可視化報表實現(xiàn)了數(shù)據(jù)的實時分析,行業(yè)應(yīng)用案例-金融,行業(yè)應(yīng)用案例-金融,系統(tǒng)由對公客戶綜合積分子系統(tǒng)、展業(yè)通客戶綜合收益分析子系統(tǒng)、授信客戶資金結(jié)算子系統(tǒng)、對公柜面交易流水分析子系統(tǒng)等組成,行業(yè)應(yīng)用案例-金融,項目需求 整合第三方支付數(shù)據(jù)資源,分析挖掘客戶交易、反饋信息、交易行等數(shù)據(jù),實現(xiàn)精準(zhǔn)營銷,最大限度地提升產(chǎn)品價值 數(shù)據(jù)源 某第三方支付平臺交易、反饋數(shù)據(jù),月交易記錄量1億條。 系統(tǒng)環(huán)境 臺X86架構(gòu)的PC服務(wù)器,共96G內(nèi)存 單臺服務(wù)器,8核CPU,16G內(nèi)存 解決方案 Hbase導(dǎo)入海量數(shù)據(jù),并支撐大數(shù)據(jù)查詢 Hiv
8、e對歷史交易數(shù)據(jù)進(jìn)行分析 可視化設(shè)計、可視化報表實現(xiàn)數(shù)據(jù)的實時分析 基于ETHINK可視化挖掘平臺,完成精準(zhǔn)營銷建模,持卡客戶多維分析: 持卡客戶人口統(tǒng)計特征分析 持卡客戶交易行為模式分析 持卡客戶應(yīng)用場景分析 特約商戶多維分析: 商戶基本信息分析/商戶業(yè)務(wù)收益分析 商戶價值貢獻(xiàn)度評估商戶收單風(fēng)險分析 持卡客戶和特約商戶雙向分析 特定特征客戶特定時間消費(fèi)商戶分布分析 特定時間在特定商戶消費(fèi)的客戶特征分析,行業(yè)應(yīng)用案例-金融,項目需求 煙草工業(yè)企業(yè)目前積累了大量的數(shù)據(jù)信息,管理方式由粗放式管理轉(zhuǎn)為精細(xì)化管理,產(chǎn)生了利用大數(shù)據(jù)技術(shù)收集、管理和展示分析結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)和信息的訴求,于是如何利用這些數(shù)據(jù)創(chuàng)造更大的價值、為領(lǐng)導(dǎo)決策和企業(yè)精益管理提供有力支撐成為重要的課題。 數(shù)據(jù)存儲 近1年數(shù)據(jù),每秒鐘10000個數(shù)據(jù)采集點 系統(tǒng)環(huán)境 硬件環(huán)境: 數(shù)據(jù)庫服務(wù)器1臺+4臺分布式pc server 單臺4核,16G內(nèi)存 解決方案 流處理模塊處理設(shè)備實時數(shù)據(jù)流 事件預(yù)警開發(fā)平臺,實現(xiàn)問題預(yù)警 基于E
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026浙江嘉興海寧市遠(yuǎn)達(dá)教育集團(tuán)招聘備考題庫(十)及一套完整答案詳解
- 2026甘肅酒泉金塔縣鑫耀人力資源管理有限公司招聘相關(guān)技術(shù)人員的4人備考題庫有答案詳解
- 2026河南省直機(jī)關(guān)遴選公務(wù)員159人備考題庫完整答案詳解
- 職業(yè)噪聲暴露的流行病學(xué)特征與防控策略
- 空調(diào)店銷售年終總結(jié)(3篇)
- 職業(yè)共病管理中的學(xué)術(shù)交流平臺
- 職業(yè)健康防護(hù)的技術(shù)標(biāo)準(zhǔn)研究
- 職業(yè)健康醫(yī)療化服務(wù)的質(zhì)量控制方法
- 職業(yè)健康促進(jìn)的成本效益實證數(shù)據(jù)
- 《老年衰弱門診服務(wù)規(guī)范》 團(tuán)體標(biāo)準(zhǔn)-編制說明
- 基建人員考核管理辦法
- 2025體育與健康課程標(biāo)準(zhǔn)深度解讀與教學(xué)實踐
- 礦山救援器材管理制度
- 2025西南民族大學(xué)輔導(dǎo)員考試試題及答案
- T/CSPSTC 17-2018企業(yè)安全生產(chǎn)雙重預(yù)防機(jī)制建設(shè)規(guī)范
- 2025年《三級物業(yè)管理師》考試復(fù)習(xí)題(含答案)
- 《數(shù)據(jù)與管理》課件
- 2025屆北京市西城區(qū)北京四中高考英語二模試卷含答案
- 面神經(jīng)炎美國神經(jīng)病學(xué)會和美國耳鼻喉-頭頸外科學(xué)會治療
- 鍋爐煤場安全管理制度
- DB11∕T1135-2024供熱系統(tǒng)有限空間作業(yè)安全技術(shù)規(guī)程
評論
0/150
提交評論