下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、(互聯(lián)網(wǎng)廣告服務(wù)提供商等、銀行金融證券企業(yè)、電信運(yùn)營等行業(yè),給這些行業(yè)帶來了一定的數(shù)據(jù)價(jià)值增值作用。HadoopSparkBI本課程基本的實(shí)踐環(huán)境是 Linux 集群,JDK1.8, Hadoop 2.7.*,Spark 2.1.*。i5CPU4GB50G(可用移動(dòng)硬盤基本的大數(shù)據(jù)分析平臺(tái)所依賴的軟件包和依賴庫等,講師已經(jīng)提前部署在虛擬機(jī)鏡像(VMware,學(xué)員根據(jù)講師的操作任務(wù)進(jìn)行實(shí)踐。作,本課程講師也精心準(zhǔn)備的實(shí)際的應(yīng)用案例供學(xué)員動(dòng)手訓(xùn)練。大 綱 Outline業(yè)界主流的數(shù)據(jù)倉庫工具和大數(shù)據(jù)分析挖掘工具HadoopSpark3.HadoopHive4.SparkSparkSQL 5.Had
2、oopMahoutSparkMLlib大數(shù)據(jù)分析挖掘項(xiàng)目的實(shí)施步驟大數(shù)據(jù)分析挖掘項(xiàng)目的數(shù)據(jù)集成操作訓(xùn)練日志數(shù)據(jù)解析和導(dǎo)入導(dǎo)出到數(shù)據(jù)倉庫的操作訓(xùn)練從原始搜索數(shù)據(jù)集中抽取、集成數(shù)據(jù),整理后形成規(guī)范的數(shù)據(jù)倉庫庫同一個(gè)數(shù)據(jù)倉庫中的事實(shí)表數(shù)據(jù),可以給多個(gè)不同類型的分析挖掘任務(wù)調(diào)用去除噪聲基于 Hadoop 的大型數(shù)據(jù)倉庫管理平臺(tái)HIVE 數(shù)據(jù)倉庫集群的多維分析建模應(yīng)用實(shí)踐6.基于 Hadoop 的大分布式數(shù)據(jù)倉庫在行業(yè)中的數(shù)據(jù)倉庫應(yīng)用案例7.Hive8.Hive ServerHiveHiveHive SQLHiveHiveHadoop + HiveSpark16.SparkMLlibSparkHive聚
3、類分析建模與挖掘算法的實(shí)現(xiàn)原理和技術(shù)應(yīng)用Spark MLliba)Canopy(canopy clustering)K(K-means clustering)K(Fuzzy K-means clustering)EM(Expectation Maximization)Spark MLib19.Spark分類分析建模與挖掘算法的實(shí)現(xiàn)原理和技術(shù)應(yīng)用20.Spark MLlib用, 包括:Spark邏輯回歸算法(logisticsregression) h)貝葉斯算法(BayesianCbeyes)支持向量機(jī)(Support vector machine)Spark MLlib21.SparkSpa
4、rkSpark關(guān)聯(lián)分析建模與挖掘算法的實(shí)現(xiàn)原理和技術(shù)應(yīng)用Spark MLlib現(xiàn)與應(yīng)用,包括:Spark(parallel FP Growth Algorithm)應(yīng)用Spark(Apriori)算法及其應(yīng)用Spark MLib25.Spark推薦分析挖掘模型與算法技術(shù)應(yīng)用Spark MLliba)Sparkb)Item-basedc)User-basedd)交叉銷售推薦模型及其實(shí)現(xiàn)回歸分析模型與預(yù)測算法利用線性回歸(多元回歸)實(shí)現(xiàn)訪問量預(yù)測利用非線性回歸預(yù)測成交量和訪問量的關(guān)系R+SparkSpark31.Spark GraphX要性排名實(shí)現(xiàn)信息傳播的社交關(guān)系傳遞分析,互聯(lián)網(wǎng)用戶的行為關(guān)系分析任務(wù)的操作訓(xùn)練神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)算法模型及其應(yīng)用實(shí)踐Neural Network34.基于人工神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)的訓(xùn)練過程a)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法b)Deep Learning 的訓(xùn)練方法35.深度學(xué)習(xí)的常用模型和方法a)CNN(Convolutional Neural Network)b)RNN(Recurrent Neural Network)c)Restricted Boltzmann Machine(RBM36.Spark日志分析系統(tǒng)與日志挖掘項(xiàng)目實(shí)踐a)Hadoop,Spark,ELKb)互聯(lián)網(wǎng)微博日志分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學(xué)校課題活動(dòng)策劃方案(3篇)
- 2026烏魯木齊市第三十六中學(xué)誠聘初高中教師(18人)參考考試題庫及答案解析
- 2026浙江臺(tái)州市緊急救援中心招聘編制外人員1人參考考試題庫及答案解析
- 2026年甘肅省慶陽市西峰環(huán)宇中學(xué)春季招聘教師備考考試題庫及答案解析
- 2026泰安岱岳區(qū)事業(yè)單位初級綜合類崗位招聘工作人員(99人)考試備考試題及答案解析
- 2026廣東中山市東鳳鎮(zhèn)佛奧幼兒園教職工招聘2人筆試模擬試題及答案解析
- 2026中鐵建昆侖高速公路運(yùn)營管理有限公司德遂高速公路路巡隊(duì)員招聘1人(重慶)參考考試題庫及答案解析
- 2026上半年玉溪師范學(xué)院招聘6人參考考試題庫及答案解析
- 第四單元7靜夜思
- 三臺(tái)公安公開招聘60名警務(wù)輔助人員備考考試試題及答案解析
- 四川省南充市2024-2025學(xué)年高一上學(xué)期期末質(zhì)量檢測英語試題(含答案無聽力原文及音頻)
- 專題08解題技巧專題:圓中輔助線的作法壓軸題三種模型全攻略(原卷版+解析)
- 2024年全國職業(yè)院校技能大賽(節(jié)水系統(tǒng)安裝與維護(hù)賽項(xiàng))考試題庫(含答案)
- 24秋人教版英語七上單詞表(Vocabulary in Each Unit)總表
- ISO 15609-1 2019 金屬材料焊接工藝規(guī)程和評定-焊接工藝規(guī)程-電弧焊(中文版)
- 肥胖患者麻醉管理
- 小鯉魚跳龍門電子版
- 2019年急性腦梗死出血轉(zhuǎn)化專家共識(shí)解讀
- 《混凝土結(jié)構(gòu)工程施工規(guī)范》
- 土地證延期申請書
- 硫乙醇酸鹽流體培養(yǎng)基適用性檢查記錄
評論
0/150
提交評論