下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
《大數(shù)據(jù)分析原理和應(yīng)用》教學大綱第一章:大數(shù)據(jù)概述教學目標和要求(按認知程度分)★了解:大數(shù)據(jù)的產(chǎn)生背景、大數(shù)據(jù)的發(fā)展歷程★★熟悉:大數(shù)據(jù)的技術(shù)、特點、大數(shù)據(jù)的價值★★★掌握:大數(shù)據(jù)的概念、大數(shù)據(jù)時代的思維變革、國家大數(shù)據(jù)戰(zhàn)略主講內(nèi)容:大數(shù)據(jù)的產(chǎn)生背景、大數(shù)據(jù)的概念、大數(shù)據(jù)的特點和技術(shù)、大數(shù)據(jù)的應(yīng)用及價值、大數(shù)據(jù)時代的思維變革、國家大數(shù)據(jù)戰(zhàn)略。授課形式:課堂教學第二章:開源大數(shù)據(jù)平臺教學目標和要求(按認知程度分)★了解:兩種常用開源大數(shù)據(jù)分析平臺——Hadoop和Spark的起源、發(fā)展及應(yīng)用現(xiàn)狀★★熟悉:Hadoop和Spark的生態(tài)系統(tǒng)、體系結(jié)構(gòu)、基本運行機制及適用范圍★★★掌握:Hadoop和Spark的安裝部署過程及使用方法主講內(nèi)容:介紹兩種常用開源大數(shù)據(jù)分析平臺——Hadoop和Spark的起源、發(fā)展及應(yīng)用現(xiàn)狀、兩種平臺各自的生態(tài)系統(tǒng)和體系結(jié)構(gòu)、基本運行機制及適用范圍、兩種平臺的安裝部署過程及使用方法授課形式:課堂教學、上機實驗第三章:Hadoop分布式文件系統(tǒng)——HDFS教學目標和要求(按認知程度分)★了解:HDFS的優(yōu)缺點★★熟悉:HDFS中冗余數(shù)據(jù)的保存方式、數(shù)據(jù)存取策略、文件讀寫過程、數(shù)據(jù)錯誤和恢復的方式★★★掌握:分布式文件系統(tǒng)和HDFS的基本原理、HDFS1.0的體系結(jié)構(gòu)以及存在的問題、HDFS2.0體系結(jié)構(gòu)、使用JavaAPI對HDFS文件進行操作主講內(nèi)容:介紹分布式文件系統(tǒng)和HDFS的基本原理、HDFS1.0的體系結(jié)構(gòu)以及存在的問題、HDFS2.0體系結(jié)構(gòu)、HDFS中冗余數(shù)據(jù)的保存方式、數(shù)據(jù)存取策略、文件讀寫過程、數(shù)據(jù)錯誤與恢復的方式,并對HDFS的優(yōu)缺點進行分析,同時給出使用JavaAPI對HDFS文件進行操作的實例。授課形式:課堂教學、上機實驗第四章:MapReduce并行編程模型教學目標和要求(按認知程度分)★了解:MapReduce的優(yōu)缺點★★熟悉:MapReduce程序的設(shè)計思路和實現(xiàn)方法★★★掌握:分布式并行編程和MapReduce模型的基本原理、MapReduce的體系結(jié)構(gòu)和工作流程主講內(nèi)容:介紹分布式并行編程和MapReduce模型的基本原理、MapReduce的體系結(jié)構(gòu)和工作流程,并通過MapReduce實例分析,掌握MapReduce程序的設(shè)計思路和實現(xiàn)方法,同時能對MapReduce的優(yōu)缺點進行分析。授課形式:課堂教學、上機實驗第五章:Hadoop2.0的資源管理調(diào)度框架——YARN教學目標和要求(按認知程度分)★了解:YARN的優(yōu)缺點★★熟悉:YARN產(chǎn)生的背景、YARN的設(shè)計思路★★★掌握:YARN的體系結(jié)構(gòu)、YARN的工作流程主講內(nèi)容:YARN產(chǎn)生的背景、YARN的設(shè)計思路、YARN的體系結(jié)構(gòu)、YARN的工作流程,并能對YARN的優(yōu)缺點進行分析授課形式:課堂教學、上機實驗第六章:大數(shù)據(jù)的獲取和預(yù)處理教學目標和要求(按認知程度分)★★熟悉:爬蟲的基本概念和流程、數(shù)據(jù)清洗的基本原理和流程、數(shù)據(jù)歸約的基本概念和操作、數(shù)據(jù)標準化的基本概念和方法★★★掌握:使用Scrapy實現(xiàn)數(shù)據(jù)爬蟲、使用Pandas實現(xiàn)數(shù)據(jù)清洗主講內(nèi)容:爬蟲的基本概念和流程、使用Scrapy實現(xiàn)數(shù)據(jù)爬蟲、數(shù)據(jù)清洗的基本原理和流程、使用Pandas實現(xiàn)數(shù)據(jù)清洗、數(shù)據(jù)歸約的基本概念和操作、數(shù)據(jù)標準化的基本概念和方法授課形式:課堂教學、上機實驗第七章:大數(shù)據(jù)分析算法教學目標和要求(按認知程度分)★★熟悉:經(jīng)典聚類算法的基本原理、詳細步驟、應(yīng)用實例和Spark實現(xiàn)、經(jīng)典分類算法的基本原理、詳細步驟、應(yīng)用實例和Spark實現(xiàn)★★★掌握:通過對大數(shù)據(jù)聚類算法和分類算法的SparkMLlib實現(xiàn)的實例分析,掌握大數(shù)據(jù)聚類和分類分析程序的設(shè)計思路和實現(xiàn)方法主講內(nèi)容:經(jīng)典聚類算法的基本原理、詳細步驟、應(yīng)用實例和Spark實現(xiàn)、經(jīng)典分類算法的基本原理、詳細步驟、應(yīng)用實例和Spark實現(xiàn)、大數(shù)據(jù)聚類和分類算法的實際應(yīng)用授課形式:課堂教學、上機實驗第八章:大數(shù)據(jù)分析的應(yīng)用案例教學目標和要求(按認知程度分)★了解:大數(shù)據(jù)分析應(yīng)用案例的背景知識★★熟悉:案例數(shù)據(jù)的獲取和預(yù)處理過程★★★掌握:案例的P
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030汽車租賃業(yè)務(wù)市場發(fā)展投資前景與競爭格局評估規(guī)劃研究報告
- 2025-2030汽車尾氣凈化催化劑企業(yè)技術(shù)路線分析
- 2025-2030汽車后市場服務(wù)供需分析投資布局規(guī)劃未來智能汽車發(fā)展分析會議
- 2025-2030汽車制造業(yè)數(shù)字化轉(zhuǎn)型路徑與智能化發(fā)展趨勢研究
- 2025-2030汽車共享計劃市場接受度與運營效益分析
- 2025-2030汽車修理維護行業(yè)市場潛力解析投資路線規(guī)劃文獻
- 2025-2030污染治理行業(yè)市場深度調(diào)研及發(fā)展趨勢與市場策略研究報告
- 2026年跨境電商公司市場信息收集與分析管理制度
- 企業(yè)管理-職業(yè)培訓公司成本核算與財務(wù)分析報告
- 綜合管理崗位考核試題與答案
- 復方蒲公英注射液在銀屑病中的應(yīng)用研究
- 住培中醫(yī)病例討論-面癱
- 設(shè)備安裝施工方案范本
- 衛(wèi)生院副院長先進事跡材料
- 復發(fā)性抑郁癥個案查房課件
- 網(wǎng)絡(luò)直播創(chuàng)業(yè)計劃書
- 人類學概論(第四版)課件 第1、2章 人類學要義第一節(jié)何為人類學、人類學的理論發(fā)展過程
- 《功能性食品學》第七章-輔助改善記憶的功能性食品
- 幕墻工程竣工驗收報告2-2
- 1、工程竣工決算財務(wù)審計服務(wù)項目投標技術(shù)方案
- 改進維持性血液透析患者貧血狀況PDCA
評論
0/150
提交評論