《大數(shù)據(jù)技術(shù)基礎(chǔ)(第2版)》792-4(覃事剛)教案 第8課 數(shù)據(jù)存儲(chǔ)與管理(二)_第1頁
《大數(shù)據(jù)技術(shù)基礎(chǔ)(第2版)》792-4(覃事剛)教案 第8課 數(shù)據(jù)存儲(chǔ)與管理(二)_第2頁
《大數(shù)據(jù)技術(shù)基礎(chǔ)(第2版)》792-4(覃事剛)教案 第8課 數(shù)據(jù)存儲(chǔ)與管理(二)_第3頁
《大數(shù)據(jù)技術(shù)基礎(chǔ)(第2版)》792-4(覃事剛)教案 第8課 數(shù)據(jù)存儲(chǔ)與管理(二)_第4頁
《大數(shù)據(jù)技術(shù)基礎(chǔ)(第2版)》792-4(覃事剛)教案 第8課 數(shù)據(jù)存儲(chǔ)與管理(二)_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PAGE2PAGE2PAGE3PAGE3

課題數(shù)據(jù)存儲(chǔ)與管理(二)課時(shí)2課時(shí)(90min)教學(xué)目標(biāo)知識(shí)技能目標(biāo):(1)了解HBase的概念、數(shù)據(jù)模型和工作原理。(2) 了解Hive的概念、工作原理和執(zhí)行流程。思政育人目標(biāo):感受我國(guó)科技企業(yè)對(duì)全球基礎(chǔ)軟件開源做出的重要貢獻(xiàn),深刻理解企業(yè)堅(jiān)持走自主創(chuàng)新路線、構(gòu)建開源生態(tài)的重要意義,不斷增強(qiáng)創(chuàng)新自信教學(xué)重難點(diǎn)教學(xué)重點(diǎn):HBase的概念、數(shù)據(jù)模型和工作原理,Hive的概念、工作原理教學(xué)難點(diǎn):Hive的執(zhí)行流程教學(xué)方法案例分析法、問答法、討論法、講授法教學(xué)用具電腦、投影儀、多媒體課件、教材教學(xué)設(shè)計(jì)第1節(jié)課:→→傳授新知(18min)→實(shí)戰(zhàn)演練(20min)第2節(jié)課:→傳授新知(15min)→實(shí)戰(zhàn)演練(20min)→課堂小結(jié)(3min)→作業(yè)布置(2min)教學(xué)過程主要教學(xué)內(nèi)容及步驟設(shè)計(jì)意圖第一節(jié)課考勤

(2min)【教師】使用文旌課堂APP【學(xué)生】按照老師要求簽到培養(yǎng)學(xué)生的組織紀(jì)律性,掌握學(xué)生的出勤情況問題導(dǎo)入(5min)【教師】提出以下問題:隨著大數(shù)據(jù)時(shí)代的到來,需要存儲(chǔ)與管理的數(shù)據(jù)越來越多,數(shù)據(jù)的結(jié)構(gòu)也變得越來越復(fù)雜。我們已經(jīng)學(xué)習(xí)了分布式系統(tǒng)HDFS,那么分布式數(shù)據(jù)庫是什么呢?它是如何工作和運(yùn)行的呢?【學(xué)生】聆聽、思考、舉手回答通過問題導(dǎo)入的方法,引導(dǎo)學(xué)生主動(dòng)思考,激發(fā)學(xué)生的學(xué)習(xí)興趣傳授新知

(18min)【教師】通過學(xué)生的回答引入要講的知識(shí),介紹分布式數(shù)據(jù)庫HBase一、HBase簡(jiǎn)介?【教師】提出問題:什么是HBase??【學(xué)生】思考、舉手回答HBase是一個(gè)開源的、分布式的、非關(guān)系型的列式數(shù)據(jù)庫。?【教師】提出問題:Hbase的特點(diǎn)有哪些??【學(xué)生】思考、舉手回答?【教師】總結(jié)學(xué)生的回答(1)它彌補(bǔ)了Hadoop不能進(jìn)行實(shí)時(shí)數(shù)據(jù)處理的缺陷,是一種非關(guān)系型數(shù)據(jù)庫(NoSQL數(shù)據(jù)庫),因此不能保證關(guān)系型數(shù)據(jù)庫的原子性、一致性、隔離性和持久性。(2)它采用了稀疏矩陣的存儲(chǔ)方式,對(duì)于空值(null)數(shù)據(jù)的存儲(chǔ)并不占用存儲(chǔ)空間。HBase表中的列可根據(jù)需求來動(dòng)態(tài)增加,并且每個(gè)cell(由行和列來確定)的數(shù)據(jù)可以存在多個(gè)版本。(3)它可以通過增加節(jié)點(diǎn)的方式進(jìn)行線性擴(kuò)展,使得可以在用廉價(jià)計(jì)算機(jī)構(gòu)建的集群上管理超大規(guī)模的稀疏表。(詳見教材)?【教師】提出以下學(xué)習(xí)任務(wù):閱讀教材“高手點(diǎn)撥”部分,總結(jié)數(shù)據(jù)管理技術(shù)的發(fā)展的階段特點(diǎn),時(shí)間段和優(yōu)缺點(diǎn)。?【學(xué)生】自主學(xué)習(xí)、思考、理解二、HBase的數(shù)據(jù)模型?【教師】利用多媒體輔助講解HBase的數(shù)據(jù)模型Base是一個(gè)類似于Bigtable的分布式數(shù)據(jù)庫,它是一個(gè)稀疏的、長(zhǎng)期存儲(chǔ)的(存在HDFS上)、多維度的、排序的映射表。HBase的數(shù)據(jù)都是字符串,沒有類型。HBase中的表一般由行鍵(rowkey)、時(shí)間戳(timestamp)、列族(columnfamily)、列(column)組成。(詳見教材)HBase的邏輯視圖三、HBase的工作原理?【教師】提出以下問題:對(duì)照HBase的體系結(jié)構(gòu)圖說一說HBase每一部分的組成和作用?【學(xué)生】思考、舉手回答?【教師】總結(jié)學(xué)生的回答(1)Client(客戶端)??蛻舳税L問HBase的接口,可做一些本地緩存,如借助ZooKeeper服務(wù)器從主服務(wù)器HBaseMaster獲取Region位置信息,并從Region(HRegion)服務(wù)器上讀取數(shù)據(jù)。(2)Master(HMaster)。管理運(yùn)行不同的Region服務(wù)器,也為客戶端操作HBase的所有元數(shù)據(jù)提供接口,同時(shí)負(fù)責(zé)RegionServer的故障處理和Region的切分。(詳見教材)【學(xué)生】聆聽、記錄、理解通過教師的講解和演示,互動(dòng)以及案例,使學(xué)生了解分布式數(shù)據(jù)庫HBase實(shí)戰(zhàn)演練(20min)【教師】演示安裝并使用HBase數(shù)據(jù)庫的操作,然后組織學(xué)生上機(jī)操作(1)安裝和啟動(dòng)HBase(2)HBase表和數(shù)據(jù)操作【學(xué)生】【教師】巡視課堂紀(jì)律,對(duì)操作有困難的學(xué)生進(jìn)行指導(dǎo)通過實(shí)戰(zhàn)演練,加深學(xué)生對(duì)HBase數(shù)據(jù)庫相關(guān)操作的熟練度第二節(jié)課問題導(dǎo)入(5min)【教師】提出問題:我們已經(jīng)學(xué)習(xí)了管理數(shù)據(jù)的系統(tǒng),那么數(shù)據(jù)是如何存儲(chǔ)的呢?【學(xué)生】聆聽、思考、舉手回答通過問題導(dǎo)入,引導(dǎo)學(xué)生主動(dòng)思考,激發(fā)學(xué)生的學(xué)習(xí)興趣傳授新知(15min)【教師】通過學(xué)生的回答引入新的知識(shí),介紹數(shù)據(jù)倉庫Hive一、Hive簡(jiǎn)介Hive是一個(gè)基于Hadoop的數(shù)據(jù)倉庫框架,它使用SQL語句讀、寫和管理大型分布式數(shù)據(jù)集。Hive可以將SQL語句轉(zhuǎn)化為MapReduce(或Spark、Tez)任務(wù)執(zhí)行,大大降低了Hadoop的使用門檻,減少了開發(fā)MapReduce程序的時(shí)間成本?!ㄔ斠娊滩模?【教師】提出以下問題:HDFS有哪些優(yōu)缺點(diǎn)??【學(xué)生】思考、舉手回答?【教師】對(duì)學(xué)生的回答進(jìn)行總結(jié)Hive是Hadoop的頂級(jí)項(xiàng)目之一,也是Hadoop生態(tài)系統(tǒng)中的第一個(gè)SQL框架。它提供了一種類SQL的數(shù)據(jù)查詢語言——HiveQL(Hive查詢語言),并且通常被用來對(duì)歷史數(shù)據(jù)進(jìn)行挖掘與分析。Hive并不能解決所有的大數(shù)據(jù)問題,例如,它不提供在線事務(wù)處理、實(shí)時(shí)數(shù)據(jù)查詢及記錄級(jí)的數(shù)據(jù)更新,不適合實(shí)現(xiàn)復(fù)雜的機(jī)器學(xué)習(xí)算法等。但是,Hive對(duì)于批量處理海量數(shù)據(jù)表現(xiàn)良好?!ㄔ斠娊滩模?【教師】提出以下學(xué)習(xí)任務(wù):閱讀教材“提示”部分,了解Hive和HDFS的區(qū)別。?【學(xué)生】自主學(xué)習(xí)、思考、理解?【教師】利用多媒體輔助講解Hive支持的文件存儲(chǔ)格式,數(shù)據(jù)類型和數(shù)據(jù)模型Hive支持的文件存儲(chǔ)格式主要包括TextFile(文本文件)、SequenceFile(序列文件)、RCFile(列式記錄文件)等。Hive的數(shù)據(jù)類型分為基本數(shù)據(jù)類型和復(fù)合數(shù)據(jù)類型。其中,基本數(shù)據(jù)類型包括INT(整型)、BOOLEAN(布爾型)、STRING(字符串型)和TIMESTAMP(時(shí)間戳)等。Hive的數(shù)據(jù)模型包括數(shù)據(jù)庫、表、視圖、分區(qū)和表數(shù)據(jù)等。數(shù)據(jù)庫、表、分區(qū)等都對(duì)應(yīng)HDFS上的一個(gè)目錄;表數(shù)據(jù)對(duì)應(yīng)HDFS對(duì)應(yīng)目錄下的文件。Hive中所有的數(shù)據(jù)都存儲(chǔ)在HDFS中,沒有專門的數(shù)據(jù)存儲(chǔ)格式,因?yàn)镠ive是讀模式。二、Hive的工作原理?【教師】利用多媒體輔助講解Hive的工作原理Hive的體系主要由4部分組成:用戶接口、元數(shù)據(jù)存儲(chǔ)(Metastore)、跨語言服務(wù)(ThriftServer)和引擎(Driver)。(1)用戶接口。用戶接口負(fù)責(zé)接收用戶的輸入命令,主要有3個(gè)接口:CLI、JDBC/ODBC和WebUI。?!ㄔ斠娊滩模?【教師】提出以下學(xué)習(xí)任務(wù):根據(jù)Hive的體系結(jié)構(gòu)圖進(jìn)一步理解Hive每一部分的任務(wù)。?【學(xué)生】思考、分析、理解三、Hive的執(zhí)行流程?【教師】利用多媒體輔助講解Hive的執(zhí)行流程Hive作業(yè)通過命令行或者客戶端提交,經(jīng)過編譯器Compiler,借助Metastore中的元數(shù)據(jù)進(jìn)行類型檢測(cè)和語法分析,生成一個(gè)邏輯方案(LogicalPlan),通過優(yōu)化處理,產(chǎn)生一個(gè)MapReduce任務(wù)?!ㄔ斠娊滩模緦W(xué)生】聆聽、記錄、理解通過講授,提問,討論等教學(xué)方式,讓學(xué)生了解數(shù)據(jù)倉庫Hive實(shí)戰(zhàn)演練(20min)【教師】演示安裝并使用Hive數(shù)據(jù)倉庫的基本操作,然后組織學(xué)生上機(jī)操作(1)安裝MySQL(2)安裝和配置Hive(3)Hive數(shù)據(jù)庫、表和數(shù)據(jù)查詢操作【學(xué)生】【教師】巡視課堂紀(jì)律,對(duì)操作有困難的學(xué)生進(jìn)行指導(dǎo)通過實(shí)戰(zhàn)演練,使學(xué)生熟悉Hive數(shù)據(jù)倉庫基本操作,為后面的學(xué)習(xí)打好基礎(chǔ)課堂小結(jié)

(3min)【教師】簡(jiǎn)要總結(jié)本節(jié)課的要點(diǎn)本節(jié)課學(xué)習(xí)了分布式文件數(shù)據(jù)庫HBase數(shù)據(jù)模型和工作原理,了解了數(shù)據(jù)倉庫Hive的工作原理和執(zhí)行流程。希望大家在課下多加練習(xí),鞏固所學(xué)知識(shí)?!緦W(xué)生】總結(jié)回顧知識(shí)點(diǎn)總結(jié)知識(shí)點(diǎn),鞏固學(xué)生對(duì)分布式文件數(shù)據(jù)庫HBase和數(shù)據(jù)倉庫Hive相關(guān)知識(shí)的印象作業(yè)布置

(2min)【教師】布置課后作業(yè)(1)對(duì)HBase表和數(shù)據(jù)進(jìn)行操作(2)進(jìn)行Hive的數(shù)據(jù)庫、表和數(shù)據(jù)查詢操作(3)完成本章節(jié)課后相關(guān)習(xí)題?!緦W(xué)生】完成課后任務(wù)通過課后作業(yè)復(fù)習(xí)鞏固學(xué)到的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論