數(shù)據(jù)倉庫與數(shù)據(jù)挖掘(第2版微課版)-教案_第1頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘(第2版微課版)-教案_第2頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘(第2版微課版)-教案_第3頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘(第2版微課版)-教案_第4頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘(第2版微課版)-教案_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

PAGEPAGE21計(jì)算機(jī)學(xué)院教案教案(首頁)課程名稱數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)W分232學(xué)時(shí)講授:24學(xué)時(shí)實(shí)驗(yàn):8學(xué)時(shí)其它:學(xué)時(shí)類別(請打√)□公共課□公共選修課□專業(yè)必修課√專業(yè)選修課□實(shí)驗(yàn)課/課程設(shè)計(jì)授課對象專業(yè):軟件工程班級:08111601-6班使用教材參考資料(注明書名、主編、出版社、出版時(shí)間)選用教材:袁漢寧,王樹良,阮思捷,耿晶,金福生.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘.北京:人民郵電出版社,2025.教學(xué)方法教學(xué)手段采用多媒體教學(xué)與傳統(tǒng)教學(xué)方法相結(jié)合進(jìn)行教學(xué)、課堂提問與討論課程目標(biāo)1.通過理論教學(xué),掌握數(shù)據(jù)倉庫的基本概念、數(shù)據(jù)模型和結(jié)構(gòu),掌握數(shù)據(jù)的概念、內(nèi)容、屬性、統(tǒng)計(jì)描述、數(shù)據(jù)相似性和向異性的度量方法、數(shù)據(jù)可視化的概念和方法。掌握數(shù)據(jù)預(yù)處理、關(guān)聯(lián)規(guī)則、聚類、分類等經(jīng)典算法2.通過課堂教學(xué),使學(xué)生掌握數(shù)據(jù)倉庫原理并能夠使用數(shù)據(jù)倉庫軟件實(shí)現(xiàn)實(shí)際工程中數(shù)據(jù)倉庫的設(shè)計(jì)、實(shí)現(xiàn)、維護(hù)與管理。掌握數(shù)據(jù)預(yù)處理、關(guān)聯(lián)規(guī)則、聚類、分類等算法的程序?qū)崿F(xiàn),針對實(shí)際工程問題能用程序?qū)崿F(xiàn)數(shù)據(jù)挖掘算法并解決相關(guān)實(shí)際問題3.通過課堂教學(xué)和課外研討,使學(xué)生能夠了解數(shù)據(jù)倉庫和數(shù)據(jù)挖掘領(lǐng)域的重要標(biāo)準(zhǔn)規(guī)范、重要學(xué)術(shù)論文的來源和檢索途徑,引導(dǎo)學(xué)生通過檢索獲取相關(guān)信息,使之有助于開展數(shù)據(jù)挖掘領(lǐng)域復(fù)雜問題的分析。4通過課堂教學(xué)和學(xué)生自主學(xué)習(xí),使學(xué)生能夠應(yīng)用所獲得的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘知識(shí),針對具體問題,設(shè)計(jì)和構(gòu)建數(shù)據(jù)挖掘分析系統(tǒng),實(shí)現(xiàn)數(shù)據(jù)的采集、清理、存儲(chǔ)、挖掘分析、使用與維護(hù)??己朔绞娇己朔绞剑洪]卷筆試成績構(gòu)成:書面作業(yè):3次書面作業(yè),每次作業(yè)根據(jù)每題得分按百分制打分,最終將3次作業(yè)成績折合為15分,占總成績的10%;課程實(shí)驗(yàn)報(bào)告:占總成績的40%。期末考試:占總成績的50%數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程教案(續(xù)頁)授課時(shí)間第1周授課方式(請打√)√講授□實(shí)驗(yàn)□其它課時(shí)安排4授課題目(章節(jié)或單位課時(shí)):第一章概述第二章數(shù)據(jù)教學(xué)目的與要求(分了解、熟悉、掌握和綜合運(yùn)用四個(gè)層次):1.了解數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的應(yīng)用和歷史、數(shù)據(jù)可視化技術(shù)2.熟悉數(shù)據(jù)挖掘的目的、概念、模式、技術(shù)3.掌握數(shù)據(jù)對象、數(shù)據(jù)屬性及數(shù)據(jù)集相關(guān)概念4掌握數(shù)據(jù)特征的統(tǒng)計(jì)描述與數(shù)據(jù)相似與相異性的度量方法教學(xué)重點(diǎn)與難點(diǎn):1.數(shù)據(jù)特征的統(tǒng)計(jì)描述2.數(shù)據(jù)相似與相異性的度量教學(xué)內(nèi)容備注第1章概述1.1引言1.2研究歷程1.3數(shù)據(jù)挖掘的流程1.4數(shù)據(jù)驅(qū)動(dòng)的應(yīng)用1.5關(guān)鍵挑戰(zhàn)第2章數(shù)據(jù)2.1數(shù)據(jù)的基本內(nèi)容2.2數(shù)據(jù)的統(tǒng)計(jì)特征2.3數(shù)據(jù)的相似差異

教案(末頁)復(fù)習(xí)思考題:1定義下列數(shù)據(jù)挖掘功能:特征化、區(qū)分、關(guān)聯(lián)和相關(guān)分析、預(yù)測聚類和演變分析。2總結(jié)本章重要的數(shù)據(jù)挖掘領(lǐng)域的術(shù)語3、根據(jù)iris數(shù)據(jù)集繪制散點(diǎn)圖、直方圖和盒圖。4假定用于分析的數(shù)據(jù)包含屬性age。數(shù)據(jù)元組的age值(以遞增序)是:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。(a)該數(shù)據(jù)的均值是什么?中位數(shù)是什么?(b)該數(shù)據(jù)的眾數(shù)是什么?討論數(shù)據(jù)的峰(即雙峰、三峰等)(c)數(shù)據(jù)的中列數(shù)是什么?(d)找出數(shù)據(jù)的第一個(gè)四分位數(shù)(Q1)和第三個(gè)四分位數(shù)(Q3)(e)給出數(shù)據(jù)的五數(shù)概括。推薦閱讀書目:查閱CCF推薦的數(shù)據(jù)挖掘領(lǐng)域的重要會(huì)議和論文期刊(KDDICDMTKDE等)T.DasuandT.Johnson.ExploratoryDataMiningandDataCleaning.JohnWiley,2003E.R.Tufte.TheVisualDisplayofQuantitativeInformation,2nded.,GraphicsPress,2001數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程教案(續(xù)頁)授課時(shí)間第2周授課方式(請打√)√講授□實(shí)驗(yàn)□其它課時(shí)安排4授課題目(章節(jié)或單位課時(shí)):第3章數(shù)據(jù)預(yù)處理第4章數(shù)據(jù)倉庫和ETL工具教學(xué)目的與要求(分了解、熟悉、掌握和綜合運(yùn)用四個(gè)層次):1、掌握并綜合運(yùn)用數(shù)據(jù)預(yù)處理方法2、了解數(shù)據(jù)倉庫與ETL工具教學(xué)重點(diǎn)與難點(diǎn):1.數(shù)據(jù)清理技術(shù)2數(shù)據(jù)約簡和變換技術(shù)3維度約簡技術(shù)教學(xué)內(nèi)容備注第3章數(shù)據(jù)預(yù)處理3.1數(shù)據(jù)清洗3.2數(shù)據(jù)變換3.3數(shù)據(jù)集成3.4數(shù)據(jù)融合3.5數(shù)據(jù)規(guī)約第4章數(shù)據(jù)倉庫和數(shù)據(jù)湖4.1數(shù)據(jù)倉庫的概念4.2數(shù)據(jù)倉庫模型4.3數(shù)據(jù)ETL

教案(末頁)復(fù)習(xí)思考題:1數(shù)據(jù)倉庫可以用星形模式或雪花模式建模。簡略討論這兩種模式的相似點(diǎn)和不同點(diǎn),然后分析它們的相對做優(yōu)、缺點(diǎn)。2、總結(jié)數(shù)據(jù)倉庫本章的相關(guān)術(shù)語3、梳理數(shù)據(jù)預(yù)處理流程及各流程中使用的預(yù)處理方法推薦閱讀書目:T.DasuandT.Johnson.ExploratoryDataMiningandDataCleaning.JohnWiley,2003T.Dasu,T.Johnson,S.Muthukrishnan,V.Shkapenyuk.

MiningDatabaseStructure;Or,HowtoBuildaDataQualityBrowser.SIGMOD’02V.RamanandJ.Hellerstein.PottersWheel:AnInteractiveFrameworkforDataCleaningandTransformation,VLDB’2001數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程教案(續(xù)頁)授課時(shí)間第3周授課方式(請打√)√講授□實(shí)驗(yàn)□其它課時(shí)安排4授課題目(章節(jié)或單位課時(shí)):4、ETL技術(shù)第5章關(guān)聯(lián)規(guī)則挖掘教學(xué)目的與要求(分了解、熟悉、掌握和綜合運(yùn)用四個(gè)層次):1、了解相關(guān)ETL技術(shù)2掌握關(guān)聯(lián)規(guī)則挖掘算法Aprior和FP并可以應(yīng)用教學(xué)重點(diǎn)與難點(diǎn):1.Aprior算法2.FP算法教學(xué)內(nèi)容備注4.4OLAP4.5數(shù)據(jù)湖4.6湖倉一體第5章關(guān)聯(lián)規(guī)則5.1關(guān)聯(lián)規(guī)則的基本思想5.2關(guān)聯(lián)規(guī)則的主要算法5.3關(guān)聯(lián)規(guī)則的研發(fā)歷程

教案(末頁)復(fù)習(xí)思考題:1設(shè)數(shù)據(jù)庫有5個(gè)事務(wù)。設(shè)min_sup=60%,min_conf=80%分別使用Apriori和FP增長算法找出所有頻繁項(xiàng)集。比較兩種挖掘過程的效率。2下面的相依表匯總了超級市場的事務(wù)數(shù)據(jù)。其中,hotdogs表示包含熱狗的事務(wù),hotdogs表示不包含熱狗的事務(wù),hamburgers表示包含漢堡包的事務(wù),hamburgers表示不包含漢堡包的事務(wù),(a)假定挖掘出了關(guān)聯(lián)規(guī)則。給定最小支持度閥值25%,最小置信度閥值50%,該關(guān)聯(lián)規(guī)則是強(qiáng)規(guī)則嗎?(b)根據(jù)給定的數(shù)據(jù),買hotdogs獨(dú)立于買humburgers嗎?如果不是,二者之間存在何種相關(guān)聯(lián)系。推薦閱讀書目:(AssociationRules)R.Agrawal,T.Imielinski,andA.Swami.Miningassociationrulesbetweensetsofitemsinlargedatabases.SIGMOD'93(Max-pattern)R.J.Bayardo.Efficientlymininglongpatternsfromdatabases.SIGMOD'98(Closed-pattern)N.Pasquier,Y.Bastide,R.Taouil,andL.Lakhal.Discoveringfrequentcloseditemsetsforassociationrules.ICDT'99(Sequentialpattern)R.AgrawalandR.Srikant.Miningsequentialpatterns.ICDE'95數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程教案(續(xù)頁)授課時(shí)間第4周授課方式(請打√)√講授□實(shí)驗(yàn)□其它課時(shí)安排4授課題目(章節(jié)或單位課時(shí)):第6章聚類算法6.1聚類的基本思想6.2聚類的主要算法教學(xué)目的與要求(分了解、熟悉、掌握和綜合運(yùn)用四個(gè)層次):1、了解聚類算法的基本思想2、掌握k-means算法、高斯混合模型教學(xué)重點(diǎn)與難點(diǎn):k-means算法、高斯混合模型教學(xué)內(nèi)容備注第6章聚類6.1聚類的基本思想6.2聚類的主要算法6.2.1k-means算法6.2.2高斯混合模型

教案(末頁)復(fù)習(xí)思考題:請解釋決策樹中屬性選擇度量標(biāo)準(zhǔn):信息增益度、信息增益率和基尼指數(shù),并比較各種度量標(biāo)準(zhǔn)的優(yōu)缺點(diǎn)推薦閱讀書目:C.ApteandS.Weiss.Dataminingwithdecisiontreesanddecisionrules.FutureGenerationComputerSystems,13,1997R.O.Duda,P.E.Hart,andD.G.Stork.PatternClassification,2ed.JohnWiley,2001數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程教案(續(xù)頁)授課時(shí)間第5周授課方式(請打√)√講授□實(shí)驗(yàn)□其它課時(shí)安排5授課題目(章節(jié)或單位課時(shí)):第6章聚類算法第7章分類算法7.1算法概述7.2決策樹算法教學(xué)目的與要求(分了解、熟悉、掌握和綜合運(yùn)用四個(gè)層次):掌握劃分方法(patition)、層次方法、基于密度的方法和基于網(wǎng)格的方法。了解聚類算法發(fā)展趨勢3、了解分類的基本思想4、掌握決策樹算法教學(xué)重點(diǎn)與難點(diǎn):劃分方法(patition)、層次方法、基于密度的方法和基于網(wǎng)格的方法。決策樹算法中的信息增益度、信息增益率和基尼指數(shù)教學(xué)內(nèi)容備注6.2.3層次聚類算法6.2.4DBSCAN算法6.2.5網(wǎng)格聚類6.3聚類的研發(fā)歷程第7章分類7.1分類的基本思想7.2分類的主要算法7.2.1決策樹算法及其優(yōu)化

教案(末頁)復(fù)習(xí)思考題:1、下圖已按分類器返回示例為正的概率值的遞減排序。對于每個(gè)示例計(jì)算真正例(TP),假正例(FP)、真負(fù)例(TN)和負(fù)示例(FN)的個(gè)數(shù)。計(jì)算真正例率(TPR)和假正例率(FPR),為該數(shù)據(jù)繪制ROC曲線。元組號(hào)類概率1p0.952n0.853p0.784p0.665n0.606p0.557n0.538n0.529n0.512、如何使用10折交叉驗(yàn)證評估分類器的準(zhǔn)確率推薦閱讀書目:I.H.WittenandE.Frank.DataMining:PracticalMachineLearningToolsandTechniques,2ed.MorganKaufmann,2005[1]袁漢寧,王樹良,程永,金福生,宋紅.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘.北京:人民郵電出版社,2015.[2]王振武.大數(shù)據(jù)挖掘與應(yīng)用.北京:清華大學(xué)出版社,2017.[3]王宏志.大數(shù)據(jù)分析原理與實(shí)踐.北京:機(jī)械工業(yè)出版社,2017數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程教案(續(xù)頁)授課時(shí)間第6周授課方式(請打√)√講授□實(shí)驗(yàn)□其它課時(shí)安排6授課題目(章節(jié)或單位課時(shí)):第7章分類算法7.2分類的主要算法7.3分類的研發(fā)歷程教學(xué)目的與要求(分了解、熟悉、掌握和綜合運(yùn)用四個(gè)層次):1、掌握knn和貝葉斯算法2、掌握分類算法集成、評估3、了解分類算法發(fā)展趨勢教學(xué)重點(diǎn)與難點(diǎn):貝葉斯算法分類算法的集成教學(xué)內(nèi)容備注7.2.2CART算法7.2.3SVM算法7.2.4KNN算法7.2.5樸素貝葉斯算法7.3分類的研發(fā)歷程

教案(末頁)復(fù)習(xí)思考題:1、簡略的介紹如下的聚類算法:劃分方法(patition)、層次方法、基于密度的方法和基于網(wǎng)格的方法。2、按如下標(biāo)準(zhǔn)對DBSCAN聚類算法進(jìn)行描述(1)可以確定的簇的形狀、(2)指定的輸入?yún)?shù)(3)局限性推薦閱讀書目:[1]袁漢寧,王樹良,程永,金福生,宋紅.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘.北京:人民郵電出版社,2015.[2]王振武.大數(shù)據(jù)挖掘與應(yīng)用.北京:清華大學(xué)出版社,2017.[3]王宏志.大數(shù)據(jù)分析原理與實(shí)踐.北京:機(jī)械工業(yè)出版社,2017數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程教案(續(xù)頁)授課時(shí)間第7周授課方式(請打√)□講授√實(shí)驗(yàn)□其它課時(shí)安排7授課題目(章節(jié)或單位課時(shí)):數(shù)據(jù)探索與預(yù)處理實(shí)踐教學(xué)目的與要求(分了解、熟悉、掌握和綜合運(yùn)用四個(gè)層次):1、掌握劃數(shù)據(jù)探索與預(yù)處理實(shí)踐方法。教學(xué)重點(diǎn)與難點(diǎn):數(shù)據(jù)探索方式的選擇教學(xué)內(nèi)容備注第12章 典型應(yīng)用12.1 客戶流失預(yù)測12.1.1業(yè)務(wù)理解12.1.2數(shù)據(jù)理解12.1.3數(shù)據(jù)準(zhǔn)備12.1.4構(gòu)建模型12.1.5評估模型12.1.6結(jié)果部署

教案(末頁)復(fù)習(xí)思考題:1如何根據(jù)數(shù)據(jù)具體情況選擇合適的探索與可視化方法?推薦閱讀書目:實(shí)驗(yàn)指導(dǎo)書[1]袁漢寧,王樹良,程永,金福生,宋紅.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘.北京:人民郵電出版社,2015.[2]王振武.大數(shù)據(jù)挖掘與應(yīng)用.北京:清華大學(xué)出版社,2017.[3]王宏志.大數(shù)據(jù)分析原理與實(shí)踐.北京:機(jī)械工業(yè)出版社,2017數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程教案(續(xù)頁)授課時(shí)間第8周授課方式(請打√)□講授√實(shí)驗(yàn)□其它課時(shí)安排8授課題目(章節(jié)或單位課時(shí)):數(shù)據(jù)挖掘?qū)嵺`教學(xué)目的與要求(分了解、熟悉、掌握和綜合運(yùn)用四個(gè)層次):1、掌握數(shù)據(jù)挖掘?qū)嵺`方法。教學(xué)重點(diǎn)與難點(diǎn):數(shù)據(jù)挖掘方法的選擇教學(xué)內(nèi)容備注第12章 典型應(yīng)用12.2 客戶穩(wěn)定度評估12.2.1業(yè)務(wù)理解12.2.2數(shù)據(jù)理解12.2.3數(shù)據(jù)準(zhǔn)備12.2.4構(gòu)建模型12.2.5評估模型12.2.6結(jié)果部署

教案(末頁)復(fù)習(xí)思考題:1如何根據(jù)數(shù)據(jù)具體情況選擇合適的數(shù)據(jù)挖掘方法?推薦閱讀書目:實(shí)驗(yàn)指導(dǎo)書[1]袁漢寧,王樹良,程永,金福生,宋紅.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘.北京:人民郵電出版社,2015.[2]王振武.大數(shù)據(jù)挖掘與應(yīng)用.北京:清華大學(xué)出版社,2017.[3]王宏志.大數(shù)據(jù)分析原理與實(shí)踐.北京:機(jī)械工業(yè)出版社,2017教案(末頁)復(fù)習(xí)思考題:1如何根據(jù)數(shù)據(jù)具體情況選擇合適的數(shù)據(jù)挖掘方法?推薦閱讀書目:實(shí)驗(yàn)指導(dǎo)書[1]袁漢寧,王樹良,程永,金福生,宋紅.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘.北京:人民郵電出版社,2015.[2]王振武.大數(shù)據(jù)挖掘與應(yīng)用.北京:清華大學(xué)出版社,2017.[3]王宏志.大數(shù)據(jù)分析原理與實(shí)踐.北京:機(jī)械工業(yè)出版社,2017大作業(yè)的選題://(1)城市人口可視化模塊可以利用人口數(shù)據(jù)設(shè)計(jì)并實(shí)現(xiàn)人口可視化模塊,通過可視化方式和相關(guān)分析方法直觀展示人口發(fā)展現(xiàn)狀及規(guī)律??梢暬ㄗh軟件:echart,D3.數(shù)據(jù)鏈接:/datasets/105/datasets/91/datasets/68/datasets/36/datasets/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論