版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
PAGEPAGE2第1頁教案案首(總第1號)授課時間第周周(年月日)第節(jié)至第周周(年月日)第節(jié)授課地點(diǎn)授課學(xué)時2項(xiàng)目/任務(wù)簡介項(xiàng)目/任務(wù)名稱任務(wù)1-1數(shù)據(jù)項(xiàng)目/任務(wù)目標(biāo)知識目標(biāo)能力目標(biāo)掌握數(shù)據(jù)的概念級分類能夠運(yùn)用數(shù)據(jù)思維分析案例項(xiàng)目/任務(wù)分析數(shù)據(jù)的概念、數(shù)據(jù)的類型、數(shù)據(jù)的生命周期、數(shù)據(jù)戰(zhàn)略理論教學(xué)內(nèi)容與方法講解舉例分析實(shí)踐教學(xué)內(nèi)容與方法研討分析教學(xué)內(nèi)容與時間安排【組織教學(xué)】(2分鐘)【導(dǎo)入新課】(5分鐘)【講授新課】(50分鐘)【課堂練習(xí)】(15分鐘)【講解練習(xí)】(7分鐘)【布置作業(yè)】(1分鐘)參考資料《大數(shù)據(jù)基礎(chǔ)》中國人民大學(xué)出版社教學(xué)過程(附教案紙3頁)PAGEPAGE2第1頁【組織教學(xué)】(2分鐘)查點(diǎn)人數(shù),填寫學(xué)生考勤表【導(dǎo)入新課】(5分鐘)你認(rèn)為什么是數(shù)據(jù)?【講授新課】(50分鐘)一、數(shù)據(jù)的概念數(shù)據(jù)(data)是指對客觀事件進(jìn)行記錄并可以鑒別的符號,是對客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進(jìn)行記載的物理符號或這些物理符號的組合。對數(shù)據(jù)的含義的理解要把握以下幾點(diǎn):第一,數(shù)據(jù)是可識別的、抽象的符號。第二,數(shù)據(jù)和信息是不可分離的,數(shù)據(jù)是信息的表達(dá),信息是數(shù)據(jù)的內(nèi)涵。數(shù)據(jù)本身沒有意義,數(shù)據(jù)只有對實(shí)體行為產(chǎn)生影響時才成為信息。因此,數(shù)據(jù)是信息的表現(xiàn)形式和載體,可以是符號、文字、數(shù)字、語音、圖像、視頻等。第三,數(shù)據(jù)可以是連續(xù)的值,如聲音、圖像,稱為模擬數(shù)據(jù);也可以是離散的值,如符號、文字,稱為數(shù)字?jǐn)?shù)據(jù)。第四,在計(jì)算機(jī)系統(tǒng)中,各種字母、數(shù)字符號的組合、語音、圖形、圖像等統(tǒng)稱為數(shù)據(jù),數(shù)據(jù)經(jīng)過加工后就成為信息。在計(jì)算機(jī)系統(tǒng)中,數(shù)據(jù)是指所有能輸入計(jì)算機(jī)并被計(jì)算機(jī)程序處理的符號的介質(zhì)的總稱,是用于輸入電子計(jì)算機(jī)進(jìn)行處理,具有一定意義的數(shù)字、字母、符號和模擬量等的通稱。二、數(shù)據(jù)的類型(一)按性質(zhì)分?jǐn)?shù)據(jù)按性質(zhì)分為以下幾類:(1)定位數(shù)據(jù),如各種坐標(biāo)數(shù)據(jù);(2)定性數(shù)據(jù),如表示事物屬性的數(shù)據(jù)(居民地、河流、道路等);(3)定量數(shù)據(jù),反映事物數(shù)量特征的數(shù)據(jù),如長度、面積、體積等幾何量或重量、速度等物理量;(4)定時數(shù)據(jù),反映事物時間特性的數(shù)據(jù),如年、月、日、時、分、秒等。(二)按表現(xiàn)形式分?jǐn)?shù)據(jù)按表現(xiàn)形式分為以下幾類:(1)數(shù)字?jǐn)?shù)據(jù),如各種統(tǒng)計(jì)或測量數(shù)據(jù);(2)模擬數(shù)據(jù),由連續(xù)函數(shù)組成,是指在某個區(qū)間連續(xù)變化的物理量,又可以分為圖形數(shù)據(jù)(如點(diǎn)、線、面)、符號數(shù)據(jù)、文字?jǐn)?shù)據(jù)和圖像數(shù)據(jù)等,如聲音的大小和溫度的變化等。(三)按記錄方式分?jǐn)?shù)據(jù)按記錄方式分為地圖、表格、影像、磁帶、紙帶等。(四)按數(shù)字化方式分?jǐn)?shù)據(jù)按數(shù)字化方式分為矢量數(shù)據(jù)、格網(wǎng)數(shù)據(jù)等。三、數(shù)據(jù)生命周期數(shù)據(jù)生命周期指的是數(shù)據(jù)從創(chuàng)建到銷毀的整個過程,通常根據(jù)指定的策略將數(shù)據(jù)組織成各個不同的層,并基于那些關(guān)鍵條件自動地將數(shù)據(jù)從一個層移動到另一個層。作為一項(xiàng)規(guī)則,較新的數(shù)據(jù)和那些很可能被更加頻繁訪問的數(shù)據(jù),應(yīng)該存儲在更快的,并且更昂貴的存儲媒介上,而那些不是很重要的數(shù)據(jù)則存儲在比較便宜的、稍微慢些的媒介上?;诖髷?shù)據(jù)環(huán)境下數(shù)據(jù)在組織機(jī)構(gòu)業(yè)務(wù)中的流轉(zhuǎn)情況,我們定義了數(shù)據(jù)生命周期的6個階段,具體各階段的定義如下:(1)數(shù)據(jù)采集:指新的數(shù)據(jù)產(chǎn)生或現(xiàn)有數(shù)據(jù)內(nèi)容發(fā)生顯著改變或更新的階段。對于組織機(jī)構(gòu)而言,數(shù)據(jù)的采集既包含在組織機(jī)構(gòu)內(nèi)部系統(tǒng)中生成的數(shù)據(jù),也包含組織機(jī)構(gòu)從外部采集的數(shù)據(jù)。(2)數(shù)據(jù)存儲:指非動態(tài)數(shù)據(jù)以任何數(shù)字格式進(jìn)行物理存儲的階段。(3)數(shù)據(jù)處理:指組織機(jī)構(gòu)在內(nèi)部針對動態(tài)數(shù)據(jù)進(jìn)行的一系列活動的組合。(4)數(shù)據(jù)傳輸:指數(shù)據(jù)在組織機(jī)構(gòu)內(nèi)部從一個實(shí)體通過網(wǎng)絡(luò)流動到另一個實(shí)體的過程。(5)數(shù)據(jù)交換:指數(shù)據(jù)經(jīng)由組織機(jī)構(gòu)內(nèi)部與外部組織機(jī)構(gòu)及個人交互過程中提供數(shù)據(jù)的階段。(6)數(shù)據(jù)銷毀:指對數(shù)據(jù)及數(shù)據(jù)的存儲介質(zhì)通過相應(yīng)的操作手段,使數(shù)據(jù)徹底丟失且無法通過任何手段恢復(fù)的過程。特定的數(shù)據(jù)所經(jīng)歷的生命周期由實(shí)際的業(yè)務(wù)場景所決定,并非所有的數(shù)據(jù)都會完整地經(jīng)歷6個階段。四、數(shù)據(jù)戰(zhàn)略隨著數(shù)字經(jīng)濟(jì)在全球加速推進(jìn)以及5G、人工智能、物聯(lián)網(wǎng)等相關(guān)技術(shù)的快速發(fā)展,數(shù)據(jù)已成為影響全球競爭的關(guān)鍵戰(zhàn)略性資源。我們只有獲取和掌握更多的數(shù)據(jù)資源,才能在新一輪的全球話語權(quán)競爭中占據(jù)主導(dǎo)地位。目前,全球數(shù)據(jù)量在飛速增長,各國數(shù)據(jù)戰(zhàn)略布局步伐加快。(一)美國聯(lián)邦數(shù)據(jù)戰(zhàn)略焦點(diǎn)從“技術(shù)”轉(zhuǎn)移到“資源”(二)歐盟數(shù)據(jù)戰(zhàn)略致力于發(fā)展數(shù)據(jù)敏捷型經(jīng)濟(jì)體(三)英國通過數(shù)據(jù)戰(zhàn)略助力經(jīng)濟(jì)復(fù)蘇(四)我國政府高度重視大數(shù)據(jù)的發(fā)展【課堂練習(xí)】(15分鐘)課后習(xí)題【講解練習(xí)】(7分鐘)教師核對答案,并對練習(xí)中出現(xiàn)的問題進(jìn)行講解【布置作業(yè)】(1分鐘)1、復(fù)習(xí)鞏固本節(jié)內(nèi)容2、預(yù)習(xí)下節(jié)內(nèi)容考勤討論分析做練習(xí)記錄教案案首(總第2號)授課時間第周周(年月日)第節(jié)至第周周(年月日)第節(jié)授課地點(diǎn)授課學(xué)時2項(xiàng)目/任務(wù)簡介項(xiàng)目/任務(wù)名稱任務(wù)1-2大數(shù)據(jù)項(xiàng)目/任務(wù)目標(biāo)知識目標(biāo)能力目標(biāo)了解大數(shù)據(jù)的概念掌握大數(shù)據(jù)思維的特征規(guī)模級特征能夠掌握大數(shù)據(jù)的發(fā)展趨勢,掌握大數(shù)據(jù)分析項(xiàng)目/任務(wù)分析大數(shù)據(jù)的概念;大數(shù)據(jù)的規(guī)模;大數(shù)據(jù)的特征:數(shù)據(jù)量大、類型繁多、價(jià)值密度低、高速性大數(shù)據(jù)的內(nèi)涵理解;大數(shù)據(jù)分析理論教學(xué)內(nèi)容與方法講解舉例分析實(shí)踐教學(xué)內(nèi)容與方法研討分析教學(xué)內(nèi)容與時間安排【組織教學(xué)】(2分鐘)【導(dǎo)入新課】(5分鐘)【講授新課】(50分鐘)【課堂練習(xí)】(15分鐘)【講解練習(xí)】(7分鐘)【布置作業(yè)】(1分鐘)參考資料《大數(shù)據(jù)基礎(chǔ)》中國人民大學(xué)出版社教學(xué)過程(附教案紙3頁)PAGEPAGE2第1頁【組織教學(xué)】(2分鐘)查點(diǎn)人數(shù),填寫學(xué)生考勤表【復(fù)習(xí)舊課】(5分鐘)大數(shù)據(jù)思維的核心原理?【講授新課】(50分鐘)一、大數(shù)據(jù)的概念“大數(shù)據(jù)”概念最早出現(xiàn)在1980年,由著名的未來學(xué)家阿爾文·托夫勒(AlvinToff-ler)在其著作《第三次浪潮》中提出。2009年,美國互聯(lián)網(wǎng)數(shù)據(jù)中心證實(shí)大數(shù)據(jù)時代的來臨,而在今天,我們已經(jīng)能充分感受到大數(shù)據(jù)的魅力和影響力。許多人看到“大數(shù)據(jù)”一詞,會先入為主地認(rèn)為大數(shù)據(jù)就是“大量數(shù)據(jù)”或者“強(qiáng)大的數(shù)據(jù)”。其實(shí)并非這樣,“大”意為:“有用的”“實(shí)用的”“有價(jià)值的”。關(guān)于大數(shù)據(jù)的確切定義,不同組織從不同角度給出了不同的定義。全球領(lǐng)先的管理咨詢公司麥肯錫給出的大數(shù)據(jù)定義是:“一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價(jià)值密度低四大特征?!敝芯繖C(jī)構(gòu)高德納咨詢公司(Gartner)給出的定義是:“大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。”全球最大的互聯(lián)網(wǎng)數(shù)據(jù)中心(InternetDataCenter,IDC)則側(cè)重從技術(shù)角度說明其概念:“大數(shù)據(jù)處理技術(shù)代表了新一代的技術(shù)架構(gòu),這種架構(gòu)通過高速獲取數(shù)據(jù)并對其進(jìn)行分析和挖掘,從海量且形式各異的數(shù)據(jù)源中更有效地抽取出富含價(jià)值的信息?!本C合各種觀點(diǎn)給出大數(shù)據(jù)的定義:大數(shù)據(jù)(BigData)是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。二、大數(shù)據(jù),到底有多大我們傳統(tǒng)的個人電腦處理的數(shù)據(jù)是GB/TB級別。例如,我們的硬盤現(xiàn)在通常是1TB/2TB/4TB的容量。TB、GB、MB、KB的關(guān)系,大家應(yīng)該都很熟悉了:1KB(KB-kilobyte)=1024B1MB(MB-megabyte)=1024KB1GB(GB-gigabyte)=1024MB1TB(TB-terabyte)=1024GB而大數(shù)據(jù)是什么級別呢?PB或EB級別。大部分人都沒聽過這兩個級別,其實(shí)也就是繼續(xù)翻1024倍:1PB(PB-petabyte)=1024TB1EB(EB-exabyte)=1024PB只是看這幾個字母的話,貌似不是很直觀。舉例說明:1TB,只需要一塊硬盤就可以存儲,容量大約是20萬張照片或20萬首MP3音樂,或者是631903部《紅樓夢》小說三、大數(shù)據(jù)的特征目前來說,關(guān)于大數(shù)據(jù)的特征還存在一定的爭議。業(yè)界通常用4個V,即數(shù)據(jù)量大 (volume)、類型繁多(variety)、價(jià)值密度低(value)和高速性(velocity)來概括大數(shù)據(jù)的特征。1.?dāng)?shù)據(jù)量大大數(shù)據(jù)的特征首先體現(xiàn)為“大”,非結(jié)構(gòu)化數(shù)據(jù)的超大規(guī)模增長導(dǎo)致數(shù)據(jù)集合的規(guī)模不斷擴(kuò)大,數(shù)據(jù)單位已經(jīng)從GB級到TB級再到PB級,甚至開始以EB級和ZB級來計(jì)數(shù)。只有數(shù)據(jù)體量達(dá)到PB級別以上,才能被稱為大數(shù)據(jù)。1PB等于1024TB,1TB等于1024G,那么1PB等于1024×1024個G的數(shù)據(jù)。隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)開始爆發(fā)性增長。社交網(wǎng)絡(luò)(微博、推特、臉書)、移動網(wǎng)絡(luò)、各種智能工具、服務(wù)工具等,都成為數(shù)據(jù)的來源。淘寶網(wǎng)近4億的會員每天產(chǎn)生的商品交易數(shù)據(jù)約20TB;臉書約10億的用戶每天產(chǎn)生的日志數(shù)據(jù)超過300TB。因此,人們迫切需要智能的算法、強(qiáng)大的數(shù)據(jù)處理平臺和新的數(shù)據(jù)處理技術(shù),來統(tǒng)計(jì)、分析、預(yù)測和實(shí)時處理如此大規(guī)模的數(shù)據(jù)。2.類型繁多如果只有單一的數(shù)據(jù),那么這些數(shù)據(jù)就沒有了價(jià)值,比如只有單一的個人數(shù)據(jù),或者單一的用戶提交數(shù)據(jù),這些數(shù)據(jù)還不能稱為大數(shù)據(jù)。廣泛的數(shù)據(jù)來源,決定了大數(shù)據(jù)形式的多樣性。比如當(dāng)前的上網(wǎng)用戶中,年齡、學(xué)歷、愛好、性格等每個人的特征都不一樣,這個也就是大數(shù)據(jù)的多樣性。當(dāng)然,如果擴(kuò)展到全國,那么數(shù)據(jù)的多樣性會更強(qiáng),每個地區(qū)、每個時間段,都會存在各種各樣的數(shù)據(jù)。任何形式的數(shù)據(jù)都可以產(chǎn)生作用,目前應(yīng)用最廣泛的就是推薦系統(tǒng),如淘寶、網(wǎng)易云音樂、今日頭條等,這些平臺都會通過對用戶的日志數(shù)據(jù)進(jìn)行分析,從而進(jìn)一步向用戶推薦其喜歡的東西。日志數(shù)據(jù)是結(jié)構(gòu)化明顯的數(shù)據(jù),還有一些數(shù)據(jù)結(jié)構(gòu)化不明顯,如圖片、音頻、視頻等,這些數(shù)據(jù)因果關(guān)系弱,就需要人工對其進(jìn)行標(biāo)注。3.價(jià)值密度低這也是大數(shù)據(jù)的核心特征?,F(xiàn)實(shí)世界所產(chǎn)生的數(shù)據(jù)中,有價(jià)值的數(shù)據(jù)所占比例很小。相比于傳統(tǒng)的小數(shù)據(jù),大數(shù)據(jù)最大的價(jià)值在于通過從大量不相關(guān)的各種類型的數(shù)據(jù)中,挖掘出對未來趨勢與模式預(yù)測分析有價(jià)值的數(shù)據(jù),并通過機(jī)器學(xué)習(xí)方法、人工智能方法或數(shù)據(jù)挖掘方法深度分析,發(fā)現(xiàn)新規(guī)律和新知識。如果你有1PB以上的全國所有20~35歲年輕人的上網(wǎng)數(shù)據(jù),那么它自然就有了商業(yè)價(jià)值,比如通過分析這些數(shù)據(jù),我們就能知道這些人的愛好,進(jìn)而指導(dǎo)產(chǎn)品的發(fā)展方向等。如果有了全國幾百萬病人的數(shù)據(jù),根據(jù)這些數(shù)據(jù)進(jìn)行分析就能預(yù)測疾病的發(fā)生。這些都是大數(shù)據(jù)的價(jià)值。大數(shù)據(jù)運(yùn)用廣泛,如運(yùn)用于農(nóng)業(yè)、金融、醫(yī)療等各個領(lǐng)域,從而最終達(dá)到改善社會治理、提高生產(chǎn)效率、推進(jìn)科學(xué)研究的效果。4.高速性高速性就是指對數(shù)據(jù)的邏輯處理速度非常快,可從各種類型的數(shù)據(jù)中快速獲得高價(jià)值的信息,這一點(diǎn)和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。大數(shù)據(jù)的產(chǎn)生非常迅速,主要通過互聯(lián)網(wǎng)傳輸。生活中,每個人都離不開互聯(lián)網(wǎng),也就是說每個人每天都在向大數(shù)據(jù)提供大量的資料。另外,這些數(shù)據(jù)是需要及時處理的,因?yàn)榛ㄙM(fèi)大量資本去存儲作用較小的歷史數(shù)據(jù)是非常不劃算的,對于一個平臺而言,也許保存的數(shù)據(jù)只有過去幾天或一個月之內(nèi)產(chǎn)生的,再久遠(yuǎn)的數(shù)據(jù)就要及時清理,不然代價(jià)太大?;谶@種情況,大數(shù)據(jù)對處理速度有非常嚴(yán)格的要求,服務(wù)器中大量的資源都用于處理和計(jì)算數(shù)據(jù),很多平臺都需要做到實(shí)時分析。數(shù)據(jù)無時無刻不在產(chǎn)生,誰的速度更快,誰就有優(yōu)勢。隨著大數(shù)據(jù)繼續(xù)滲透到我們的日常生活中,圍繞大數(shù)據(jù)的研究正在轉(zhuǎn)向?qū)嶋H使用中的真正價(jià)值。四、大數(shù)據(jù)的內(nèi)涵理解大數(shù)據(jù)是一門技術(shù),也是一種全新的商業(yè)模式,代表著一種思維方式。它是大規(guī)模數(shù)據(jù)的集合體,更是數(shù)據(jù)對象、集成技術(shù)、分析應(yīng)用、商業(yè)模式、思維創(chuàng)新的統(tǒng)一體。1.從對象角度來看,大數(shù)據(jù)是數(shù)據(jù)規(guī)模超出傳統(tǒng)數(shù)據(jù)庫處理能力的數(shù)據(jù)集合大數(shù)據(jù)對象既可能是實(shí)際的、有限的數(shù)據(jù)集合,也可能是虛擬的、無限的數(shù)據(jù)集合。目前,數(shù)據(jù)的發(fā)展演進(jìn)已由數(shù)據(jù)庫時代走向大數(shù)據(jù)時代,數(shù)據(jù)量處于TB級,乃至PB級,甚至更高。但是,大數(shù)據(jù)并非大量數(shù)據(jù)簡單、無意義的堆積,而是在數(shù)據(jù)之間存在或遠(yuǎn)或近、或直接或間接的關(guān)聯(lián)性,具有分析挖掘的價(jià)值,并且數(shù)據(jù)集中儲存和計(jì)算已經(jīng)達(dá)到傳統(tǒng)數(shù)據(jù)庫軟件無法處理的巨大數(shù)據(jù)量,具有非結(jié)構(gòu)化數(shù)據(jù)無固定格式、變化多、并發(fā)高、增長速度快等特性。傳統(tǒng)數(shù)據(jù)庫研究講究因果關(guān)系,強(qiáng)調(diào)的是數(shù)據(jù)精確性,而大數(shù)據(jù)研究則側(cè)重于相關(guān)性,強(qiáng)調(diào)挖掘不同事物間的相關(guān)性,并以此作為各類判斷的依據(jù)。此外,大數(shù)據(jù)使運(yùn)算更依賴于數(shù)據(jù)而不是算法,較多的數(shù)據(jù)對結(jié)果的影響要好于一般統(tǒng)計(jì)數(shù)據(jù)。2.從技術(shù)角度來看,大數(shù)據(jù)是從海量數(shù)據(jù)中快速獲得有價(jià)值信息的技術(shù)大數(shù)據(jù)技術(shù)涉及數(shù)據(jù)采集、存儲、管理、分析挖掘、可視化等技術(shù)及其集成。該技術(shù)可以從凌亂紛繁的數(shù)據(jù)背后找到更符合用戶興趣和習(xí)慣的產(chǎn)品和服務(wù),并對產(chǎn)品和服務(wù)進(jìn)行針對性的調(diào)整和優(yōu)化。傳統(tǒng)數(shù)據(jù)庫軟件在應(yīng)對大數(shù)據(jù)多樣化格式上較為吃力,其存儲、計(jì)算也難以獲得滿意效果,因此并不適用于大數(shù)據(jù)分析,需要革新性的大數(shù)據(jù)技術(shù)來解決這些問題?,F(xiàn)在常用的大數(shù)據(jù)技術(shù)包括:批量分布式并行計(jì)算Hadoop技術(shù)、實(shí)時分布式高吞吐高并發(fā)數(shù)據(jù)存取處理NoSQL技術(shù)、利用廉價(jià)服務(wù)器搭建高容錯性并行計(jì)算架構(gòu)技術(shù)等,涉及數(shù)據(jù)聚類、數(shù)據(jù)挖掘、分布式處理各領(lǐng)域。3.從應(yīng)用角度來看,大數(shù)據(jù)是對特定數(shù)據(jù)集合應(yīng)用相關(guān)技術(shù)獲得價(jià)值的行為大數(shù)據(jù)有著旺盛的應(yīng)用需求和廣闊的使用前景,該技術(shù)可以釋放商業(yè)價(jià)值,使數(shù)據(jù)更加透明,具有極強(qiáng)的行業(yè)應(yīng)用需求特性。通過數(shù)據(jù)分析,企業(yè)能夠了解不同市場之間的關(guān)聯(lián),發(fā)現(xiàn)新的產(chǎn)品和服務(wù)。企業(yè)可以將大數(shù)據(jù)分析技術(shù)用于在市場或行業(yè)內(nèi)創(chuàng)造競爭優(yōu)勢,開拓新的商業(yè)機(jī)會。正因?yàn)榕c具體應(yīng)用緊密聯(lián)系,甚至是一對一的聯(lián)系,“應(yīng)用”才成為大數(shù)據(jù)不可或缺的內(nèi)涵之一。4.從商業(yè)模式角度來看,大數(shù)據(jù)是企業(yè)獲得商業(yè)價(jià)值的業(yè)務(wù)創(chuàng)新方向大數(shù)據(jù)資源與技術(shù)的工具化運(yùn)用,推動大數(shù)據(jù)產(chǎn)業(yè)鏈形成,以大數(shù)據(jù)為中心的擴(kuò)張引發(fā)行業(yè)的跨界與融合。大數(shù)據(jù)使得企業(yè)在價(jià)值主張、關(guān)鍵業(yè)務(wù)與流程、收益模式等方面發(fā)生轉(zhuǎn)變,向著全數(shù)據(jù)模式演進(jìn),以利用數(shù)據(jù)價(jià)值為核心,新型商業(yè)模式不斷涌現(xiàn)。企業(yè)在制定大數(shù)據(jù)業(yè)務(wù)戰(zhàn)略時,需要分析自身業(yè)務(wù)基礎(chǔ)和數(shù)據(jù)能力,選擇適合的大數(shù)據(jù)商業(yè)模式。根據(jù)彭博創(chuàng)投(BloombergVenture)發(fā)布的大數(shù)據(jù)產(chǎn)業(yè)地圖2.0版本,大數(shù)據(jù)產(chǎn)業(yè)可劃分為6大類,共38種產(chǎn)品/商業(yè)模式,分別是大數(shù)據(jù)基礎(chǔ)設(shè)施類、大數(shù)據(jù)分析類、大數(shù)據(jù)應(yīng)用類、大數(shù)據(jù)數(shù)據(jù)源類、跨基礎(chǔ)設(shè)施分析、開源項(xiàng)目。5.從思維方式來看,大數(shù)據(jù)是從第三范式中分離出來的一種科研范式科學(xué)研究的第一范式是實(shí)驗(yàn)歸納,第二范式是模型推演,第三范式是計(jì)算機(jī)仿真模擬,第四范式是密集數(shù)據(jù)分析。圖靈獎獲得者吉姆·格雷(JimGray)基于e-Science的思路提出:大數(shù)據(jù)是科學(xué)研究的第四范式,即以大數(shù)據(jù)為基礎(chǔ)的數(shù)據(jù)密集型科研。之所以將大數(shù)據(jù)科研從第三范式中分離出來,是因?yàn)槠溲芯糠绞讲煌诨跀?shù)學(xué)模型的傳統(tǒng)研究方式。PB級數(shù)據(jù)使得人們可以做到?jīng)]有模型和假設(shè)就分析數(shù)據(jù)。將數(shù)據(jù)輸入巨大的計(jì)算機(jī)機(jī)群中,只要有相互關(guān)系的數(shù)據(jù),統(tǒng)計(jì)分析算法就可以發(fā)現(xiàn)傳統(tǒng)科學(xué)方法發(fā)現(xiàn)不了的新模式、新知識,甚至新規(guī)律??蒲械谒姆妒讲粌H是科研方式的轉(zhuǎn)變,也是人們思維方式的大變化。五、大數(shù)據(jù)分析大數(shù)據(jù),表面上看就是大量復(fù)雜的數(shù)據(jù),這些數(shù)據(jù)本身的價(jià)值并不高,但是對這些大量復(fù)雜的數(shù)據(jù)進(jìn)行分析處理后,卻能從中提煉出很有價(jià)值的信息。對大數(shù)據(jù)的分析,主要分為五個方面:可視化分析(AnalyticVisualization)、數(shù)據(jù)挖掘算法(DateMiningAlgo-rithms)、預(yù)測性分析能力(PredictiveAnalyticCapabilities)、語義引擎(SemanticEn-gines)和數(shù)據(jù)質(zhì)量管理(DataQualityManagement)??梢暬治鍪瞧胀ㄏM(fèi)者常常可以見到的一種大數(shù)據(jù)分析結(jié)果的表現(xiàn)形式,比如說百度制作的“百度地圖春節(jié)人口遷徙大數(shù)據(jù)”就是典型的案例之一??梢暬治鰧⒋罅繌?fù)雜的數(shù)據(jù)自動轉(zhuǎn)化成直觀形象的圖表,使其能夠更加容易地被普通消費(fèi)者所接受和理解。數(shù)據(jù)挖掘算法是大數(shù)據(jù)分析的理論核心,其本質(zhì)是一組根據(jù)算法事先定義好的數(shù)學(xué)公式,將收集到的數(shù)據(jù)作為參數(shù)變量帶入其中,從而能夠從大量復(fù)雜的數(shù)據(jù)中提取到有價(jià)值的信息。著名的“啤酒和尿布”的故事就是數(shù)據(jù)挖掘算法的經(jīng)典案例。沃爾瑪通過對啤酒和尿布購買數(shù)據(jù)的分析,挖掘出以前未知的兩者間的聯(lián)系,并利用這種聯(lián)系,提升了商品的銷量。亞馬遜的推薦引擎和谷歌的廣告系統(tǒng)都大量使用了數(shù)據(jù)挖掘算法。預(yù)測性分析能力是大數(shù)據(jù)分析最重要的應(yīng)用領(lǐng)域。從大量復(fù)雜的數(shù)據(jù)中挖掘出規(guī)律,建立起科學(xué)的事件模型,通過將新的數(shù)據(jù)帶入模型,就可以預(yù)測未來的事件走向。預(yù)測性分析能力常常被應(yīng)用在金融分析和科學(xué)研究領(lǐng)域,用于股票預(yù)測或氣象預(yù)測等。語義引擎是機(jī)器學(xué)習(xí)的成果之一。過去,計(jì)算機(jī)對用戶輸入內(nèi)容的理解僅僅停留在字符階段,不能很好地理解輸入內(nèi)容的意思,因此常常不能準(zhǔn)確地了解用戶的需求。通過對大量復(fù)雜的數(shù)據(jù)進(jìn)行分析,計(jì)算機(jī)從中自我學(xué)習(xí),能夠盡量精確地了解用戶輸入內(nèi)容的意思,從而把握住用戶的需求,提供更好的用戶體驗(yàn)。蘋果的Siri和谷歌的GoogleNow都采用了語義引擎。數(shù)據(jù)質(zhì)量管理是大數(shù)據(jù)在企業(yè)領(lǐng)域的重要應(yīng)用。為了保證大數(shù)據(jù)分析結(jié)果的準(zhǔn)確性,需要將大數(shù)據(jù)中不真實(shí)的數(shù)據(jù)剔除掉,保留最準(zhǔn)確的數(shù)據(jù)。這就需要建立有效的數(shù)據(jù)質(zhì)量管理系統(tǒng),分析收集到的大量復(fù)雜的數(shù)據(jù),挑選出真實(shí)有效的數(shù)據(jù)。【課堂練習(xí)】(15分鐘)課后習(xí)題【講解練習(xí)】(7分鐘)教師核對答案,并對練習(xí)中出現(xiàn)的問題進(jìn)行講解【布置作業(yè)】(1分鐘)1、復(fù)習(xí)鞏固本節(jié)內(nèi)容2、預(yù)習(xí)下節(jié)內(nèi)容考勤思考并回答分析做練習(xí)記錄教案案首(總第3號)授課時間第周周(年月日)第節(jié)至第周周(年月日)第節(jié)授課地點(diǎn)授課學(xué)時2項(xiàng)目/任務(wù)簡介項(xiàng)目/任務(wù)名稱任務(wù)1-3大數(shù)據(jù)時代項(xiàng)目/任務(wù)目標(biāo)知識目標(biāo)能力目標(biāo)掌握大數(shù)據(jù)時代的概念掌握大數(shù)據(jù)時代的大數(shù)據(jù)技術(shù)能夠運(yùn)用大數(shù)據(jù)技術(shù)對案例進(jìn)行分析項(xiàng)目/任務(wù)分析大數(shù)據(jù)時代的概念;大數(shù)據(jù)時代下大數(shù)據(jù)的應(yīng)用方向;大數(shù)據(jù)時代下大數(shù)據(jù)技術(shù);大數(shù)據(jù)時代下大數(shù)據(jù)產(chǎn)業(yè)理論教學(xué)內(nèi)容與方法講解案例分析實(shí)踐教學(xué)內(nèi)容與方法研討分析教學(xué)內(nèi)容與時間安排【組織教學(xué)】(2分鐘)【導(dǎo)入新課】(5分鐘)【講授新課】(50分鐘)【學(xué)生討論】(22分鐘)【布置作業(yè)】(1分鐘)參考資料《大數(shù)據(jù)基礎(chǔ)》中國人民大學(xué)出版社教學(xué)過程(附教案紙3頁)PAGEPAGE2第1頁【組織教學(xué)】(2分鐘)查點(diǎn)人數(shù),填寫學(xué)生考勤表【復(fù)習(xí)舊課】(5分鐘)大數(shù)據(jù)思維的三個維度和特征?【講授新課】(50分鐘)一、大數(shù)據(jù)時代的概念:大數(shù)據(jù)時代是建立在對互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等渠道廣泛、大量數(shù)據(jù)資源收集基礎(chǔ)上的數(shù)據(jù)存儲、價(jià)值提煉、智能處理和分發(fā)的信息時代。二、大數(shù)據(jù)時代下大數(shù)據(jù)的應(yīng)用方向大數(shù)據(jù)成為時代發(fā)展一個必然的產(chǎn)物,大數(shù)據(jù)時代,一切可量化,一切可分析。大數(shù)據(jù)不僅意味著海量、多樣、迅捷的數(shù)據(jù)處理,更是一種顛覆的思維方式、一項(xiàng)智能的基礎(chǔ)設(shè)施、一場創(chuàng)新的技術(shù)變革。物聯(lián)網(wǎng)、智慧城市、增強(qiáng)現(xiàn)實(shí)(AR)與虛擬現(xiàn)實(shí)(VR)、區(qū)塊鏈技術(shù)、語音識別技術(shù)、人工智能(AI)、數(shù)字匯流是大數(shù)據(jù)未來應(yīng)用的七大發(fā)展方向。(一)物聯(lián)網(wǎng)物聯(lián)網(wǎng)是把所有物品通過信息傳感設(shè)備與互聯(lián)網(wǎng)連接起來,進(jìn)行信息交換,即物物相息,以實(shí)現(xiàn)智能化識別和管理。物聯(lián)網(wǎng)是新一代信息技術(shù)的重要組成部分,也是“信息化”時代的重要發(fā)展階段。物聯(lián)網(wǎng)的核心和基礎(chǔ)仍然是互聯(lián)網(wǎng),是在互聯(lián)網(wǎng)基礎(chǔ)上的延伸和擴(kuò)展的網(wǎng)絡(luò);其用戶端延伸和擴(kuò)展到了任何物品與物品之間,進(jìn)行信息交換和通信,也就是物物相息。物聯(lián)網(wǎng)用途廣泛,遍及智能交通、環(huán)境保護(hù)、政府工作、公共安全、平安家居、智能消防、工業(yè)監(jiān)測、環(huán)境監(jiān)測、路燈照明管控、景觀照明管控、樓宇照明管控、廣場照明管控、老人護(hù)理、個人健康、花卉栽培、水系監(jiān)測、食品溯源、敵情偵查和情報(bào)搜集等多個領(lǐng)域。智慧城市智慧城市就是運(yùn)用信息和通信技術(shù)手段感測、分析、整合城市運(yùn)行核心系統(tǒng)的各項(xiàng)關(guān)鍵信息,對包括民生、環(huán)保、公共安全、城市服務(wù)、工商業(yè)活動在內(nèi)的各種需求做出智能響應(yīng)。其實(shí)質(zhì)是利用先進(jìn)的信息技術(shù),實(shí)現(xiàn)城市智慧式管理和運(yùn)行,進(jìn)而為城市中的人創(chuàng)造更美好的生活,促進(jìn)城市的和諧、可持續(xù)成長。這項(xiàng)趨勢的成敗取決于數(shù)據(jù)量是否足夠,這有賴于政府部門與民營企業(yè)的合作。一般來說,智慧城市包括十大智慧體系,分別為:智慧物流體系、智慧制造體系、智慧貿(mào)易體系、智慧能源應(yīng)用體系、智慧公共服務(wù)、智慧會管理體系、智慧交通體系、智慧健康保障體系、智慧安居服務(wù)體系、智慧文化服務(wù)體系。(三)增強(qiáng)現(xiàn)實(shí)(AR)與虛擬現(xiàn)實(shí)(VR)增強(qiáng)現(xiàn)實(shí)(AugmentedReality,AR)技術(shù)是一種實(shí)時地計(jì)算攝影機(jī)影像的位置及角度并加上相應(yīng)圖像、視頻、3D模型的技術(shù),這種技術(shù)的目標(biāo)是在屏幕上把虛擬世界套在現(xiàn)實(shí)世界并進(jìn)行互動。AR技術(shù)應(yīng)用領(lǐng)域非常廣泛,諸如尖端武器和飛行器的研制與開發(fā)、數(shù)據(jù)模型的可視化、虛擬訓(xùn)練、娛樂與藝術(shù)等領(lǐng)域。AR技術(shù)由于具有能夠?qū)φ鎸?shí)環(huán)境進(jìn)行增強(qiáng)顯示輸出的特性,因此在醫(yī)療研究與解剖訓(xùn)練、精密儀器制造和維修、軍用飛機(jī)導(dǎo)航、工程設(shè)計(jì)和遠(yuǎn)程機(jī)器人控制等領(lǐng)域,具有比VR技術(shù)更加明顯的優(yōu)勢。隨著隨身電子產(chǎn)品CPU運(yùn)算能力的提升,增強(qiáng)現(xiàn)實(shí)的用途將會越來越廣。虛擬現(xiàn)實(shí)(VirtualReality,VR)技術(shù)是一種能夠創(chuàng)建和體驗(yàn)虛擬世界的計(jì)算機(jī)仿真技術(shù),它利用計(jì)算機(jī)生成一種交互式的三維動態(tài)視景,其實(shí)體行為的仿真系統(tǒng)能夠使用戶沉浸到該環(huán)境中。虛擬現(xiàn)實(shí)技術(shù)是一種可以創(chuàng)建和體驗(yàn)虛擬世界的計(jì)算機(jī)仿真系統(tǒng),它利用計(jì)算機(jī)生成一種模擬環(huán)境,是一種多源信息融合的、交互式的三維動態(tài)視景和實(shí)體行為的仿真系統(tǒng),能夠使用戶沉浸到該環(huán)境中。(四)區(qū)塊鏈技術(shù)區(qū)塊鏈技術(shù)(BlockchainTechnology,BT),也被稱為分布式賬本技術(shù),是一種互聯(lián)網(wǎng)數(shù)據(jù)庫技術(shù),其特點(diǎn)是去中心化、公開透明,讓每個人均可參與數(shù)據(jù)庫記錄。區(qū)塊鏈技術(shù)是一種全民參與記賬的方式。所有的系統(tǒng)背后都有一個數(shù)據(jù)庫,用戶可以把數(shù)據(jù)庫看成一個大賬本。區(qū)塊鏈有很多不同的應(yīng)用方式,最常見的應(yīng)用是比特幣跟其他加密貨幣的交易。(五)語音識別技術(shù)語音識別技術(shù)就是讓機(jī)器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。與機(jī)器進(jìn)行語音交流,讓機(jī)器明白你說什么,這是人們長期以來夢寐以求的事情。中國物聯(lián)網(wǎng)校企聯(lián)盟形象地把語音識別比作為“機(jī)器的聽覺系統(tǒng)”。語音識別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個方面。語音識別在移動終端上的應(yīng)用最為火熱,語音對話機(jī)器人、語音助手、互動工具等層出不窮。預(yù)計(jì)未來10年內(nèi),語音識別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個領(lǐng)域。(六)人工智能(AI)人工智能(ArtificialIntelligence,AI)是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個分支,它試圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器。該領(lǐng)域的研究包括機(jī)器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。(七)數(shù)字匯流數(shù)字匯流是對未來沖擊最大的一項(xiàng)趨勢,就是將上述六項(xiàng)趨勢合并起來的效果。例如,84億個物聯(lián)網(wǎng)設(shè)備可用區(qū)塊鏈技術(shù)加強(qiáng)安全性;智慧城市通過物聯(lián)網(wǎng)就能產(chǎn)生海量數(shù)據(jù),這些數(shù)據(jù)需要由人工智能進(jìn)行分析;虛擬現(xiàn)實(shí)和語音識別也需要通過人工智能不斷學(xué)習(xí)。這些科技發(fā)展息息相關(guān)、相輔相成,所以數(shù)字匯流是最重要的趨勢。三、大數(shù)據(jù)時代下大數(shù)據(jù)技術(shù)大數(shù)據(jù)技術(shù)的內(nèi)涵伴隨著大數(shù)據(jù)時代的發(fā)展產(chǎn)生了一定的演進(jìn)和拓展,從基本的面向海量數(shù)據(jù)的存儲、處理、分析等需求的核心技術(shù)延展到相關(guān)的管理、流通、安全等其他需求的周邊技術(shù),逐漸形成了一整套大數(shù)據(jù)技術(shù)體系,成為數(shù)據(jù)能力建設(shè)的基礎(chǔ)設(shè)施。伴隨著技術(shù)體系的完善,大數(shù)據(jù)技術(shù)開始向著降低成本、增強(qiáng)安全的方向發(fā)展。(一)大數(shù)據(jù)基礎(chǔ)技術(shù)大數(shù)據(jù)基礎(chǔ)技術(shù)為應(yīng)對大數(shù)據(jù)時代的多種數(shù)據(jù)特征而產(chǎn)生。在大數(shù)據(jù)時代,數(shù)據(jù)量大、數(shù)據(jù)源異構(gòu)多樣、數(shù)據(jù)實(shí)效性高等特征催生了高效完成海量異構(gòu)數(shù)據(jù)存儲與計(jì)算的技術(shù)需求。在這樣的需求下,面對迅速而龐大的數(shù)據(jù)量,傳統(tǒng)關(guān)系型數(shù)據(jù)庫單機(jī)的存儲及計(jì)算性能有限,出現(xiàn)了規(guī)模并行化處理(MassivelyParallelProcessing,MPP)的分布式計(jì)算架構(gòu);面向海量網(wǎng)頁內(nèi)容及日志等非結(jié)構(gòu)化數(shù)據(jù),出現(xiàn)了基于ApacheHadoop和Spark生態(tài)體系的分布式批處理計(jì)算框架;面向?qū)r效性數(shù)據(jù)進(jìn)行實(shí)時計(jì)算反饋的需求,出現(xiàn)了ApacheStorm、Flink和SparkStreaming等分布式數(shù)據(jù)流處理計(jì)算框架。(二)數(shù)據(jù)管理類技術(shù)數(shù)據(jù)管理類技術(shù)提升數(shù)據(jù)質(zhì)量與可用性。在較為基本和急迫的數(shù)據(jù)存儲、計(jì)算需求已在一定程度上得到滿足后,如何將數(shù)據(jù)轉(zhuǎn)化為價(jià)值成為下一個最主要需求。最初,企業(yè)與組織內(nèi)部的大量數(shù)據(jù)因缺乏有效的管理,普遍存在著數(shù)據(jù)質(zhì)量低、獲取難、整合不易、標(biāo)準(zhǔn)混亂等問題,使得數(shù)據(jù)后續(xù)的使用存在眾多障礙。在此情況下,用于數(shù)據(jù)整合的數(shù)據(jù)集成技術(shù),以及用于實(shí)現(xiàn)一系列數(shù)據(jù)資產(chǎn)管理職能的數(shù)據(jù)管理技術(shù)隨之出現(xiàn)。(三)數(shù)據(jù)分析應(yīng)用技術(shù)數(shù)據(jù)分析應(yīng)用技術(shù)發(fā)掘數(shù)據(jù)資源的內(nèi)蘊(yùn)價(jià)值。在擁有充足的存儲計(jì)算能力以及高質(zhì)量可用數(shù)據(jù)的情況下,如何將數(shù)據(jù)中蘊(yùn)涵的價(jià)值充分挖掘并同相關(guān)的具體業(yè)務(wù)結(jié)合以實(shí)現(xiàn)數(shù)據(jù)的增值成為關(guān)鍵。用以發(fā)掘數(shù)據(jù)價(jià)值的數(shù)據(jù)分析應(yīng)用技術(shù),包括簡單統(tǒng)計(jì)分析與可視化展現(xiàn)技術(shù),以及以傳統(tǒng)機(jī)器學(xué)習(xí)、基于深度神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)為基礎(chǔ)的挖掘分析建模技術(shù)紛紛涌現(xiàn),幫助用戶發(fā)掘數(shù)據(jù)價(jià)值并進(jìn)一步將分析結(jié)果和模型應(yīng)用于實(shí)際業(yè)務(wù)場景中。(四)數(shù)據(jù)安全流通技術(shù)數(shù)據(jù)安全流通技術(shù)助力安全合規(guī)的數(shù)據(jù)使用及共享。在數(shù)據(jù)價(jià)值釋放的同時,數(shù)據(jù)安全問題也愈加凸顯,數(shù)據(jù)泄露、數(shù)據(jù)丟失、數(shù)據(jù)濫用等安全事件層出不窮,對國家、企業(yè)和個人用戶造成了惡劣影響。如何應(yīng)對大數(shù)據(jù)時代下嚴(yán)峻的數(shù)據(jù)安全威脅,在安全合規(guī)的前提下共享及使用數(shù)據(jù)成為備受矚目的問題。訪問控制、身份識別、數(shù)據(jù)加密、數(shù)據(jù)脫敏等傳統(tǒng)數(shù)據(jù)保護(hù)技術(shù)正積極地向更加適應(yīng)大數(shù)據(jù)場景的方向不斷發(fā)展,同時,側(cè)重于實(shí)現(xiàn)安全數(shù)據(jù)流通的隱私計(jì)算技術(shù)也成為熱點(diǎn)發(fā)展方向。大數(shù)據(jù)時代下大數(shù)據(jù)產(chǎn)業(yè)【學(xué)生討論】(22分鐘)學(xué)生根據(jù)案例進(jìn)行小組討論并分析【布置作業(yè)】(1分鐘)1、復(fù)習(xí)鞏固本節(jié)內(nèi)容2、預(yù)習(xí)下節(jié)內(nèi)容考勤思考并回答討論并分析案例討論并分析案例討論并分析案例小組討論教案案首(總第4號)授課時間第周周(年月日)第節(jié)至第周周(年月日)第節(jié)授課地點(diǎn)授課學(xué)時2項(xiàng)目/任務(wù)簡介項(xiàng)目/任務(wù)名稱任務(wù)2-1大數(shù)據(jù)思維的核心原理項(xiàng)目/任務(wù)目標(biāo)知識目標(biāo)能力目標(biāo)掌握大數(shù)據(jù)思維的核心原理能夠運(yùn)用大數(shù)據(jù)思維分析案例項(xiàng)目/任務(wù)分析數(shù)據(jù)核心原理、數(shù)據(jù)價(jià)值原理、全樣本原理、關(guān)注效率原理、關(guān)注相關(guān)性原理、預(yù)測原理、信息找人原理、機(jī)器懂人原理、電子商務(wù)智能原理、定制產(chǎn)品原理理論教學(xué)內(nèi)容與方法講解舉例分析實(shí)踐教學(xué)內(nèi)容與方法研討分析教學(xué)內(nèi)容與時間安排【組織教學(xué)】(2分鐘)【導(dǎo)入新課】(5分鐘)【講授新課】(50分鐘)【課堂練習(xí)】(15分鐘)【講解練習(xí)】(7分鐘)【布置作業(yè)】(1分鐘)參考資料《大數(shù)據(jù)基礎(chǔ)》中國人民大學(xué)出版社教學(xué)過程(附教案紙3頁)PAGEPAGE2第1頁【組織教學(xué)】(2分鐘)查點(diǎn)人數(shù),填寫學(xué)生考勤表【導(dǎo)入新課】(5分鐘)什么是大數(shù)據(jù)思維?【講授新課】(50分鐘)一、數(shù)據(jù)核心原理:在大數(shù)據(jù)時代,計(jì)算模式發(fā)生了轉(zhuǎn)變,從“流程”核心轉(zhuǎn)變?yōu)椤皵?shù)據(jù)”核心。非結(jié)構(gòu)化數(shù)據(jù)及分析需求,將改變IT系統(tǒng)的升級方式:從簡單增量到架構(gòu)變化。大數(shù)據(jù)和云計(jì)算的關(guān)系:云計(jì)算為大數(shù)據(jù)提供了有力的工具和途徑,大數(shù)據(jù)為云計(jì)算提供了很有價(jià)值的用武之地。而大數(shù)據(jù)比云計(jì)算更為實(shí)用,可有效利用已大量建設(shè)的云計(jì)算資源。以數(shù)據(jù)為核心,反映了當(dāng)下IT產(chǎn)業(yè)的變革,數(shù)據(jù)成為人工智能的基礎(chǔ),也成為智能化的基礎(chǔ),數(shù)據(jù)比流程更重要,從數(shù)據(jù)庫、記錄數(shù)據(jù)庫中都可以開發(fā)出深層次信息。云計(jì)算可以從數(shù)據(jù)庫、記錄數(shù)據(jù)庫中搜索出你是誰,你需要什么,從而推薦給你需要的信息,這是大數(shù)據(jù)核心的典型體現(xiàn)。二、數(shù)據(jù)價(jià)值原理:非互聯(lián)網(wǎng)時期的產(chǎn)品,功能是它的價(jià)值;當(dāng)今互聯(lián)網(wǎng)時期的產(chǎn)品,數(shù)據(jù)是它的價(jià)值。大數(shù)據(jù)并不在“大”,而在于“有用”,價(jià)值含量、挖掘成本比數(shù)量更為重要。不管大數(shù)據(jù)的核心價(jià)值是不是預(yù)測,但是基于大數(shù)據(jù)形成決策的模式已經(jīng)為不少企業(yè)帶來了盈利和聲譽(yù)。用數(shù)據(jù)價(jià)值思維方式思考問題,解決問題。信息總量的變化導(dǎo)致了信息形態(tài)的變化,量變引發(fā)了質(zhì)變,最先經(jīng)歷信息爆炸的學(xué)科,如天文學(xué)和基因?qū)W,創(chuàng)造出了“大數(shù)據(jù)”這個概念。如今,這個概念幾乎應(yīng)用到了所有人類致力于發(fā)展的領(lǐng)域中。從功能為價(jià)值轉(zhuǎn)變?yōu)閿?shù)據(jù)為價(jià)值,說明數(shù)據(jù)和大數(shù)據(jù)的價(jià)值在擴(kuò)大,數(shù)據(jù)為“王”的時代出現(xiàn)了。數(shù)據(jù)被解釋成信息,信息常識化是知識,所以說數(shù)據(jù)解釋、數(shù)據(jù)分析能產(chǎn)生價(jià)值。三、全樣本原理:大數(shù)據(jù)研究的對象是所有樣本,而非抽樣數(shù)據(jù),關(guān)注樣本中的主流,而非個別,這要求應(yīng)用人員有全局和大局思維。用全數(shù)據(jù)樣本思維方式思考問題,解決問題。從抽樣中得到的結(jié)論總是有水分的,而從全部樣本中得到的結(jié)論水分就很少,大數(shù)據(jù)越大,真實(shí)性也就越大,因?yàn)榇髷?shù)據(jù)包含全部的信息。四、關(guān)注效率原理:關(guān)注效率而不是精確度。大數(shù)據(jù)標(biāo)志著人類在尋求量化和認(rèn)識世界的道路上前進(jìn)了一大步,過去不可計(jì)量、存儲、分析和共享的很多東西都被數(shù)據(jù)化了,擁有大量的數(shù)據(jù)和更多不那么精確的數(shù)據(jù)為我們理解世界打開了一扇新的大門。大數(shù)據(jù)能提高生產(chǎn)效率和銷售效率,原因是大數(shù)據(jù)能夠讓我們知道市場的需要、人的消費(fèi)需要。大數(shù)據(jù)讓企業(yè)的決策更科學(xué),由關(guān)注精確度轉(zhuǎn)變?yōu)殛P(guān)注效率的提高,大數(shù)據(jù)分析能提高企業(yè)的效率。五、關(guān)注相關(guān)性原理:關(guān)注相關(guān)性而不是因果關(guān)系,社會需要放棄它對因果關(guān)系的渴求,而僅需關(guān)注相關(guān)關(guān)系,也就是說只需要知道是什么,而不需要知道為什么。過去尋找原因的信念正在被“更好”的相關(guān)性所取代。轉(zhuǎn)向相關(guān)性,不是不要因果關(guān)系,因果關(guān)系還是基礎(chǔ),科學(xué)的基石還是要的。只是在高速信息化的時代,為了得到即時信息,實(shí)時預(yù)測,在快速的大數(shù)據(jù)分析技術(shù)下,尋找到相關(guān)性信息,就可以預(yù)測用戶的行為,為企業(yè)快速決策提供依據(jù)。六、預(yù)測原理:大數(shù)據(jù)的核心就是預(yù)測,大數(shù)據(jù)能夠預(yù)測體現(xiàn)在很多方面。大數(shù)據(jù)不是要教機(jī)器像人一樣思考,相反,它是把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來預(yù)測事情發(fā)生的可能性。正因?yàn)樵诖髷?shù)據(jù)規(guī)律面前,每個人的行為都跟別人一樣,沒有本質(zhì)變化,所以系統(tǒng)會比行為者本人更了解他的行為。七、信息找人原理:互聯(lián)網(wǎng)和大數(shù)據(jù)的發(fā)展,是一個從人找信息到信息找人的過程。當(dāng)下,人與信息的連接方式正在經(jīng)歷重構(gòu),互聯(lián)網(wǎng)出現(xiàn)之前,獲取信息的途徑少,用戶需要自己去找信息,是人找信息的模式;互聯(lián)網(wǎng)和大數(shù)據(jù)出現(xiàn)后,已經(jīng)從人找信息變?yōu)樾畔⒄胰?。?dāng)你打開網(wǎng)頁查找信息時,搜索框下方會推送若干資訊供你閱讀,這些推送的內(nèi)容與你搜索的內(nèi)容相近,這也就是我們所說的信息找人。八、機(jī)器懂人原理:讓機(jī)器懂人,這是人工智能的成功,同時,也是人的大數(shù)據(jù)思維轉(zhuǎn)變。一個機(jī)器、軟件、服務(wù)是否更懂人,將是衡量該機(jī)器、軟件、服務(wù)好壞的標(biāo)準(zhǔn)。人機(jī)關(guān)系已經(jīng)發(fā)生很大變化,由人機(jī)分離,轉(zhuǎn)化為人機(jī)溝通、人機(jī)互補(bǔ)、機(jī)器懂人,現(xiàn)在年輕人已離不開智能手機(jī)就是一個很好的例證。九、電子商務(wù)智能原理:大數(shù)據(jù)改變了電子商務(wù)模式,讓電子商務(wù)更智能。用電子商務(wù)更智能的思維方式思考問題、解決問題。人腦思維與機(jī)器思維有很大差別,但機(jī)器思維在速度上是取勝的,而且智能軟件在很多領(lǐng)域已能代替人腦思維的操作工作。十、定制產(chǎn)品原理:下一波的改革是大規(guī)模定制,即為大量消費(fèi)者定制產(chǎn)品和服務(wù),成本低,又兼具個性化。要真正做到個性化產(chǎn)品和服務(wù),就必須對消費(fèi)者的需求有很好的了解,這背后就需要依靠大數(shù)據(jù)技術(shù)?!菊n堂練習(xí)】(15分鐘)課后習(xí)題【講解練習(xí)】(7分鐘)教師核對答案,并對練習(xí)中出現(xiàn)的問題進(jìn)行講解【布置作業(yè)】(1分鐘)1、復(fù)習(xí)鞏固本節(jié)內(nèi)容2、預(yù)習(xí)下節(jié)內(nèi)容考勤討論分析做練習(xí)記錄教案案首(總第5號)授課時間第周周(年月日)第節(jié)至第周周(年月日)第節(jié)授課地點(diǎn)授課學(xué)時2項(xiàng)目/任務(wù)簡介項(xiàng)目/任務(wù)名稱任務(wù)2-2大數(shù)據(jù)思維方式項(xiàng)目/任務(wù)目標(biāo)知識目標(biāo)能力目標(biāo)了解大數(shù)據(jù)思維的三個維度掌握大數(shù)據(jù)思維的特征能夠辨別大數(shù)據(jù)思維方式與其他思維方式的區(qū)別項(xiàng)目/任務(wù)分析大數(shù)據(jù)思維的三個維度:定量思維、相關(guān)思維、實(shí)驗(yàn)思維大數(shù)據(jù)思維方式的轉(zhuǎn)換:從樣本向總體、從精確向容錯、從因果向相關(guān)大數(shù)據(jù)思維的特征:整體性與涌現(xiàn)性、多樣性與非線性、相關(guān)性與不確定性理論教學(xué)內(nèi)容與方法講解舉例分析實(shí)踐教學(xué)內(nèi)容與方法研討分析教學(xué)內(nèi)容與時間安排【組織教學(xué)】(2分鐘)【導(dǎo)入新課】(5分鐘)【講授新課】(50分鐘)【課堂練習(xí)】(15分鐘)【講解練習(xí)】(7分鐘)【布置作業(yè)】(1分鐘)參考資料《大數(shù)據(jù)基礎(chǔ)》中國人民大學(xué)出版社教學(xué)過程(附教案紙3頁)PAGEPAGE2第1頁【組織教學(xué)】(2分鐘)查點(diǎn)人數(shù),填寫學(xué)生考勤表【復(fù)習(xí)舊課】(5分鐘)大數(shù)據(jù)思維的核心原理?【講授新課】(50分鐘)一、大數(shù)據(jù)思維的三個維度(一)定量思維,即提供更多描述性的信息,其原則是一切皆可測。不僅銷售數(shù)據(jù)、價(jià)格這些客觀標(biāo)準(zhǔn)可以形成大數(shù)據(jù),而且連顧客情緒都可以測得,大數(shù)據(jù)包含與消費(fèi)行為有關(guān)的方方面面。(二)相關(guān)思維,一切皆可連,消費(fèi)者行為的不同數(shù)據(jù)都有內(nèi)在聯(lián)系。這可以用來預(yù)測消費(fèi)者的行為偏好。(三)實(shí)驗(yàn)思維,一切皆可試,大數(shù)據(jù)所帶來的信息可以幫助制定。二、大數(shù)據(jù)思維方式大數(shù)據(jù)時代,人們對待數(shù)據(jù)的思維方式會發(fā)生如下三個變化:第一,人們處理的數(shù)據(jù)從樣本數(shù)據(jù)變成全部數(shù)據(jù);第二,由于是全樣本數(shù)據(jù),人們不得不接受數(shù)據(jù)的混雜性,而放棄對精確性的追求;第三,人類通過對大數(shù)據(jù)的處理,放棄對因果關(guān)系的渴求,轉(zhuǎn)而關(guān)注相關(guān)關(guān)系?;谏鲜鲇^點(diǎn),大數(shù)據(jù)思維包括總體思維、容錯思維和相關(guān)思維。從樣本思維轉(zhuǎn)向總體思維抽樣又稱取樣,是從欲研究的全部樣品中抽取一部分樣品單位。其基本要求是保證所抽取的樣品單位對全部樣品具有充分的代表性。抽樣保證了在客觀條件達(dá)不到的情況下,可能得出一個相對正確的結(jié)論,讓研究有的放矢。但抽樣是不穩(wěn)定的,從而導(dǎo)致結(jié)論與實(shí)際可能差異非常明顯。大數(shù)據(jù)與小數(shù)據(jù)的根本區(qū)別在于大數(shù)據(jù)采用全樣思維方式,小數(shù)據(jù)強(qiáng)調(diào)抽樣。在大數(shù)據(jù)時代,隨著數(shù)據(jù)收集、存儲、分析技術(shù)的突破性發(fā)展,我們可以更加方便、快捷、動態(tài)地獲得研究對象有關(guān)的所有數(shù)據(jù),而不再因諸多限制而不得不采用樣本研究方法,相應(yīng)地,思維方式也應(yīng)該從樣本思維轉(zhuǎn)向總體思維,從而能夠更加全面、立體、系統(tǒng)地認(rèn)識總體狀況。(二)從精確思維轉(zhuǎn)向容錯思維在小數(shù)據(jù)時代,因?yàn)槭占臉颖拘畔⒘勘容^少,所以必須確保記錄下來的數(shù)據(jù)盡量結(jié)構(gòu)化、精確化,否則,分析得出的結(jié)論很可能南轅北轍,因此,通常十分注重精確思維。然而,在大數(shù)據(jù)時代,得益于大數(shù)據(jù)技術(shù)的突破,大量的非結(jié)構(gòu)化、異構(gòu)化的數(shù)據(jù)能夠得到儲存和分析,這一方面提升了我們從數(shù)據(jù)中獲取知識和洞見的能力,另一方面也對傳統(tǒng)的精確思維提出了挑戰(zhàn)。(三)從因果思維轉(zhuǎn)向相關(guān)思維在小數(shù)據(jù)世界中,人們往往執(zhí)著于現(xiàn)象背后的因果關(guān)系,試圖通過有限樣本數(shù)據(jù)來剖析其中的內(nèi)在機(jī)理。小數(shù)據(jù)的另一個缺陷就是有限的樣本數(shù)據(jù)無法反映出事物之間的普遍性的相關(guān)關(guān)系。在大數(shù)據(jù)時代,思維方式要從因果思維轉(zhuǎn)向相關(guān)思維,努力顛覆千百年來人類形成的傳統(tǒng)思維模式和固有偏見,才能更好地分享大數(shù)據(jù)帶來的深刻洞見。三、大數(shù)據(jù)思維的特征(一)整體性與涌現(xiàn)性大數(shù)據(jù)思維的整體性是指在數(shù)據(jù)挖掘的過程中,我們需要重視對全體數(shù)據(jù)的分析,在把握問題的方法上,注重從整體把握對象。在大數(shù)據(jù)時代,整體性思維是面對問題、解決問題時的首選。大數(shù)據(jù)思維主張進(jìn)行全體數(shù)據(jù)的獲取和分析,也就是通過整體思維的方式來把握研究對象。涌現(xiàn)性通常是系統(tǒng)整體具有的特征,是指在系統(tǒng)中各部分、各元素單獨(dú)存在時不具有,但是將它們組合成一個整體后系統(tǒng)所具有的特征。在大數(shù)據(jù)思維的背景下,新情況不斷地涌現(xiàn),涌現(xiàn)性也成為大數(shù)據(jù)思維的重要屬性。(二)多樣性與非線性大數(shù)據(jù)思維的多樣性特征是通過數(shù)據(jù)種類的不同體現(xiàn)的。關(guān)系數(shù)據(jù)庫中存儲的基本是結(jié)構(gòu)化數(shù)據(jù),而非關(guān)系數(shù)據(jù)庫中存儲的多源異構(gòu)數(shù)據(jù),成為大數(shù)據(jù)思維多樣性的主要來源。非線性是相對于線性來說的,是指方程的解滿足疊加定理的現(xiàn)象或者系統(tǒng)所具有的特征,非線性是線性的否定。大數(shù)據(jù)思維的出現(xiàn)帶來了整體思維,人們可以利用采集海量大數(shù)據(jù)的方法得到現(xiàn)實(shí)世界第一手的數(shù)據(jù),通過這些數(shù)據(jù)來了解我們的世界,將更加接近真實(shí)、接近現(xiàn)實(shí)。在這樣的意義上,大數(shù)據(jù)思維在本質(zhì)上表現(xiàn)出了非線性特征。(三)相關(guān)性與不確定性相關(guān)性表示事物之間具有的某種聯(lián)系,它也是大數(shù)據(jù)思維的一個重要特征。從大數(shù)據(jù)中尋求事物相關(guān)性,通過這種相關(guān)思維對可能發(fā)生的事進(jìn)行預(yù)測,是大數(shù)據(jù)思維的最主要目的。在大數(shù)據(jù)時代,基于結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的多源異構(gòu)的數(shù)據(jù)的新分類,以及關(guān)系數(shù)據(jù)庫、非關(guān)系數(shù)據(jù)庫的數(shù)據(jù)處理的新局面,大數(shù)據(jù)思維在數(shù)據(jù)類型和數(shù)據(jù)挖掘等領(lǐng)域表現(xiàn)出明顯的不確定性。不確定性在數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)處理等數(shù)據(jù)挖掘的全過程中均有體現(xiàn)?!菊n堂練習(xí)】(15分鐘)課后習(xí)題【講解練習(xí)】(7分鐘)教師核對答案,并對練習(xí)中出現(xiàn)的問題進(jìn)行講解【布置作業(yè)】(1分鐘)1、復(fù)習(xí)鞏固本節(jié)內(nèi)容2、預(yù)習(xí)下節(jié)內(nèi)容考勤思考并回答分析做練習(xí)記錄教案案首(總第6號)授課時間第周周(年月日)第節(jié)至第周周(年月日)第節(jié)授課地點(diǎn)授課學(xué)時2項(xiàng)目/任務(wù)簡介項(xiàng)目/任務(wù)名稱任務(wù)2-3運(yùn)用大數(shù)據(jù)思維案例分析項(xiàng)目/任務(wù)目標(biāo)知識目標(biāo)能力目標(biāo)掌握大數(shù)據(jù)思維的核心原理掌握大數(shù)據(jù)思維的特征能夠運(yùn)用大數(shù)據(jù)思維方式對案例進(jìn)行分析項(xiàng)目/任務(wù)分析以大數(shù)據(jù)整體性為支撐的總體思維、以大數(shù)據(jù)多樣性為支撐的容錯思維、以大數(shù)據(jù)關(guān)聯(lián)性為支撐的相關(guān)思維、以大數(shù)據(jù)開放性為支撐的智能思維理論教學(xué)內(nèi)容與方法講解案例分析實(shí)踐教學(xué)內(nèi)容與方法研討分析教學(xué)內(nèi)容與時間安排【組織教學(xué)】(2分鐘)【導(dǎo)入新課】(5分鐘)【講授新課】(50分鐘)【學(xué)生討論】(22分鐘)【布置作業(yè)】(1分鐘)參考資料《大數(shù)據(jù)基礎(chǔ)》中國人民大學(xué)出版社教學(xué)過程(附教案紙3頁)PAGEPAGE2第1頁【組織教學(xué)】(2分鐘)查點(diǎn)人數(shù),填寫學(xué)生考勤表【復(fù)習(xí)舊課】(5分鐘)大數(shù)據(jù)思維的三個維度和特征?【講授新課】(50分鐘)一、精準(zhǔn)營銷下的大數(shù)據(jù)思維某出版社一直重視數(shù)據(jù)的收集、分析、挖掘,為將數(shù)據(jù)資源應(yīng)用在業(yè)務(wù)管理和圖書營銷方面,前幾年就已經(jīng)在持續(xù)地關(guān)注與營銷方面有關(guān)的數(shù)據(jù)。一開始,該出版社只是有內(nèi)部業(yè)務(wù)部門統(tǒng)計(jì),現(xiàn)在已經(jīng)發(fā)展到從社、店、第三方來采集和分析數(shù)據(jù)。數(shù)據(jù)分為兩類:內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)。內(nèi)部數(shù)據(jù)有退回匯總、賬期匯總、庫存表、重點(diǎn)產(chǎn)品分析,外部數(shù)據(jù)有市場占有率、重點(diǎn)板塊競爭、市場排名變化、同類品銷售排行、競品分析、線上線下大客戶銷售排行榜。從內(nèi)容到發(fā)行,大數(shù)據(jù)貫穿整個流程。營銷貫穿于出版的全流程中,而大數(shù)據(jù)對營銷具有非常重要的作用,可以說大數(shù)據(jù)在出版的編輯(論證選題、組織稿件、加工整理、版式要求、裝幀設(shè)計(jì))、印務(wù)(印制效果、裝訂形式)、發(fā)行(倉儲備貨、宣傳推廣、最終銷售)等各個環(huán)節(jié)中都發(fā)揮作用。大數(shù)據(jù)的獲取途徑基本分成內(nèi)部和外部兩種。內(nèi)部報(bào)表主要是根據(jù)該出版社ERP系統(tǒng)中的出、入庫的基礎(chǔ)業(yè)務(wù)數(shù)據(jù)對圖書的發(fā)貨時效、補(bǔ)貨數(shù)量、補(bǔ)貨頻率、適銷程度、渠道特點(diǎn)予以反饋,以此對庫存銷售周期進(jìn)行分析和預(yù)判。外部數(shù)據(jù)中,大客戶銷售排行榜單是該出版社參考的重點(diǎn)數(shù)據(jù)指標(biāo),它可以真實(shí)地反映產(chǎn)品的動銷情況,驗(yàn)證我們對產(chǎn)品上市預(yù)判的正確性,根據(jù)實(shí)際銷售數(shù)量確定是否加印以及加印數(shù)量。二、塔吉特的“讀心術(shù)”塔吉特百貨是美國第二大超市。一天,一名男子闖入塔吉特,大吼:“你們?yōu)槭裁唇o我的女兒發(fā)嬰兒紙尿褲的優(yōu)惠券,她才17歲??!”這家全美第二大的零售商,竟鬧出如此大的烏龍?商場經(jīng)理立刻向該男子道歉,并解釋:“那肯定是個誤會?!比欢?,這位經(jīng)理并不知道,這一切都是公司數(shù)據(jù)預(yù)測系統(tǒng)進(jìn)行了一系列數(shù)據(jù)分析的結(jié)果。一個月后,經(jīng)理接到了該男子的道歉電話,塔吉特的優(yōu)惠券并沒有發(fā)錯,他的女兒的確懷孕了。為什么,孕婦身邊的人都沒有發(fā)覺時,塔吉特就已經(jīng)知道誰懷孕了呢,難道塔吉特有神奇的讀心術(shù)?(一)塔吉特是如何收集數(shù)據(jù)的塔吉特盡可能地給每位顧客一個編號(即會員卡)。顧客刷卡、使用優(yōu)惠券、填寫問卷、開啟廣告郵件等,都會記錄進(jìn)顧客的編號。這個編號還會對號入座地記下顧客的人口統(tǒng)計(jì)信息:年齡、婚姻狀況、子女、住址、薪水等。塔吉特還可以從其他相關(guān)機(jī)構(gòu)那里購買顧客的其他信息,如種族、就業(yè)史、喜歡讀的雜志、破產(chǎn)記錄、購房記錄、求學(xué)記錄等。這些看似凌亂的數(shù)據(jù)信息,在塔吉特的數(shù)據(jù)分析師手里,能轉(zhuǎn)化出巨大的能量。(二)塔吉特是如何分析數(shù)據(jù)的塔吉特并不知道孕婦開始懷孕的時間,但是,它利用相關(guān)模型找到了她們的購物規(guī)律,并以此判斷某位女士可能懷孕了。這個案例揭示了,企業(yè)已經(jīng)進(jìn)入數(shù)據(jù)應(yīng)用的新階段。企業(yè)不僅利用商品的相關(guān)性開展促銷,而且利用事物的相關(guān)性預(yù)測消費(fèi)者的消費(fèi)活動。這種預(yù)測是利用事物相關(guān)性來發(fā)現(xiàn)事情的變化規(guī)律的。三、農(nóng)田里的大數(shù)據(jù)思維農(nóng)業(yè)物聯(lián)網(wǎng)自動化系統(tǒng)可對大棚內(nèi)環(huán)境進(jìn)行實(shí)時感知。農(nóng)田里建氣候觀測站,用手機(jī)一掃就可以獲得田地的施肥方案、灌溉方案,農(nóng)業(yè)物聯(lián)網(wǎng)自動化系統(tǒng)可以精確測算市場的需求,農(nóng)業(yè)生產(chǎn)者根據(jù)需求決定種什么、養(yǎng)什么?!按髷?shù)據(jù)思維”的背后,是農(nóng)業(yè)生產(chǎn)從“靠經(jīng)驗(yàn)”走向“靠數(shù)據(jù)”、從粗放走向精準(zhǔn)的變革。(一)用大數(shù)據(jù)“測天測地測市場”(二)從“靠經(jīng)驗(yàn)”到“靠數(shù)據(jù)”(三)“投入”大數(shù)據(jù),降風(fēng)險(xiǎn)增效益四、大數(shù)據(jù)思維方式的啟示(一)建立以大數(shù)據(jù)整體性為支撐的總體思維在小數(shù)據(jù)時代,由于技術(shù)條件的限制,人們只能通過把復(fù)雜的整體分解為簡單的部分的方法來分析研究事物,并試圖用這些部分來描述整體。而在大數(shù)據(jù)時代,人們可以利用大數(shù)據(jù)技術(shù),收集、處理和運(yùn)用海量數(shù)據(jù),實(shí)現(xiàn)思維和認(rèn)知從被迫關(guān)注局部向主動關(guān)注全局轉(zhuǎn)變,從更廣的范圍、更高的層次、更深的程度認(rèn)識事物,形成基于大數(shù)據(jù)網(wǎng)絡(luò)環(huán)境的總體思維。(二)建立以大數(shù)據(jù)多樣性為支撐的容錯思維容錯思維,不是縱容錯誤存在,而是接受不精確的存在,并不斷調(diào)整糾偏。在大數(shù)據(jù)時代,由于技術(shù)的進(jìn)步,人們基本可以做到實(shí)時、實(shí)地采集、傳輸、處理數(shù)據(jù),可以實(shí)時準(zhǔn)確地把握事物的動態(tài)發(fā)展變化情況,隨時調(diào)整決策,糾正錯誤。(三)建立以大數(shù)據(jù)關(guān)聯(lián)性為支撐的相關(guān)思維在大數(shù)據(jù)時代,事物各組成要素之間的關(guān)系已經(jīng)不完全是簡單的線性因果關(guān)系,而更多的是一種非線性的相關(guān)關(guān)系。通過分析研究數(shù)據(jù)變化所反映的事物之間的內(nèi)在聯(lián)系以及相關(guān)關(guān)系,我們可以避免將思維方式陷入冗長的因果關(guān)系鏈,較為快捷地發(fā)現(xiàn)事物不同要素之間的相互關(guān)系和相互影響及相互作用方式,為快捷、準(zhǔn)確地找到解決復(fù)雜問題的方案提供有效的路徑。(四)建立以大數(shù)據(jù)開放性為支撐的智能思維封閉導(dǎo)致混沌,而開放則會帶來生機(jī)和活力。大數(shù)據(jù)的一個鮮明特征就是其開放性。從數(shù)據(jù)來源來看,大數(shù)據(jù)時代的數(shù)據(jù)建設(shè)對所有的有效數(shù)據(jù)保持開放;從數(shù)據(jù)的使用來看,大數(shù)據(jù)時代的數(shù)據(jù)向所有的合法用戶保持開放,任何用戶都沒有數(shù)據(jù)特權(quán)。這種開放性為人們的智能思維奠定了基礎(chǔ),為我們探索并掌握現(xiàn)實(shí)和未來事物發(fā)展的特點(diǎn)規(guī)律,智慧思考、超前謀劃提供了支撐和條件?!緦W(xué)生討論】(22分鐘)學(xué)生根據(jù)案例進(jìn)行小組討論并分析【布置作業(yè)】(1分鐘)1、復(fù)習(xí)鞏固本節(jié)內(nèi)容2、預(yù)習(xí)下節(jié)內(nèi)容考勤思考并回答討論并分析案例討論并分析案例討論并分析案例小組討論教案案首(總第9號)授課時間第周周(年月日)第節(jié)至第周周(年月日)第節(jié)授課地點(diǎn)授課學(xué)時2項(xiàng)目/任務(wù)簡介項(xiàng)目/任務(wù)名稱任務(wù)3-1數(shù)據(jù)庫項(xiàng)目/任務(wù)目標(biāo)知識目標(biāo)能力目標(biāo)了解數(shù)據(jù)及數(shù)據(jù)庫的基本含義能夠掌握數(shù)據(jù)庫的基本內(nèi)涵項(xiàng)目/任務(wù)分析能掌握數(shù)據(jù)庫分類與關(guān)系型數(shù)據(jù)庫的特征理論教學(xué)內(nèi)容與方法講解案例分析實(shí)踐教學(xué)內(nèi)容與方法研討分析教學(xué)內(nèi)容與時間安排【組織教學(xué)】(2分鐘)【導(dǎo)入新課】(5分鐘)【講授新課】(50分鐘)【學(xué)生討論】(22分鐘)【布置作業(yè)】(1分鐘)參考資料《大數(shù)據(jù)基礎(chǔ)》中國人民大學(xué)出版社教學(xué)過程(附教案紙3頁)PAGEPAGE2第1頁【組織教學(xué)】(2分鐘)查點(diǎn)人數(shù),填寫學(xué)生考勤表【引入新課】(5分鐘)我們的數(shù)據(jù)該怎么存儲?【講授新課】(50分鐘)一、數(shù)據(jù)庫的定義當(dāng)我們的祖先還在荒野中茹毛飲血的時候,就學(xué)會了利用結(jié)繩記事來進(jìn)行數(shù)據(jù)儲存,這些被打上結(jié)的繩子就是“數(shù)據(jù)”。后來,我們的祖先利用甲骨、竹簡、紙張來儲存文字?jǐn)?shù)據(jù)。近代人們發(fā)明了錄音機(jī)、攝像機(jī)來儲存音頻數(shù)據(jù)。雖然數(shù)據(jù)載體一直在變化,但是數(shù)據(jù)存儲的方式并沒有發(fā)生很大的變化,都屬于傳統(tǒng)存儲方式。直到信息時代的到來,數(shù)據(jù)存儲的方式才發(fā)生了重大變革并朝著兩個方向發(fā)展:文件與數(shù)據(jù)庫。(1)文件相當(dāng)于把數(shù)據(jù)存放在Excel當(dāng)中,形成讀寫文件后進(jìn)行存儲,然后通過Python等工具對文件數(shù)據(jù)進(jìn)行篩選、處理、提??;(2)數(shù)據(jù)庫則是把數(shù)據(jù)按照其結(jié)構(gòu)將其儲存在計(jì)算機(jī)中,形成一個具有大數(shù)據(jù)量的數(shù)據(jù)集合,相當(dāng)于存放文件的文件柜。利用數(shù)據(jù)庫存儲數(shù)據(jù)是目前最為流行的方式,因?yàn)閿?shù)據(jù)庫擁有持久化存儲的特點(diǎn),讀寫速度也很高,更關(guān)鍵的是數(shù)據(jù)庫可以在極大程度上保證數(shù)據(jù)的有效性,而不像Excel等文件極易產(chǎn)生修改錯誤。數(shù)據(jù)庫顧名思義就是數(shù)據(jù)的集合,是由一張張數(shù)據(jù)表組成的??傊?,數(shù)據(jù)庫是有組織的數(shù)據(jù)集合。它是模式(schema)、表(table)、查詢(query)、報(bào)告(report)、視圖(view)和其他對象的集合。數(shù)據(jù)庫是系統(tǒng)地組織或結(jié)構(gòu)化地索引信息存儲庫(通常是一組連接的數(shù)據(jù)文件),可以輕松地檢索、更新、分析和輸出數(shù)據(jù)。這些數(shù)據(jù)通常存儲在計(jì)算機(jī)中,其形式可以是圖形、報(bào)告、腳本、文本等,幾乎代表每種信息。大多數(shù)計(jì)算機(jī)應(yīng)用程序(包括防病毒軟件、電子表格、文字處理器)的核心都是數(shù)據(jù)庫。二、數(shù)據(jù)庫的分類按照早期的數(shù)據(jù)庫理論,比較流行的數(shù)據(jù)庫模型有三種,分別為層次數(shù)據(jù)庫、網(wǎng)狀數(shù)據(jù)庫和關(guān)系型數(shù)據(jù)庫。而在當(dāng)今的互聯(lián)網(wǎng)企業(yè)中,最常用的數(shù)據(jù)庫模型主要有兩種,即關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫關(guān)系型數(shù)據(jù)庫模型是把復(fù)雜的數(shù)據(jù)結(jié)構(gòu)歸結(jié)為簡單的二元關(guān)系(即二維表格形式),。在關(guān)系型數(shù)據(jù)庫中,對數(shù)據(jù)的操作幾乎全部建立在一個或多個關(guān)系表格上,通過這些關(guān)聯(lián)的表格分類、合并、連接或選取等運(yùn)算來實(shí)現(xiàn)數(shù)據(jù)的管理。關(guān)系型數(shù)據(jù)庫,簡單說,是由多張能互相連接的二維行列表格組成的數(shù)據(jù)庫。在數(shù)據(jù)準(zhǔn)備時,我們通常要建立表關(guān)聯(lián)來分析。關(guān)系型數(shù)據(jù)庫是基于關(guān)系代數(shù)模型發(fā)展而來的,常用的關(guān)系型數(shù)據(jù)庫有SQLServer、MySQL、Oracle、DB2等。關(guān)系型數(shù)據(jù)庫的基本結(jié)構(gòu)是一張二維表,包括以下概念:1.表在用戶將文件夾放入文件柜的時候,不是將文件夾隨便扔進(jìn)某個抽屜就可以了,而是在文件柜中創(chuàng)建文件,然后將相關(guān)的資料放入相關(guān)的文件中,這就是數(shù)據(jù)庫的表。表是一種結(jié)構(gòu)化的文件,用來存儲某種特定類型的數(shù)據(jù),如SQL文件,其里面包含了20多個數(shù)據(jù)庫表,每個表的名字都不應(yīng)該是相同的,但是我們可以在不同的數(shù)據(jù)庫里存放有相同表名的數(shù)據(jù)表,同時,我們不能把學(xué)生數(shù)據(jù)與老師數(shù)據(jù)放在同一個表里,否則不容易提取數(shù)據(jù),檢索和訪問也比較麻煩,所以我們應(yīng)該創(chuàng)建兩個表,每個清單一個表。2.列列是組成表的字段信息,一張表可以由一個或多個列組成。我們可以這么理解,每一列都是數(shù)據(jù)庫表中的每一個字段,學(xué)生ID列、學(xué)生姓名列、考試成績列就是三個字段。正確地將數(shù)據(jù)分解為多個列是十分重要的。例如,班級和學(xué)生姓名應(yīng)該是獨(dú)立的列,通過將它們分解開,才有可能利用特定的列隊(duì)數(shù)據(jù)進(jìn)行排列和過濾;如果學(xué)生姓名和班級組合在了一個列里,按照班級過濾就會十分困難,數(shù)據(jù)庫中每個列都有對應(yīng)的數(shù)據(jù)類型,數(shù)據(jù)類型定義列可以存儲的數(shù)據(jù)種類。例如,如果列中存儲的是數(shù)字,那么對應(yīng)的數(shù)據(jù)類型應(yīng)該是數(shù)值類型;如果列中存儲的是日期、文本、注釋、金額等,應(yīng)該用恰當(dāng)?shù)臄?shù)據(jù)類型規(guī)定出來。數(shù)據(jù)類型:每個列都應(yīng)該有相對應(yīng)的數(shù)據(jù)類型,限制存儲的數(shù)據(jù)形式。3.行數(shù)據(jù)庫表中的數(shù)據(jù)是按照行進(jìn)行存儲的,每一行就是存儲的一個數(shù)據(jù),比如第一行是張三的數(shù)據(jù),第二行是李四的數(shù)據(jù)。信息存放在物理實(shí)體上,是一堆寫在磁盤上的文件,文件中有數(shù)據(jù)。4.主鍵每一張表都有一個唯一標(biāo)識,即主鍵,也就是ID,ID是數(shù)據(jù)庫中重要的概念,叫作唯一標(biāo)識符/主鍵,用來表示數(shù)據(jù)的唯一性。就相當(dāng)于我們的身份證,是唯一的,有了身份證,就知道數(shù)據(jù)在哪了。ID通常沒有業(yè)務(wù)含義,就是一種唯一標(biāo)識,每張表只能有一個主鍵,且主鍵通常是整數(shù),主鍵一旦設(shè)立,值通常不允許修改。數(shù)據(jù)庫是表的集合。一個數(shù)據(jù)庫中可以放多張表,我們給每張表命名,表與表之間能互相聯(lián)系。聯(lián)系就是數(shù)據(jù)能夠?qū)?yīng)匹配,正式名稱叫作連接,對應(yīng)的操作叫作Join【學(xué)生討論】(22分鐘)學(xué)生根據(jù)案例進(jìn)行小組討論并分析【布置作業(yè)】(1分鐘)1、復(fù)習(xí)鞏固本節(jié)內(nèi)容2、預(yù)習(xí)下節(jié)內(nèi)容考勤思考并回答討論并分析案例討論并分析案例討論并分析案例小組討論教案案首(總第10號)授課時間第周周(年月日)第節(jié)至第周周(年月日)第節(jié)授課地點(diǎn)授課學(xué)時2項(xiàng)目/任務(wù)簡介項(xiàng)目/任務(wù)名稱任務(wù)3-2數(shù)據(jù)庫管理系統(tǒng)與數(shù)據(jù)庫系統(tǒng)項(xiàng)目/任務(wù)目標(biāo)知識目標(biāo)能力目標(biāo)了解數(shù)據(jù)庫系統(tǒng)能夠掌握數(shù)據(jù)庫的類型項(xiàng)目/任務(wù)分析能掌握數(shù)據(jù)庫的分類與關(guān)系型數(shù)據(jù)庫的特征,并準(zhǔn)確表述關(guān)系型數(shù)據(jù)庫的邏輯特征。理論教學(xué)內(nèi)容與方法講解案例分析實(shí)踐教學(xué)內(nèi)容與方法研討分析教學(xué)內(nèi)容與時間安排【組織教學(xué)】(2分鐘)【導(dǎo)入新課】(5分鐘)【講授新課】(50分鐘)【學(xué)生討論】(22分鐘)【布置作業(yè)】(1分鐘)參考資料《大數(shù)據(jù)基礎(chǔ)》中國人民大學(xué)出版社教學(xué)過程(附教案紙3頁)PAGEPAGE2第1頁【組織教學(xué)】(2分鐘)查點(diǎn)人數(shù),填寫學(xué)生考勤表【引入新課】(5分鐘)數(shù)據(jù)庫的分類?【講授新課】(50分鐘)一、實(shí)體與數(shù)據(jù)庫實(shí)體是客觀存在并可互相區(qū)別的事物。就數(shù)據(jù)庫而言,實(shí)體往往指某類事物的集合??梢允蔷唧w的人、事、物,也可以是抽象的概念、聯(lián)系。在現(xiàn)實(shí)世界,實(shí)體并不是孤立存在的,實(shí)體與實(shí)體之間也存在聯(lián)系。例如,課程與學(xué)生之間存在學(xué)生學(xué)習(xí)課程的聯(lián)系,課程與老師之間存在老師創(chuàng)建課程的聯(lián)系。實(shí)體數(shù)據(jù)的存儲要求是:必須按照一定的分類和規(guī)律存儲。而數(shù)據(jù)庫是專門用來存儲這些實(shí)體信息的數(shù)據(jù)集合。其具有的特點(diǎn)包括:海量存儲數(shù)據(jù),數(shù)據(jù)檢索方便;保持?jǐn)?shù)據(jù)信息的一致、完整,并實(shí)現(xiàn)數(shù)據(jù)的共享和安全;通過組合分析,產(chǎn)生新的有用的信息。實(shí)體存儲的基本單元是數(shù)據(jù)表。數(shù)據(jù)表為實(shí)體信息存儲的基本單元,同類實(shí)體存放在同一個表中,表又稱為實(shí)體的集合。表中的行(記錄)即實(shí)體,表中的列(字段)為實(shí)體的屬性。二、數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)(DataBaseManagementSystem,DBMS)是一種操縱和管理數(shù)據(jù)庫的軟件,用于建立、使用和維護(hù)數(shù)據(jù)庫。它對數(shù)據(jù)庫進(jìn)行統(tǒng)一的管理和控制,以保證數(shù)據(jù)庫的安全性和完整性。用戶通過DBMS訪問數(shù)據(jù)庫中的數(shù)據(jù),數(shù)據(jù)庫管理員也通過DBMS進(jìn)行數(shù)據(jù)庫的維護(hù)工作。它可使多個應(yīng)用程序和用戶用不同的方法在同時或不同時刻去建立、修改和詢問數(shù)據(jù)庫。數(shù)據(jù)庫管理系統(tǒng)主要提供如下功能。1.?dāng)?shù)據(jù)定義DBMS提供數(shù)據(jù)定義語言DDL(DataDefinitionLanguage),供用戶定義數(shù)據(jù)庫的三級模式結(jié)構(gòu)、兩級映像以及完整性約束和保密限制等約束。DDL主要用于建立、修改數(shù)據(jù)庫的庫結(jié)構(gòu)。DDL所描述的庫結(jié)構(gòu)僅僅給出了數(shù)據(jù)庫的框架,數(shù)據(jù)庫的框架信息被存放在數(shù)據(jù)字典(DataDictionary)中。2.?dāng)?shù)據(jù)操作DBMS提供數(shù)據(jù)操作語言DML(DataManipulationLanguage),供用戶實(shí)現(xiàn)對數(shù)據(jù)的追加、刪除、更新、查詢等操作。3.?dāng)?shù)據(jù)庫的運(yùn)行管理數(shù)據(jù)庫的運(yùn)行管理功能是DBMS的運(yùn)行控制、管理功能,包括多用戶環(huán)境下的并發(fā)控制、安全性檢查和存取限制控制、完整性檢查和執(zhí)行、運(yùn)行日志的組織管理、事務(wù)的管理和自動恢復(fù),即保證事務(wù)的原子性。這些功能保證了數(shù)據(jù)庫系統(tǒng)的正常運(yùn)行。4.?dāng)?shù)據(jù)組織、存儲與管理DBMS要分類組織、存儲和管理各種數(shù)據(jù),包括數(shù)據(jù)字典、用戶數(shù)據(jù)、存取路徑等,需要確定以何種文件結(jié)構(gòu)和存取方式在存儲級別上組織這些數(shù)據(jù),如何實(shí)現(xiàn)數(shù)據(jù)之間的聯(lián)系。數(shù)據(jù)組織和存儲的基本目標(biāo)是提高存儲空間利用率,選擇合適的存取方法以提高存取效率。5.?dāng)?shù)據(jù)庫的保護(hù)數(shù)據(jù)庫中的數(shù)據(jù)是信息社會的戰(zhàn)略資源,所以對數(shù)據(jù)的保護(hù)至關(guān)重要。DBMS對數(shù)據(jù)庫的保護(hù)通過4個方面來實(shí)現(xiàn):數(shù)據(jù)庫的恢復(fù)、數(shù)據(jù)庫的并發(fā)控制、數(shù)據(jù)庫的完整性控制、數(shù)據(jù)庫的安全性控制。DBMS的其他保護(hù)功能還有系統(tǒng)緩沖區(qū)的管理以及數(shù)據(jù)存儲的某些自適應(yīng)調(diào)節(jié)機(jī)制等。6.?dāng)?shù)據(jù)庫的維護(hù)一個數(shù)據(jù)庫被創(chuàng)建后的工作叫作數(shù)據(jù)庫維護(hù)。數(shù)據(jù)庫維護(hù)比數(shù)據(jù)庫的創(chuàng)建和使用更難,這一部分包括:備份系統(tǒng)數(shù)據(jù)、恢復(fù)數(shù)據(jù)庫系統(tǒng)、產(chǎn)生用戶信息表,為信息表授權(quán)、監(jiān)視系統(tǒng)運(yùn)行狀況,及時處理系統(tǒng)錯誤、保護(hù)系統(tǒng)數(shù)據(jù)安全,周期更改用戶口令。這些功能分別由各個使用程序來完成。7.通信DBMS具有與操作系統(tǒng)的聯(lián)機(jī)處理、分時系統(tǒng)及遠(yuǎn)程作業(yè)輸入的相關(guān)接口,負(fù)責(zé)處理數(shù)據(jù)的傳送。對網(wǎng)絡(luò)環(huán)境下的數(shù)據(jù)庫系統(tǒng),還應(yīng)該包括DBMS與網(wǎng)絡(luò)中其他軟件系統(tǒng)的通信功能以及數(shù)據(jù)庫之間的互操作功能??傊?,數(shù)據(jù)庫管理系統(tǒng)(DBMS)是一個供用戶使用的數(shù)據(jù)庫管理軟件,目的是通過數(shù)據(jù)庫管理軟件完成對數(shù)據(jù)庫數(shù)據(jù)的處理。三、數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)庫系統(tǒng)(DataBaseSystem,DBS)一般由4個部分組成:1.?dāng)?shù)據(jù)庫(DataBase,DB)數(shù)據(jù)庫是指長期存儲在計(jì)算機(jī)內(nèi)的、有組織、可共享的數(shù)據(jù)的集合。數(shù)據(jù)庫中的數(shù)據(jù)按一定的數(shù)學(xué)模型組織、描述和存儲,具有較小的冗余、較高的數(shù)據(jù)獨(dú)立性和易擴(kuò)展性,并可為各種用戶共享。2.硬件硬件構(gòu)成計(jì)算機(jī)系統(tǒng)的各種物理設(shè)備,包括存儲所需的外部設(shè)備。硬件的配置應(yīng)滿足整個數(shù)據(jù)庫系統(tǒng)的需要。3.軟件軟件包括操作系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)及應(yīng)用程序。數(shù)據(jù)庫管理系統(tǒng)是數(shù)據(jù)庫系統(tǒng)的核心軟件,是在操作系統(tǒng)(如Windows、Linux等操作系統(tǒng))的支持下工作,解決如何科學(xué)地組織和存儲數(shù)據(jù)、如何高效地獲取和維護(hù)數(shù)據(jù)的系統(tǒng)軟件。其主要功能包括:數(shù)據(jù)定義功能、數(shù)據(jù)操縱功能、數(shù)據(jù)庫的運(yùn)行管理和數(shù)據(jù)庫的建立與維護(hù)。4.人員人員主要有4類。第一類為系統(tǒng)分析員和數(shù)據(jù)庫設(shè)計(jì)人員。系統(tǒng)分析員負(fù)責(zé)應(yīng)用系統(tǒng)的需求分析和規(guī)范說明,他們和用戶及數(shù)據(jù)庫管理員一起確定系統(tǒng)的硬件配置,并參與數(shù)據(jù)庫系統(tǒng)的概要設(shè)計(jì)。數(shù)據(jù)庫設(shè)計(jì)人員負(fù)責(zé)數(shù)據(jù)庫中數(shù)據(jù)的確定、數(shù)據(jù)庫各級模式的設(shè)計(jì)。第二類為應(yīng)用程序員,負(fù)責(zé)編寫使用數(shù)據(jù)庫的應(yīng)用程序。這些應(yīng)用程序可對數(shù)據(jù)進(jìn)行檢索、建立、刪除或修改。第三類為最終用戶,他們利用系統(tǒng)的接口或查詢語言訪問數(shù)據(jù)庫。第四類為數(shù)據(jù)庫管理員(DataBaseAdministrator,DBA),負(fù)責(zé)數(shù)據(jù)庫的總體信息控制。數(shù)據(jù)庫管理員的具體職責(zé)包括:確定數(shù)據(jù)庫中的信息內(nèi)容,決定數(shù)據(jù)庫的存儲結(jié)構(gòu)和存取策略,定義數(shù)據(jù)庫的安全性要求和完整性約束條件,監(jiān)控?cái)?shù)據(jù)庫的使用和運(yùn)行,負(fù)責(zé)數(shù)據(jù)庫的性能改進(jìn)、數(shù)據(jù)庫的重組和重構(gòu),以提高系統(tǒng)的性能?!緦W(xué)生討論】(22分鐘)學(xué)生根據(jù)案例進(jìn)行小組討論并分析【布置作業(yè)】(1分鐘)1、復(fù)習(xí)鞏固本節(jié)內(nèi)容2、預(yù)習(xí)下節(jié)內(nèi)容考勤思考并回答討論并分析案例討論并分析案例討論并分析案例小組討論教案案首(總第11號)授課時間第周周(年月日)第節(jié)至第周周(年月日)第節(jié)授課地點(diǎn)授課學(xué)時2項(xiàng)目/任務(wù)簡介項(xiàng)目/任務(wù)名稱任務(wù)3-3數(shù)據(jù)庫系統(tǒng)與數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫應(yīng)用系統(tǒng)的關(guān)系項(xiàng)目/任務(wù)目標(biāo)知識目標(biāo)能力目標(biāo)了解數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫應(yīng)用系統(tǒng)三者區(qū)別與聯(lián)系能夠掌握關(guān)系數(shù)據(jù)庫的特征項(xiàng)目/任務(wù)分析能掌握數(shù)據(jù)庫的分類與關(guān)系型數(shù)據(jù)庫的特征,并準(zhǔn)確表述關(guān)系型數(shù)據(jù)庫的邏輯特征。理論教學(xué)內(nèi)容與方法講解案例分析實(shí)踐教學(xué)內(nèi)容與方法研討分析教學(xué)內(nèi)容與時間安排【組織教學(xué)】(2分鐘)【導(dǎo)入新課】(5分鐘)【講授新課】(50分鐘)【學(xué)生討論】(22分鐘)【布置作業(yè)】(1分鐘)參考資料《大數(shù)據(jù)基礎(chǔ)》中國人民大學(xué)出版社教學(xué)過程(附教案紙2頁)PAGEPAGE2第1頁【組織教學(xué)】(2分鐘)查點(diǎn)人數(shù),填寫學(xué)生考勤表【引入新課】(5分鐘)數(shù)據(jù)庫的類型?【講授新課】(50分鐘)一、數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫應(yīng)用系統(tǒng)三者的區(qū)別1.本質(zhì)不同數(shù)據(jù)庫系統(tǒng)是一種軟件系統(tǒng),數(shù)據(jù)庫管理系統(tǒng)本質(zhì)上就是一個軟件,而數(shù)據(jù)庫應(yīng)用系統(tǒng)則是一個計(jì)算機(jī)應(yīng)用系統(tǒng)。數(shù)據(jù)庫系統(tǒng)是為適應(yīng)數(shù)據(jù)處理的需要而發(fā)展起來的一種較為理想的數(shù)據(jù)處理系統(tǒng),也是一個為實(shí)際可運(yùn)行的存儲、維護(hù)和應(yīng)用系統(tǒng)提供數(shù)據(jù)的軟件系統(tǒng),是存儲介質(zhì)、處理對象和管理系統(tǒng)的集合體。數(shù)據(jù)庫管理系統(tǒng)就是實(shí)現(xiàn)把用戶意義下抽象的邏輯數(shù)據(jù)處理,轉(zhuǎn)換成為計(jì)算機(jī)中具體的物理數(shù)據(jù)處理的軟件。數(shù)據(jù)庫應(yīng)用系統(tǒng)是在數(shù)據(jù)庫管理系統(tǒng)(DBMS)支持下建立的一種計(jì)算機(jī)應(yīng)用系統(tǒng)。2.組成成分不同數(shù)據(jù)庫系統(tǒng)(DataBaseSystem,DBS)通常由軟件、數(shù)據(jù)庫和數(shù)據(jù)管理員組成。其軟件主要包括操作系統(tǒng)、各種宿主語言、實(shí)用程序以及數(shù)據(jù)庫管理系統(tǒng)。數(shù)據(jù)庫管理系統(tǒng)由數(shù)據(jù)庫語言和數(shù)據(jù)庫管理例行程序組成。數(shù)據(jù)庫應(yīng)用系統(tǒng)是由數(shù)據(jù)庫系統(tǒng)、應(yīng)用程序系統(tǒng)、用戶組成的,具體包括數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫管理員、硬件平臺、軟件平臺、應(yīng)用軟件、應(yīng)用界面二、數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫應(yīng)用系統(tǒng)三者的聯(lián)系(1)三者都用于管理數(shù)據(jù)庫,功能都是對數(shù)據(jù)庫進(jìn)行管理。(2)數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫應(yīng)用系統(tǒng)的組成成分中都包含有數(shù)據(jù)庫管理系統(tǒng),這兩者都是通過數(shù)據(jù)庫管理系統(tǒng)來實(shí)現(xiàn)對數(shù)據(jù)庫的管理和操控。三、數(shù)據(jù)庫系統(tǒng):數(shù)據(jù)庫系統(tǒng)是為適應(yīng)數(shù)據(jù)處理的需要而發(fā)展起來的一種較為理想的數(shù)據(jù)處理系統(tǒng),也是一個為實(shí)際可運(yùn)行的存儲、維護(hù)和應(yīng)用系統(tǒng)提供數(shù)據(jù)的軟件系統(tǒng),是存儲介質(zhì)、處理對象和管理系統(tǒng)的集合體。數(shù)據(jù)庫系統(tǒng)必須滿足以下幾個要求:①能夠保證數(shù)據(jù)的獨(dú)立性。數(shù)據(jù)和程序相互獨(dú)立有利于加快軟件開發(fā)速度,節(jié)省開發(fā)費(fèi)用。②冗余數(shù)據(jù)少,數(shù)據(jù)共享程度高。③系統(tǒng)的用戶接口簡單,用戶容易掌握,使用方便。④能夠確保系統(tǒng)運(yùn)行可靠,出現(xiàn)故障時能迅速排除;能夠保護(hù)數(shù)據(jù)不受非受權(quán)者訪問或破壞;能夠防止錯誤數(shù)據(jù)的產(chǎn)生,一旦產(chǎn)生也能及時發(fā)現(xiàn)。⑤有重新組織數(shù)據(jù)的能力,能改變數(shù)據(jù)的存儲結(jié)構(gòu)或數(shù)據(jù)存儲位置,以適應(yīng)用戶操作特性的變化,改善由于頻繁插入、刪除操作造成的數(shù)據(jù)組織零亂和時空性能變壞的狀況。⑥具有可修改性和可擴(kuò)充性。⑦能夠充分描述數(shù)據(jù)間的內(nèi)在聯(lián)系?!緦W(xué)生討論】(22分鐘)學(xué)生根據(jù)案例進(jìn)行小組討論并分析【布置作業(yè)】(1分鐘)1、復(fù)習(xí)鞏固本節(jié)內(nèi)容2、預(yù)習(xí)下節(jié)內(nèi)容考勤思考并回答討論并分析案例討論并分析案例討論并分析案例教案案首(總第12號)授課時間第周周(年月日)第節(jié)至第周周(年月日)第節(jié)授課地點(diǎn)授課學(xué)時2項(xiàng)目/任務(wù)簡介項(xiàng)目/任務(wù)名稱任務(wù)3-3數(shù)據(jù)庫系統(tǒng)與數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫應(yīng)用系統(tǒng)的關(guān)系項(xiàng)目/任務(wù)目標(biāo)知識目標(biāo)能力目標(biāo)了解數(shù)據(jù)庫語言SQL能夠掌握數(shù)據(jù)庫管理系統(tǒng)級數(shù)據(jù)庫語言項(xiàng)目/任務(wù)分析能準(zhǔn)確把握數(shù)據(jù)庫管理系統(tǒng)及其數(shù)據(jù)庫語言的區(qū)別。理論教學(xué)內(nèi)容與方法講解案例分析實(shí)踐教學(xué)內(nèi)容與方法研討分析教學(xué)內(nèi)容與時間安排【組織教學(xué)】(2分鐘)【導(dǎo)入新課】(5分鐘)【講授新課】(50分鐘)【學(xué)生討論】(22分鐘)【布置作業(yè)】(1分鐘)參考資料《大數(shù)據(jù)基礎(chǔ)》中國人民大學(xué)出版社教學(xué)過程(附教案紙2頁)PAGEPAGE2第1頁【組織教學(xué)】(2分鐘)查點(diǎn)人數(shù),填寫學(xué)生考勤表【引入新課】(5分鐘)數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫應(yīng)用系統(tǒng)三者的聯(lián)系?【講授新課】(50分鐘)一、數(shù)據(jù)結(jié)構(gòu)化及相關(guān)概念在信息社會,信息可以劃分為兩大類。一類信息能夠用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示,我們稱之為結(jié)構(gòu)化數(shù)據(jù),如數(shù)字、符號;而另一類信息無法用數(shù)字或統(tǒng)一的結(jié)構(gòu)表示,如文本、圖像、聲音、網(wǎng)頁等,我們稱之為非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)屬于非結(jié)構(gòu)化數(shù)據(jù),是非結(jié)構(gòu)化數(shù)據(jù)的特例。(1)結(jié)構(gòu)化數(shù)據(jù):即行數(shù)據(jù),是由二維碼結(jié)構(gòu)來邏輯表達(dá)和實(shí)現(xiàn)的數(shù)據(jù),嚴(yán)格地遵循數(shù)據(jù)格式和長度規(guī)范,主要通過關(guān)系型數(shù)據(jù)庫進(jìn)行存儲和管理。數(shù)據(jù)集中每條數(shù)據(jù)屬性的數(shù)量和順序相同,且數(shù)據(jù)的結(jié)構(gòu)信息和數(shù)據(jù)內(nèi)容是分離的,最典型的是關(guān)系型數(shù)據(jù)庫的表。(2)非結(jié)構(gòu)化數(shù)據(jù):顧名思義,就是沒有固定結(jié)構(gòu)的數(shù)據(jù),常見的各種文檔、圖片、視頻/音頻等都屬于非結(jié)構(gòu)化數(shù)據(jù)。對于這類數(shù)據(jù),一般以二進(jìn)制的形式進(jìn)行整體存儲,包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報(bào)表、圖像和音頻/視頻信息等。(3)半結(jié)構(gòu)化數(shù)據(jù):就是介于完全結(jié)構(gòu)化數(shù)據(jù)(如關(guān)系型數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫中的數(shù)據(jù))和完全無結(jié)構(gòu)化數(shù)據(jù)(如聲音、圖像文件等)之間的數(shù)據(jù),指帶有自描述信息的數(shù)據(jù),即數(shù)據(jù)的結(jié)構(gòu)信息和數(shù)據(jù)內(nèi)容混在一起,沒有明顯的區(qū)分。常見的XML、JSON、HTML和CSV等文件就屬于半結(jié)構(gòu)化數(shù)據(jù)。二、SQL與數(shù)據(jù)庫SQL就是結(jié)構(gòu)化查詢語言(StructureQueryLanguage),被美國國家標(biāo)準(zhǔn)局(ANSI)確定為關(guān)系型數(shù)據(jù)庫語言的美國標(biāo)準(zhǔn),后來被國際化標(biāo)準(zhǔn)組織(ISO)采納為關(guān)系型數(shù)據(jù)庫語言的國際標(biāo)準(zhǔn)。各數(shù)據(jù)庫廠商都支持ISO的SQL標(biāo)準(zhǔn)。關(guān)于SQL與數(shù)據(jù)庫的概念的關(guān)系,很多新接觸數(shù)據(jù)庫的人就以為SQL就是用來存儲數(shù)據(jù)的數(shù)據(jù)庫,還有的以為SQL是數(shù)據(jù)庫的一種。這兩種說法都是不準(zhǔn)確的。為了便于理解,舉例如下:如果數(shù)據(jù)就是一張張的表格,我們就可以按照不同的表格關(guān)系放在不同的文件夾里,這個文件夾就相當(dāng)于數(shù)據(jù)庫的基礎(chǔ)構(gòu)成要素——數(shù)據(jù)表。而當(dāng)我們的文件夾也非常繁多復(fù)雜的時候,我們就可以將文件夾按照不同的構(gòu)成分類儲存在文件柜中,每個文件柜中可能有非常多的分類用來存放不同的文件夾,這個文件柜就相當(dāng)于數(shù)據(jù)庫。而當(dāng)我們想要從文件柜中找到某份文件的時候,我們需要按照一定的規(guī)則去尋找,比如說“合同文件放在第三層第四排的架子上”,這種查找規(guī)則的實(shí)施就需要數(shù)據(jù)庫管理系統(tǒng)(DBMS)來實(shí)現(xiàn),相當(dāng)于一名文件管理員,幫助我們管理數(shù)據(jù)庫中的數(shù)據(jù)。三、常見的數(shù)據(jù)庫系統(tǒng):MySQLMySQL是一個快速的、多線程、多用戶和健壯的SQL數(shù)據(jù)庫服務(wù)器。MySQL服務(wù)器支持關(guān)鍵任務(wù)、重負(fù)載生產(chǎn)系統(tǒng)的使用,也可以將它嵌入到一個大配置(mass-deployed)的軟件中去。SQLServerSQLServer提供了眾多的Web和電子商務(wù)功能,如對XML和Internet標(biāo)準(zhǔn)的豐富支持,通過Web對數(shù)據(jù)進(jìn)行輕松安全的訪問,具有強(qiáng)大的、靈活的、基于Web的和安全的應(yīng)用程序管理等。OracleOracle產(chǎn)品系列齊全,幾乎囊括所有應(yīng)用領(lǐng)域,大型,完善,安全,可以支持多個實(shí)例同時運(yùn)行,功能強(qiáng)。能在所有主流平臺上運(yùn)行。完全支持所有的工業(yè)標(biāo)準(zhǔn)。采用完全開放策略??梢允箍蛻暨x擇最適合的解決方案。對開發(fā)商全力支持?!緦W(xué)生討論】(22分鐘)學(xué)生根據(jù)案例進(jìn)行小組討論并分析【布置作業(yè)】(1分鐘)1、復(fù)習(xí)鞏固本節(jié)內(nèi)容2、預(yù)習(xí)下節(jié)內(nèi)容考勤思考并回答討論并分析案例討論并分析案例討論并分析案例教案案首(總第號)授課時間第周周(年月日)第節(jié)至第周周(年月日)第節(jié)授課地點(diǎn)授課學(xué)時2項(xiàng)目/任務(wù)簡介項(xiàng)目/任務(wù)名稱任務(wù)4-1大數(shù)據(jù)分析技術(shù)之初體驗(yàn)項(xiàng)目/任務(wù)目標(biāo)知識目標(biāo)能力目標(biāo)了解傳統(tǒng)的數(shù)據(jù)處理和分析方式、大數(shù)據(jù)性質(zhì)的變化能夠?qū)W會將大數(shù)據(jù)時代和傳統(tǒng)的數(shù)據(jù)處理和分析方式做比較項(xiàng)目/任務(wù)分析傳統(tǒng)方式下數(shù)據(jù)處理和分析;大數(shù)據(jù)性質(zhì)的變化理論教學(xué)內(nèi)容與方法講解舉例分析實(shí)踐教學(xué)內(nèi)容與方法研討分析教學(xué)內(nèi)容與時間安排【組織教學(xué)】(2分鐘)【導(dǎo)入新課】(5分鐘)【講授新課】(50分鐘)【課堂練習(xí)】(15分鐘)【講解練習(xí)】(7分鐘)【布置作業(yè)】(1分鐘)參考資料《大數(shù)據(jù)基礎(chǔ)》中國人民大學(xué)出版社
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年黑龍江農(nóng)業(yè)工程職業(yè)學(xué)院單招職業(yè)技能考試備考試題含詳細(xì)答案解析
- 2026年武漢理工大學(xué)附屬小學(xué)教師招聘6人參考考試試題及答案解析
- 2026年黑龍江三江美術(shù)職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試備考題庫及答案詳細(xì)解析
- 2026年天津工藝美術(shù)職業(yè)學(xué)院單招綜合素質(zhì)考試參考題庫含詳細(xì)答案解析
- 2026年烏蘭察布職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試模擬試題及答案詳細(xì)解析
- 2026年江西建設(shè)職業(yè)技術(shù)學(xué)院單招綜合素質(zhì)考試參考題庫含詳細(xì)答案解析
- 2026年廣東水利電力職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試備考題庫及答案詳細(xì)解析
- 2023河北石家莊深澤縣人力資源和社會保障局“三支一扶”志愿者中專項(xiàng)招聘事業(yè)單位工作人員1人參考考試試題及答案解析
- 2026年四川財(cái)經(jīng)職業(yè)學(xué)院單招綜合素質(zhì)考試參考題庫含詳細(xì)答案解析
- 2026年河北外國語學(xué)院單招職業(yè)技能考試模擬試題含詳細(xì)答案解析
- (2025)事業(yè)單位考試(面試)試題與答案
- CNAS-GC25-2023 服務(wù)認(rèn)證機(jī)構(gòu)認(rèn)證業(yè)務(wù)范圍及能力管理實(shí)施指南
- 入伍智力測試題及答案
- 竣工驗(yàn)收方案模板
- 企業(yè)安全生產(chǎn)內(nèi)業(yè)資料全套范本
- 安全生產(chǎn)標(biāo)準(zhǔn)化與安全文化建設(shè)的關(guān)系
- DL-T5054-2016火力發(fā)電廠汽水管道設(shè)計(jì)規(guī)范
- 耳部刮痧治療
- 神經(jīng)外科介入神經(jīng)放射治療技術(shù)操作規(guī)范2023版
- 多模態(tài)數(shù)據(jù)的聯(lián)合增強(qiáng)技術(shù)
- 濱海事業(yè)單位招聘2023年考試真題及答案解析1
評論
0/150
提交評論