《文本分類:網(wǎng)上購物評價分類》教學設(shè)計_第1頁
《文本分類:網(wǎng)上購物評價分類》教學設(shè)計_第2頁
《文本分類:網(wǎng)上購物評價分類》教學設(shè)計_第3頁
《文本分類:網(wǎng)上購物評價分類》教學設(shè)計_第4頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

課題文本分類:網(wǎng)上購物評價分類建議課時1課時課型新知學習課()原理探究課(√)綜合應(yīng)用課()其它_____()教學背景分析隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展和普及,對浩如煙海的文獻、資料和數(shù)據(jù)進行表示處理、自動分類、組織管理,已經(jīng)成為一個重要的研究課題。文本分類(textcategorization)是一種對文本數(shù)據(jù)進行處理的基礎(chǔ)技術(shù),學生在前面的學習中接觸較少。本節(jié)課以“網(wǎng)上購物評價分類、新聞分類”等問題情境引入,幫助學生理解文本分類基本概念及其應(yīng)用,并以新聞文本分類為例,要求學生通過人工智能實驗平臺探究文本分類的原理,理解文本分類的核心算法,讓學生在探索、應(yīng)用和實踐中對自然語言處理技術(shù)有更深入的理解。學習目標1.了解文本分類基本概念和文本分類系統(tǒng)。2.理解文本特征選取與權(quán)重計算的基本方法,掌握TF-IDF算法。3.理解樸素貝葉斯原理及其應(yīng)用。學習重難點1.學習重點(1)了解文本分類基本概念和文本分類系統(tǒng)。(2)理解文本特征選取與權(quán)重計算的基本方法,掌握TF-IDF算法。2.學習難點(1)理解樸素貝葉斯原理及其應(yīng)用。課前準備教材,教學課件,平板電腦,人工智能實驗平臺(含“文本分類”實驗),學習單,閱讀材料“自動提取關(guān)鍵詞:TF-IDF統(tǒng)計方法解讀”。教學過程設(shè)計教師活動學生活動環(huán)節(jié)一:新課引入教師活動:1.創(chuàng)設(shè)情境:要求學生扮演新聞社編輯角色,對給定的2則新聞進行分類,并回答分類依據(jù)。2.通過人工分類與機器自動分類的對比,引出本節(jié)課的主題——文本分類。3.啟發(fā)學生思考:計算機是否能夠正確理解評論者要表達的意思?引出理解語言的復雜性及機器理解語言的一般方法,即將文本想要表達的內(nèi)容劃分到正確的類型中。學生活動:1.新聞分類,并回答分類依據(jù)。2.理解文本分類產(chǎn)生的原因。3.積極思考。設(shè)計意圖:通過創(chuàng)設(shè)“新聞社編輯”情境,讓學生體驗人工分類的過程,進而對比人工分類和機器自動分類,順利引出本節(jié)課的學習主題——文本分類。 環(huán)節(jié)二:新知學習(一)認識文本分類教師活動:1.講解文本分類的產(chǎn)生背景、基本概念和文本分類在生活中的實際應(yīng)用,如購物評價分類系統(tǒng)、新聞題材分類系統(tǒng)、垃圾郵件識別系統(tǒng)等。2.啟發(fā)學生思考:機器是如何進行文本分類的?引出最常用的一種分類方法,即關(guān)鍵詞分析。學生活動:1.了解文本分類的產(chǎn)生背景、基本概念和實際應(yīng)用。2.積極思考,知道關(guān)鍵詞分析是文本分類最常用的一種分類方法。設(shè)計意圖:采用教師講授形式幫助學生理解文本分類的基本概念及其應(yīng)用,并啟發(fā)學生思考文本分類的原理,激發(fā)學習興趣。 環(huán)節(jié)三:新知學習(二)文本分類的原理教師活動:1.組織學生開展感知體驗5-5:探究文本分類的方法。(1)提出任務(wù):獨立尋找給定兩節(jié)文本的關(guān)鍵詞,將結(jié)果填寫在表5-5中,然后小組合作分析思考題(1)、(2)。(2)課堂巡視,解決小組合作中存在的問題。(3)組織學生分組匯報,匯報要點包括任務(wù)完成情況和過程體會。(4)結(jié)合各小組的匯報結(jié)果,進行總結(jié),幫助學生明確人工分類和機器自動分類的區(qū)別,即人依據(jù)主觀感受和經(jīng)驗進行判斷,而機器則是通過大數(shù)據(jù)分析和統(tǒng)計算法進行判斷。2.布置小組活動1:探究文本分類的原理。(1)小組劃分,每4-6人一組。(2)說明活動步驟與要求:閱讀材料“自動提取關(guān)鍵詞:TF-IDF統(tǒng)計方法解讀”(閱讀材料源文件詳見本課時素材資源),理解TF-IDF算法。打開平板人工智能實驗平臺,選擇“文本分類”實驗,感受機器對新聞文本進行分類的過程,填寫學習單。(3)課堂巡視,解決小組合作過程中的疑問。(4)組織學生分組匯報,匯報要點包括實驗過程和實驗中遇到的困難及解決辦法?;顒?建議時長:20分鐘。3.教師總結(jié)(1)以第一條新聞為例,介紹機器新聞文本分類初體驗的實驗結(jié)果,展示學習單填寫參照,總結(jié)學生開展原理探究的4個步驟。(2)展示中文分詞的實驗過程,講解停用詞的概念和新聞分詞的結(jié)果,強調(diào)灰色字體即為停用詞。(3)展示“詞袋模型”的實驗過程,強調(diào)詞匯表是分詞及統(tǒng)計詞語在文檔中出現(xiàn)次數(shù)的判斷依據(jù)。(4)展示特征提取的實驗過程,結(jié)合提供給學生的閱讀材料“自動提取關(guān)鍵詞:TF-IDF統(tǒng)計方法解讀”,再次講解TF-IDF統(tǒng)計方法的計算過程,幫助學生鞏固理解文本特征選取與權(quán)重計算的基本方法,讓學生點擊不同的詞語,查看其TF-IDF的值,判斷該文檔的關(guān)鍵詞。(5)展示分類預測的實驗過程,在前面的實驗過程中,學生對于樸素貝葉斯分類法產(chǎn)生疑問,詳細講解樸素貝葉斯算法的思想和計算公式,并以小飛去超市的案例講解樸素貝葉斯算法計算過程,進而讓學生自主探究分類預測中新聞分類預測概率的計算過程。學生活動:1.開展感知體驗5-5:探究文本分類的方法。(1)明確任務(wù)內(nèi)容與要求。(2)組內(nèi)分工,開展小組任務(wù)。(3)按照教師要求分小組匯報。(4)記錄教師總結(jié)中的要點。2.各小組分工協(xié)作完成活動1。(1)按要求完成分組。(2)明確活動步驟與要求。(3)組內(nèi)分工,合作完成活動1。(4)按照教師要求分小組匯報。3.記錄教師總結(jié)中的要點。(1)對照、補充學習單。(2)理解中文分詞過程和停用詞的概念。(3)理解詞匯表的作用。(4)結(jié)合閱讀材料,理解TF-IDF算法,判斷文檔的關(guān)鍵詞。(5)結(jié)合教師的講解,理解樸素貝葉斯分類法的計算過程和中心思想,進一步探究分類預測中新聞分類預測概率的計算過程。設(shè)計意圖:通過感知體驗5-5,幫助學生明確人工分類和機器自動分類的區(qū)別,即人依據(jù)主觀感受和經(jīng)驗進行判斷,而機器則是通過大數(shù)據(jù)分析和統(tǒng)計算法進行判斷。為了讓學生理解文本分類的核心算法,如TF-IDF算法、樸素貝葉斯算法等,首先讓學生閱讀材料“自動提取關(guān)鍵詞:TF-IDF統(tǒng)計方法解讀”,初步理解TF-IDF算法的基本思想,接著要求學生通過人工智能實驗平臺探究文本分類的原理,最后通過實驗要點總結(jié),系統(tǒng)介紹TF-IDF算法和樸素貝葉斯算法,解決學生實驗過程中的疑問,學生在探索、應(yīng)用和實踐中能夠?qū)ψ匀徽Z言處理技術(shù)有更深入的理解。環(huán)節(jié)四:總結(jié)歸納教師活動:1.通過提問引導學生回顧本節(jié)課所學知識點,問題如下:(1)什么是文本分類,它在生活中有哪些應(yīng)用?(2)TF-IDF算法和樸素貝葉斯算法在文本分類中的作用是什么?學生活動:1.回答問題,鞏固新知。設(shè)計意圖:通過提問幫助學生回憶本節(jié)課所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論