自然語言處理基礎(chǔ)及應(yīng)用-教學(xué)大綱_第1頁
自然語言處理基礎(chǔ)及應(yīng)用-教學(xué)大綱_第2頁
自然語言處理基礎(chǔ)及應(yīng)用-教學(xué)大綱_第3頁
自然語言處理基礎(chǔ)及應(yīng)用-教學(xué)大綱_第4頁
自然語言處理基礎(chǔ)及應(yīng)用-教學(xué)大綱_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

《自然語言處理基礎(chǔ)及應(yīng)用》教學(xué)大綱課程名稱:自然語言處理基礎(chǔ)課程類別:必修適用專業(yè):計算機、人工智能類相關(guān)專業(yè)總學(xué)時:48學(xué)時(其中理論32學(xué)時,實驗16學(xué)時)總學(xué)分:3.0學(xué)分課程的性質(zhì)《自然語言處理》是面向計算機科學(xué)與技術(shù)、人工智能、智能科學(xué)與技術(shù)等專業(yè)本科生開設(shè)的一門專業(yè)核心(或?qū)I(yè)選修)課程。本課程旨在系統(tǒng)介紹自然語言處理(NaturalLanguageProcessing,NLP)的基本理論、關(guān)鍵方法與典型應(yīng)用,聚焦于如何讓計算機理解、生成和處理人類語言。作為一門交叉性與應(yīng)用性并重的課程,需要學(xué)生具備扎實的程序設(shè)計、數(shù)據(jù)結(jié)構(gòu)、概率統(tǒng)計與機器學(xué)習(xí)等前期知識基礎(chǔ)。課程內(nèi)容既涵蓋詞法分析、句法解析、語義表示等傳統(tǒng)自然語言處理技術(shù),也深入學(xué)習(xí)基于深度學(xué)習(xí)的現(xiàn)代NLP模型(如Transformer、預(yù)訓(xùn)練語言模型等),并緊密結(jié)合信息抽取、情感分析、機器翻譯、智能問答等前沿應(yīng)用場景。通過本課程的學(xué)習(xí),學(xué)生將掌握自然語言處理的核心思想與技術(shù)框架,培養(yǎng)解決實際語言計算問題的能力,為未來從事人工智能相關(guān)的研究、開發(fā)或應(yīng)用工作奠定堅實的理論與實踐基礎(chǔ)。同時,課程注重培養(yǎng)學(xué)生的算法設(shè)計能力、工程實踐意識與批判性思維,以適應(yīng)快速發(fā)展的AI領(lǐng)域?qū)Ω叨思夹g(shù)人才的需求。課程的任務(wù)本課程立足應(yīng)用型人才培養(yǎng),核心任務(wù)是使學(xué)生掌握自然語言處理的基礎(chǔ)能力。課程將引導(dǎo)學(xué)生熟練使用Python中的常用工具庫(如jieba,NLTK,Sklearn),通過完成一系列循序漸進的實踐項目(如新聞分類、評論情感分析等),切實體驗從數(shù)據(jù)處理、模型構(gòu)建到評估應(yīng)用的全流程。在此基礎(chǔ)上,重點培養(yǎng)學(xué)生將實際問題轉(zhuǎn)化為NLP任務(wù)、查閱文檔、調(diào)試代碼并優(yōu)化結(jié)果的綜合實踐能力,為其未來的技術(shù)工作或畢業(yè)設(shè)計奠定堅實基礎(chǔ)。課程學(xué)時分配序號教學(xué)內(nèi)容理論學(xué)時實驗學(xué)時其它1第1章緒論202第2章NLP前置技術(shù)解析223第3章卷積神經(jīng)網(wǎng)絡(luò)304第4章循環(huán)神經(jīng)網(wǎng)絡(luò)305第5章序列到序列模型與注意力機制426第6章序列標(biāo)注327第7章文本向量化表示228第8章機器翻譯349第9章預(yù)訓(xùn)練語言模型4010第10章預(yù)訓(xùn)練語言模型實戰(zhàn)4411第11章大模型:通用人工智能的典范20總計3216教學(xué)內(nèi)容及學(xué)時安排理論教學(xué)序號章節(jié)名稱教學(xué)目標(biāo)學(xué)時1緒論能夠了解自然語言處理的研究任務(wù)和發(fā)展歷程;能理解自然語言處理的挑戰(zhàn)。22NLP前置技術(shù)解析1.掌握開發(fā)環(huán)境的搭建;2.了解深度學(xué)習(xí)框架TensorFlow的基本概念與安裝;3.掌握PyTorch框架的使用及簡單線性回歸實現(xiàn);4.掌握NumPy常用算法、統(tǒng)計函數(shù)的使用。23卷積神經(jīng)網(wǎng)絡(luò)1.了解卷積神經(jīng)網(wǎng)絡(luò)(CNN)的基本原理與超參數(shù);

2.掌握用于文本分類的CNN模型結(jié)構(gòu);

3.了解TextCNN、DPCNN、IDCNN等CNN變體;

4.掌握使用PyTorch實現(xiàn)基于TextCNN的電影評論情感分析。34循環(huán)神經(jīng)網(wǎng)絡(luò)理解循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的模型結(jié)構(gòu)及三種模式;

2.掌握基于門控的RNN(LSTM、GRU)及其變體;

3.理解雙向長短期記憶網(wǎng)絡(luò)的工作原理;

4.掌握基于THUCNews數(shù)據(jù)集的文本分類實戰(zhàn)。35序列到序列模型與注意力機制1.掌握Seq2Seq模型的編碼器-解碼器結(jié)構(gòu)及實現(xiàn);

2.理解注意力機制(Attention)的原理及其權(quán)重可視化;

3.深度掌握Transformer模型(位置編碼、自注意力、多頭注意力);

4.了解Transformer的相關(guān)變體模型。46序列標(biāo)注1.了解序列標(biāo)注的基本任務(wù)(分詞、詞性標(biāo)注、命名實體識別);

2.理解基于規(guī)則、統(tǒng)計及深度學(xué)習(xí)的序列標(biāo)注算法;

3.掌握基于人民日報語料庫的分詞、詞性標(biāo)注及實體識別實戰(zhàn)。37文本向量化表示1.掌握文本表示方法(獨熱表示、分布式表示、詞嵌入);

2.理解語言模型及評價指標(biāo)(N-gram、神經(jīng)網(wǎng)絡(luò)語言模型);

3.掌握主流詞向量模型(Word2vec、GloVe)及向量化方法(PV-DM/DBOW);

4.能夠?qū)崿F(xiàn)網(wǎng)頁相似度計算。28機器翻譯1.了解機器翻譯的發(fā)展史及基本分類;

2.理解統(tǒng)計機器翻譯與神經(jīng)機器翻譯的區(qū)別;

3.掌握基于RNN和Transformer的機器翻譯代碼實現(xiàn);

4.了解機器翻譯的人工與自動評價方法。39預(yù)訓(xùn)練語言模型1.了解預(yù)訓(xùn)練語言模型的發(fā)展史、分類及起源;

2.掌握GPT模型的結(jié)構(gòu)與原理;

3.深度掌握BERT模型的整體結(jié)構(gòu)、輸入表示及預(yù)訓(xùn)練任務(wù);

4.了解ALBERT、RoBERTa、T5、XLNet等變體模型。410預(yù)訓(xùn)練語言模型實戰(zhàn)1.掌握利用預(yù)訓(xùn)練模型進行情感分析的全流程實現(xiàn);

2.掌握文本摘要抽取任務(wù)的代碼實現(xiàn)與評估;

3.理解文本分類與摘要抽取的評價指標(biāo)。411第11章大模型:通用人工智能的典范1.了解生成式人工智能與大模型的發(fā)展歷程;

2.理解大模型帶來的變革與面臨的挑戰(zhàn);

3.了解國產(chǎn)常用大模型(如文心一言)及其在輔助編程中的應(yīng)用。2學(xué)時合計36實驗教學(xué)1深度學(xué)習(xí)開發(fā)環(huán)境與框架基礎(chǔ)1.搭建Python、Anaconda及PyTorch開發(fā)環(huán)境;

2.掌握NumPy矩陣運算與統(tǒng)計函數(shù);

3.實現(xiàn)簡單的線性回歸模型。22Seq2Seq與Attention模型實踐1.掌握基于PyTorch的編碼器-解碼器(Seq2Seq)結(jié)構(gòu)實現(xiàn);

2.實現(xiàn)注意力機制(Attention)并進行權(quán)重可視化分析。23中文序列標(biāo)注任務(wù)實戰(zhàn)1.掌握基于人民日報語料庫的數(shù)據(jù)預(yù)處理方法;

2.實現(xiàn)中文分詞、詞性標(biāo)注及命名實體識別(NER)任務(wù)。24文本向量化與詞向量訓(xùn)練1.掌握Word2vec(CBOW/Skip-gram)模型的代碼實現(xiàn);

2.利用余弦相似度實現(xiàn)網(wǎng)頁或短文本的相似度計算。25神經(jīng)機器翻譯1.掌握基于Transformer架構(gòu)的中英翻譯模型訓(xùn)練流程;

2.學(xué)習(xí)使用BLEU指標(biāo)對機器翻譯質(zhì)量進行自動化評估。46預(yù)訓(xùn)練模型微調(diào)與下游任務(wù)1.掌握BERT/GPT等預(yù)訓(xùn)練模型的加載與微調(diào)(Fine-tuning)技術(shù);

2.實現(xiàn)電影評論情感分類實戰(zhàn)及文本摘要生成任務(wù)。4學(xué)時合計16考核方式1.綜合成績的構(gòu)成及比例:綜合成績的構(gòu)成包括平時成績20%和卷面成績80%。2.平時成績和期末成績的關(guān)系:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論