【《基于多輪對話的情緒分析系統(tǒng)構(gòu)架分析概述》1200字】_第1頁
【《基于多輪對話的情緒分析系統(tǒng)構(gòu)架分析概述》1200字】_第2頁
【《基于多輪對話的情緒分析系統(tǒng)構(gòu)架分析概述》1200字】_第3頁
【《基于多輪對話的情緒分析系統(tǒng)構(gòu)架分析概述》1200字】_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

基于多輪對話的情緒分析系統(tǒng)構(gòu)架分析概述目錄TOC\o"1-2"\h\u3768基于多輪對話的情緒分析系統(tǒng)構(gòu)架分析概述 140841.1整體架構(gòu) 1141891.2多輪對話情緒分析模型構(gòu)建 2305701.3網(wǎng)站前后端架構(gòu) 31.1整體架構(gòu)基于對話的情緒分析系統(tǒng)網(wǎng)站設(shè)計(jì)架構(gòu)如圖1.1所示,整個(gè)系統(tǒng)的構(gòu)建分文兩個(gè)大部分,一部分是整個(gè)網(wǎng)站的搭建,另一部分為情緒分析模型的構(gòu)建。圖1.1模型整體架構(gòu)圖網(wǎng)站的搭建流程主要分為四個(gè)步驟:首先使用HTML、CSS搭建靜態(tài)網(wǎng)頁,之后用JavaScript寫腳本實(shí)現(xiàn)動(dòng)態(tài)網(wǎng)頁,隨后用Ajax處理前后臺(tái)的HTTP請求,最后在后臺(tái)直接使用Django框架進(jìn)行管理。情緒分析模型構(gòu)建流程如下:首先建立數(shù)據(jù)集,然后對獲取到的數(shù)據(jù)進(jìn)行文本預(yù)處理,清洗好數(shù)據(jù)后就可以訓(xùn)練語料建立詞向量,獲得數(shù)字化表示后可以進(jìn)行模型構(gòu)建及訓(xùn)練以及驗(yàn)證集驗(yàn)證。1.2多輪對話情緒分析模型構(gòu)建情緒分析模型部分的整體架構(gòu)如圖1.2所示,主要分為四部分內(nèi)容:數(shù)據(jù)預(yù)處理、構(gòu)建詞向量、模型構(gòu)建、模型訓(xùn)練及測試。數(shù)據(jù)預(yù)處理主要過程如下:首先是區(qū)分出單個(gè)句子,因?yàn)樗@取的數(shù)據(jù)集很多句子混雜在一起的,而深度學(xué)習(xí)模型需要針對單個(gè)句子進(jìn)行建模和計(jì)算,因此要根據(jù)句子間隔符區(qū)分出多輪對話中的每個(gè)單個(gè)句子。然后是利用正則表達(dá)式去清洗句子,因?yàn)槭褂玫氖侵形奈谋镜南嚓P(guān)技術(shù),去掉非中文的英文大小寫、數(shù)字等其他字符來獲取絕對干凈的句子。之后就是利用jieba工具包進(jìn)行分詞,將句子劃分為一個(gè)個(gè)單詞。最后根據(jù)停用詞詞典去掉停用詞,停用詞即沒有實(shí)際意義的客觀詞,去掉停用詞,這將對之后詞向量的構(gòu)建及模型的構(gòu)建和分析都有積極作用。圖1.2情緒分析模型架構(gòu)圖構(gòu)建詞向量的過程如下:首先是分別使用one-hot、Glove、Word2vec模型構(gòu)造詞典,這三個(gè)技術(shù)將在第四章中進(jìn)行詳細(xì)介紹,這樣句子中的每一個(gè)單詞就可以用數(shù)字化的方式表示出來,可以作為深度學(xué)習(xí)模型的正確輸入。然后將句子成劃分訓(xùn)練集、驗(yàn)證集、測試集,準(zhǔn)備好模型構(gòu)建好之后模型訓(xùn)練、驗(yàn)證、測試所需要的數(shù)據(jù)集。模型構(gòu)建流程如下:本文主要用到了三個(gè)模型,首先是利用Pytorch包構(gòu)建LSTM模型,然后利用Keras包構(gòu)建CNN模型和TextCNN模型,最后是構(gòu)建了一種融合模型,將前面兩大類的模型串聯(lián)起來構(gòu)建成文新的模型,在這個(gè)模型中CNN模型的輸出作為LSTM的輸入,這樣所獲得的模型既融合了強(qiáng)大的特征提取又包含了時(shí)間序列的相關(guān)信息,是一種很好的方法。模型訓(xùn)練及測試過程如下:定義優(yōu)化器,定義損失函數(shù),然后輸入訓(xùn)練數(shù)據(jù)得到損失及準(zhǔn)確率,輸入驗(yàn)證數(shù)據(jù)得到損失及準(zhǔn)確率,輸入測試集得到損失及準(zhǔn)確率,模型進(jìn)行五輪訓(xùn)練及驗(yàn)證,最后輸出平均準(zhǔn)確率。1.3網(wǎng)站前后端架構(gòu)如圖1.3所示,整個(gè)網(wǎng)站的搭建分為前端設(shè)計(jì)、后端設(shè)計(jì)、及前后端交互設(shè)計(jì)三個(gè)方面。圖1.3網(wǎng)站框架圖前端設(shè)計(jì)中,首先是靜態(tài)網(wǎng)頁搭建,即設(shè)計(jì)顯示在Web頁面的整體頁面的布局及樣式;其次是寫腳本語言將靜態(tài)的網(wǎng)頁變?yōu)閯?dòng)態(tài)的網(wǎng)頁,實(shí)現(xiàn)事件響應(yīng)、數(shù)據(jù)顯示等。前后端交互處理網(wǎng)站的HTTP請求。本文中使用Ajax進(jìn)行不同URL之間的數(shù)據(jù)傳送,即進(jìn)行POST操作,其中傳輸?shù)臄?shù)據(jù)為JSON格式。之后使用頁面不同的URL作為數(shù)據(jù)的傳送地址,實(shí)現(xiàn)數(shù)據(jù)在前后臺(tái)的傳輸;最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論