版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
(19)國家知識產(chǎn)權局(12)發(fā)明專利(10)授權公告號CN117056511B(65)同一申請的已公布的文獻號地址232000安徽省淮南市山南新區(qū)泰豐大街168號GO6NG16H20/70(2018.01)汪雨晴.基于交互注意力機制的心理咨詢文(第08期),全文.審查員鄧清清(54)發(fā)明名稱一種面向心理咨詢的用戶情感分析方法本發(fā)明公開了一種面向心理咨詢的用戶情健康情感詞典;S2:文本預處理后,提取用戶當前文本序列,并利用心理健康情感詞典提取對話雙方歷史情感詞序列;S3:將三個序列輸入到BiLSTM模型中得到對應的特征向量,并利用艾賓浩斯遺忘曲線對歷史情感詞序列進行權重分配;S4:利用交互注意力機制獲取慣性特征和交互特合后輸入到Softmax層計算情感傾向概率。本發(fā)明利用艾賓浩斯遺忘曲線對歷史情感詞序列進行權重分配增強了情感特征,并挖掘用戶自身、用戶與咨詢師之間的情感交互,提高情感分析的心理咨詢數(shù)據(jù)集構建心理健康情感詞典獲取用戶當前文本序列、用戶歷史情感詞序列、咨詢師歷史情感詞序列獲取用戶文本特征、用戶加權歷史情感特征、咨詢師加權歷史情感特征交互特征用戶情感傾向概率2步驟2:將心理咨詢文本進行預處理,獲取用戶當前文步驟3:將用戶當前文本序列通過BiLSTM模型獲取用戶文本特征,將用戶歷史情感詞序步驟4:將用戶文本特征和用戶歷史情感特征通過交互注意力機制獲取用戶自身情感步驟5:將得到的用戶文本特征、慣性特征和交互特征步驟4.1:對于用戶文本特征向量每一個元素的隱藏向量,計算與用戶的加權歷史情感對于用戶的加權歷史情感特征的每一個元素的隱藏向量,計算的交互表示,根據(jù)以上兩個交互表示,得到用戶當前情感狀態(tài)與用戶歷史情感狀態(tài)進行交互的慣性3步驟4.2:同步驟4.1進行處理用戶文本特征和咨詢師歷史情感特征,進而獲取用戶與咨詢師之間情感轉移的交互特征,M(γ“e,y)=tanh(WM[γ?2.根據(jù)權利要求1所述一種面向心理咨詢的用戶情感分析方法,其特征在于步驟1包步驟1.1:降噪處理,將心理咨詢文本中特殊符號、多余空格和url去除;理學和社會心理學這四個方面提取心理學領域?qū)S忻~,獲取心理學詞集,利用jieba分詞工具對文本進行分詞處理時,加入自定義的心理學詞集來提高心理咨詢文本分詞的準確步驟1.3:去停用詞處理,從心理咨詢文本分詞結果中移除了出現(xiàn)在停用詞列表內(nèi)的單步驟1.4:獲取種子詞集和候選詞集,通過統(tǒng)計每個詞匯在文本中出現(xiàn)的次數(shù),以及在負向情感種子詞集,以及候選情感詞集;步驟1.5:構建心理健康情感詞典,通過計算候選詞集與種子詞集的PMI值,并進行差異計算,得出每個詞的情感值SO-PMI(w)并與閾值比較,從而得出該詞匯的情感傾向,進而構建心理健康情感詞典,其計算公式如下:其中,w?和w?分別表示未確定情感極性的情感詞,Pw和Nw分別表示正負情感種子詞,P(w?,w?)表示兩個詞語w?和w?共同出現(xiàn)的概率,P(w?)和P(w?)分別表示兩個單詞單獨出現(xiàn)的3.根據(jù)權利要求1所述的面向心理咨詢的用戶情感分析方法,其特征在于步驟2包括:步驟2.1:將一個心理咨詢文本分為三個部分,分別為用戶當前句、用戶歷史文本和咨詢師歷史文本;步驟2.2:將這三個文本進行降噪、分詞和去停用詞操作,在利用jieba分詞工具進行分詞時,加入自定義的心理學詞集進行分詞操作,得到用戶當前文本序列、用戶歷史文本序列和咨詢師歷史文本序列;步驟2.3:將用戶歷史文本序列和咨詢師歷史文本序列進一步處理,利用構建的心理健康情感詞典,分別與用戶和咨詢師歷史文本序列進行匹配,提取歷史文本序列中的情感詞,從而獲取用戶歷史情感詞序列和咨詢師歷史情感詞序列。4.根據(jù)權利要求1所述的面向心理咨詢的用戶情感分析方法,其特征在于步驟3包括:步驟3.1:將獲取的用戶當前文本序列、用戶歷史情感詞序列和咨詢師歷史情感詞序4表示用戶文本特征;步驟3.3:將用戶歷史情感詞序列和咨詢師歷史情感詞將用戶歷史情感特征和咨詢師歷史情感特征利用艾賓浩斯遺忘曲5步驟5.2:將融合后的特征向量經(jīng)全連接層輸入到Softmax層中,計算用戶情感傾向概6技術領域[0001]本發(fā)明涉及自然語言處理領域,具體是一種面向心理咨詢的用戶情感分析方法。背景技術[0002]當人們尋求心理咨詢時,往往傾訴出自己情感困擾和內(nèi)心矛盾,表達情緒波動和情感需求。心理咨詢師的言辭和語氣傳遞安撫和支持信息,讓用戶感受被理解和接納。這種安撫和支持有助于減輕用戶的焦慮和壓力,改善他們的情緒狀態(tài)。因此對心理咨詢文本中的用戶進行情感分析,挖掘出用戶自身的情感傳遞,以及用戶與咨詢師交互中產(chǎn)生的情感轉移,識別用戶情感的變化,使咨詢師可以更好地了解用戶情感狀態(tài),從而有效進行心理干預和支持,也為心理咨詢AI助手實時檢測用戶的情感變化以生成合適的回復提供幫助。[0003]現(xiàn)有對話情感分析方法主要分為基于上下文建模、基于說話者建模和基于外部知識建模三種?;谏舷挛慕5姆椒ㄍㄟ^獲取上下文信息,捕捉上下文信息對話語的影響并提取特征用于情感分類?;谡f話者建模的方法將情感分析任務與說話者的特點與個性化相關聯(lián),考慮到不同說話者可能有不同的情感表達方式和特點,從而更準確的預測他們的情感狀態(tài)?;谕獠恐R建模的方法通過利用外部的語言資源、情感詞典、知識圖譜等來增強模型的語義理解和情感識別能力。以上方法將對話歷史文本作為一個整體特征進行情感分析,而在對話過程中,隨著時間的推移早期對話內(nèi)容可能逐漸模糊或被遺忘,在用戶當前的前幾句對話內(nèi)容可能對用戶當前有著較強的情感影響,本發(fā)明將對用戶當前情感狀態(tài)有較強影響的句子定義為前向近鄰句,因忽略早期對話內(nèi)容和前向近鄰句對用戶當前的情感狀態(tài)具有不同程度的影響,導致分類的準確率較低。[0004]針對以上不足,本發(fā)明提出一種面向心理咨詢的用戶情感分析方法。本發(fā)明不同之處在于,通過構建心理健康情感詞典,識別對話雙方歷史文本中的情感詞,并利用艾賓浩斯遺忘曲線對歷史情感詞序列進行權重分配,增強文本的情感特征。同時,使用交互注意力機制挖掘用戶自身的情感傳遞、用戶與咨詢師之間的情感交互。發(fā)明內(nèi)容[0005]本發(fā)明的目的在于提供一種面向心理咨詢的用戶情感分析方法,先將心理咨詢文本分為用戶當前句、用戶歷史文本和咨詢師歷史文本,利用構建的心理健康情感詞典分別提取對話雙方歷史文本的情感詞序列。再將當前句與對話雙方的歷史情感詞序列輸入到BiLSTM中獲取對應的特征向量,并利用艾賓浩斯遺忘對歷史情感詞序列進行權重分配。再將用戶文本特征分別與對話雙方的情感特征通過交互注意力機制獲取慣性特征和交互特征,并結合用戶文本特征輸入到Softmax計算情感傾向概率。[0006]本發(fā)明為了實現(xiàn)發(fā)明目的采用如下技術方案:[0007]一種面向心理咨詢的用戶情感分析方法,包括以下[0008]步驟1:對數(shù)據(jù)進行降噪、分詞、去停用詞預處理后,計算詞匯的情感傾向來構建心理健康情感詞典,其基本步驟如下:7[0009]步驟1.1:降噪處理。將心理咨詢文本中特殊符號、多余空格和url去除。格心理學和社會心理學這四個方面提取心理學領域?qū)S忻~,獲取心理學詞集,利用jieba分詞工具對文本進行分詞處理時,加入自定義的心理學詞集來提高心理咨詢文本分詞的準確率。[0011]步驟1.3:去停用詞處理。從心理咨詢文本分詞結果中移除了出現(xiàn)在停用詞列表內(nèi)的單詞。[0012]步驟1.4:獲取種子詞集和候選詞集。通過統(tǒng)計每個詞匯在文本中出現(xiàn)的次數(shù),以及在整個語料庫中出現(xiàn)的文檔數(shù),計算出詞頻TF和逆文檔頻率IDF后,求出TF-IDF值。去除低頻詞以獲取候選情感詞集,并篩選出高頻率詞匯以獲取正、負向情感種子詞集。[0013]步驟1.5:構建心理健康情感詞典。通過計算候選詞集與種子詞集的PMI值,并進行差異計算,得出每個詞的情感值SO-PMI(w)并與閾值相比較,得出該詞匯的情感傾向,進而構建心理健康情感詞典。[0014]情感傾向點互信息算法計算如下:子詞,P(w?,w?)表示兩個詞語w?和w?共同出現(xiàn)的概率,P(w?)和P(w?)分別表示兩個單詞單獨[0017]步驟2:將心理咨詢文本進行預處理,獲取用戶當前文本序列,并結合步驟1構建的心理健康情感詞典獲取用戶歷史情感詞序列和咨詢師歷史情感詞序列,其基本步驟如下:[0018]步驟2.1:將心理咨詢文本首先分為三個部分,分別為用戶當前句、用戶歷史文本和咨詢師歷史文本,再對三個部分進行降噪、分詞和去停用詞操作。在利用jieba分詞工具進行分詞時,加入自定義的心理學詞集進行分詞操作。經(jīng)以上處理后獲取用戶當前文本序列、用戶歷史文本序列和咨詢師歷史文本序列。[0019]步驟2.2:利用自建的心理健康情感詞典,分別與用戶歷史文本序列和咨詢師歷史用戶歷史情感詞序列和咨詢師歷史情感詞序列。[0020]步驟3:針對步驟2中獲取的用戶當前文本序列、用戶歷史情感詞序列和咨詢師歷[0021]步驟3.1:針對步驟2獲取的用戶當前文本序列、用戶歷史情感詞序列和咨詢師歷史情感詞序列,使用Word2Vec進行詞嵌入訓練,以獲取每個詞的詞向量。[0022]步驟3.2:將用戶當前文本序列訓練得到的詞向量,輸入到BiLSTM中獲取用戶當前句的文本特征向量,[0023]H={h,h?,h?3,8照情感詞序列位置進行權重分配,獲取用戶加權歷史情感特征和咨詢師加權歷史情感特[0034]參數(shù)說明:9"表示元素h?與h之間的注意力分數(shù),f表示計算元素h與h?相似9[0037]參數(shù)說明:9;表示元素h?與h之間的注意力分數(shù),f表示計算元素h?與h相似[0041]步驟4.2:同步驟4.1進行處理用戶文本特征和咨詢師歷史情感特征,進而獲取用[0042]步驟5:融合步驟3和步驟4獲取的特征并輸出到全連接層和Softmax獲得分類結[0046]步驟5.2:將融合后的特征向量經(jīng)全連接層輸入到Soft附圖說明[0052]圖4為基于交互注意力機制獲取慣性特征和交互特征示意圖。健康情感詞典。結合圖2進行如下說明:空格和url去除。[0057]S1.2.分詞操作。首先獲取心理學詞集,再將心理學詞集應用到分詞操作中,提高心理咨詢文本分詞結果的準確性。獲取心理學詞集;[0059]S1.2.2.利用jieba分詞工具對心理咨詢文本進行分詞處理,如“你/這/是/創(chuàng)傷/后/應激/障礙”,而加入自定義的心理學詞集來分詞“你/這/是/創(chuàng)后應激障礙”(簡稱PTSD)看成一個心理學名詞,提高分詞準確率。[0061]S1.4.獲取種子詞集和候選詞集。通過統(tǒng)計每個詞匯在文本中出現(xiàn)的次數(shù),以及在整個語料庫中出現(xiàn)的文檔數(shù),計算出詞頻TF和逆文檔頻率IDF后,求出TF-IDF值。去除低頻[0062]S1.5.構建心理健康情感詞典。通過計算候選詞集與種子詞集的PMI值,并進行差異計算,得出每個詞的情感值SO-PMI(w)并與閾值相比較,最終差值大于0時,w為正面情感建心理健康情感詞典。[0063]S2.將心理咨詢文本進行預處理,獲取用戶當前文本序列,并結合S1構建的心理健康情感詞典獲取用戶歷史情感詞序列和咨詢師歷史情感詞序列。[0064]S2.1.將一個心理咨詢文本分為三個部分,心理咨詢文其中u表示用戶在第i輪的咨詢話語。首先分為三個部分,分別為用戶當前句d?={u3、用[0065]S2.2.將文本進行降噪、分詞和去停用詞操作。在利用jieba分詞工具進行分詞時,加入自定義的心理學詞集進行分詞操作。經(jīng)以上處理后獲取用戶當前文本序列W、用戶歷史文本序列wA和咨詢師歷史文本序列wB。[0066]S2.3.對用戶歷史文本和咨詢師歷史文本序列進一步處理。利用構建的心理健康情感詞典,分別與wAH、w進行匹配,當歷史文本序列中的詞在心理健康情感詞典中,則留文本第i個情感詞,和咨詢師歷史情感詞序列SB={s1,sB,s3,…s,其中s,表示咨詢師歷史文本第i個情感詞。[0067]S3.針對S2中獲取的用戶當前文本序列、用戶歷史情感詞序列和咨詢師歷史情感[0068]S3.1.將獲取的用戶當前文本序列W={w?,W?,W?,...,w}、用戶歷史情感詞序列S?={s?,s?,s3…s和咨詢師歷史情感詞序列SB={s1,s,s3,…s},使用Word2Vec進行詞[0069]S3.2.將用戶當前文本序列訓練得到的詞向量,輸入到BiLSTM中獲取用戶當前句H={h,h?,h?,…,h?}[0072]S3.3.將用戶歷史情感詞序列和咨詢師歷史情感詞序列訓練得到的詞向量,[0074]參數(shù)說明:h?表示用戶歷史情感詞序列t時刻隱藏狀態(tài),H?表示用戶歷史情感特[0075]S3.4.將用戶歷史情感特征和咨詢師歷史情感特征利用艾賓浩斯遺忘曲線,情感詞序列位置進行權重分配,獲取用戶加權歷史情感特征和咨詢師加權歷史情感特征。[0077]參數(shù)說明:βA(t)表示權重函數(shù),c為1.25,k為1.84,aA(t)[0080]S4.1.對于用戶文本特征向量每一個元素的隱藏向量,計算與用戶的加權歷史情
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第05講 鴻門宴(寒假預習講義)【含答案詳解】
- 會議會務籌備與場地布置制度
- 2025年企業(yè)環(huán)境保護責任手冊
- 車站客運服務評價與反饋制度
- 2026年瀏陽五中編外合同制教師招聘備考題庫(三)及1套完整答案詳解
- 2026年獅山松崗中心幼兒園財務報賬員招聘備考題庫及答案詳解一套
- 2026年環(huán)縣事業(yè)單位引進高層次和急需緊缺人才備考題庫完整參考答案詳解
- 2026年沈陽鋁鎂設計研究院有限公司招聘備考題庫及1套參考答案詳解
- 養(yǎng)老院入住老人滿意度調(diào)查與反饋制度
- 2026年武義縣醫(yī)療保障局招聘備考題庫及答案詳解1套
- 2026年國有企業(yè)金華市軌道交通控股集團招聘備考題庫有答案詳解
- 2025年電子工程師年度工作總結
- 2026年吉林司法警官職業(yè)學院單招職業(yè)技能筆試備考題庫帶答案解析
- 2025年高職第三學年(工程造價)工程結算與審計測試題及答案
- 2024年曲阜師范大學馬克思主義基本原理概論期末考試真題匯編
- 醫(yī)院消毒技術培訓課件
- 江蘇省電影集團招聘筆試題庫2026
- 《機械創(chuàng)新設計》課件-多功能播種機整體結構設計
- 旅拍分銷合同范本模板
- 有創(chuàng)動脈血壓導管堵塞的應急處理
- ai寫作與公文寫作培訓課件
評論
0/150
提交評論