2022青少年兒童心理健康領(lǐng)域的詢問式問答系統(tǒng)設(shè)計方案_第1頁
2022青少年兒童心理健康領(lǐng)域的詢問式問答系統(tǒng)設(shè)計方案_第2頁
2022青少年兒童心理健康領(lǐng)域的詢問式問答系統(tǒng)設(shè)計方案_第3頁
2022青少年兒童心理健康領(lǐng)域的詢問式問答系統(tǒng)設(shè)計方案_第4頁
2022青少年兒童心理健康領(lǐng)域的詢問式問答系統(tǒng)設(shè)計方案_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

DesignandImplementationofQuery-basedQuestionAnsweringSystemforMentalHealthofAdolescentsandAugust,近年來,青少年兒童心理健康問題日益嚴(yán)重。如何給予孩子及時的關(guān)懷和較專業(yè)的初步干預(yù)變得十分重要。然而,目前各級學(xué)校專業(yè)心理輔導(dǎo)的人力不足,一般教師和家長又缺乏心理健康專業(yè)知識,青少年兒童也常不愿意主動公開求助?;谝陨媳尘?,本論文設(shè)計并實作了一個詢問式的問答系統(tǒng)。系統(tǒng)采用自動問答和詢問式問答相結(jié)合的模式,并串接在臺灣用戶使用頻率最高的LINE平臺上,希望提供家長和教師實時的在線心理問答服務(wù),成為一項可隨時使用的心理輔導(dǎo)資源。本系統(tǒng)的主要任務(wù)如下:、通過檢索模塊,快速鎖定和用戶問題相似的候選問題集,縮短問題匹配時間和問答反應(yīng)時間。檢索模塊包括四個部分:采用jieba分詞工具之搜索引擎模式搭配心理健康領(lǐng)域詞典的方法分詞、停用詞過濾、近義詞召回和建立倒排表;、使用BET模型對問句進(jìn)行句矢量編碼;、使用余弦相似度計算候選問題集和用戶問題間的相似性;4、加入詢問式學(xué)習(xí)機(jī)制:當(dāng)系統(tǒng)無法確定用戶問題的答案時,回傳相似度前三的候選問題列表供用戶點選,進(jìn)行問題的二次召回;當(dāng)系統(tǒng)無法解答用戶問題時,向其他用戶詢問并征集答案,通過滿意度統(tǒng)計方法篩選出最佳答案,經(jīng)專家評估認(rèn)可后,更新到系統(tǒng)問答庫中,實現(xiàn)問答庫的自動擴(kuò)充和優(yōu)化。 Bot LINEBot執(zhí)行架 QA資料 jieba分詞模 ELIZA腳 LINEBot執(zhí)行架 jieba分詞工 第一 緒亡資料統(tǒng)計暨自殺通報統(tǒng)計》[1]資料顯示,1524105.98.80.2師,平均而言,學(xué)生需要等待一個月才可以排到諮商[3]。學(xué)校的一般教師沒有1.1[6]。一級和二級的教師以及輔導(dǎo)室老師,為了改善學(xué)生[7]。當(dāng)中,9成的青少年不會主動尋求治療,75%的青少年也不會主動告訴老師和家在現(xiàn)今的互聯(lián)網(wǎng)時代中,實時通訊軟件在現(xiàn)代人生活中占據(jù)愈來愈重要的位置,聊天機(jī)器人的應(yīng)用愈來愈廣泛,是當(dāng)代熱門的科技話題之一。聊天機(jī)器人具備極強(qiáng)的實時性,人們使用它的主要原因也在于快捷、方便,可以更容易地獲得幫助和信息,快速融入日常情境之中,還可以避免與真人交談時的社交壓力,不必?fù)?dān)心自己提出的問題[10。但聊天機(jī)器人多用于商務(wù)、顧客服務(wù)、游戲、理財?shù)阮I(lǐng)域,而在心理健康領(lǐng)域,中文問答聊天機(jī)器人的發(fā)展較少。本研究的目的,本研究的工作成果如下。1.整理問答知識庫:收集青少年兒童心理健康領(lǐng)域的問答文本資料,構(gòu)建聊天機(jī)器人所需的問答知識庫。2.篩選候選問題集:使用jieba分詞工具、停用詞過濾、近義詞召回和建立倒排表,快速篩選出和用戶問題相似的候選集。3.改善jieba分詞效果:整理心理健康領(lǐng)域詞典,在jieba詞庫中加入心理健康領(lǐng)域詞典,改善jieba對心理健康領(lǐng)域詞匯的分詞效果,提升檢索模塊表現(xiàn)4.匹配可信的最適候選問答:使用BET模型搭配余弦相似度方法,計算用戶問題和候選問題集的相似度,匹配出具備一定置信度的最適配候選問題,并回傳其答案。5.詢問式問答學(xué)習(xí):當(dāng)檢索結(jié)果沒有達(dá)到一定的置信度時,回應(yīng)相似度高的候選問題供用戶選擇。6.向同儕用戶詢問并征集答案,通過滿意度統(tǒng)計方法篩選最佳答案,經(jīng)專家認(rèn)可后更新到問答知識庫。第二 文獻(xiàn)探問答系統(tǒng)是人工智能和自然語言處理領(lǐng)域的一個熱門研究方向[11]。按知識識圖譜的問答系統(tǒng),以及基于大規(guī)模文檔集的問答系統(tǒng)等。其中,F(xiàn)AQ問答系統(tǒng)的問答庫是由問答對(QuestionAnswerPair,QAPair)構(gòu)成的。FAQ問答系統(tǒng)基在于計算和排序用戶問題與問答庫中的問題的相似度。FAQ問答系統(tǒng)對比搜尋引的大規(guī)模文檔集,需要去閱讀大量文檔,從中節(jié)選出所需答案。因此,F(xiàn)AQ問答正向索引是一種索引方法,它以文檔id作為關(guān)鍵字,記錄每個文檔中每個詞的位置。如圖2.1所示,查找時會有序遍歷每個文檔中的詞,直到找到匹配所有涵會導(dǎo)致檢索時間很長,檢索效率低。以本論文系統(tǒng)為例,如果每一次用戶提問,都需要把用戶問題與整個問答庫的問題計算一遍相似度,再對相似度進(jìn)行排序選出最相似的問題,會造成巨大的計算量。從用戶使用體驗的角度出發(fā),也會造成問答的延時等待。當(dāng)問答庫的資料量越來越大的時候,這種情況會越來越嚴(yán)重。因此,需要設(shè)計倒排索引機(jī)制,改善計算量問題。圖2.1:正向索引結(jié) 圖2.2:倒排索引結(jié)倒排索引,亦稱為反向索引,是檢索算法中常用的重要的資料結(jié)構(gòu)12]。如圖2.2所示,它以詞作為關(guān)鍵字進(jìn)行索引,記錄每個詞出現(xiàn)在哪些文檔中。以本論文系統(tǒng)為例,實際對話中,我們往往不知道問題的id,只收到用戶輸入的問題,這樣檢索的時候如果對問答庫做全局掃描,遍歴每一個問題來判斷是否包含用戶問題中的關(guān)鍵詞,顯然時間復(fù)雜度很高,十分耗時。所以需要構(gòu)建倒排索引:由用戶問題當(dāng)中的關(guān)鍵詞快速地從問答庫中檢索到一個相對較小的問題子集作為候選問題集,保證該集合以較大的可能性包含用戶問題的相似問題。換言之,即由用戶問題的關(guān)鍵詞來高效鎖定問答庫中可能相似問題的id。由于每個詞對應(yīng)的問句數(shù)量會隨著問答對資料集的擴(kuò)展,而產(chǎn)生動態(tài)的變化,所以系統(tǒng)需要定期維在自然語言處理領(lǐng)域,文本屬于非結(jié)構(gòu)化資料,計算機(jī)無法直接讀懂和計算。因此,鎖定候選問題集后,在計算用戶問題與每一個候選問題的相似度之前,需要先將文本進(jìn)行預(yù)處理,表示成結(jié)構(gòu)化的矢量表達(dá)。文本表示的方法主要有四種:獨熱編碼、基于加權(quán)方式的方法F、基于詞矢量的算法ord2vec和預(yù)訓(xùn)練模型。 獨熱編碼把每個詞表示為一個長的矢量,矢量維度是詞表的大小。矢量中只有代表這個詞的所在維度為10,是一種離散表示。例如,抑郁[1,0,0,0,0],焦慮[0,1,0,0,0],自閉[0,0,1,0,0],晚飯[0,0,0,1,0],寵物[0,0,0,0,1]。 TF-TF-IDF[13]是一種常用于信息檢索的加權(quán)技術(shù),作為文檔與用戶查詢之間相關(guān)程度的評級,本質(zhì)上是通過統(tǒng)計的方法,評估一個詞匯在目標(biāo)文檔或整個語料庫中的重要程度。F是指詞頻,代表某一個詞語wi在一個文檔中出現(xiàn)的頻率,TFi,j

widjdj的總詞量。TFwidj中的重要性,詞語在文檔中出現(xiàn)的次數(shù)越IDF是指逆向文檔頻率,評估的是一個詞語的普遍重要性。如果一個詞語在IDF值來降低詞語對文檔的重要性。IDF計算方式如下:

=

|{j:w∈dwiwidjTFIDF值計算公式為:TFIDFi,j=TFi,j× TFIDF=<TFIDF1,TFIDF2,TFIDF3,...,TFIDFk TFIDF的計算公式可以看出,詞頻較大的詞語,比如“的"字在不同文檔中經(jīng)常出現(xiàn),對區(qū)別每個文檔沒有太大用處,所以IDF值會讓整體權(quán)值得到調(diào)IDF認(rèn)為詞頻越小的詞語就越重要,并不能很好地考慮詞語重要程度和特[14]示,TFIDF只有當(dāng)每個文檔中的總詞量足夠大時,詞語才會重復(fù)出現(xiàn)。而當(dāng)系統(tǒng)的文檔是指單個的簡短問句的時候,往往達(dá)不到統(tǒng)計的效果,TFIDF不那么適用于短文本的表示。加之,TFIDF方法沒有理解詞語本身的語義,會有一定的局限 Word2vec[15Google2013年提出的一種產(chǎn)生詞矢量的兩層神CBOWSkip-gram2.3,CBOW模型通過上下文來預(yù)測當(dāng)前詞語,Skip-gram模型使用當(dāng)前詞語預(yù)測上下文。詞矢量是基于神經(jīng)網(wǎng)絡(luò)的分TFIDF在語義理解上的不足。但是Word2vec的詞矢量是靜態(tài)的,在不同文本中的同一個詞語的詞矢量表BET[16]是GoogleAI研究院于2018年10月提出的一種預(yù)訓(xùn)練語言模型,它是在不需要標(biāo)記的巨量語料上訓(xùn)練出一個通用的語言理解模型,首次在深層神經(jīng)網(wǎng)絡(luò)成功實行預(yù)訓(xùn)練雙向性。給定BET模型一個句子,它可以輸出一個句矢量。句矢量常被應(yīng)用于語義搜索、文本聚類、文本分類領(lǐng)域。不同的句子輸入到BET模型后,在不同的上下文情況下同一個詞的詞矢量表示是不同的,能夠很2.3:Word2vecseq2seq模型一樣,Transformer包括了編碼器和解碼器兩個部分;不同的個輸入是有先后順序的。Transformer框架并沒有考慮順序信息,可以在輸入中加入位置編碼,使輸入攜帶位置信息,因此它適用于并行化計算。Transformer本身模型的復(fù)雜程度使得它在精度和性能上都要高于RNN循環(huán)神經(jīng)網(wǎng)絡(luò),突破了RNN模型不能平行計算的限制,解決長時依賴問題;計算兩個位置間的關(guān)聯(lián)的操CNN模型會隨著距離增長而增長。Transformer可以產(chǎn)生更具有2.5,ELMo[18]RNN的語言模型,使用兩個方向相反的單向長短期記憶網(wǎng)絡(luò)LSTM作為提取器,可以解決一詞多義的問題,但多層提取特征的能力有限,特征融合的能力會比BERT一體化的方式弱。GPT[19語TransformerELMo更豐富,采用單向且正向Transfomer模型,只能利用上文信息,會導(dǎo)致反向信息的缺失;BERT2.4:Transformer型則是使用雙向Transfomer模型,能捕捉更長距離的依賴,預(yù)訓(xùn)練的方法相較GPT而言亦有所創(chuàng)新,用了MaskedLM方法來捕捉詞語的表示和NextSentencePrediction方法來捕捉句子的表示。(a)(a)ELMoGPT語言模型 (c)BERT語言模型圖2.5:語言模型比較SQuAD1.1中的各項衡量指標(biāo)上超越優(yōu)SOA結(jié)果,包括將通用語言理解評估GLUE基準(zhǔn)提高到80.4%,提升7.6%;MultiNLI準(zhǔn)確度達(dá)到86.7%,提升5.6,是自然語言處理發(fā)展史上具有重大開創(chuàng)性意義的模型成就。目前,BET在自然語言處理領(lǐng)域已有相當(dāng)廣泛的應(yīng)用。在中文命名實體識別方面,王月等人[20]提出一種基于BET和注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型,用來解決警情領(lǐng)域關(guān)鍵實體信息難以識別的問題;在短文本情感分類方面,宋明等人21]提出基于Bert和Focals的微博短文本情感分類方法,亦比對多種文本分類方法,證明基于Bert的分類方法準(zhǔn)確率最高;在智能問答系統(tǒng)領(lǐng)域,羅玲等人[22]將BET模型應(yīng)用于冬奧會知識問答領(lǐng)域,并對知識圖譜、F和BET三種模型進(jìn)行評估,證明BET模型的整體表現(xiàn)較優(yōu)。2.6:2.6θ越小,表示兩個矢量的方向越接近。矢量方向一致時,夾角為0度,余弦值達(dá)到最大為1;矢量之間夾角越大,90度時,余弦值0,兩個矢量方向相反時,余弦值達(dá)到最小為-1。給定兩個矢量m和n

cosθ m·

SatyaNadella便曾提出「ConversationsAsAPlatform[23]。在這個人們高度依賴實時通訊多種媒體形式和內(nèi)容與用戶互動,讓用戶得以在熟悉的平臺和操作界面中,高聊天機(jī)器人研發(fā)的開發(fā)框架(Framework)便應(yīng)運(yùn)而生。這些開發(fā)框架會封裝一些LINE、Messenger等不同平臺的資料格式之轉(zhuǎn)換處理工作。BotBotFramework[24]是微軟幫助開發(fā)者構(gòu)建、連接、發(fā)布和管理聊天機(jī)器人的平臺。BotBuilderBotFrameworkSDK,支NodeC#Azure、BotFrameworkLuis.ai等微軟套裝BuilderBotFramework中與聊天機(jī)器人開發(fā)有關(guān)的所有微Bot設(shè)定、套件管理等任務(wù)的項目。原始碼大部分botpressAGPLBottender[26是臺灣優(yōu)拓團(tuán)隊使用Node.js開發(fā)的多平臺聊天機(jī)器人開源框架。Bottender支援臺灣用戶使用量最大的FacebookMessenger、LINE等通訊平戶體驗。BottenderJavaScriptES6及以上的語法每個框架各有千秋,開發(fā)者可從自身系統(tǒng)需求出發(fā)來考量和選擇適合的框BotBuilder串接第三方語義理解服務(wù)時在語義理解算法選擇及算法表JavaScriptBottenderLINEBotPython語言ELIZA[27]JosephWeizenbaum19641966年期間打造的史上第一個聊天機(jī)器人。它是基于腳本的規(guī)則來DOCTOR是一種對話引導(dǎo)的心CarlRogers的個人中心治療理論(Person-CenteredTherapy)[28]。腳本的編排相當(dāng)巧妙,盡管無法真正地理解語義,它通過模式匹配的方法,選擇性轉(zhuǎn)述或替換用戶輸入的話,達(dá)到了引導(dǎo)用戶自述的目的。2.7ELIZA[29]。圖2.7:與ELIZA的一則對 圖2.8:ELIZA腳ELIZA[30預(yù)定義了很多模式,每個模式都有其對應(yīng)的轉(zhuǎn)換方法來生字繼續(xù)對話,如圖2.8所示,當(dāng)A識別到關(guān)鍵字”why”,如果分解句式后發(fā)現(xiàn)符合”whycanti”模式,A會在五個預(yù)定義好的句式中隨機(jī)挑選一個句式,并采用”whycanti”句子后面的內(nèi)容代入該句式中重組,回覆給用戶。這樣一來,在與用戶互動過程中展現(xiàn)出積極回應(yīng),讓用戶更愿意與其互動。但A不直接回答問題,更無法提供專業(yè)的建議以及進(jìn)行心理輔導(dǎo),換言之,它給予用戶的是持續(xù)的陪伴與傾聽,亦無法在與用戶對話中學(xué)習(xí)新的知識,想要改變它的回應(yīng)內(nèi)容,須直接對腳本進(jìn)行編輯。oebot31]是史丹佛大學(xué)的臨床心理學(xué)家AlisonDarcy推出的心理學(xué)聊天機(jī)器人軟件,其對話設(shè)計基于認(rèn)知行為療法(CognitiveBehavioralTherap,CB,該理論最初旨在治療抑郁癥,現(xiàn)已擴(kuò)展到治療許多心理健康問題。它透過改變非理性的認(rèn)知扭曲[32,從而間接地改善情緒與行為。CBT的進(jìn)行過程是現(xiàn)有治療方式當(dāng)中結(jié)構(gòu)化程度相對較高的,因此oebot以此作為開發(fā)的起點,透過談話去梳理人們認(rèn)知。如圖2.9,按照CBT的流程,oebot會先通過一系列問卷調(diào)查對用戶的情緒和狀態(tài)進(jìn)行了解。如圖2.1,oebot大多數(shù)時候是讓用戶點擊唯一的按鈕選項進(jìn)行回覆,進(jìn)而觸發(fā)oebot的新回應(yīng),不斷給出專業(yè)建議和例子供用戶閱讀,讓CBT的流程得以繼續(xù)。只有在少數(shù)時候,它會邀請用戶寫下自己的想法,再通過截取用戶的相關(guān)表述,將其套用在預(yù)設(shè)的對話模板中,透過CBT當(dāng)中的一些技巧,引導(dǎo)用戶去審視這個想法與現(xiàn)實之間的關(guān)系,協(xié)助用戶調(diào)整一些慣性思維。整個互動過程不是一場自然對話。如圖2.oebot提供一系列心理課題,用戶通過點擊按鈕的形式讓課程內(nèi)容以文字、影片等方式不斷呈現(xiàn),供用戶Fitzpatrick[33Woebot對抑郁或焦慮患者有一定的治療 圖2.9:問卷調(diào) 圖2.10:調(diào)整想誤等專業(yè)的知識和建議是最受用戶喜愛和在意的一點;同時,只能點擊選項而不能使用文字作更貼切的自我表達(dá)是用戶使用上最明顯的阻礙。若不按指示回答,機(jī)器人會自說自話,使整體互動感欠佳。2.122.13,該系統(tǒng)是非實時對話的在線問答系統(tǒng)。自動問答的部分是讓用戶在線檢索相似問題,它使用jieba分詞工具對原始問題進(jìn)行分詞,使用TextRankWord2vec工具對中文維基百科語料庫訓(xùn)練詞WR句目前專注于青少年及兒童心理健康心理健康領(lǐng)域的問答系統(tǒng)和聊天機(jī)器人較少??梢粤私獾?,A和oebot處理互動流程的邏輯都是背后寫好的腳本。(a)心理課題 (b)疏導(dǎo)工具 (c)心情日志圖2.11:Woebot功能頁面ELIZA是通過模式匹配,重述用戶的關(guān)鍵詞,達(dá)到引導(dǎo)用戶自述的效果,并不能解答用戶心理健康領(lǐng)域的疑惑,亦不具備學(xué)習(xí)能力。WoebotCBT流慣,將系統(tǒng)串接LINE平臺,提高系統(tǒng)的大眾接受度和使用率。心理健康疾病的2.1:第三 系統(tǒng)流程與實LINEBot3.1,DataReportal2021[35]顯示,臺灣的各大通訊軟件的使用狀況中,LINE88%的用戶比例,活躍程度遠(yuǎn)遠(yuǎn)高于FacebookMessenger。因此,考慮臺灣用戶的使用習(xí)慣,本論文LINE平臺上,方便學(xué)生家長和老師的日常使用。3.2,用戶是通過LINEAPP來發(fā)送訊息;LINELINE官方用來傳遞「用戶」及「Bot服務(wù)器」訊息的中介服務(wù)器;Bot服務(wù)器是指用來開發(fā)LINEBotJavaScriptBottenderLINE平臺HTTP請求轉(zhuǎn)換為可處理的事件和情境,經(jīng)邏輯運(yùn)算后觸發(fā)訊息回覆流程;使PythonMySQL數(shù)據(jù)QA問答資料集和對話過程中產(chǎn)生的對話資料。MessagingAPILINE官方定義的訊息回應(yīng)標(biāo)準(zhǔn),訊息有文字、影片、貼圖、圖文選單等形式。3.1:2021API運(yùn)行方式的其中一種,BotWebhookURL,借助代理客戶端(Proxy)LINEAPP客戶端主動推送消息,而不是像傳統(tǒng)client-server主從式架構(gòu),只有一方擔(dān)任發(fā)送方。Webhook可以讓用戶不需要通過主動點擊來BotLINEAPP的問題。整個執(zhí)行LINEAPP發(fā)送訊息時,LINE平臺將接收用戶訊息并傳遞到MessagingAPILINELINE平臺再傳遞給用戶。3.2:LINEBotQA問答系統(tǒng)的開發(fā)是基于A問答對資料集實現(xiàn)的,限定域問答對資料集的構(gòu)建是一項大型的工程,可以通過開源數(shù)據(jù)、自行采集甚至人工編寫等方式進(jìn)行。本論文人工收集并整理出胡珍玉主編的書籍《兒童青少年心理健康100問》[36]中有效的85個問答對,作為本論文系統(tǒng)初始的高質(zhì)量問答資料集。少量的問答對難免會有無法全面覆蓋到的問題。因此,本論文系統(tǒng)是在傳統(tǒng)Q問答系統(tǒng)的基礎(chǔ)上,著重引入一個詢問式學(xué)習(xí)機(jī)制,允許用戶持續(xù)地對問答對資料集進(jìn)行擴(kuò)充和優(yōu)化。系統(tǒng)遇到當(dāng)前未能解答的新問題,會向用戶提出幫助解答疑問的請求,征集答案。系統(tǒng)后端也會基于“新問題所征集的答案"的滿意度調(diào)查統(tǒng)計數(shù)據(jù),將最佳答案推送給專家評定后,自動對問答對資料集進(jìn)行擴(kuò)充和優(yōu)化,使系統(tǒng)能夠解答越來越多的用戶提問。詢問式學(xué)習(xí)和資料處理的流程會在后續(xù)章節(jié)詳細(xì)介紹。jiebaid對應(yīng)著唯一id時,就可以檢索出對應(yīng)的問題關(guān)鍵詞。在上述章節(jié)id。構(gòu)建方法如下:3.4:idid=[59,60,61,62,63]的候選問答資料中,直接id=[59,60,61,62,63]的候選問題進(jìn)行相似度計算即可。jiebajieba庫的分詞分為三種模式,全模式、精確模式和搜索引擎模式。全模式將 3.5:jiebajieba3.5(a)jieba精確模式構(gòu)建的倒排列表之部分?jǐn)?shù)據(jù)??梢钥闯龃嬖诓簧賳栴},例如:包含詞語id沒有idjieba分詞的搜索引擎模式,對長詞再次切分,3.5(b)所示,可以看到唯一的變化是jieba對“嫉妒心"一詞jieba的未登錄詞,決定在jieba詞庫中加入維基百科精神疾病列表[37]和開源心理學(xué)詞庫[38]jieba3.5(c)所示,加入自定義的詞典后,jieba能沒有遺漏地把心理領(lǐng)域?qū)S性~匯識別出來??梢钥闯?,jieba雖有新詞識別能力,但自行添加新詞可以保證更高的分詞正確率。如果jieba分詞搜索引擎模式并加入自定義的詞典。BERT模型搭配余弦相似度的方法實作句矢量編碼與相bert_serving.clientBERTClient()函數(shù)對用戶問題及其候選相似度判斷模塊的工作任務(wù)主要是,當(dāng)系統(tǒng)從問答庫中檢索出候選問題集后,對候選問題集的相似度進(jìn)行排序,并判斷最大相似度是否有足夠的置信度。如圖3.6,相似度判斷模塊的判斷流程分為以下三種情況:第一種情況,當(dāng)最大相似度不小于0.95,本系統(tǒng)認(rèn)為用戶問題與某候選問題3.7(a)所0.50.95之間,本系統(tǒng)認(rèn)為未能完全確定3.7(c)所示。(a)相似度高 (b)相似度中等 (c)相似度低圖3.7:「相似度判斷機(jī)制」在LINEAPP上的頁面呈現(xiàn)上述流程可以看出,Bot在回應(yīng)用戶自主輸入的問題時,對于確定的問題,Bot直接回傳問答庫中確定的答案;對于不確定問題,Bot回傳待確認(rèn)候選問題列Bot收到用戶在待確LINE傳過來的數(shù)據(jù)的,流程如圖QA問答對更新到問答庫中。Q,在用戶們的歷史點選記錄中顯示,Q與現(xiàn)有問答Q1、Q19都相似。其中,Q1920次,Q1被用戶們點選了2QQ19Q19Bot的問答庫中。BotQ,就能回應(yīng)準(zhǔn)確的答案。第一種情況,該問題在以往的用戶對話數(shù)據(jù)中沒有出現(xiàn)過。Bot第二種情況,該問題在以往的用戶對話數(shù)據(jù)中出現(xiàn)過,但是仍然還沒有答案。Bot同樣會回應(yīng)暫無解答的提示給用戶。同時,該問題會繼續(xù)處在「我想幫 3.9:統(tǒng)后端還未能確定這是一個好的適合的答案,還是答非所問。此時,Bot仍然會把這個尚未考究的候選答案回傳給用戶,并向用戶彈出一個快速簡潔的滿意度調(diào)3.9(a)。用戶若完成了滿意度調(diào)查,Bot會感謝用戶的反饋,如圖3.9(b);并把調(diào)查結(jié)果回傳到后端,作為判斷該答案是否足夠好的數(shù)據(jù)。后端會定期檢查這些問題的答案是否得到足夠多的用戶肯定。例如在一定數(shù)量的調(diào)查數(shù)據(jù)支持下,用戶認(rèn)為“答案有用"的比例占了60%以上,系統(tǒng)就會將該問題及其答案發(fā)送給專家。該答案經(jīng)過專家評估認(rèn)可后,系統(tǒng)將該問題和答案更新到問答庫中,如圖3.9(c;如果后端檢查發(fā)現(xiàn)該答案收到過多的“答案沒用"的負(fù)面反饋,就會把這個答案淘汰移除。Bot后端經(jīng)過上述流程的數(shù)據(jù)處理,得以實現(xiàn)識別同一問題的不同問法并對問題進(jìn)行二次召回、識別并記錄新問題、篩選出新問題的最佳候選答案等任務(wù),從而得到新的A問答對,擴(kuò)充和優(yōu)化問答庫。3.133.11。青少年/該功能的流程如圖3.10所示。如果用戶點擊「功能導(dǎo)覽」主選單之「青少戶選擇常見問題類別后,Bot會回傳該分類的問題列表;接著,用戶可以點選欲Bot返回答案給用如圖3.12,當(dāng)用戶點擊「功能導(dǎo)覽」主選單之「心理衛(wèi)生求助信息」功能,Bot39,該網(wǎng)站可提供全臺各縣市醫(yī)療協(xié)助和心理咨詢領(lǐng)域相關(guān)的單位信息,如單位名稱、電話、地址和服務(wù)內(nèi)容等。需要長期深度干預(yù)治療和緊急求助的用戶可以根據(jù)自身需求,及時聯(lián)系當(dāng)?shù)乜h市的醫(yī)院和相關(guān)單位。 圖3.12:心理衛(wèi)生求助信圖3.13:功能導(dǎo)覽主選 圖3.14:常見問題分類子選第四 實驗結(jié)果與討使用問答知識庫中初始的85個A問答對,分別對倒排索引檢索和遍歷檢索兩種方法的時間表現(xiàn)進(jìn)行實驗測試。在倒排索引檢索方法上,實驗將85個問句分計算候選問題集里每個問句與傳入問句的相似度,找出最相似的問題。在遍歷檢索方法上,實驗同樣將85個問句分別作為傳入?yún)?shù),轉(zhuǎn)換成句矢量后,直接與問答庫中的每一個問句的句矢量做相似度的計算,找出與傳入問句最相似的問題。由于傳入的問句均是來自問答庫,則最佳結(jié)果應(yīng)為:找到的最相似問題與傳入的問句是同一個語句。因此,除了計算兩種方法的運(yùn)算時間,在實驗中亦統(tǒng)計了問題判斷準(zhǔn)確的數(shù)量:只有當(dāng)傳入問句與最相似的問句是同一語句的時候,認(rèn)定系統(tǒng)的判斷為正確;最后分別計算出兩種方法的問題判斷準(zhǔn)確率。+jieba4.1jieba動、同義詞庫啟動、分詞、過濾停用詞、替換同義詞等步驟的時間消耗,所用的總運(yùn)算時間仍明顯比遍歷方法減少至少74.6。因此,使用倒排索引方法在縮短問答時長上有更好的表現(xiàn)。檢索模塊使用遍歷方法的結(jié)果如預(yù)期,盡管總耗時長,問題判斷的正確率達(dá)到100%;使用倒排索引搭配jieba默認(rèn)模式的方法,正確率可以達(dá)到94.12%,推測是因為jieba分詞不夠精確,所構(gòu)建的倒排列表中記錄的問題id不夠全面有所遺漏,導(dǎo)致在檢索模塊中個別傳入的問句沒有召回正確的語句;使用倒排索引搭配jieba搜索引擎模式的方法,問題判斷的正確率達(dá)到98.82%;使用倒排索引搭配jieba搜索引擎模式并加入心理健康領(lǐng)域詞典的方法,運(yùn)算時間上和前者相差不大,問題判斷的正確率達(dá)到100%jieba搜索引擎模式并加入心理健康領(lǐng)域詞典的方法,保證問題判斷正確率的同時,也能避免運(yùn)算時間過長導(dǎo)致問答延長的問題。QA資料集中原始的問題,人工設(shè)計兩句語義相同但問法不同的相似問題,共168個句子。本實驗使用168個問題測試BERT預(yù)訓(xùn)練模型在相似度任務(wù)上的表現(xiàn):1.能否直接找出原問題;2.原問題是否出現(xiàn)在相似度Top3的候選問題集中等待用戶點選進(jìn)行二次召回。相似問題與原問題資料示例如4.1。Precision@k是搜索模型的評價指標(biāo)之一,它是指檢索正確的結(jié)果數(shù)量占所有k3Precision@3=0.74.1:Precision@k

TPTP@k+FP

MRR是國際上通用的搜索算法的評價指標(biāo),檢索結(jié)果的好壞,與正確結(jié)果所在的位置有關(guān)。如果正確結(jié)果出現(xiàn)在檢索結(jié)果的第一個位置,那么得到的分?jǐn)?shù)是1,如果出現(xiàn)在第二個位置,分?jǐn)?shù)是0.5,出現(xiàn)在第n個位置,分?jǐn)?shù)是1/n。最終的分?jǐn)?shù)為每個問題得分之和的平均數(shù)??梢姡_結(jié)果出現(xiàn)的位置越靠前,代表檢索的表現(xiàn)越好。以本實驗為例,正確結(jié)果指的是原問題,當(dāng)原問題與輸入問句的相似度在候選問題集中的排名越高,MRR的得分越高,檢索的表現(xiàn)會越好。MRR的計算公式如下,其中,ranki代表問題i的檢索正確結(jié)果所出現(xiàn)的位置。MRR=1

ni=14.285%左右的問題可以被準(zhǔn)確檢索并回傳正確答案。其中,63%22%左右的問題可以在候選問題列表中通過用戶點選被二次召回在第三章里,本論文介紹了系統(tǒng)的相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論