CN114334163B 抑郁癥診斷對話數(shù)據(jù)集生成方法、電子設備和存儲介質(思必馳科技股份有限公司)_第1頁
CN114334163B 抑郁癥診斷對話數(shù)據(jù)集生成方法、電子設備和存儲介質(思必馳科技股份有限公司)_第2頁
CN114334163B 抑郁癥診斷對話數(shù)據(jù)集生成方法、電子設備和存儲介質(思必馳科技股份有限公司)_第3頁
CN114334163B 抑郁癥診斷對話數(shù)據(jù)集生成方法、電子設備和存儲介質(思必馳科技股份有限公司)_第4頁
CN114334163B 抑郁癥診斷對話數(shù)據(jù)集生成方法、電子設備和存儲介質(思必馳科技股份有限公司)_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

(19)國家知識產(chǎn)權局(12)發(fā)明專利(10)授權公告號CN114334163B(65)同一申請的已公布的文獻號(73)專利權人思必馳科技股份有限公司地址215123江蘇省蘇州市蘇州工業(yè)園區(qū)新平街388號騰飛創(chuàng)新園14棟(72)發(fā)明人俞凱吳夢玥陳露姚鑌煒(74)專利代理機構北京商專永信知識產(chǎn)權代理事務所(普通合伙)11400專利代理師黃謙侯曉艷A61B5/16(2006.01)DatasetforDepression-Diagnosis-OrientedChat.Proceedingsofthe2022ConferenceProcessing.2022,2438-2459.審查員鐘芮娜抑郁癥診斷對話數(shù)據(jù)集生成方法、電子設備和存儲介質本發(fā)明實施例提供一種抑郁癥診斷對話數(shù)據(jù)集生成方法。該方法包括:基于抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發(fā)起對擬患者角色與醫(yī)生角色之間的抑郁門診對話記錄;對抑郁門診對話記錄進行監(jiān)督和過濾,得到達到臨床標準的抑郁癥診斷對話數(shù)據(jù)集。本發(fā)明實施例收集的抑郁癥診斷對話數(shù)據(jù)集,對于研究端到端的抑郁癥問診對話,基于癥狀的抑郁癥診斷有十分重要的意義。而對話系統(tǒng)對于抑郁癥的21.一種抑郁癥診斷對話數(shù)據(jù)集生成方法,包括:基于抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發(fā)起對話,生成所述真實人群的患者畫像;基于所述患者畫像,模擬患者角色與醫(yī)生角色之間的抑郁門診對話記錄,包括基于所述患者畫像,利用第一工人模擬患者角色進行與模擬醫(yī)生角色之間的表達對于事件的內心感受,基于抑郁癥診斷臨床標準,利用第二工人模擬所述醫(yī)生角色向所述患者角色詢問與所述抑郁癥診斷臨床標準相關的事件,并提供標注,其中,所述標注包括所述抑郁門診對話記錄的對話主題;對所述抑郁門診對話記錄進行監(jiān)督和過濾,包括利用專業(yè)精神科醫(yī)生對所述抑郁門診對話記錄進行監(jiān)督,獲取所述專業(yè)精神科醫(yī)生對所述抑郁門診對話記錄的專業(yè)評估,獲取所述模擬患者角色與醫(yī)生角色相互的角色表現(xiàn)評估,其中,所述;角色表現(xiàn)評估包括:患者角色評估、醫(yī)生角色評估,所述患者角色評估包括:由所述患者角色配對的模擬醫(yī)生角色評估的對話的自然程度、敘述的一致性,以及由專業(yè)精神科醫(yī)生評估的患者畫像中癥狀的嚴重程度與表達的匹配程度,所述醫(yī)生角色評估包括:由所述醫(yī)生角色配對的所述患者角色評估的醫(yī)生相似度以及由醫(yī)療人員評估的醫(yī)生相似度;基于所述專業(yè)評估、所述角色表現(xiàn)評估以及所述抑郁門診對話記錄的對話長度對所述抑郁門診對話記錄進行過濾,得到達到臨床標準的抑郁癥診斷對話數(shù)據(jù)集。2.根據(jù)權利要求1所述的方法,其中,所述基于抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發(fā)起對話,生成所述真實人群的患者畫像包括:基于抑郁癥診斷臨床標準,利用基于狀態(tài)機的咨詢聊天機器人向包括抑郁癥患者的真實人群發(fā)起對話,生成所述真實人群的患者畫像,其中,所述患者畫像包括:患者人口學信息屬性以及至少包括情緒、興趣、精神狀態(tài)3.一種抑郁癥診斷對話數(shù)據(jù)集生成方法,包括:基于抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發(fā)起對話,生成所述真實人群的患者畫像;基于所述患者畫像,模擬患者角色與醫(yī)生角色之間的抑郁門診對話記錄,包括利用基于所述患者畫像訓練的模擬患者機器人,利用采集專業(yè)精神科醫(yī)生的對話訓練的模擬醫(yī)生機器人,基于所述模擬患者機器人與所述模擬醫(yī)生機器人交互生成抑郁門診對話記錄,以及相互的角色表現(xiàn)評估,利用模擬醫(yī)生機器人,通過抑郁癥診斷臨床標準對所述抑郁門診對話記錄進行模擬醫(yī)生評估;通過角色表現(xiàn)評估、模擬醫(yī)生評估以及抑郁門診對話記錄對話長度對所述抑郁門診對話記錄進行過濾,得到達到臨床標準的抑郁癥診斷對話數(shù)據(jù)集。利用達到臨床標準的抑郁癥診斷對話數(shù)據(jù)集訓練抑郁癥的自動診斷模型。5.一種電子設備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行權利要求1-4中任一項所述方法的步驟。6.一種存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)權3利要求1-4中任一項所述方法的步驟。4抑郁癥診斷對話數(shù)據(jù)集生成方法、電子設備和存儲介質技術領域[0001]本發(fā)明涉及智能語音領域,尤其涉及一種抑郁癥診斷對話數(shù)據(jù)集生成方法、電子設備和存儲介質。背景技術[0002]抑郁癥的影響廣泛,已經(jīng)成為對全球生活預期的重大威脅。因此,抑郁癥的自動診斷方法已成為新的研究熱點。通過對話,可以從客觀的角度更好地了解患者的情緒和認知狀態(tài),這與抑郁癥的診斷密切相關,同時可以提供情感支持。此外,對話系統(tǒng)可以為基于文本、語音和多模態(tài)的診斷方法提供可泛化的載體。通過詳細的對話標注可以有效增強診斷的可解釋性。因此,對話系統(tǒng)對于抑郁癥的大規(guī)模篩查和抑郁癥患者的定期回訪具有重要[0003]在實現(xiàn)本發(fā)明過程中,發(fā)明人發(fā)現(xiàn)相關技術中至少存在如下問題:[0004]臨床診斷是一個復雜的過程,其目的是收集和總結一名患者的關鍵癥狀信息,同時提供類似聊天的對話體驗。在臨床實踐中,精神科醫(yī)生根據(jù)實踐經(jīng)驗和多種診斷標準與患者進行溝通并提供診斷結果。這種抑郁癥的自動診斷模型需要患者和精神科醫(yī)生之間的大量對話。由于精神科醫(yī)療數(shù)據(jù)隱私保護,很難收集到真實患者和精神科醫(yī)生之間的大量對話。而其他領域的醫(yī)療對話并不能簡單修改轉用到抑郁癥診斷模型的訓練中,例如,網(wǎng)絡可以爬取到的關于軀體疾病的對話數(shù)據(jù),軀體疾病的對話數(shù)據(jù)不能直接遷移到心理疾病,而用于心理咨詢的對話數(shù)據(jù)則缺乏一定的專業(yè)性,不能服務于診斷。發(fā)明內容[0005]為了至少解決現(xiàn)有技術中難以從真實患者和精神科醫(yī)生之間獲取抑郁癥診斷對話數(shù)據(jù),網(wǎng)絡爬取的對話數(shù)據(jù)缺乏專業(yè)性,不能用于抑郁癥的自動診斷模型訓練的問題。第一方面,本發(fā)明實施例提供一種抑郁癥診斷對話數(shù)據(jù)集生成方法,包括:[0006]基于抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發(fā)起對話,生成所述真實人群的患者畫像;[0007]基于所述患者畫像,模擬患者角色與醫(yī)生角色之間的抑郁門診對話記錄;[0008]對所述抑郁門診對話記錄進行監(jiān)督和過濾,得到達到臨床標準的抑郁癥診斷對話數(shù)據(jù)集。[0009]第二方面,提供一種電子設備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行本發(fā)明實施例的抑郁癥診斷對話數(shù)據(jù)集生成方法的步驟。[0010]第三方面,本發(fā)明實施例提供一種存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)本發(fā)明實施例的抑郁癥診斷對話數(shù)據(jù)集生成方法的步驟。[0011]本發(fā)明實施例的有益效果在于:利用本方法收集的抑郁癥診斷對話數(shù)據(jù)集,對于5研究端到端的抑郁癥問診對話,基于癥狀的抑郁癥診斷有十分重要的意義。而對話系統(tǒng)對于抑郁癥的大規(guī)模篩查和回訪也有十分重要的作用,能有效幫助緩解醫(yī)療資源不均衡造成的問題。附圖說明[0012]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。[0013]圖1是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的流程圖;[0014]圖2是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的三階段數(shù)據(jù)收集示意圖;[0015]圖3是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的患者畫像的風險估計示意圖;[0016]圖4是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的質量控制標準數(shù)據(jù)示意圖;[0017]圖5是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的數(shù)據(jù)示意[0018]圖6是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的醫(yī)生診斷與患者畫像的一致性示意圖;[0019]圖7是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的醫(yī)生對同一患者畫像的診斷一致性分析示意圖;[0020]圖8是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的抑郁癥嚴重程度統(tǒng)計示意圖;[0021]圖9是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的不同抑郁程度的癥狀摘要中最常見的詞分布示意圖;[0022]圖10是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的主題統(tǒng)計示意圖;[0023]圖11是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的主題轉換示意圖;[0024]圖12是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的與相關數(shù)據(jù)集的比較示意圖;[0025]圖13是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的回復生成和主題預測的評估結果示意圖;[0026]圖14是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的對話框摘要任務的評估結果示意圖;[0027]圖15是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的嚴重程度分類的評估結果示意圖;[0028]圖16是本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的回復生成6的人類評估結果示意圖;[0029]圖17為本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成的電子設備的實施例的結構示意圖。具體實施方式[0030]為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。[0031]如圖1所示為本發(fā)明一實施例提供的一種抑郁癥診斷對話數(shù)據(jù)集生成方法的流程[0032]S11:基于抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發(fā)起對話,生成所述真實人群的患者畫像;[0033]S12:基于所述患者畫像,模擬患者角色與醫(yī)生角色之間的抑郁門診對話記錄;[0034]S13:對所述抑郁門診對話記錄進行監(jiān)督和過濾,得到達到臨床標準的抑郁癥診斷對話數(shù)據(jù)集。[0035]在本實施方式中,為了模仿現(xiàn)實的抑郁癥臨床咨詢場景,并涉及收集診斷對話的[0036]對于步驟S11,為了模擬醫(yī)療記錄并且確保臨床對話的專業(yè)性,從抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發(fā)起對話,其中,抑郁癥診斷臨床標準包括臨床抑郁癥診斷標準ICM-11和DSM-5,可以從這些標準中提取固定的問題向真實人群發(fā)起對話,由于這些問題都是由臨床抑郁癥診斷標準ICM-11和DSM-5中固定提取的,所產(chǎn)生的對話都是有臨床抑郁癥診斷標準作為基礎,并且范圍可控,這種對話數(shù)據(jù)有著一定的專業(yè)性,可以引導真實人群表達出患者畫像的相應信息。而真實人群中包括抑郁癥患者,由于抑郁癥患者需要溝通,在與抑郁癥患者的溝通中,可以引導抑郁癥患者表達出某類抑郁癥患者存在的患者畫像信息,這個交互過程中,只采集某類抑郁癥患者存在的部分患者畫像,不采集交互的對話,因此也不會涉及到抑郁癥患者的隱私。[0037]作為一種實施方式,所述基于抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發(fā)起對話,生成所述真實人群的患者畫像包括:[0038]基于抑郁癥診斷臨床標準,利用基于狀態(tài)機的咨詢聊天機器人向包括抑郁癥患者的真實人群發(fā)起對話,生成所述真實人群的患者畫像,其中,所述患者畫像包括:患者人口學信息屬性以及至少包括情緒、興趣、精神狀態(tài)的診斷屬性。[0039]在本實施方式中,由于目的僅為要采集患者畫像,不需要過于專業(yè)的抑郁癥鑒別,因此可以通過基于狀態(tài)機的咨詢聊天機器人來向包含抑郁癥患者的真實人群發(fā)起對話,減少了人工采集成本,也可以得到患者畫像。[0040]為了克服獲取醫(yī)患保密協(xié)議涵蓋的患者病歷的不切實際,設計了一個基于狀態(tài)機的咨詢聊天機器人,它利用臨床標準中的固定問題來記錄每個用戶的抑郁癥狀和人口統(tǒng)計睡眠、食欲、社交功能和特殊傾向。邀請用戶簡7合起來,獲得了一個自愿的、合法的抑郁癥畫像。如圖2所示,采集乏自信心的抑郁癥診斷臨床標準的臨床屬性。[0041]根據(jù)每個患者畫像的臨床標準ICD-11和DSM-5估計抑郁發(fā)作的嚴重程度和自殺風例的,68位患者畫像提供者報告說他們在授權診所被診斷出患有抑郁癥。在這些提供者中,53人目前正在經(jīng)歷抑郁發(fā)作。[0042]對于步驟S12,在步驟S11中,可以采集到各種抑郁癥的患者畫像,利用這些患者畫像,可以模擬出各種類型的抑郁癥模擬患者角色,通過模擬患者角色與模擬醫(yī)生角色直接進行模擬的心理咨詢對話,這樣,就可以得到抑郁門診對話記錄,為了保證咨詢對話的數(shù)[0043]在精神科醫(yī)生的指導下,根據(jù)真實抑郁癥患者的自我報告進行了對話模擬。特別是,首先收集了少量真實場景中醫(yī)生和患者之間的對話?;谏鲜鱿葲Q條件和臨床抑郁癥診斷標準ICD-11和DSM-5,向模擬工作者發(fā)布了模擬任務。整個流程是這樣的:(1)設計與培主題/癥狀轉換進行注解;(3)同伴評價:醫(yī)生和患者角色在對話后從多個維度相互評價。[0044]作為一種實施方式,所述模擬患者角色與醫(yī)生角色之間的抑郁門診對話記錄包[0045]基于所述患者畫像,利用第一工人模擬患者角色進行與模擬醫(yī)生角色之間的表達對于事件的內心感受;[0046]基于抑郁癥診斷臨床標準,利用第二工人模擬所述醫(yī)生角色向所述患者角色詢問與所述抑郁癥診斷臨床標準相關的事件,并提供標注,其中,所述標注包括所述抑郁門診對話記錄的對話主題。[0047]在本實施方式中,對于模擬患者角色,大多數(shù)有耐心的工人都沒有抑郁,讓這些工人作為扮演病人的演員。為了幫助他們了解患者畫像中的癥狀,提供了患者畫像中癥狀的詳細解釋,包括嚴重程度和持續(xù)時間,以及一些患者的自我報告,以幫助他們了解患者的內心感受。根據(jù)準確表達的癥狀,他們需要自我想象患者畫像提供者可能發(fā)生的生活事件,并與醫(yī)生交談,以表達患者在講述事件過程中的內心感受。[0048]對于模擬醫(yī)生角色,邀請精神科醫(yī)生和臨床心理治療師與實際的抑郁癥患者進行會診對話,從中收集參考對話。然后根據(jù)他們的詢問,結合ICD-11和DSM-5,匯編了醫(yī)生在診斷時需要知道的信息。模擬醫(yī)生角色的演員需要在與模擬患者角色的談話中獲得足夠的信息,并在模擬患者角色向他們傾訴他們正在經(jīng)歷的事情時同情和安撫他們。在談話結束時,他們需要提醒可能出現(xiàn)抑郁癥的患者及時就醫(yī)。[0049]其中,對話主題的標注根據(jù)臨床標準涵蓋的核心癥狀,將主題分為情緒、興趣、精一個特殊主題,因為它是臨床實踐中的重要組成部分。模擬醫(yī)生角色的演員被要求在聊天期間標注他們的對話記錄的主題(上述說明的情緒、興趣…篩查)。通過上述步驟,獲得了保證咨詢對話的數(shù)量、質量和專業(yè)性的抑郁門診對話記錄。[0050]對于步驟S13,由于在步驟S12所獲得的抑郁門診對話記錄,還是模擬的,可能存在8一些不達標(不標準、錯誤)的抑郁門診對話。為了濾除沒有達到臨床標準的抑郁門診對話會對獲得的抑郁門診對話記錄進行監(jiān)督和過濾。[0051]作為一種實施方式,利用專業(yè)精神科醫(yī)生對所述抑郁門診對話記錄進行監(jiān)督,獲取所述專業(yè)精神科醫(yī)生對所述抑郁門診對話記錄的專業(yè)評估;[0052]獲取所述模擬患者角色與醫(yī)生角色相互的角色表現(xiàn)評估;[0053]基于所述專業(yè)評估、所述角色表現(xiàn)評估以及所述抑郁門診對話記錄的對話長度對所述抑郁門診對話記錄進行過濾。[0054]所述患者角色評估包括:由所述患者角色配對的模擬醫(yī)生角色評估的對話的自然程度、敘述的一致性,以及由專業(yè)精神科醫(yī)生評估的患者畫像中癥狀的嚴重程度與表達的匹配程度;[0055]所述醫(yī)生角色評估包括:由所述醫(yī)生角色配對的所述患者角色評估的醫(yī)生相似度以及由所述醫(yī)療人員評估的醫(yī)生相似度。[0056]在本實施方式中,獲得演員的角色表現(xiàn)評估,在抑郁門診對話結束后,模擬患者角色的演員和模擬醫(yī)生角色演員還會相互打分,來評判對方是否進入了其對應的角色,是否表達出抑郁癥患者的特征或醫(yī)生的職業(yè)水平。[0057]患者角色評估,從三個維度評估患者角色的任務表現(xiàn):表達的自然程度、敘述的一致性以及所描述癥狀的嚴重程度與表達的匹配程度(例如說話是否自然,對于某件事情前后敘述是否一致,患者畫像中記錄的抑郁癥情況患者角色是否表現(xiàn)了出來)。前兩個分數(shù)由對話中的另一個參與者給出,第三個分數(shù)由檢查對話的醫(yī)療專業(yè)人員給出。[0058]醫(yī)生角色評估,通過演員與真正醫(yī)生的相似程度來評估醫(yī)生任務的完成情況。該程度分別由對話的患者角色和專業(yè)醫(yī)生進行評估。[0059]為確保符合臨床方案,進一步邀請專業(yè)精神科醫(yī)生和臨床心理治療師進行對話評估。他們篩選滿足診斷需求的對話,并提供精神病學診斷結果和癥狀總結。他們用真實場景的相似度分別對模擬醫(yī)生角色和模擬患者角色進行評分。[0060]為了更好的培訓目的,采用多種范式進行質量檢查。對對話長度(抑郁門診對話記錄的對話長度、醫(yī)生每次對話的平均話語長度)、演員相互評分和精神科醫(yī)生給出的評分設[0061]最終,通過上述步驟總共收集了4428條對話,經(jīng)過嚴格的質量篩選,最終保留了1339條(30%)抑郁癥診斷對話數(shù)據(jù)集。利用這些達到臨床標準的抑郁癥診斷對話數(shù)據(jù)集訓練抑郁癥的自動診斷模型,來進行自動的抑郁癥診斷,隨著確保質量和專業(yè)性的抑郁門診對話不斷的生成,所訓練的抑郁癥的自動診斷模型也會越來越精準。[0062]通過該實施方式可以看出,利用本方法收集的抑郁癥診斷對話數(shù)據(jù)集,對于研究端到端的抑郁癥問診對話,基于癥狀的抑郁癥診斷有十分重要的意義。而對話系統(tǒng)對于抑郁癥的大規(guī)模篩查和回訪也有十分重要的作用,能有效幫助緩解醫(yī)療資源不均衡造成的問題。[0063]作為一種實施方式,在本實施例中,所述模擬患者角色與醫(yī)生角色之間的抑郁門診對話記錄還包括:[0064]利用基于所述患者畫像訓練的模擬患者機器人;[0065]利用采集專業(yè)精神科醫(yī)生的對話訓練的模擬醫(yī)生機器人;9[0066]基于所述模擬患者機器人與所述模擬醫(yī)生機器人交互生成抑郁門診對話記錄,以及相互的角色表現(xiàn)評估。[0067]利用模擬醫(yī)生機器人,通過抑郁癥診斷臨床標準對所述抑郁門診對話記錄進行模擬醫(yī)生評估;[0068]通過角色表現(xiàn)評估、模擬醫(yī)生評估以及抑郁門診對話記錄對話長度對所述抑郁門診對話記錄進行過濾。[0069]在本實施方式中,考慮到人工智能的進步,利用每個人的患者畫像構建不同患者不同癥狀的神經(jīng)網(wǎng)絡,再利用知識圖譜進行擴充延伸,生成同一抑郁癥狀但性格不同的多種模擬患者機器人。的性格。這樣,一個患者畫像可以模擬出多種不同人格的同一抑郁癥狀的多種模擬患者機器人。在模擬患者角色這端,也就可以生成更[0071]對于模擬的醫(yī)生機器人,專業(yè)精神科醫(yī)生的與抑郁癥患者的對話中,每句話都是有一定的意圖,并且某種問題也是有專業(yè)的醫(yī)學理論支持,和對于該問題的診斷。通過采集這些專業(yè)精神科醫(yī)生的對話訓練的模擬醫(yī)生機器人。這樣,在模擬醫(yī)生角色這端,可以發(fā)出某類抑郁癥特征的問題,并且對于抑郁癥狀給出適當?shù)脑\斷結果。[0072]由于該部分的抑郁門診對話記錄也是模擬生成的,也是需要監(jiān)督和過濾的。此時,由于都是訓練的機器人,角色表現(xiàn)評估也就是雙方的對話是否通順、符合邏輯。例如,模擬醫(yī)生機器人提出問題后,模擬患者機器人反饋的內容中,模擬醫(yī)生機器人無法從反饋的內容中提取到問題的答案,從模擬醫(yī)生機器人的角度來說,對模擬患者機器人的評估較差。相反的,如果模擬患者機器人提出的內容,模擬醫(yī)生機器人并沒有基于與該內容相關的內容進行提問或解答(也就是模擬醫(yī)生機器人反饋的內容中提取不到模擬患者機器人提出的內容的關鍵詞),這樣模擬患者機器人和模擬醫(yī)生機器人可以相互進行評估。再利用訓練的模擬的醫(yī)生機器人重新對整段對話進行判斷,和對話長度進行綜合判斷,得到過濾的抑郁癥診斷對話數(shù)據(jù)集。隨著各類數(shù)據(jù)的不斷采集,對模擬醫(yī)生機器人、模擬患者機器人的不斷訓練,也就可以得到更多的達到臨床標準的抑郁癥診斷對話數(shù)據(jù)集。[0073]對本方法進行試驗說明,數(shù)據(jù)集的整體統(tǒng)計數(shù)據(jù)如圖5所示。正如在這樣的診斷場景中所見,需要足夠的對話輪次:診斷對話表現(xiàn)出平均。每次對話21.6回合。精神科醫(yī)生提供的癥狀摘要平均達到83.1個單詞。這些統(tǒng)計數(shù)據(jù)明顯長于以前的相關數(shù)據(jù)集,表明診斷對話任務與其不同的數(shù)據(jù)要求存在差異。[0074]需要注意的是,對話數(shù)據(jù)中模擬的癥狀是基于真實人群的畫像。為了驗證模擬對話確實反映了患者畫像中的癥狀,并從此類對話中得出有效的診斷結論,分析了患者畫像與精神科醫(yī)生癥狀總結的相應內容的一致性,以及一致性不同醫(yī)生對同一畫像的診斷結果。[0075]人像診斷一致性,患者畫像包含抑郁癥狀,模擬患者角色的演員在此基礎上在實際描述中添加了更多細節(jié),從而導致診斷摘要涵蓋更多內容。因此,利用醫(yī)生診斷總結的命中率(如圖6所示)來衡量一致性??梢钥闯?,大多數(shù)診斷的準確率很高,平均為86.1%,證明了患者模仿的真實性和總結的全面性。此外,還請精神科醫(yī)生對患者表達與癥狀嚴重程度的匹配程度進行評分,平均3.9分,總分5分,即符合程度達到78%。[0076]醫(yī)生的一致性,來自不同醫(yī)生的同一患者畫像的診斷結果可能略有不同。對于圖7所示的三個指標,計算了不同人像標準推導的平均值(排除了單獨診斷的人像),表明診斷結果的一致性較高,受工人主觀性影響較小。[0077]在如圖8所示中展示了不同嚴重程度的抑郁癥患者的統(tǒng)計數(shù)據(jù)。隨著抑郁癥嚴重程度的提高,由于醫(yī)生對特定主題的更深入的提問,輪次和對話長度變得更長。診斷摘要中的內容變得更長以列出更多的抑郁癥狀。有可能受到質疑。[0079]如圖9中,觀察到不同嚴重程度的診斷摘要中的熱詞存在很大差異。如(a)所示,患者大多有淺層癥狀,如決策困難和信心下降,通常存在于健康人群中。隨著病情的惡化,睡眠困難等更明顯的癥狀會頻繁出現(xiàn),醫(yī)生會建議患者及時采取措施。在最嚴重的患者中,自殺風險和絕望在圖表(d)中變得頻繁。[0080]不同話題的特征統(tǒng)計見如圖10所示。核心抑郁癥狀占談話的68.3%,其次是共情安慰,占23.1%。通過對首次出現(xiàn)的話題進行分析,可以看通常在開始時被詢問,逐漸轉向自殺和軀體癥狀,這些癥狀通常是重癥患者所經(jīng)歷的。這與臨床實踐相呼應,咨詢遵循漸進深入的方式。[0081]圖11說明了對話主題轉換過程。與其他常見的話題很少跨越一回合的對話不同,診斷話題總是跨回合出現(xiàn)。由于抑郁癥診斷場景的特殊性,共情安慰在所有階段都保持穩(wěn)[0082]介紹相關數(shù)據(jù)集并與提出的診斷數(shù)據(jù)集進行比較,如圖12所示。抑郁癥診斷需要通過更多的對話輪次、更長的時間進行精確的癥狀信息收集話語權,以及足夠的情感支持。[0083]面向任務的對話數(shù)據(jù)集是對話系統(tǒng)研究中最重要的組成部分之一,由為此目的的[0084]心理咨詢數(shù)據(jù)集與心理健康相關的對話研究已經(jīng)解決了對話過程中的情緒并試圖激勵用戶。像ESConv這樣的網(wǎng)絡開始關注情感支持對話系統(tǒng)。然而,他們主要關心的是為患者提供鼓勵和建議,而不是提供專業(yè)的診斷建議。[0085]有一些針對診斷的醫(yī)學對話數(shù)在軀體癥狀和軀體疾病上。MedDialog雖然有少量的精神病數(shù)據(jù),但缺乏專業(yè)的標注,不能用于抑郁癥診斷對話系統(tǒng)。此外,抑郁癥的診斷過程與軀體疾病的診斷過程有很大不同。根障礙等多個維度的癥狀。出于這個原因,精神科醫(yī)生需要全面的信息來提供是準確的診斷的診斷,因此對話將屬于并包含多個知識領域。[0086]一些對話數(shù)據(jù)集與抑郁癥密切相關,例如多模態(tài)數(shù)據(jù)集DAIC-WOZ。該數(shù)據(jù)集由采訪者和患有抑郁癥、焦慮癥等的患者之間的面對面咨詢對話組成,研究人員用這些對話來[0087]為了試驗對比了幾種模型,Transformer是序列到序列模型進行回復生成和主題11預測實驗。使用的實現(xiàn)是HuggingFace。這些參數(shù)是從在中醫(yī)對話數(shù)據(jù)集MedDialog上預訓練的轉換器加載的。BART是一個去噪序列到序列預訓練模型,它是文本生成和摘要任務的入門模型。出于這個原因,使用在中文數(shù)據(jù)集上訓練的Bart數(shù)據(jù)集來執(zhí)行回復生成和對話摘要任務。[0088]CPT是一種新穎的中文預訓練不平衡變壓器模型,不僅在生成任務中有效,而且具有強大的分類能力,因此選擇它作為骨干模型來進行生成任務,并將其分類任務的性能與BART進行比較。[0089]Bert有效地用于廣泛的語言理解任務,例如問答和語言推理。因此,使用在中文數(shù)據(jù)集上預訓練的version2來執(zhí)行分類任務。衡量模型生成的回復和標簽之間的相似性。為了顯示代的多樣性,計算了DIST-2。實現(xiàn)jieba3進行標記化并計算單詞級別的度量。[0091]回復生成任務的結果如圖13所示??梢缘贸鋈齻€觀察結果:[0092](1)BART和CPT在本方法生成的數(shù)據(jù)集上表現(xiàn)出相似的生成性能;[0093](2)兩個模型大部分輸出執(zhí)行Transformer,它是在醫(yī)學語料上預訓練的,表明抑郁癥診斷不同于傳統(tǒng)的以軀體為導向的醫(yī)學對話;[0094](3)給定黃金主題,可以進一步提升生成性能的BART*。[0095]主題預測準確率結果顯示為主題。在如圖13中觀察到類似的趨勢:BART≈CPT>Transformer。由于十個主題是根據(jù)核心癥狀和情感支持進行分類的,抑郁癥診斷對話的不確定性和語言歧義無疑增加了預測難度。[0097]嚴重性分類二進制和4級分類通過平均加權精度、召回率和F1進行評估,如圖15所[0098]為了更好地評估模型生成的回復的性能,雇傭15名工作人員來對由BART和CPT生成的回復和醫(yī)生的真實回復分別進行評分。為每個模型隨機選擇了100個來自不同主題的回復,讓3個工人從4個方面評估相同的回復:流暢度衡量生成句子的流暢度;合理性衡量基于對話歷史給出此回復的合理程度;醫(yī)生的相似度衡量反應與醫(yī)生的話的相似程度;舒適度衡量響應的舒適程度。評價結果如圖16所示。一般情況下,人工評價是根據(jù)客觀衡量的:CPT和BART表現(xiàn)出相似的表現(xiàn),但都落后于基本事實。關于詳細的[0099]總的來說,本方法構建了一個符合臨床標準的抑郁癥診斷數(shù)據(jù)集,其中包含1339次對話以及精神科醫(yī)生的診斷摘要。此外,使用最先進的模型對多項任務進行實驗驗證,并將結果與客觀和人工評估進行比較。模型可以生成流暢且類似人類的回復。[0100]本發(fā)明實施例還提供了一種非易失性計算機存儲介質,計算機存儲介質存儲有計算機可執(zhí)行指令,該計算機可執(zhí)行指令可執(zhí)行上述實施例中的抑郁癥診斷對話數(shù)據(jù)集生成[0101]作為一種實施方式,本發(fā)明的非易失性計算機存儲介質存儲有計算機可執(zhí)行指[0102]基于抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發(fā)起對話,生成所述真實人群的患者畫像;[0103]基于所述患者畫像,模擬患者角色與醫(yī)生角色之間的抑郁門診對話記錄;[0104]對所述抑郁門診對話記錄進行監(jiān)督和過濾,得到達到臨床標準的抑郁癥診斷對話數(shù)據(jù)集。[0105]作為一種非易失性計算機可讀存儲介質,可用于存儲非易失性軟件程序、非易失性計算機可執(zhí)行程序以及模塊,如本發(fā)明實施例中的方法對應的程序指令/模塊。一個或者多個程序指令存儲在非易失性計算機可讀存儲介質中,當被處理器執(zhí)行時,執(zhí)行上述實施例中的抑郁癥診斷對話數(shù)據(jù)集生成方法。[0106]圖17是本申請另一實施例提供的抑郁癥診斷對話數(shù)據(jù)集生成方法的電子設備的[0107]一個或多個處理器1710以及存儲器1720,圖17中以一個處理器1710為例。抑郁癥診斷對話數(shù)據(jù)集生成方法的設備還可以包括:輸入裝置1730和輸出裝置1740。[0108]處理器1710、存儲器1720、輸入裝置1730和輸出裝置1740可以通過總線或者其他方式連接,圖17中以通過總線連接為例。[0109]存儲器1720作為一種非易失性計算機可讀存儲介質,可用于存儲非易失性軟件程序、非易失性計算機可執(zhí)行程序以及模塊,如本申請實施例中的抑郁癥診斷對話數(shù)據(jù)集生成方法對應的程序指令/模塊。處理器1710通過運行存儲在存儲器1720中的非易失性軟件程序、指令以及模塊,從而執(zhí)行服務器的各種功能應用以及數(shù)據(jù)處理,即實現(xiàn)上述方法實施例抑郁癥診斷對話數(shù)據(jù)集生成方法。[0110]存儲器1720可以包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個功能所需要的應用程序;存儲數(shù)據(jù)區(qū)可存儲數(shù)據(jù)等。此外,存儲器1720可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他非易失性固態(tài)存儲器件。在一些實施例中,存儲器1720可選包括相對于處理器1710遠程設置的存儲器,這些遠程存儲器可以通過網(wǎng)絡連接至移動裝置。上述網(wǎng)絡的實例[0111]輸入裝置1730可接收輸入的數(shù)字或字符信息。輸出裝置1740可包括顯示屏等顯示[0112]所述一個或者多個模塊存儲在所述存儲器1720中,當被所述一個或者多個處理器1710執(zhí)行時,執(zhí)行上述任意方法實施例中的抑郁癥診斷對話數(shù)據(jù)集生成方法。[0113]上述產(chǎn)品可執(zhí)行本申請實施例所提供的方法,具備執(zhí)行方法相應的功能模塊和有益效果。未在本實施例中詳盡描述的技術細節(jié),可參見本申請實施例所提供的方法。[0114]非易失性計算機可讀存儲介質可以包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個功能所需要的應用程序;存儲數(shù)據(jù)區(qū)可存儲根據(jù)裝置的使用所創(chuàng)建的數(shù)據(jù)等。此外,非易失性計算機可讀存儲介質可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他非易失性固態(tài)存儲器件。在一些實施例中,非易失性計算機可讀存儲介質可選包括相對于處理器遠程設置的存儲器,這些遠程存儲器可以通過網(wǎng)絡連接至裝置。上述網(wǎng)絡的實例包括但不限于互聯(lián)[0115]本發(fā)明實施例還提供一種電子設備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行本發(fā)明任一實施例的抑郁癥診斷對話數(shù)據(jù)集生成方法的步驟。[0116]本申請實施例的電子設備以多種形式存在,包括但不限于:[0117](1)移動通信設備:這類設備的特點是具備移動通信功能,并且以提供話音、數(shù)據(jù)[0118](2)超移動個人計算機設備:這類設備屬于個人計算機的范疇,有計算和處理功[0119](3)便攜式娛樂設備:這類設備可以顯示和播放多媒體內容。該類設[0120](4)其他具有數(shù)據(jù)處理功能的電子裝置。[0121]在本文中,諸如第一和第二等之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限或者設備中還存在另外的相同要素。[0122]以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上??梢愿鶕?jù)實際的需要選擇其中的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論