CN120196802A 一種用于車載系統(tǒng)的搜索方法、系統(tǒng)、存儲介質(zhì)_第1頁
CN120196802A 一種用于車載系統(tǒng)的搜索方法、系統(tǒng)、存儲介質(zhì)_第2頁
CN120196802A 一種用于車載系統(tǒng)的搜索方法、系統(tǒng)、存儲介質(zhì)_第3頁
CN120196802A 一種用于車載系統(tǒng)的搜索方法、系統(tǒng)、存儲介質(zhì)_第4頁
CN120196802A 一種用于車載系統(tǒng)的搜索方法、系統(tǒng)、存儲介質(zhì)_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

(19)國家知識產(chǎn)權(quán)局(10)申請公布號CN120196802A(21)申請?zhí)?02510691051.1(71)申請人央廣智能網(wǎng)聯(lián)汽車數(shù)字媒體(上海)有限公司地址200000上海市浦東新區(qū)自由貿(mào)易試驗區(qū)新金橋路27號13號樓2樓(72)發(fā)明人劉華周宏波林淼王衛(wèi)萍葉韓明陸方舟王浩劉祝峰(74)專利代理機構(gòu)上海申意誠專利代理有限公司3100601專利代理師王乾(54)發(fā)明名稱一種用于車載系統(tǒng)的搜索方法、系統(tǒng)、存儲介質(zhì)(57)摘要本申請實施例提供一種用于車載系統(tǒng)的搜所述搜索指令包括:初始文本特征;所述環(huán)境特征用于表征車輛實時狀態(tài);所述用戶特征用于表征用戶歷史行為;對所述初始文本特征進行語義泛化處理,生成文本特征合集;將所述文本特征合集、所述環(huán)境特征和所述用戶特征融合為融合向量;基于所述文本特征合集進行第一召回,生成第一候選集;基于所述融合向量進行第二召回,生成第二候選集;根據(jù)預(yù)設(shè)的融合權(quán)重策響應(yīng)接索指令,獲取環(huán)境特征和用戶特征,搜本特征;環(huán)境特征用于表征車輛實時狀態(tài);用戶特征用歷史行為對初始文本特征進行語義泛化處理,生成文本將文本特征合集、環(huán)境特征和用戶特征融合根據(jù)預(yù)設(shè)的融合權(quán)重策略,對第一候選集和第二候選集進行融合與2響應(yīng)搜索指令,獲取環(huán)境特征和用戶特征,所述搜索指令包括:初始文本特征;所述環(huán)境特征用于表征車輛實時狀態(tài);所述用戶特征用于表征用戶歷史行為;對所述初始文本特征進行語義泛化處理,生成文本特征合集;將所述文本特征合集、所述環(huán)境特征和所述用戶特征融合為融合向量;基于所述文本特征合集進行第一召回,生成第一候選集;基于所述融合向量進行第二召回,生成第二候選集;根據(jù)預(yù)設(shè)的融合權(quán)重策略,對所述第一候選集和所述第二候選集進行融合與排序,生成搜索合集。2.根據(jù)權(quán)利要求1所述的用于車載系統(tǒng)的搜索方法,其特征在于,所述對所述初始文本特征進行語義泛化處理,生成文本特征合集包括:通過提示詞模型對所述初始文本特征進行意圖識別,生成意圖信息,所述意圖信息包括基礎(chǔ)意圖和主題意圖;對所述基礎(chǔ)意圖進行同義詞擴展,生成第一同義詞合集;對所述主題意圖進行同義詞擴展,生成第二同義詞合集;基于所述第一同義詞合集和所述第二同義詞合集,生成所述文本特征合集。3.根據(jù)權(quán)利要求2所述的用于車載系統(tǒng)的搜索方法,其特征在于,所述對所述主題意圖進行同義詞擴展,生成第二同義詞合集包括:根據(jù)所述用戶特征和所述主題意圖生成召回提示詞;將所述召回提示詞輸入預(yù)設(shè)的擴展模型,生成第二同義詞合集。4.根據(jù)權(quán)利要求2所述的用于車載系統(tǒng)的搜索方法,其特征在于,所述對所述主題意圖進行同義詞擴展,生成第二同義詞合集包括:將所述主題意圖輸入預(yù)設(shè)的擴展模型,生成通用同義詞合集;計算所述通用同義詞合集中的同義詞與所述用戶特征之間的相關(guān)度;基于所述相關(guān)度在所述通用同義詞合集中篩選出所述第二同義詞合集;所述第二同義詞合集中的同義詞的相關(guān)度大于所述通用同義詞合集中其他同義詞的相關(guān)度。5.根據(jù)權(quán)利要求2所述的用于車載系統(tǒng)的搜索方法,其特征在于,所述基于所述文本特征合集進行第一召回,生成第一候選集包括:針對所述第一同義詞合集限定召回范圍;針對所述第二同義詞合集在所述召回范圍內(nèi)進行關(guān)鍵詞匹配,生成所述第一候選集。6.根據(jù)權(quán)利要求1所述的用于車載系統(tǒng)的搜索方法,其特征在于,所述將所述文本特征合集、所述環(huán)境特征和所述用戶特征融合為融合向量包括:將所述文本特征合集轉(zhuǎn)換為文本特征向量,將所述環(huán)境特征轉(zhuǎn)換為環(huán)境特征向量,將所述用戶特征轉(zhuǎn)換為用戶特征向量;對所述文本特征向量、環(huán)境特征向量以及用戶特征向量進行加權(quán)融合,生成融合向量。7.根據(jù)權(quán)利要求6所述的用于車載系統(tǒng)的搜索方法,其特征在于,所述基于所述融合向量進行第二召回,生成第二候選集包括:計算所述融合向量與預(yù)先構(gòu)建的資源向量庫中的各個資源向量之間的相似度;在所述資源向量庫中篩選所述相似度大于預(yù)設(shè)相似度的目標資源向量;3基于所述目標資源向量對應(yīng)的資源,生成所述第二候選集。8.根據(jù)權(quán)利要求1所述的用于車載系統(tǒng)的搜索方法,其特征在于,所述環(huán)境特征包括:車輛狀態(tài)參數(shù)、交互時機參數(shù);所述第一候選集所包含多個候選資源,每個候選資源對應(yīng)有第一得分,所述第二候選集包含多個候選資源,每個候選資源對應(yīng)有第二得分;所述根據(jù)預(yù)設(shè)的融合權(quán)重策略,對所述第一候選集和所述第二候選集進行融合與排將所述第一候選集的各所述候選資源的第一得分和所述第二候選集中的各所述候選資源的第二得分進行歸一化處理;獲取所述車輛狀態(tài)參數(shù)和交互時機參數(shù),并確認當前交互可靠性;在所述交互可靠性低于預(yù)設(shè)閾值時,降低第一候選集中各候選資源的權(quán)重,增大第二候選集中各候選資源的權(quán)重,并基于所述第一候選集中各候選資源的權(quán)重和歸一化處理后的所述第一得分生成對應(yīng)的融合得分,基于所述第二候選集中各候選資源的權(quán)重和歸一化處理后的所述第二得分生成對應(yīng)的融合得分;或,在所述交互可靠性高于或者等于預(yù)設(shè)閾值時,提高第一候選集中各候選資源的權(quán)重,降低第二候選集中各候選資源的權(quán)重,并基于所述第一候選集中各候選資源的權(quán)重和歸一化處理后的所述第一得分生成對應(yīng)的融合得分,基于所述第二候選集中各候選資源的權(quán)重和歸一化處理后的所述第二得分生成對應(yīng)的融合得分;基于所述融合得分統(tǒng)一對所述第一候選集和所述第二候選集中的各候選資源進行排響應(yīng)模塊,用于響應(yīng)搜索指令,獲取環(huán)境特征和用戶特征,所述搜索指令包括:初始文本特征;所述環(huán)境特征用于表征車輛實時狀態(tài);所述用戶特征用于表征用戶歷史行為;語義處理模塊,用于對所述初始文本特征進行語義泛化處理,生成文本特征合集;向量轉(zhuǎn)換模塊,用于將所述文本特征合集、所述環(huán)境特征和所述用戶特征融合為融合第一召回模塊,用于基于所述文本特征合集進行第一召回,生成第一候選集;第二召回模塊,用于基于所述融合向量進行第二召回,生成第二候選集;融合模塊,用于根據(jù)預(yù)設(shè)的融合權(quán)重策略,對所述第一候選集和所述第二候選集進行10.一種計算機可讀存儲介質(zhì),其特征在于,其上存儲有計算機程序,所述計算機程序被處理器進行加載,以執(zhí)行權(quán)利要求1-8中任一項所述的用于車載系統(tǒng)的搜索方法中的步驟。4一種用于車載系統(tǒng)的搜索方法、系統(tǒng)、存儲介質(zhì)技術(shù)領(lǐng)域[0001]本申請涉及車載系統(tǒng)的技術(shù)領(lǐng)域,具體涉及一種用于車載系統(tǒng)的搜索方法、系統(tǒng)、存儲介質(zhì)。背景技術(shù)[0002]隨著智能網(wǎng)聯(lián)汽車的發(fā)展,車載系統(tǒng)日益成為用戶獲取導(dǎo)航、媒體、服務(wù)等信息的重要交互入口。車載搜索作為其中的核心功能之一,直接影響用戶在駕駛過程中的信息獲取效率與體驗?,F(xiàn)有的車載系統(tǒng)多采用基于關(guān)鍵詞匹配的傳統(tǒng)信息檢索架構(gòu),典型代表如基于倒排索引的Elasticsearch(ES)系統(tǒng),結(jié)合BM25、TF-IDF等經(jīng)典統(tǒng)計模型實現(xiàn)搜索排[0003]然而,用戶駕駛過程中注意力有限,交互窗口短,傳統(tǒng)信息檢索架構(gòu)應(yīng)用車載系統(tǒng)中存在召回率低、結(jié)果相關(guān)性差等問題。發(fā)明內(nèi)容[0004]本申請實施例提供一種用于車載系統(tǒng)的搜索方法、系統(tǒng)、存儲介質(zhì),能夠提高用于車載系統(tǒng)的搜索系統(tǒng)的召回率和結(jié)果相關(guān)性。響應(yīng)搜索指令,獲取環(huán)境特征和用戶特征,所述搜索指令包括:初始文本特征;所述環(huán)境特征用于表征車輛實時狀態(tài);所述用戶特征用于表征用戶歷史行為;對所述初始文本特征進行語義泛化處理,生成文本特征合集;將所述文本特征合集、所述環(huán)境特征和所述用戶特征融合為融合向量;基于所述文本特征合集進行第一召回,生成第一候選集;基于所述融合向量進行第二召回,生成第二候選集;根據(jù)預(yù)設(shè)的融合權(quán)重策略,對所述第一候選集和所述第二候選集進行融合與排[0006]在其中一些實施例中,對所述初始文本特征進行語義泛化處理,生成文本特征合集包括:通過提示詞模型對所述初始文本特征進行意圖識別,生成意圖信息,所述意圖信息包括基礎(chǔ)意圖和主題意圖;對所述基礎(chǔ)意圖進行同義詞擴展,生成第一同義詞合集;對所述主題意圖進行同義詞擴展,生成第二同義詞合集;基于所述第一同義詞合集和所述第二同義詞合集,生成所述文本特征合集。[0007]在其中一些實施例中,所述對所述主題意圖進行同義詞擴展,生成第二同義詞合集包括:根據(jù)所述用戶特征和所述主題意圖生成召回提示詞;將所述召回提示詞輸入預(yù)設(shè)的擴展模型,生成第二同義詞合集。5[0008]在其中一些實施例中,所述對所述主題意圖進行同義詞擴展,生成第二同義詞合集包括:將所述主題意圖輸入預(yù)設(shè)的擴展模型,生成通用同義詞合集;計算所述通用同義詞合集中的同義詞與所述用戶特征之間的相關(guān)度;基于所述相關(guān)度在所述通用同義詞合集中篩選出所述第二同義詞合集;所述第二同義詞合集中的同義詞的相關(guān)度大于所述通用同義詞合集中其他同義詞的相關(guān)度。[0009]在其中一些實施例中,所述基于所述文本特征合集進行第一召回,生成第一候選集包括:針對所述第一同義詞合集限定召回范圍;針對所述第二同義詞合集在所述召回范圍內(nèi)進行關(guān)鍵詞匹配,生成所述第一候選集。[0010]在其中一些實施例中,所述將所述文本特征合集、所述環(huán)境特征和所述用戶特征融合為融合向量包括:將所述文本特征合集轉(zhuǎn)換為文本特征向量,將所述環(huán)境特征轉(zhuǎn)換為環(huán)境特征向量,將所述用戶特征轉(zhuǎn)換為用戶特征向量;對所述文本特征向量、環(huán)境特征向量以及用戶特征向量進行加權(quán)融合,生成融合向量。[0011]在其中一些實施例中,所述基于所述融合向量進行第二召回,生成第二候選集包計算所述融合向量與預(yù)先構(gòu)建的資源向量庫中的各個資源向量之間的相似度;在所述資源向量庫中篩選所述相似度大于預(yù)設(shè)相似度的目標資源向量;基于所述目標資源向量對應(yīng)的資源,生成所述第二候選集。[0012]在其中一些實施例中,所述環(huán)境特征包括:車輛狀態(tài)參數(shù)、交互時機參數(shù);所述第一候選集所包含多個候選資源,每個候選資源對應(yīng)有第一得分,所述第二候選集包含多個候選資源,每個候選資源對應(yīng)有第二得分;所述根據(jù)預(yù)設(shè)的融合權(quán)重策略,對所述第一候選集和所述第二候選集進行融合與將所述第一候選集的各所述候選資源的第一得分和所述第二候選集中的各所述候選資源的第二得分進行歸一化處理;獲取所述車輛狀態(tài)參數(shù)和交互時機參數(shù),并確認當前交互可靠性;在所述交互可靠性低于預(yù)設(shè)閾值時,降低第一候選集中各候選資源的權(quán)重,增大第二候選集中各候選資源的權(quán)重,并基于所述第一候選集中各候選資源的權(quán)重和歸一化處理后的所述第一得分生成對應(yīng)的融合得分,基于所述第二候選集中各候選資源的權(quán)重和歸一化處理后的所述第二得分生成對應(yīng)的融合得分;或,在所述交互可靠性高于或者等于預(yù)設(shè)閾值時,提高第一候選集中各候選資源的權(quán)重,降低第二候選集中各候選資源的權(quán)重,并基于所述第一候選集中各候選資源的權(quán)重和歸一化處理后的所述第一得分生成對應(yīng)的融合得分,基于所述第二候選集中各候選資源的權(quán)重和歸一化處理后的所述第二得分生成對應(yīng)的融合得分;基于所述融合得分統(tǒng)一對所述第一候選集和所述第二候選集中的各候選資源進6響應(yīng)模塊,用于響應(yīng)搜索指令,獲取環(huán)境特征和用戶特征,所述搜索指令包括:初始文本特征;所述環(huán)境特征用于表征車輛實時狀態(tài);所述用戶特征用于表征用戶歷史行為;語義處理模塊,用于對所述初始文本特征進行語義泛化處理,生成文本特征合集;向量轉(zhuǎn)換模塊,用于將所述文本特征合集、所述環(huán)境特征和所述用戶特征融合為融合向量;第一召回模塊,用于基于所述文本特征合集進行第一召回,生成第一候選集;第二召回模塊,用于基于所述融合向量進行第二召回,生成第二候選集;融合模塊,用于根據(jù)預(yù)設(shè)的融合權(quán)重策略,對所述第一候選集和所述第二候選集[0014]第三方面,本實施例還提供一種計算機可算機程序被處理器進行加載,以執(zhí)行上述實施例中任一項的用于車載系統(tǒng)的搜索方法中的有益效果[0015]本申請公開的用于車載系統(tǒng)的搜索方法提出一種雙通路召回方法,通過對搜索指令進行語義泛化處理,結(jié)合用戶歷史特征與車輛當前環(huán)境特征,分別進行關(guān)鍵詞召回與融合向量召回,并引入基于交互可靠性評分的權(quán)重調(diào)控機制對召回結(jié)果進行加權(quán)融合排序,從而在不同駕駛場景中均可實現(xiàn)高相關(guān)性、高魯棒性與高響應(yīng)性的搜索結(jié)果輸出。附圖說明[0016]為了更清楚地說明本申請實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領(lǐng)域技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附[0017]圖1是本申請一些實施例提供的用于車載系統(tǒng)的搜索方法的流程示意圖一;圖2是本申請一些實施例提供的用于車載系統(tǒng)的搜索方法的流程示意圖二;圖3是本申請一些實施例提供的用于車載系統(tǒng)的搜索方法的流程示意圖三。具體實施方式[0018]下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├?,本領(lǐng)域技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“豎直”、“水平”、“頂”、“底”、“內(nèi)”、“外”等指示的方位或位置關(guān)系為基于附圖所示的方位或位置關(guān)系,僅是為了便于描述本申請和簡化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,7為指示或暗示相對重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、個”的含義是兩個或兩個以上,除非另有明確具體的限定。為“基于”一個或多個所述條件或值的過程、步驟、計算或其他動作在實踐中可以基于額外條件或超出所述的值。“示例性”的任何實施例不一定被解釋為比其它實施例更優(yōu)選或更具優(yōu)勢。為了使本領(lǐng)域任何技術(shù)人員能夠?qū)崿F(xiàn)和使用本申請,給出了以下描述。在以下描述中,為了解釋的目的而列出了細節(jié)。應(yīng)當明白的是,本領(lǐng)域普通技術(shù)人員可以認識到,在不使用這些特定細節(jié)的情況下也可以實現(xiàn)本申請。在其它實例中,不會對公知的結(jié)構(gòu)和過程進行詳細闡述,以避免不必要的細節(jié)使本申請的描述變得晦澀。因此,本申請并非旨在限于所示的實施例,而是與符合本申請所公開的原理和特征的最廣范圍相一致。[0023]如背景技術(shù)所述,傳統(tǒng)車載系統(tǒng)的搜索架構(gòu)應(yīng)用存在技術(shù)瓶頸,具體地,用戶駕駛過程中注意力有限,因而發(fā)出的搜索指令往往準確度不足且信息量有限。當用戶表達不規(guī)范、指令口語化,或搜索詞與目標內(nèi)容缺乏顯性匹配時,傳統(tǒng)車載系統(tǒng)的搜索架構(gòu)容易出現(xiàn)召回不全、結(jié)果不相關(guān)等問題,上述不足不僅嚴重削弱了搜索體驗,還會分散駕駛者注意[0024]參照圖1,本申請實施例提供了一種用于車載系統(tǒng)的搜索方法,包括:境特征用于表征車輛實時狀態(tài);用戶特征用于表征用戶歷史行為;S200、對初始文本特征進行語義泛化處理,S300、將文本特征合集、環(huán)境特征和用戶特S400、基于文本特征合集進行第一召回,生成第一候選集;S600、根據(jù)預(yù)設(shè)的融合權(quán)重策略,對第一候選集和第二候選集進行融合與排序,生成搜索合集。[0025]在步驟S100中,響應(yīng)搜索指令,獲取環(huán)境特征和用戶特征,搜索指令包括:初始文本特征;環(huán)境特征用于表征車輛實時狀態(tài);用戶特征用于表征用戶歷史行為。[0026]在本申請實施例中,搜索指令可以通過文本輸入的方式輸入、也可以通過語音輸入的方式輸入,車載系統(tǒng)的搜索系統(tǒng)能夠?qū)Σ煌问降妮斎脒M行統(tǒng)一解析與處理,獲取搜索指令中包括的初始文本特征。[0027]在接收并響應(yīng)搜索指令后,車載系統(tǒng)的搜索系統(tǒng)能夠獲取環(huán)境特征和用戶特征。環(huán)境特征包括但不限于:車輛狀態(tài)參數(shù)、交互時機參數(shù)、時間參數(shù)等。車輛狀態(tài)參數(shù)包括但不限于車輛當前位置信息、當前車速、當前加速度等。時間參數(shù)包括當前時間信息。交互時機參數(shù)包括:交互高峰期和交互低峰期;交互高峰期用于表示用戶注意力較為集中、處于空閑可交互狀態(tài)的階段。交互低峰期用于表示用于注意力受限、駕駛?cè)蝿?wù)優(yōu)先級較高的階段。8比如,交互高峰期可以為:上車初期(車輛剛解鎖并啟動完成后的前0~30秒)、車輛靜止期間車輛靜止≥10秒)等;交互低峰期可以為:行駛期間。用戶特征包括但不限于用戶歷史行[0028]在步驟S200中,對初始文本特征進行語義泛化處理,生成文本特征合集。[0029]參照圖2,在本申請實施例中,通過下述步驟生成文本特征合集,具體地:S201、通過提示詞模型對初始文本特征進行意圖識別,生成意圖信息,意圖信息包括基礎(chǔ)意圖和主題意圖;S204、基于第一同義詞合集和第二同義詞合集,生成文本特征合集。[0030]具體地,基礎(chǔ)意圖表示用戶欲執(zhí)行的操作類型,通常為動詞性表達。如用戶輸入但不限于["播放","聽","來點","播一下","放首歌"]。主題意圖表示用戶感興趣的內(nèi)容主體,通常為名詞性或短語結(jié)構(gòu)。如用戶輸入“我想聽周某某的安靜”,主題意圖為“周某某的安靜”,第二同義詞合集包括但不限于[“周某某的安靜”,"安靜","抒情",”安靜的歌","周某某","華語流行”]。生成的文本特征合集可以為對第一同義詞合集和第二同義詞合集交叉組合生成短語結(jié)構(gòu)的特征表達,如["播放安靜","播放周某某","播放抒情歌曲","來點安靜","聽周某某","來點華語流行”],也可以分別保留所述第一同義詞合集與第二同義詞合集的結(jié)構(gòu),也可以同時存在上述兩種形式的文本特征合集。[0031]值得一提的是,本申請實施例中,第一同義詞合集和第二同義詞合集中包含的同義詞具有不同的顆粒度,比如,第二同義詞合集中的,細粒度表留完整指向性)為“周某某的安靜”;中粒度表達(抽象出部分語義關(guān)鍵詞)為“安靜”、"抒情"、"安靜的歌"、"周某某";粗粒度表達(泛化到語義類別或內(nèi)容風格)為"華語流行”。[0032]進一步地,生成第二同義詞合集時,還可以基于用戶特征和主題意圖共同生成第二同義詞合集,在一些實施例中,通過下述步驟生成第二同義詞合集:根據(jù)用戶特征和主題意圖生成召回提示詞;將召回提示詞輸入預(yù)設(shè)的擴展模型,生成第二同義詞合集。用戶畫像信息為:30-40歲,則可以基于上述主題意圖和用于特征生成召回提示詞[用戶偏樂;請基于上述信息,擴展與“輕音樂”相關(guān)的關(guān)鍵詞],并將上述召回提示詞輸入預(yù)設(shè)的擴展模型中,生成第二同義詞合集。擴展模型可以為支持提示詞輸入的輕量化的生成模型。[0034]在一些其他實施例中,通過下述步驟生成第二同義詞合集:將主題意圖輸入預(yù)設(shè)的擴展模型,生成通用同義詞合集;計算通用同義詞合集中的同義詞與用戶特征之間的相關(guān)度;基于相關(guān)度在通用同義詞合集中篩選出第二同義詞合集;第二同義詞合集中的同義詞的相關(guān)度大于通用同義詞合集中其他同義詞的相關(guān)度。9詞擴展,生成通用同義詞合集:["放松音樂”,"純音樂”,"背景音樂”,"鋼琴曲","爵士","小夜曲","Lo-fi","睡眠旋律"];用戶特征中,用戶興趣標簽為:爵士、鋼琴、小夜個通用同義詞,計算其與用戶興趣標簽和用戶歷史行為記錄之間的語義相關(guān)度(可用向量余弦相似度或基于規(guī)則打分)。篩選出第二同義詞合集即為["鋼琴曲","爵士","小夜[0036]上述兩種生成第二同義詞合集的實施例中,均將用戶特征引入主題意圖的同義詞擴展環(huán)節(jié),能夠提高第一召回時,第一候選集的精確性。同時,用戶輸入搜索指令時經(jīng)常具有模糊性和不完整性(如“來點輕的”),或者存在非標準口語表達。本方案通過泛化和個性驗的一致性。[0037]在步驟S400中,基于文本特征合集進行第一召回,生成第一候選集。在本申請實施例中,具體通過下述步驟生成第一候選集:針對第一同義詞合集限定召回范圍;針對第二同義詞合集在召回范圍內(nèi)進行關(guān)鍵詞匹配,生成第一候選集。[0038]具體地,前述公開生成的文本特征合集的時提到文本特征合集可以分別保留所述第一同義詞合集與第二同義詞合集的結(jié)構(gòu)。本實施例利用保留所述第一同義詞合集與第二同義詞合集的結(jié)構(gòu)的文本特征合集,首先以基礎(chǔ)意圖識別所生成的第一同義詞合集作為行為限定條件,對資源庫中的索引字段或語義標簽進行篩選,限定召回范圍。示例:當基礎(chǔ)意圖為“聽”,第一同義詞合集為["播放","聽","來點","播一下"],則系統(tǒng)在召回資源時,僅檢索媒體類資源(如歌曲、專輯、電臺),而非導(dǎo)航、問答或服務(wù)類資源的召回范圍內(nèi),對第二同義詞合集中的同義詞進行關(guān)鍵詞匹配,篩選出相關(guān)度高的候選資源構(gòu)成第一候選集。示例:第二同義詞合集為["周某某","安靜","抒情","小夜曲","爵士"],可以基于ES(Elasticsearch)倒排索引的精確匹配或模糊匹配(Fuzzy),并使用BM25、TF-IDF或定制化打分機制對候選資源打分排序,最后得分高于預(yù)設(shè)閾值的候選資源將被納入第一候選集,用于后續(xù)的融合排序。[0039]在步驟S300中,將文本特征合集、環(huán)境特征和用戶特征融合為融合向量;在步驟述步驟形成融合向量:將文本特征合集轉(zhuǎn)換為文本特征向量,將環(huán)境特征轉(zhuǎn)換為環(huán)境特征向量,將用戶特征轉(zhuǎn)換為用戶特征向量;對文本特征向量、環(huán)境特征向量以及用戶特征向量進行加權(quán)融合,生成融合向量。[0040]具體地,文本特征合集可以通過預(yù)設(shè)的文本編碼模型(如BERT、SBERT、SimCSE等輕量語義模型)生成對應(yīng)的文本特征向量V-text。環(huán)境特征(包括車輛狀態(tài)參數(shù)、交互時機參數(shù)、時間參數(shù)等)可以編碼為數(shù)值型特征后,輸入至嵌入模型或使用多維歸一化方法生成環(huán)境特征向量V-env。用戶特征(包括用戶歷史行為記錄、用戶興趣標簽、用戶畫像信息、歷史地理行為特征等)可以轉(zhuǎn)換為固定維度的向量表示,轉(zhuǎn)換方式包括但不限于基于標簽向[0041]對文本特征向量、環(huán)境特征向量以及用戶特征向量進行加權(quán)融合,生成融合向量時,三種向量的維度可能不同,文本特征向量V-text可能為128維,環(huán)境特征向量V-env可能為64維,用戶特征向量V-user可能為64維,需要先將三種向量通過線性變換映射為相同維+β*V-env+γ*V-user,其中α、β、γ可為預(yù)設(shè)固定值(如0.6,0.15,0.25)。[0042]在傳統(tǒng)的車載系統(tǒng)的搜索系統(tǒng)中,單靠文本向量,容易遺漏用戶真實意圖,在第二搜索系統(tǒng)可根據(jù)其偏好召回不同資源,例如“播放輕音樂”,有人喜歡“鋼琴曲”,有人喜歡[0043]在本申請實施例中,通過下述步驟形成生成第二候選集:計算融合向量與預(yù)先構(gòu)建的資源向量庫中的各個資源向量之間的相似度;在資源向量庫中篩選相似度大于預(yù)設(shè)相似度的目標資源向量;基于目標資源向量對應(yīng)的資源,生成第二候選集。[0044]在預(yù)先構(gòu)建的資源向量庫中對資源庫中的各類目標資源(如歌曲、專輯、新聞、電臺節(jié)目等)進行統(tǒng)一編碼,將每個資源內(nèi)容(包括標題、標簽、描述字段等)轉(zhuǎn)換為固定維度的資源語義向量。計算融合向量與預(yù)先構(gòu)建的資源向量庫中的各個資源向量之間的相似度時,可以通過余弦相似度計算。相比于第一召回,第二召回通過進行同義詞擴展后的文本特征、環(huán)境特征和用戶特征后的向量表達,能捕捉到更深層次、隱性關(guān)聯(lián)的語義,能有效補全用戶輸入不完整、關(guān)鍵詞缺失或表達模糊情況下的檢索結(jié)果。[0045]參照圖3,在步驟S600中根據(jù)預(yù)設(shè)的融合權(quán)重策略,對第一候選集和第二候選集進[0046]具體地,第一候選集所包含多個候選資源,每個候選資源對應(yīng)有第一得分,第二候選集包含多個候選資源,每個候選資源對應(yīng)有第二得分。本申請實施例基于下述步驟生成搜索合集:S601、將第一候選集的各候選資源的第一得分和第二候選集中的各候選資源的第二得分進行歸一化處理;S602、獲取車輛狀態(tài)參數(shù)和交互時機參數(shù),并確認當前交互可靠性;S603、在交互可靠性低于預(yù)設(shè)閾值時,降低第一候選集中各候選資源的權(quán)重,增大第二候選集中各候選資源的權(quán)重,并基于第一候選集中各候選資源的權(quán)重和歸一化處理后的第一得分生成對應(yīng)的融合得分,基于第二候選集中各候選資源的權(quán)重和歸一化處理后的S604、在交互可靠性高于或者等于預(yù)設(shè)閾值時,提高第一候選集中各候選資源的權(quán)重,降低第二候選集中各候選資源的權(quán)重,并基于第一候選集中各候選資源的權(quán)重和歸一化處理后的第一得分生成對應(yīng)的融合得分,基于第二候選集中各候選資源的權(quán)重和歸一化處理后的第二得分生成對應(yīng)的融合得分;S605、基于融合得分統(tǒng)一對第一候選集和第二候選集中的各候選資源進行排序,生成搜索合集。[0047]具體地,第一候選集中的候選資源和第二候選集中的候選資源通過不同的召回路徑召回,通過分別對第一候選集中各候選資源的第一得分和第二候選集中各候選資源的第11二得分進行歸一化處理,可以消除不同召回路徑中評分互高峰期可以為:上車初期(車輛剛解鎖并啟動完成后的前0~30秒)、車輛靜止期間車輛能在急加速/急剎)對應(yīng)0.4。通過線性加權(quán),當前車速的權(quán)重為0.6,當前加速度的權(quán)重為0.4,通過R-vehicle=0.6×f(speed)+0.4×f(acceleration)即可確定車輛狀態(tài)參數(shù)用于評估交互可靠性的評分R-vehicle,f(speed)表示當前車速的評分,f可靠性的綜合評分R-interact,其中R-context表示交互時機參數(shù)的評分。在一些實施例不完整或噪聲干擾,故應(yīng)弱化對第一召回得到的第一候[0052]比如,第一候選集中命中資源“周某某·安靜”,融合得分0.81;第二候選集中同樣命中該資源,融合得分0.74;可以基于融合得分的權(quán)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論