CN119397005B 一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法和裝置 (杭州弘云信息咨詢有限公司)_第1頁(yè)
CN119397005B 一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法和裝置 (杭州弘云信息咨詢有限公司)_第2頁(yè)
CN119397005B 一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法和裝置 (杭州弘云信息咨詢有限公司)_第3頁(yè)
CN119397005B 一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法和裝置 (杭州弘云信息咨詢有限公司)_第4頁(yè)
CN119397005B 一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法和裝置 (杭州弘云信息咨詢有限公司)_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(19)國(guó)家知識(shí)產(chǎn)權(quán)局(12)發(fā)明專利(10)授權(quán)公告號(hào)CN119397005B(65)同一申請(qǐng)的已公布的文獻(xiàn)號(hào)(73)專利權(quán)人杭州弘云信息咨詢有限公司地址310000浙江省杭州市余杭區(qū)倉(cāng)前街道景興路999號(hào)4幢101室(72)發(fā)明人張雷陳莉莉林輝(74)專利代理機(jī)構(gòu)浙江得恒知識(shí)產(chǎn)權(quán)代理有限公司33504專利代理師趙芳審查員丁雪龍一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法和裝置本申請(qǐng)?zhí)岢龅囊环N基于大語(yǔ)言模型的數(shù)據(jù)分析方法和裝置,根據(jù)第一用戶基礎(chǔ)畫像和第一用戶搜索畫像篩選得出與所述第一用戶相似度較高的多個(gè)第三用戶,在篩選過(guò)程中綜合考慮了用戶的基礎(chǔ)信息、搜索問(wèn)題以及對(duì)搜索答案的風(fēng)格偏好,根據(jù)多個(gè)第三用戶的搜索歷史確定用于表征搜索問(wèn)題和數(shù)據(jù)分析維度的多個(gè)第三映射關(guān)系,并根據(jù)第一用戶的數(shù)據(jù)分析需求確定目標(biāo)映射關(guān)系,進(jìn)而生成第一推薦結(jié)果,另外還可根據(jù)用戶的數(shù)據(jù)分析能力不同針對(duì)同一問(wèn)題給出不同的解決方案,以滿足不同用戶的個(gè)性化需畫像,根攝所述A個(gè)第二畫像獲得A個(gè)第二用戶S3:根據(jù)所述第一用戶的第一歷史搜索信息確定第S4:利用所迷第一用戶搜索畫像從所述A個(gè)第二畫像中,西配得出B個(gè)第三畫像,根據(jù)所迷B個(gè)第三畫像獲得日個(gè)第三用戶S5:獲取所述B個(gè)第三用戶的C條第三歷史搜索信息,對(duì)所述C條第三映射關(guān)系S6:根據(jù)所述第一用戶發(fā)出的第一分析需中確定第一推薦結(jié)果S7:根據(jù)所迷A個(gè)第二畫像和所迷第一推薦結(jié)果,獲取E個(gè)第一常見用戶21.一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法,其特征在于,該方法包括:S1:根據(jù)第一用戶的基礎(chǔ)信息確定第一用戶基礎(chǔ)畫像;S2:利用所述第一用戶基礎(chǔ)畫像,在第一用戶基礎(chǔ)畫像集合中匹配得出A個(gè)第二畫像,根據(jù)A個(gè)所述第二畫像獲得A個(gè)第二用戶;S3:根據(jù)所述第一用戶的第一歷史搜索信息確定第一用戶搜索畫像;S4:利用所述第一用戶搜索畫像從A個(gè)所述第二畫像中,匹配得出B個(gè)第三畫像,根據(jù)B個(gè)所述第三畫像獲得B個(gè)第三用戶;S5:獲取B個(gè)所述第三用戶的C條第三歷史搜索信息,對(duì)C條所述第三歷史搜索信息進(jìn)行聚類,以根據(jù)獲得的D個(gè)第一聚類中心確定D個(gè)第三映射關(guān)系;S6:根據(jù)所述第一用戶發(fā)出的第一分析需求,從D個(gè)所述第三映射關(guān)系中確定第一推薦結(jié)果;S7:根據(jù)所述A個(gè)第二畫像和所述第一推薦結(jié)果,獲取E個(gè)第一常見問(wèn)題,將所述E個(gè)第一常見問(wèn)題和相應(yīng)的第一解決方案推送給所述第一用戶;所述S6包括如下子步驟:S61:根據(jù)所述D個(gè)所述第三映射關(guān)系獲得D個(gè)第一問(wèn)題信息和D個(gè)第一分析維度信息;S62:將所述第一分析需求逐一與每條所述第三映射關(guān)系進(jìn)行相似度匹配,將相似度最高的第三映射關(guān)系作為目標(biāo)映射關(guān)系;S63:根據(jù)所述第一分析需求獲取第一目標(biāo)數(shù)據(jù),根據(jù)所述目標(biāo)映射關(guān)系中的第一分析維度和所述第一目標(biāo)數(shù)據(jù)獲得所述第一推薦結(jié)果。2.根據(jù)權(quán)利要求1所述的一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法,其特征在于,所述S1包括如下子步驟:S11:獲取所述第一用戶的第一基礎(chǔ)信息;S12:獲取所述第一用戶的多條第一歷史搜索問(wèn)題,將多條所述第一歷史搜索問(wèn)題按照搜索主題進(jìn)行分類,以得到多個(gè)第一搜索問(wèn)題;S13:對(duì)多個(gè)所述第一搜索問(wèn)題進(jìn)行關(guān)鍵詞提取,以獲取多個(gè)第一搜索標(biāo)簽;S14:根據(jù)所述第一基礎(chǔ)信息和多個(gè)所述第一搜索標(biāo)簽,生成所述第一用戶基礎(chǔ)畫像。3.根據(jù)權(quán)利要求2所述的一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法,其特征在于,所述S14之后還包括如下子步驟:S15:根據(jù)每個(gè)所述第一搜索標(biāo)簽,按照所述第一基礎(chǔ)信息確定若干不同等級(jí)的第一搜索結(jié)果,基于所述第一搜索標(biāo)簽和所述若干不同等級(jí)的第一搜索結(jié)果建立第一映射關(guān)系。4.根據(jù)權(quán)利要求3所述的一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法,其特征在于,所述S3包括如下子步驟:S31:針對(duì)每條所述第一歷史搜索問(wèn)題,獲取相應(yīng)的第二歷史搜索信息和第一動(dòng)作信息,并建立多條第二映射關(guān)系;S32:針對(duì)每條所述第一動(dòng)作信息,當(dāng)與目標(biāo)動(dòng)作信息的匹配度滿足預(yù)設(shè)要求時(shí),將與所述第一動(dòng)作信息滿足所述第二映射關(guān)系的所述第二歷史搜索信息確定為第一歷史搜索信息,否則繼續(xù)處理下一條第一動(dòng)作信息;S33:將多條所述第一歷史搜索信息進(jìn)行文本聚類分析,以得到多個(gè)第一文本風(fēng)格,根3據(jù)多個(gè)所述第一文本風(fēng)格確定所述第一用戶搜索畫像。5.根據(jù)權(quán)利要求4所述的一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法,其特征在于,所述S31包括如下子步驟:S311:從云服務(wù)器中獲取所述第一用戶的第一存檔文件;S312:從所述第一存檔文件中獲取若干第二歷史搜索信息和若干第一動(dòng)作信息,并建立多條第二映射關(guān)系。6.根據(jù)權(quán)利要求5所述的一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法,其特征在于,所述S33包括如下子步驟:S331:對(duì)每條所述第一歷史搜索信息進(jìn)行關(guān)鍵詞標(biāo)引;S332:根據(jù)標(biāo)引結(jié)果獲取多個(gè)第一關(guān)鍵詞集合和多個(gè)第一關(guān)鍵詞位置關(guān)系;S333:對(duì)所述多個(gè)第一關(guān)鍵詞集合和所述多個(gè)第一關(guān)鍵詞位置關(guān)系進(jìn)行聚類,以獲得多個(gè)所述第一文本風(fēng)格;S334:根據(jù)多個(gè)所述第一文本風(fēng)格,確定第一用戶搜索畫像。7.根據(jù)權(quán)利要求6所述的一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法,其特征在于,所述S5包括如下子步驟:S51:針對(duì)B個(gè)所述第三用戶,獲取C條第三歷史搜索信息;S52:針對(duì)每條所述第三歷史搜索信息,獲取第一分析維度信息,利用所述第三歷史搜索信息和相應(yīng)的所述第一分析維度建立第四映射關(guān)系;S53:對(duì)多條所述第四映射關(guān)系進(jìn)行聚類,以獲得D個(gè)第一聚類中心,根據(jù)所述D個(gè)第一聚類中心確定D個(gè)第三映射關(guān)系。8.根據(jù)權(quán)利要求7所述的一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法,其特征在于,所述S7包括如下子步驟:S71:獲取所述A個(gè)第二畫像中的多個(gè)第二搜索標(biāo)簽;S72:根據(jù)所述第一推薦結(jié)果與多個(gè)所述第二搜索標(biāo)簽的相似度,以獲得G個(gè)第一常見S73:根據(jù)所述第一映射關(guān)系和所述第一用戶基礎(chǔ)畫像,確定所述第一解決方案并推送給所述第一用戶。9.一種基于大語(yǔ)言模型的數(shù)據(jù)分析裝置,用于實(shí)現(xiàn)上述權(quán)利要求1-8中任一項(xiàng)所述的一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法。4一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法和裝置技術(shù)領(lǐng)域[0001]本發(fā)明屬于行為預(yù)測(cè)技術(shù)領(lǐng)域,尤其涉及一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法和裝置。背景技術(shù)[0002]隨著谷歌Transformer模型的提出,大語(yǔ)言模型已經(jīng)成為AI領(lǐng)域的新一代新興技術(shù),大語(yǔ)言模型依靠其強(qiáng)大的算力和海量的樣本數(shù)據(jù),能夠針對(duì)用戶的需求交出滿意的答[0003]但目前用戶針對(duì)大語(yǔ)言模型的運(yùn)用往往僅局限在文檔的生成和知識(shí)搜索,其在數(shù)據(jù)分析等應(yīng)用場(chǎng)景也具備較大的潛力,然而現(xiàn)有技術(shù)并無(wú)法針對(duì)用戶的特點(diǎn)和需要完成數(shù)據(jù)分析任務(wù)。發(fā)明內(nèi)容[0004]本發(fā)明的目的在于提供一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法和裝置,以解決現(xiàn)有技術(shù)中無(wú)法針對(duì)用戶的特點(diǎn)和需要完成數(shù)據(jù)分析任務(wù)的技術(shù)問(wèn)題。[0005]一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法,其特征在于,該方法包括:[0006]S1:根據(jù)第一用戶的基礎(chǔ)信息確定第一用戶基礎(chǔ)畫像;[0007]S2:利用所述第一用戶基礎(chǔ)畫像,在第一用戶基礎(chǔ)畫像集合中匹配得出A個(gè)第二畫[0008]S3:根據(jù)所述第一用戶的第一歷史搜索信息確定第一用戶搜索畫像;[0009]S4:利用所述第一用戶搜索畫像從A個(gè)所述第二畫像中,匹配得出B個(gè)第三畫像,根據(jù)B個(gè)所述第三畫像獲得B個(gè)第三用戶;[0010]S5:獲取B個(gè)所述第三用戶的C條第三歷史搜索信息,對(duì)C條所述第三歷史搜索信息進(jìn)行聚類,以根據(jù)獲得的D個(gè)第一聚類中心確定D個(gè)第三映射關(guān)系;[0011]S6:根據(jù)所述第一用戶發(fā)出的第一分析需求,從D個(gè)所述第三映射關(guān)系中確定第一推薦結(jié)果;[0012]S7:根據(jù)所述A個(gè)第二畫像和所述第一推薦結(jié)果,獲取E個(gè)第一常見問(wèn)題,將所述E個(gè)第一常見問(wèn)題和相應(yīng)的第一解決方案推送給所述第一用戶;[0015]S11:獲取所述第一用戶的第一基礎(chǔ)信息;[0016]S12:獲取所述第一用戶的多條第一歷史搜索問(wèn)題,將多條所述第一歷史搜索問(wèn)題按照搜索主題進(jìn)行分類,以得到多個(gè)第一搜索問(wèn)題;[0017]S13:對(duì)多個(gè)所述第一搜索問(wèn)題進(jìn)行關(guān)鍵詞提取,以獲取多個(gè)第一搜索標(biāo)簽;[0018]S14:根據(jù)所述第一基礎(chǔ)信息和多個(gè)所述第一搜索標(biāo)簽,生成所述第一用戶基礎(chǔ)畫2/7頁(yè)2/7頁(yè)5[0019]優(yōu)選的,所述S14之后還包括如下子步驟:[0020]S15:根據(jù)每個(gè)所述第一搜索標(biāo)簽,按照所述第一基礎(chǔ)信息確定若干不同等級(jí)的第一搜索結(jié)果,基于所述第一搜索標(biāo)簽和所述若干不同等級(jí)的第一搜索結(jié)果建立第一映射關(guān)[0022]S31:針對(duì)每條所述第一歷史搜索問(wèn)題,獲取相應(yīng)的第二歷史搜索信息和第一動(dòng)作[0023]S32:針對(duì)每條所述第一動(dòng)作信息,當(dāng)與目標(biāo)動(dòng)作信息的匹配度滿足預(yù)設(shè)要求時(shí),將與所述第一動(dòng)作信息滿足所述第二映射關(guān)系的所述第二歷史搜索信息確定為第一歷史搜索信息,否則繼續(xù)處理下一條第一動(dòng)作信息;[0024]S33:將多條所述第一歷史搜索信息進(jìn)行文本聚類分析,以得到多個(gè)第一文本風(fēng)格,根據(jù)多個(gè)所述第一文本風(fēng)格確定所述第一用戶搜索畫像。[0025]優(yōu)選的,所述S31包括如下子步驟:[0026]S311:從云服務(wù)器中獲取所述第一用戶的第一存檔文件;[0027]S312:從所述第一存檔文件中獲取若干第二歷史搜索信息和若干第一動(dòng)作信息,并建立多條第二映射關(guān)系。[0029]S331:對(duì)每條所述第一歷史搜索信息進(jìn)行關(guān)鍵詞標(biāo)引;[0030]S332:根據(jù)標(biāo)引結(jié)果獲取多個(gè)第一關(guān)鍵詞集合和多個(gè)第一關(guān)鍵詞位置關(guān)系;[0031]S333:對(duì)所述多個(gè)第一關(guān)鍵詞集合和所述多個(gè)第一關(guān)鍵詞位置關(guān)系進(jìn)行聚類,以獲得多個(gè)所述第一文本風(fēng)格;[0032]S334:根據(jù)多個(gè)所述第一文本風(fēng)格,確定第一用戶搜索畫像。[0033]優(yōu)選的,所述S5[0034]S51:針對(duì)B個(gè)所述第三用戶,獲取C條第三歷史搜索信息;[0035]S52:針對(duì)每條所述第三歷史搜索信息,獲取第一分析維度信息,利用所述第三歷史搜索信息和相應(yīng)的所述第一分析維度建立第四映射關(guān)系;[0036]S53:對(duì)多條所述第四映射關(guān)系進(jìn)行聚類,以獲得D個(gè)第一聚類中心,根據(jù)所述D個(gè)第一聚類中心確定D個(gè)第三映射關(guān)系。[0038]S61:根據(jù)所述D個(gè)所述第三映射關(guān)系獲得D個(gè)第一問(wèn)題信息和D個(gè)第一分析維度信[0039]S62:將所述第一分析需求逐一與每條所述第三映射關(guān)系進(jìn)行相似度匹配,將相似度最高的第三映射關(guān)系作為目標(biāo)映射關(guān)系;[0040]S63:根據(jù)所述第一分析需求獲取第一目標(biāo)數(shù)據(jù),根據(jù)所述目標(biāo)映射關(guān)系中的第一分析維度和所述第一目標(biāo)數(shù)據(jù)獲得所述第一推薦結(jié)果。[0042]S71:獲取所述A個(gè)第二畫像中的多個(gè)第二搜索標(biāo)簽;[0043]S72:根據(jù)所述第一推薦結(jié)果與多個(gè)所述第二搜索標(biāo)簽的相似度,以獲得G個(gè)第一常見問(wèn)題;6[0044]S73:根據(jù)所述第一映射關(guān)系和所述第一用戶基礎(chǔ)畫像,確定所述第一解決方案并推送給所述第一用戶。[0045]本申請(qǐng)還提出了一種基于大語(yǔ)言模型的數(shù)據(jù)分析裝置,用于實(shí)現(xiàn)上述基于大語(yǔ)言模型的數(shù)據(jù)分析方法。[0046]本申請(qǐng)?zhí)岢龅囊环N基于大語(yǔ)言模型的數(shù)據(jù)分析方法和裝置,根據(jù)第一用戶基礎(chǔ)畫像和第一用戶搜索畫像篩選得出與所述第一用戶相似度較高的多個(gè)第三用戶,在篩選過(guò)程中綜合考慮了用戶的基礎(chǔ)信息、搜索問(wèn)題以及對(duì)搜索答案的風(fēng)格偏好,根據(jù)多個(gè)第三用戶的搜索歷史確定用于表征搜索問(wèn)題和數(shù)據(jù)分析維度的多個(gè)第三映射關(guān)系,并根據(jù)第一用戶的數(shù)據(jù)分析需求確定目標(biāo)映射關(guān)系,進(jìn)而生成第一推薦結(jié)果,另外還可根據(jù)用戶的數(shù)據(jù)分析能力不同針對(duì)同一問(wèn)題給出不同的解決方案,以滿足不同用戶的個(gè)性化需求。通過(guò)本申請(qǐng)的技術(shù)方案可進(jìn)一步擴(kuò)充大語(yǔ)言模型的應(yīng)用場(chǎng)景,加快數(shù)據(jù)分析的便利性。附圖說(shuō)明[0047]為了更清楚地說(shuō)明本發(fā)明的實(shí)施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹。顯而易見地,下面描述中的附圖僅僅是示例性的,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)提供的附圖引伸獲得其它的實(shí)施附圖。[0048]圖1是本發(fā)明一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法的執(zhí)行流程圖。[0049]圖2是本發(fā)明中用戶針對(duì)不同問(wèn)題發(fā)出不同動(dòng)作信息的示意圖。具體實(shí)施方式[0050]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他[0051]下面將結(jié)合附圖以及具體實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明,其中的示意性實(shí)施例以及說(shuō)明僅用來(lái)解釋本發(fā)明,但并不作為對(duì)本發(fā)明的限定。[0052]下面對(duì)本發(fā)明的一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法和裝置進(jìn)行詳細(xì)說(shuō)明。[0053]本實(shí)施例提出了一種基于大語(yǔ)言模型的數(shù)據(jù)分析方法,方法流程如圖1所示,具體包括如下步驟:[0054]S1:根據(jù)第一用戶的基礎(chǔ)信息確定第一用戶基礎(chǔ)畫像。[0055]所述第一用戶基礎(chǔ)畫像用于表征所述第一用戶的基本信息、數(shù)據(jù)分析能力等信[0056]所述S1包括如下子步驟:[0057]S11:獲取所述第一用戶的第一基礎(chǔ)信息。[0058]所述第一基礎(chǔ)信息包括所述第一用戶的年齡、性別、職業(yè)、所從事工作等,主要用于表征所述第一用戶的基本能力。[0059]S12:獲取所述第一用戶的多條第一歷史搜索問(wèn)題,將所述多條第一歷史搜索問(wèn)題按照搜索主題進(jìn)行分類,以得到多個(gè)第一搜索問(wèn)題。7[0060]其中,所述搜索主題至少包括兩類。一類是求助類搜索主題,比如:VLO0KUP函數(shù)如何使用”等在數(shù)據(jù)分析中的工具使用問(wèn)題,另一類是下達(dá)任務(wù)類搜索主題,比如“請(qǐng)幫我分析一下我所在城市的天氣變化趨勢(shì)”等具體分析任務(wù)類的問(wèn)題。[0061]所述第一搜索問(wèn)題為求助類搜索主題,通過(guò)所述第一搜索問(wèn)題可反映出所述第一用戶的數(shù)據(jù)分析能力。[0062]S13:對(duì)所述多個(gè)第一搜索問(wèn)題進(jìn)行關(guān)鍵詞提取,以獲取多個(gè)第一搜索標(biāo)簽。[0063]在本步驟中,對(duì)所述多個(gè)第一搜索問(wèn)題進(jìn)行關(guān)鍵詞提取,從而可獲取多個(gè)用于表征搜索問(wèn)題的第一搜索標(biāo)簽。搜索標(biāo)簽以加入所述第一用戶基礎(chǔ)畫像中。[0065]S14:根據(jù)所述第一基礎(chǔ)信息和所述多個(gè)第一搜索標(biāo)簽,生成所述第一用戶基礎(chǔ)畫[0066]在所述第一用戶基礎(chǔ)畫像中,包括表征所述第一用戶基本能力的所述第一基礎(chǔ)信息,以及用于表征用戶的數(shù)據(jù)分析能力的所述第一搜索標(biāo)簽。[0067]優(yōu)選的,為了針對(duì)不同類型的用戶提供差異性搜索結(jié)果推薦,在所述S14之后還可以包括S15。[0068]S15:根據(jù)每個(gè)所述第一搜索標(biāo)簽,按照所述第一基礎(chǔ)信息確定若干不同等級(jí)的第一搜索結(jié)果,基于所述第一搜索標(biāo)簽和所述若干不同等級(jí)的第一搜索結(jié)果建立第一映射關(guān)[0069]針對(duì)同一個(gè)搜索問(wèn)題,針對(duì)不同類型的用戶可能所需的搜索結(jié)果并不相同。舉例因此在本步驟中,針對(duì)每個(gè)所述第一搜索標(biāo)簽,根據(jù)所述第一用戶的第一基礎(chǔ)信息確定所述第一用戶的類型,并進(jìn)而確定出若干不同等級(jí)的第一搜索結(jié)果,從而可在后續(xù)為用戶針對(duì)性推薦搜索結(jié)果時(shí)提供依據(jù)。[0070]S2:利用所述第一用戶基礎(chǔ)畫像,在第一用戶基礎(chǔ)畫像集合中匹配得出A個(gè)第二畫[0071]所述第一用戶基礎(chǔ)畫像集合中包括多個(gè)歷史用戶畫像,每個(gè)所述歷史用戶畫像均為按照所述S1中的方式構(gòu)建而成。[0072]在S2中,逐一計(jì)算所述第一用戶基礎(chǔ)畫像與所述第一用戶基礎(chǔ)畫像集合中每個(gè)所述歷史用戶畫像的余弦相似度,將所述余弦相似度大于預(yù)設(shè)值的所述歷史用戶畫像確定為第二畫像,從而可得到A個(gè)所述第二畫像,并可根據(jù)所述第二畫像與第二用戶的對(duì)應(yīng)關(guān)系,確定出A個(gè)第二用戶。每個(gè)所述第二用戶均為與所述第一用戶具備較為相似的基礎(chǔ)能力和搜索習(xí)慣。[0073]S3:根據(jù)所述第一用戶的第一歷史搜索信息確定第一用戶搜索畫像。[0074]所述第一歷史搜索信息是指針對(duì)所述第一用戶提出的每一個(gè)問(wèn)題,大語(yǔ)言模型為其提供的最滿意答復(fù)信息。由于大語(yǔ)言模型是基于用戶提出的問(wèn)題進(jìn)行分析后來(lái)提供答復(fù),因此當(dāng)用戶對(duì)得到的答復(fù)不滿意時(shí),有可能會(huì)調(diào)整問(wèn)題表達(dá)方式,從而力求使大語(yǔ)言模型能夠更好的理解用戶的需求,從而給出滿意的答復(fù)。因此在本步驟中,對(duì)用戶最滿意的所述第一歷史搜索信息進(jìn)行分析,從而了解到用戶的預(yù)期答案特性。8[0075]所述S3包括如下子步驟:[0076]S31:針對(duì)每條所述第一歷史搜索問(wèn)題,獲取相應(yīng)的第二歷史搜索信息和第一動(dòng)作信息,并建立多條第二映射關(guān)系。[0077]所述S31包括如下子步驟:[0078]S311:從云服務(wù)器中獲取所述第一用戶的第一存檔文件。[0079]所述第一存檔文件中存儲(chǔ)有所述第一用戶提出的所有第一歷史搜索問(wèn)題,另外還存儲(chǔ)有與每條所述第一歷史搜索問(wèn)題相對(duì)應(yīng)的第二歷史搜索信息和第一動(dòng)作信息。[0080]其中,所述第二歷史搜索信息是由大語(yǔ)言模型通過(guò)對(duì)所述第一歷史搜索問(wèn)題分析后得到。[0081]另外,針對(duì)每一條所述歷史搜索問(wèn)題,當(dāng)所述第二歷史搜索信息展示于第一界面上之后,所述第一用戶發(fā)出的動(dòng)作信息為所述第一動(dòng)作信息。舉例對(duì)當(dāng)前在所述第一界面上展示的答復(fù)不滿意時(shí),用戶可能會(huì)針對(duì)前一條問(wèn)題調(diào)整表達(dá)方式再次發(fā)出搜索問(wèn)題,而當(dāng)用戶對(duì)當(dāng)前在所述第一界面上展示的答復(fù)比較滿意時(shí),用戶可能會(huì)對(duì)當(dāng)前展示的所述第二歷史搜索信息作出復(fù)制、轉(zhuǎn)發(fā)等動(dòng)作,比如用戶可能針對(duì)問(wèn)題1和問(wèn)題2的答案不滿意,但針對(duì)問(wèn)題3的答案比較滿意,因此觸發(fā)了轉(zhuǎn)發(fā)控件。[0082]S312:從所述第一存檔文件中獲取若干第二歷史搜索信息和若干第一動(dòng)作信息,并建立多條第二映射關(guān)系。[0083]由于每條所述第二歷史搜索信息均與一個(gè)所述第一動(dòng)作信息相對(duì)應(yīng),因此可為每條所述第二歷史搜索信息建立一個(gè)第二映射關(guān)系。[0084]S32:針對(duì)每條所述第一動(dòng)作信息,當(dāng)與目標(biāo)動(dòng)作信息的匹配度滿足預(yù)設(shè)要求時(shí),將與所述第一動(dòng)作信息滿足所述第二映射關(guān)系的所述第二歷史搜索信息確定為第一歷史搜索信息,否則繼續(xù)處理下一條第一動(dòng)作信息。[0086]S33:將多條所述第一歷史搜索信息進(jìn)行文本聚類分析,以得到多個(gè)第一文本風(fēng)格,根據(jù)多個(gè)所述第一文本風(fēng)格確定所述第一用戶搜索畫像。[0087]所述S33包括如下子步驟:[0088]S331:對(duì)每條所述第一歷史搜索信息進(jìn)行關(guān)鍵詞標(biāo)引。[0089]針對(duì)每一種文本類型,均對(duì)應(yīng)有一定的文本風(fēng)格,每一種文本風(fēng)格均由若干關(guān)鍵詞組成,且所述若干關(guān)鍵詞之間具備預(yù)設(shè)的位置關(guān)系。[0090]S332:根據(jù)標(biāo)引結(jié)果獲取多個(gè)第一關(guān)鍵詞集合和多個(gè)第一關(guān)鍵詞位置關(guān)系。[0091]所述第一關(guān)鍵詞集合中保存有提取出的若干關(guān)鍵詞,所述第一關(guān)鍵詞位置關(guān)系中保存有不同關(guān)鍵詞之間的位置關(guān)系。[0092]S333:對(duì)所述多個(gè)第一關(guān)鍵詞集合和所述多個(gè)第一關(guān)鍵詞位置關(guān)系進(jìn)行聚類,以獲得多個(gè)所述第一文本風(fēng)格。[0093]在本步驟中,通過(guò)所述聚類操作之后,可得到目標(biāo)關(guān)鍵詞集合和位置關(guān)系,從而可根據(jù)獲得的關(guān)鍵詞集合和位置關(guān)系,形成若干所述第一文本風(fēng)格,所述第一文本風(fēng)格可代表所述第一用戶對(duì)搜索答案的偏好。[0094]S334:根據(jù)多個(gè)所述第一文本風(fēng)格,確定第一用戶搜索畫像。[0095]從多個(gè)所述第一文本風(fēng)格中獲取若干標(biāo)簽信息,從而形成所述第一用戶搜索畫9[0096]S4:利用所述第一用戶搜索畫像從所述A個(gè)第二畫像中,匹配得出B個(gè)第三畫像,根據(jù)所述B個(gè)第三畫像獲得B個(gè)第三用戶。[0097]在本步驟中,首先按照S3中的步驟為每個(gè)所述第二用戶生成相應(yīng)的搜索畫像,然后逐一計(jì)算所述第一用戶搜索畫像與每個(gè)第二用戶的搜索畫像的余弦相似度,得出所述余弦相似度滿足預(yù)設(shè)要求的B個(gè)第三畫像,并根據(jù)所述B個(gè)第三畫像獲得B個(gè)第三用戶。[0098]S5:獲取所述B個(gè)第三用戶的C條第三歷史搜索信息,對(duì)所述C條第三歷史搜索信息進(jìn)行聚類,以根據(jù)獲得的D個(gè)第一聚類中心確定D個(gè)第三映射關(guān)系。[0099]所述S5包括如下子步驟:[0100]S51:針對(duì)所述B個(gè)第三用戶,獲取C條第三歷史搜索信息。[0101]其中,所述第三歷史搜索信息是關(guān)于數(shù)據(jù)分析表格的搜索信息,且所述第三歷史搜索信息是一組由問(wèn)題和回答組成的二元組。[0102]S52:針對(duì)每條所述第三歷史搜索信息,獲取第一分析維度信息,利用所述第三歷史搜索信息和相應(yīng)的所述第一分析維度建立第四映射關(guān)系。[0103]所述第一分析維度信息是針對(duì)所述第三歷史搜索信息中的回答信息分析獲得,其中包含針對(duì)于所述第三用戶發(fā)出的問(wèn)題,由大語(yǔ)言模型給出的分析維度。[0104]S53:對(duì)多條所述第四映射關(guān)系進(jìn)行聚類,以獲得D個(gè)第一聚類中心,根據(jù)所述D個(gè)第一聚類中心確定D個(gè)第三映射關(guān)系。[0105]每個(gè)所述第一聚類中心,包含一條由問(wèn)題和第一分析維度信息組成的第三映射關(guān)[0106]S6:根據(jù)所述第一用戶發(fā)出的第一分析需求,從所述D個(gè)第三映射關(guān)系中確定第一推薦結(jié)果。[0107]由于所述第三映射關(guān)系中保存有分析問(wèn)題和第一分析維度信息組成的第三映射關(guān)系,因此當(dāng)利用所述第一分析需求在所述D個(gè)第三映射關(guān)系中進(jìn)行相似度匹配時(shí),可以根據(jù)匹配度最高的第三映射關(guān)系確定出第一推薦結(jié)果。[0108]所述S6包括如下子步驟:[0109]S61:根據(jù)所述D個(gè)所述第三映射關(guān)系獲得D個(gè)第一問(wèn)題信息和D個(gè)第一分析維度信[0110]S62:將所述第一分析需求逐一與每條所述第三映射關(guān)系進(jìn)行相似度匹配,將相似度最高的第三映射關(guān)系作為目標(biāo)映射關(guān)系。[0111]在本步驟中,將所述第一分析需求分別與同一條所述第三映射關(guān)系中的所述第一問(wèn)題信息和所述第一分析維度信息進(jìn)行相似度計(jì)算,從而得到第一相似度和第二相似度,將所述第一相似度和所述第二相似度進(jìn)行加權(quán)求和以作為所述第一分析需求與每條所述第三映射關(guān)系的相似度。[0112]S63:根據(jù)所述第一分析需求獲取第一目標(biāo)數(shù)據(jù),根據(jù)所述目標(biāo)映射關(guān)系中的第一分析維度和所述第一目標(biāo)數(shù)據(jù)獲得所述第一推薦結(jié)果。[0113]其中,所述第一目標(biāo)數(shù)據(jù)是由大語(yǔ)言模型根據(jù)所述第一分析需求獲得的數(shù)據(jù)內(nèi)容,所述第一分析維度是由所述目標(biāo)映射關(guān)系得出的數(shù)據(jù)分析維度,二者融合后即可得到所述第一推薦結(jié)果。[0114]S7:根據(jù)所述A個(gè)第二畫像和所述第一推薦結(jié)果,獲取E個(gè)第一常見問(wèn)題,將所述E個(gè)第一常見問(wèn)題和相應(yīng)的第一解決方案推送給所述第一用戶。[0115]所述S7包括如下子步驟:[0116]S71:獲取所述A個(gè)第二畫像中

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論