CN118861218B 樣本數(shù)據(jù)生成方法、裝置、電子設(shè)備及存儲介質(zhì)(騰訊科技(深圳)有限公司)_第1頁
CN118861218B 樣本數(shù)據(jù)生成方法、裝置、電子設(shè)備及存儲介質(zhì)(騰訊科技(深圳)有限公司)_第2頁
CN118861218B 樣本數(shù)據(jù)生成方法、裝置、電子設(shè)備及存儲介質(zhì)(騰訊科技(深圳)有限公司)_第3頁
CN118861218B 樣本數(shù)據(jù)生成方法、裝置、電子設(shè)備及存儲介質(zhì)(騰訊科技(深圳)有限公司)_第4頁
CN118861218B 樣本數(shù)據(jù)生成方法、裝置、電子設(shè)備及存儲介質(zhì)(騰訊科技(深圳)有限公司)_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

(19)國家知識產(chǎn)權(quán)局(12)發(fā)明專利地址518000廣東省深圳市南山區(qū)高新區(qū)(72)發(fā)明人楊震謝若冰安子豪孫興武連鳳宗康戰(zhàn)輝限公司44205GO6F40/284(2020.0(56)對比文件權(quán)利要求書3頁說明書26頁附圖8頁介質(zhì)(57)摘要本申請實施例公開了一種樣本數(shù)據(jù)生成方法、裝置、電子設(shè)備及存儲介質(zhì),該方法包括:獲取用于提示第一大語言模型生成問題指令的第初始問題指令作為首個輸入至第二大語言模型語言模型用于根據(jù)目標(biāo)回答文本生成輸入至第將初始問題指令作為首個輸入至第二大語言模型的問題指令,調(diào)用第二大語言模型與第三大語言模型進(jìn)行多輪對話2獲取用于提示第一大語言模型生成問題指令的第一提示文本,調(diào)用所述第一大語言模型基于所述第一提示文本進(jìn)行問題指令預(yù)測,生成初始問題指令;將所述初始問題指令作為首個輸入至第二大語言模型的問題指令,調(diào)用所述第二大語言模型與第三大語言模型進(jìn)行多輪對話,其中,所述第二大語言模型用于根據(jù)輸入的問題指令生成目標(biāo)回答文本,所述第三大語言模型用于根據(jù)第二提示文本生成輸入至所述第二大語言模型的目標(biāo)問題指令,所述第二提示文本用于提示所述第三大語言模型每當(dāng)接收到所述目標(biāo)回答文本時根據(jù)所述目標(biāo)回答文本生成所述目標(biāo)問題指令;基于所述初始問題指令、多輪對話中的所述目標(biāo)問題指令以及多輪對話中的所述目標(biāo)2.根據(jù)權(quán)利要求1所述的樣本數(shù)據(jù)生成方法,其特征在于,所述將所述初始問題指令作為首個輸入至第二大語言模型的問題指令之前,所述樣本數(shù)據(jù)生成方法還包括:獲取第一角色定義文本和第二角色定義文本,其中,所述第一角色定義文本用于提示所述第二大語言模型在所述多輪對話中作為針對目標(biāo)任務(wù)的回答方,所述第二角色定義文本用于提示所述第三大語言模型在所述多輪對話中作為提問方,所述目標(biāo)任務(wù)為基于所述樣本數(shù)據(jù)進(jìn)行訓(xùn)練的下游任務(wù);將所述第一角色定義文本輸入至所述第二大語言模型,將所述第二角色定義文本輸入至所述第三大語言模型。3.根據(jù)權(quán)利要求1所述的樣本數(shù)據(jù)生成方法,其特征在于,所述將所述初始問題指令作為首個輸入至第二大語言模型的問題指令,調(diào)用所述第二大語言模型與第三大語言模型進(jìn)將所述初始問題指令輸入第二大語言模型進(jìn)行回答預(yù)測,生成首個對話輪次的目標(biāo)回答文本;構(gòu)建所述第二提示文本,將所述第二提示文本和首個所述對話輪次的所述目標(biāo)回答文本輸入所述第三大語言模型進(jìn)行問題指令預(yù)測,生成下一個對話輪次的目標(biāo)問題指令;將下一個所述對話輪次的所述目標(biāo)問題指令輸入至所述第二大語言模型再次進(jìn)行回答預(yù)測,直至所述對話輪次的數(shù)量等于預(yù)設(shè)的數(shù)量閾值。4.根據(jù)權(quán)利要求3所述的樣本數(shù)據(jù)生成方法,其特征在于,所述將所述第二提示文本和首個所述對話輪次的所述目標(biāo)回答文本輸入所述第三大語言模型進(jìn)行問題指令預(yù)測,生成下一個對話輪次的目標(biāo)問題指令,包括:將所述初始問題指令添加至所述第二提示文本,得到目標(biāo)提示文本;將所述目標(biāo)提示文本和首個所述對話輪次的所述目標(biāo)回答文本輸入所述第三大語言模型進(jìn)行問題指令預(yù)測,生成下一個對話輪次的目標(biāo)問題指令,其中,所述目標(biāo)提示文本用于提示所述第三大語言模型根據(jù)各個輸入至所述第二大語言模型的問題指令,以及各個所述對話輪次的目標(biāo)回答文本生成問題指令。5.根據(jù)權(quán)利要求1所述的樣本數(shù)據(jù)生成方法,其特征在于,所述獲取用于提示第一大語言模型生成問題指令的第一提示文本,包括:獲取目標(biāo)任務(wù)的任務(wù)信息,其中,所述目標(biāo)任務(wù)為基于所述樣本數(shù)據(jù)進(jìn)行訓(xùn)練的下游任務(wù);3基于所述任務(wù)信息,構(gòu)建用于提示第一大語言模型根據(jù)所述任務(wù)信息生成問題指令的第一提示文本。6.根據(jù)權(quán)利要求5所述的樣本數(shù)據(jù)生成方法,其特征在于,所述基于所述任務(wù)信息,構(gòu)建用于提示第一大語言模型根據(jù)所述任務(wù)信息生成問題指令的第一提示文本,包括:根據(jù)所述任務(wù)信息,在預(yù)設(shè)的任務(wù)樹中確定與所述任務(wù)信息匹配的目標(biāo)節(jié)點,其中,所述任務(wù)樹包括多層節(jié)點,各個所述節(jié)點均攜帶有各自的候選關(guān)鍵詞;將所述目標(biāo)節(jié)點所攜帶的所述候選關(guān)鍵詞作為目標(biāo)關(guān)鍵詞,根據(jù)所述目標(biāo)關(guān)鍵詞,構(gòu)建用于提示第一大語言模型根據(jù)所述任務(wù)信息生成問題指令的第一提示文本。7.根據(jù)權(quán)利要求6所述的樣本數(shù)據(jù)生成方法,其特征在于,所述根據(jù)所述目標(biāo)關(guān)鍵詞,構(gòu)建用于提示第一大語言模型根據(jù)所述任務(wù)信息生成問題指令的第一提示文本,包括:當(dāng)所述目標(biāo)節(jié)點所在層級為目標(biāo)層級時,根據(jù)所述目標(biāo)關(guān)鍵詞,構(gòu)建用于提示第一大語言模型根據(jù)所述任務(wù)信息生成問題指令的第一提示文本,其中,所述目標(biāo)層級為所述任務(wù)樹中根節(jié)點所在層級的后一個層級;或者,當(dāng)所述目標(biāo)節(jié)點所在層級為所述目標(biāo)層級之后的層級時,在所述任務(wù)樹中確定與所述目標(biāo)節(jié)點關(guān)聯(lián)的關(guān)聯(lián)節(jié)點,將所述關(guān)聯(lián)節(jié)點所攜帶的所述候選關(guān)鍵詞作為關(guān)聯(lián)關(guān)鍵詞,根據(jù)所述關(guān)聯(lián)關(guān)鍵詞和所述目標(biāo)關(guān)鍵詞,構(gòu)建用于提示第一大語言模型根據(jù)所述任務(wù)信息生成問題指令的第一提示文本,其中,所述關(guān)聯(lián)節(jié)點所在層級位于所述目標(biāo)節(jié)點所在層級之前。8.根據(jù)權(quán)利要求6所述的樣本數(shù)據(jù)生成方法,其特征在于,所述任務(wù)樹中根節(jié)點所在層級的后一個層級為目標(biāo)層級,位于所述目標(biāo)層級的節(jié)點攜帶有第三角色定義文本,所述將所述目標(biāo)節(jié)點所攜帶的所述候選關(guān)鍵詞作為目標(biāo)關(guān)鍵詞之前,所述樣本數(shù)據(jù)生成方法還包將與所述目標(biāo)節(jié)點關(guān)聯(lián)且位于所述目標(biāo)層級的節(jié)點作為目標(biāo)角色定義節(jié)點,將所述目標(biāo)角色定義節(jié)點所攜帶的所述第三角色定義文本作為目標(biāo)角色定義文本,其中,所述目標(biāo)角色定義文本用于提示所述第一大語言模型作為針對所述目標(biāo)任務(wù)的提問方;將所述目標(biāo)角色定義文本輸入至所述第一大語言模型。9.根據(jù)權(quán)利要求1所述的樣本數(shù)據(jù)生成方法,其特征在于,所述初始問題指令的數(shù)量為多個,所述將所述初始問題指令作為首個輸入至第二大語言模型的問題指令之前,所述樣本數(shù)據(jù)生成方法還包括:從多個所述初始問題指令中隨機(jī)采樣出第一問題指令;基于預(yù)設(shè)的擴(kuò)展策略構(gòu)建用于提示第一大語言模型按照所述擴(kuò)展策略進(jìn)行指令擴(kuò)展的第三提示文本;將所述第三提示文本和所述第一問題指令輸入所述第一大語言模型,對所述第一問題指令進(jìn)行指令擴(kuò)展,生成第一擴(kuò)展問題指令,將所述第一擴(kuò)展問題指令作為所述初始問題10.根據(jù)權(quán)利要求9所述的樣本數(shù)據(jù)生成方法,其特征在于,所述擴(kuò)展策略的數(shù)量為多對所述第一問題指令進(jìn)行多次的指令擴(kuò)展,得到每一次指令擴(kuò)展生成的第一擴(kuò)展問題4其中,每當(dāng)對所述第一問題指令進(jìn)行指令擴(kuò)展時,按照多個所述擴(kuò)展策略中的至少一個對所述第一問題指令進(jìn)行指令擴(kuò)展。11.根據(jù)權(quán)利要求1所述的樣本數(shù)據(jù)生成方法,其特征在于,所述初始問題指令的數(shù)量為多個,所述將所述初始問題指令作為首個輸入至第二大語言模型的問題指令之前,所述樣本數(shù)據(jù)生成方法還包括:從多個所述初始問題指令隨機(jī)采樣出第二問題指令;構(gòu)建用于提示所述第一大語言模型參照所述第二問題指令生成問題指令的第四提示文本,將所述第四提示文本和所述第二問題指令輸入所述第一大語言模型進(jìn)行問題指令預(yù)測,生成第二擴(kuò)展問題指令,將所述第二擴(kuò)展問題指令作為所述初始問題指令。12.根據(jù)權(quán)利要求1所述的樣本數(shù)據(jù)生成方法,其特征在于,所述調(diào)用所述第一大語言模型基于所述第一提示文本進(jìn)行問題指令預(yù)測之前,所述樣本數(shù)據(jù)生成方法還包括:獲取目標(biāo)采樣溫度值;將所述第一大語言模型的溫度參數(shù)配置為所述目標(biāo)采樣溫度值,其中,所述目標(biāo)采樣溫度值用于指示所述第一大語言模型輸出結(jié)果的隨機(jī)程度。13.根據(jù)權(quán)利要求1所述的樣本數(shù)據(jù)生成方法,其特征在于,所述調(diào)用所述第一大語言模型基于所述第一提示文本進(jìn)行問題指令預(yù)測,生成初始問題指令,包括:調(diào)用所述第一大語言模型基于所述第一提示文本進(jìn)行問題指令預(yù)測,依次生成多個初始問題指令;其中,每當(dāng)生成所述初始問題指令時,確定當(dāng)前生成的所述初始問題指令與歷史生成的所述初始問題指令之間的指令相似度,當(dāng)所述指令相似度大于或者等于預(yù)設(shè)的相似度閾值時,剔除當(dāng)前生成的所述初始問題指令。第一生成模塊,用于獲取用于提示第一大語言模型生成問題指令的第一提示文本,調(diào)用所述第一大語言模型基于所述第一提示文本進(jìn)行問題指令預(yù)測,生成初始問題指令;第二生成模塊,用于將所述初始問題指令作為首個輸入至第二大語言模型的問題指令,調(diào)用所述第二大語言模型與第三大語言模型進(jìn)行多輪對話,其中,所述第二大語言模型用于根據(jù)輸入的問題指令生成目標(biāo)回答文本,所述第三大語言模型用于根據(jù)第二提示文本生成輸入至所述第二大語言模型的目標(biāo)問題指令,所述第二提示文本用于提示所述第三大語言模型每當(dāng)接收到所述目標(biāo)回答文本時根據(jù)所述目標(biāo)回答文本生成所述目標(biāo)問題指令;樣本構(gòu)建模塊,用于基于所述初始問題指令、多輪對話中的所述目標(biāo)問題指令以及多輪對話中的所述目標(biāo)回答文本,構(gòu)建樣本數(shù)據(jù)。15.一種電子設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計算機(jī)程序時實現(xiàn)權(quán)利要求1至13任意一項所述的樣本數(shù)據(jù)生成方16.一種計算機(jī)可讀存儲介質(zhì),所述存儲介質(zhì)存儲有計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至13任意一項所述的樣本數(shù)據(jù)生成方法。17.一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至13任意一項所述的樣本數(shù)據(jù)生成方法。5技術(shù)領(lǐng)域[0001]本申請涉及人工智能技術(shù)領(lǐng)域,特別是涉及一種樣本數(shù)據(jù)生成方法、裝置、電子設(shè)備及存儲介質(zhì)。背景技術(shù)[0002]在人工智能領(lǐng)域,大語言模型是大型語言模型(LargeLanguageModeling,LLM)的簡稱,是指使用大量文本數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)模型,可以生成自然語言文本或理解語言[0003]目前,可以通過多種獲取方式來得到用于訓(xùn)練大語言模型的樣本數(shù)據(jù),例如,可以通過人工構(gòu)建方式得到高質(zhì)量的樣本數(shù)據(jù),但是人工構(gòu)建方式無法高效地得到多樣化的樣本數(shù)據(jù),又例如,可以通過在線平臺采集大量的樣本數(shù)據(jù),但是樣本數(shù)據(jù)的質(zhì)量普遍較低,需要耗費較多的時間進(jìn)行數(shù)據(jù)清洗,可見,傳統(tǒng)的樣本數(shù)據(jù)獲取方式無法高效地得到高質(zhì)量且多樣化的樣本數(shù)據(jù),亟需一種能夠高效地得到高質(zhì)量且多樣化的樣本數(shù)據(jù)的方法。發(fā)明內(nèi)容[0004]以下是對本申請詳細(xì)描述的主題的概述。本概述并非是為了限制權(quán)利要求的保護(hù)[0005]本申請實施例提供了一種樣本數(shù)據(jù)生成方法、裝置、電子設(shè)備及存儲介質(zhì),能夠高效地得到高質(zhì)量且多樣化的樣本數(shù)據(jù)。[0007]獲取用于提示第一大語言模型生成問題指令的第一提示文本,調(diào)用所述第一大語言模型基于所述第一提示文本進(jìn)行問題指令預(yù)測,生成初始問題指令;[0008]將所述初始問題指令作為首個輸入至第二大語言模型的問題指令,調(diào)用所述第二大語言模型與第三大語言模型進(jìn)行多輪對話,其中,所述第二大語言模型用于根據(jù)輸入的問題指令生成目標(biāo)回答文本,所述第三大語言模型用于根據(jù)所述目標(biāo)回答文本生成輸入至所述第二大語言模型的目標(biāo)問題指令;[0009]基于所述初始問題指令、多輪對話中的所述目標(biāo)問題指令以及多輪對話中的所述[0011]第一生成模塊,用于獲取用于提示第一大語言模型生成問題指令的第一提示文本,調(diào)用所述第一大語言模型基于所述第一提示文本進(jìn)行問題指令預(yù)測,生成初始問題指[0012]第二生成模塊,用于將所述初始問題指令作為首個輸入至第二大語言模型的問題指令,調(diào)用所述第二大語言模型與第三大語言模型進(jìn)行多輪對話,其中,所述第二大語言模型用于根據(jù)輸入的問題指令生成目標(biāo)回答文本,所述第三大語言模型用于根據(jù)所述目標(biāo)回答文本生成輸入至所述第二大語言模型的目標(biāo)問題指令;6[0013]樣本構(gòu)建模塊,用于基于所述初始問題指令、多輪對話中的所述目標(biāo)問題指令以及多輪對話中的所述目標(biāo)回答文本,構(gòu)建樣本數(shù)據(jù)。[0014]進(jìn)一步,所述候選文本的知識粒度類型的數(shù)量為至少一種,上述第二生成模塊還[0015]獲取第一角色定義文本和第二角色定義文本,其中,所述第一角色定義文本用于提示所述第二大語言模型在所述多輪對話中作為針對目標(biāo)任務(wù)的回答方,所述第二角色定義文本用于提示所述第三大語言模型在所述多輪對話中作為提問方,所述目標(biāo)任務(wù)為基于所述樣本數(shù)據(jù)進(jìn)行訓(xùn)練的下游任務(wù);[0016]將所述第一角色定義文本輸入至所述第二大語言模型,將所述第二角色定義文本輸入至所述第三大語言模型。[0018]將所述初始問題指令輸入第二大語言模型進(jìn)行回答預(yù)測,生成首個對話輪次的目標(biāo)回答文本;[0019]構(gòu)建用于提示第三大語言模型每當(dāng)接收到所述目標(biāo)回答文本時根據(jù)所述目標(biāo)回答文本生成問題指令的第二提示文本;[0020]將所述第二提示文本和首個所述對話輪次的所述目標(biāo)回答文本輸入所述第三大語言模型進(jìn)行問題指令預(yù)測,生成下一個對話輪次的目標(biāo)問題指令;[0021]將下一個所述對話輪次的所述目標(biāo)問題指令輸入至所述第二大語言模型再次進(jìn)行回答預(yù)測,直至所述對話輪次的數(shù)量等于預(yù)設(shè)的數(shù)量閾值。[0023]將所述初始問題指令添加至所述第二提示文本,得到目標(biāo)提示文本;[0024]將所述目標(biāo)提示文本和首個所述對話輪次的所述目標(biāo)回答文本輸入所述第三大語言模型進(jìn)行問題指令預(yù)測,生成下一個對話輪次的目標(biāo)問題指令,其中,所述目標(biāo)提示文本用于提示所述第三大語言模型根據(jù)各個輸入至所述第二大語言模型的問題指令,以及各個所述對話輪次的目標(biāo)回答文本生成問題指令。[0026]獲取目標(biāo)任務(wù)的任務(wù)信息,其中,所述目標(biāo)任務(wù)為基于所述樣本數(shù)據(jù)進(jìn)行訓(xùn)練的下游任務(wù);[0027]基于所述任務(wù)信息,構(gòu)建用于提示第一大語言模型根據(jù)所述任務(wù)信息生成問題指令的第一提示文本。[0029]根據(jù)所述任務(wù)信息,在預(yù)設(shè)的任務(wù)樹中確定與所述任務(wù)信息匹配的目標(biāo)節(jié)點,其中,所述任務(wù)樹包括多層節(jié)點,各個所述節(jié)點均攜帶有各自的候選關(guān)鍵詞;[0030]將所述目標(biāo)節(jié)點所攜帶的所述候選關(guān)鍵詞作為目標(biāo)關(guān)鍵詞,根據(jù)所述目標(biāo)關(guān)鍵詞,構(gòu)建用于提示第一大語言模型根據(jù)所述任務(wù)信息生成問題指令的第一提示文本。[0032]當(dāng)所述目標(biāo)節(jié)點所在層級為目標(biāo)層級時,根據(jù)所述目標(biāo)關(guān)鍵詞,構(gòu)建用于提示第一大語言模型根據(jù)所述任務(wù)信息生成問題指令的第一提示文本,其中,所述目標(biāo)層級為所述任務(wù)樹中根節(jié)點所在層級的后一個層級;7[0033]或者,當(dāng)所述目標(biāo)節(jié)點所在層級為所述目標(biāo)層級之后的層級時,在所述任務(wù)樹中確定與所述目標(biāo)節(jié)點關(guān)聯(lián)的關(guān)聯(lián)節(jié)點,將所述關(guān)聯(lián)節(jié)點所攜帶的所述候選關(guān)鍵詞作為關(guān)聯(lián)關(guān)鍵詞,根據(jù)所述關(guān)聯(lián)關(guān)鍵詞和所述目標(biāo)關(guān)鍵詞,構(gòu)建用于提示第一大語言模型根據(jù)所述任務(wù)信息生成問題指令的第一提示文本,其中,所述關(guān)聯(lián)節(jié)點所在層級位于所述目標(biāo)節(jié)點所在層級之前。[0034]進(jìn)一步,所述任務(wù)樹中根節(jié)點所在層級的后一個層級為目標(biāo)層級,位于所述目標(biāo)層級的節(jié)點攜帶有第三角色定義文本,上述第一生成模塊還用于:[0035]將與所述目標(biāo)節(jié)點關(guān)聯(lián)且位于所述目標(biāo)層級的節(jié)點作為目標(biāo)角色定義節(jié)點,將所述目標(biāo)角色定義節(jié)點所攜帶的所述第三角色定義文本作為目標(biāo)角色定義文本,其中,所述目標(biāo)角色定義文本用于提示所述第一大語言模型作為針對所述目標(biāo)任務(wù)的提問方;[0036]將所述目標(biāo)角色定義文本輸入至所述第一大語言模型。[0037]進(jìn)一步,所述初始問題指令的數(shù)量為多個,樣本數(shù)據(jù)生成裝置還包括第三生成模[0038]從多個所述初始問題指令中隨機(jī)采樣出第一問題指令;[0039]基于預(yù)設(shè)的擴(kuò)展策略構(gòu)建用于提示第一大語言模型按照所述擴(kuò)展策略進(jìn)行指令擴(kuò)展的第三提示文本;[0040]將所述第三提示文本和所述第一問題指令輸入所述第一大語言模型,對所述第一問題指令進(jìn)行指令擴(kuò)展,生成第一擴(kuò)展問題指令,將所述第一擴(kuò)展問題指令作為所述初始問題指令。[0042]對所述第一問題指令進(jìn)行多次的指令擴(kuò)展,得到每一次指令擴(kuò)展生成的第一擴(kuò)展問題指令;[0043]其中,每當(dāng)對所述第一問題指令進(jìn)行指令擴(kuò)展時,按照多個所述擴(kuò)展策略中的至少一個對所述第一問題指令進(jìn)行指令擴(kuò)展。[0044]進(jìn)一步,所述初始問題指令的數(shù)量為多個,上述第一生成模塊還用于:[0045]從多個所述初始問題指令隨機(jī)采樣出第二問題指令;[0046]構(gòu)建用于提示所述第一大語言模型參照所述第二問題指令生成問題指令的第四提示文本,將所述第四提示文本和所述第二問題指令輸入所述第一大語言模型進(jìn)行問題指令預(yù)測,生成第二擴(kuò)展問題指令,將所述第二擴(kuò)展問題指令作為所述初始問題指令。[0049]將所述第一大語言模型的溫度參數(shù)配置為所述目標(biāo)采樣溫度值,其中,所述目標(biāo)采樣溫度值用于指示所述第一大語言模型輸出結(jié)果的隨機(jī)程度。[0050]進(jìn)一步,上述第一生成模塊具體用于:[0051]調(diào)用所述第一大語言模型基于所述第一提示文本進(jìn)行問題指令預(yù)測,依次生成多個初始問題指令;[0052]其中,每當(dāng)生成所述初始問題指令時,確定當(dāng)前生成的所述初始問題指令與歷史生成的所述初始問題指令之間的指令相似度,當(dāng)所述指令相似度大于或者等于預(yù)設(shè)的相似度閾值時,剔除當(dāng)前生成的所述初始問題指令。8[0053]另一方面,本申請實施例還提供了一種電子設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,所述處理器執(zhí)行所述計算機(jī)程序時實現(xiàn)上述的樣本數(shù)據(jù)生成方法。[0054]另一方面,本申請實施例還提供了一種計算機(jī)可讀存儲介質(zhì),所述存儲介質(zhì)存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行實現(xiàn)上述的樣本數(shù)據(jù)生成方法。[0055]另一方面,本申請實施例還提供了一種計算機(jī)程序產(chǎn)品,該計算機(jī)程序產(chǎn)品包括計算機(jī)程序,該計算機(jī)程序存儲在計算機(jī)可讀存介質(zhì)中。計算機(jī)設(shè)備的處理器從計算機(jī)可讀存儲介質(zhì)讀取該計算機(jī)程序,處理器執(zhí)行該計算機(jī)程序,使得該計算機(jī)設(shè)備執(zhí)行實現(xiàn)上述的樣本數(shù)據(jù)生成方法。[0056]本申請實施例至少包括以下有益效果:通過第一大語言模型生成初始問題指令,然后將初始問題指令作為首個輸入至第二大語言模型的問題指令,相當(dāng)于將初始問題指令作為多輪對話的起點,通過第二大語言模型與第三大語言模型進(jìn)行多輪對話,能夠得到多個對話輪次的目標(biāo)回答文本和目標(biāo)問題指令,然后通過初始問題指令、目標(biāo)問題指令以及目標(biāo)回答文本構(gòu)建樣本數(shù)據(jù),由于第一大語言模型能夠生成高質(zhì)量且多樣化的初始問題指令,而且第二大語言模型能夠生成高質(zhì)量且多樣化的目標(biāo)回答文本,以及第三大語言模型能夠生成高質(zhì)量且多樣化的目標(biāo)問題指令,因此,能夠通過聯(lián)合多個大語言模型來提升問題指令的復(fù)雜性和多樣性,從而高效地得到高質(zhì)量且多樣化的樣本數(shù)據(jù)。[0057]本申請的其他特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本申請而了解。附圖說明[0058]附圖用來提供對本申請技術(shù)方案的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本申請的實施例一起用于解釋本申請的技術(shù)方案,并不構(gòu)成對本申請技術(shù)方案的限制。[0059]圖1為本申請實施例提供的一種可選的實施環(huán)境的示意圖;[0060]圖2為本申請實施例提供的樣本數(shù)據(jù)生成方法的一種可選的流程示意圖;[0061]圖3為本申請實施例提供的第一大語言模型的第一種可選的結(jié)構(gòu)示意圖;[0062]圖4為本申請實施例提供的多輪對話的一種可選的結(jié)構(gòu)示意圖;[0063]圖5為本申請實施例提供的任務(wù)樹的一種可選的結(jié)構(gòu)示意圖;[0064]圖6為本申請實施例提供的任務(wù)配置界面的一種可選的界面示意圖;[0065]圖7為本申請實施例提供的任務(wù)配置界面的另一種可選的界面示意圖;[0066]圖8為本申請實施例提供的第一大語言模型的第二種可選的結(jié)構(gòu)示意圖;[0067]圖9為本申請實施例提供的第一大語言模型的第三種可選的結(jié)構(gòu)示意圖;[0068]圖10為本申請實施例提供的樣本數(shù)據(jù)生成方法的一種可選的構(gòu)架示意圖;[0069]圖11為本申請實施例提供的樣本數(shù)據(jù)生成裝置的一種可選的結(jié)構(gòu)示意圖;[0070]圖12為本申請實施例提供的終端的部分結(jié)構(gòu)框圖;[0071]圖13為本申請實施例提供的服務(wù)器的部分結(jié)構(gòu)框圖。具體實施方式[0072]為了使本申請的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本申請進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅用以解釋本申請,并不9用于限定本申請。[0073]需要說明的是,在本申請的各個具體實施方式中,當(dāng)涉及到需要根據(jù)目標(biāo)對象屬性信息或?qū)傩孕畔⒓系扰c目標(biāo)對象特性相關(guān)的數(shù)據(jù)進(jìn)行相關(guān)處理時,都會先獲得目標(biāo)對象的許可或者同意,而且,對這些數(shù)據(jù)的收集、使用和處理等,都會遵守相關(guān)法律法規(guī)和標(biāo)過彈窗或者跳轉(zhuǎn)到確認(rèn)頁面等方式獲得目標(biāo)對象的單獨許可或者單獨同意,在明確獲得目標(biāo)對象的單獨許可或者單獨同意之后,再獲取用于使本申請實施例能夠正常運行的必要的目標(biāo)對象相關(guān)數(shù)據(jù)。序的一部分,并與其他相關(guān)部分一起工作以實現(xiàn)預(yù)定目標(biāo),并且可以通過使用軟件、硬件(如處理電路或存儲器)或其組合來全部或部分實現(xiàn)。同樣的,一個處理器(或多個處理器或存儲器)可以用來實現(xiàn)一個或多個模塊或單元。此外,每個模塊或單元都可以是包含該模塊或單元功能的整體模塊或單元的一部分。[0075]為便于理解本申請實施例提供的技術(shù)方案,這里先對本申請實施例使用的一些關(guān)鍵名詞進(jìn)行解釋:資源統(tǒng)一起來,實現(xiàn)數(shù)據(jù)的計算、儲存、處理和共享的一種托管技術(shù)。云技術(shù)基于云計算商資源池,按需所用,靈活便利。云計算技術(shù)將變成重要支撐。技術(shù)網(wǎng)絡(luò)系統(tǒng)的后臺服務(wù)需要大量的計算、存儲資源,如視頻網(wǎng)站、圖片類網(wǎng)站和更多的門戶網(wǎng)站。伴隨著互聯(lián)網(wǎng)行業(yè)的高度發(fā)展和應(yīng)用,將來每個物品都有可能存在自己的識別標(biāo)志,都需要傳輸?shù)胶笈_系統(tǒng)進(jìn)行邏輯處理,不同程度級別的數(shù)據(jù)將會分開處理,各類行業(yè)數(shù)據(jù)皆需要強(qiáng)大的系統(tǒng)后盾支[0077]人工智能(ArtificialIntelligence,AI)是利用數(shù)字計算機(jī)或者數(shù)字計算機(jī)控制的機(jī)器模擬、延伸和擴(kuò)展人的智能,感知環(huán)境、獲取知識并使用知識獲得最佳結(jié)果的理智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器。人工智能也就是研究各種智能機(jī)器的設(shè)計原理與實現(xiàn)方法,使機(jī)器具有感知、推理與決策的功能。人工智能技術(shù)是一門綜合學(xué)科,涉及領(lǐng)域廣泛,既有硬件層面的技術(shù)也有軟件層面的技術(shù)。人工智能基礎(chǔ)技術(shù)一般包括如傳感器、專用人工智能芯片、云計算、分布式存儲、大數(shù)據(jù)處理模型,經(jīng)過微調(diào)后可以廣泛應(yīng)用于人工智能各大方向下游任務(wù)。人工智能軟件技術(shù)主要包括計算機(jī)視覺技術(shù)、語音處理技術(shù)、自然語言處理技術(shù)以及機(jī)器學(xué)習(xí)/深度學(xué)習(xí)等幾大方[0078]機(jī)器學(xué)習(xí)(MachineLearning,簡稱ML)是一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。專門研究計算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。機(jī)器學(xué)習(xí)是人工智能的核心,是使計算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個[0079]目前,可以通過多種獲取方式來得到用于訓(xùn)練大語言模型的樣本數(shù)據(jù),例如,可以通過人工構(gòu)建方式得到高質(zhì)量的樣本數(shù)據(jù),但是人工構(gòu)建方式無法高效地得到多樣化的樣本數(shù)據(jù),又例如,可以通過在線平臺采集大量的樣本數(shù)據(jù),但是樣本數(shù)據(jù)的質(zhì)量普遍較低,需要耗費較多的時間進(jìn)行數(shù)據(jù)清洗,可見,傳統(tǒng)的樣本數(shù)據(jù)獲取方式無法高效地得到高質(zhì)量且多樣化的樣本數(shù)據(jù),亟需一種能夠高效地得到高質(zhì)量且多樣化的樣本數(shù)據(jù)的方法。[0080]基于此,本申請實施例提供了一種樣本數(shù)據(jù)生成方法、裝置、電子設(shè)備及存儲介質(zhì),能夠高效地得到高質(zhì)量且多樣化的樣本數(shù)據(jù)。[0081]參照圖1,圖1為本申請實施例提供的一種可選的實施環(huán)境的示意圖,該實施環(huán)境包括終端101和服務(wù)器102,其中,終端101和服務(wù)器102之間通過通信網(wǎng)絡(luò)連接。[0082]示例性地,服務(wù)器102可以獲取終端101發(fā)送的用于提示第一大語言模型生成問題指令的第一提示文本,調(diào)用第一大語言模型基于第一提示文本進(jìn)行問題指令預(yù)測,生成初始問題指令;將初始問題指令作為首個輸入至第二大語言模型的問題指令,調(diào)用第二大語言模型與第三大語言模型進(jìn)行多輪對話,其中,第二大語言模型用于根據(jù)輸入的問題指令生成目標(biāo)回答文本,第三大語言模型用于根據(jù)目標(biāo)回答文本生成輸入至第二大語言模型的目標(biāo)問題指令;基于初始問題指令、多輪對話中的目標(biāo)問題指令以及多輪對話中的目標(biāo)回答文本,構(gòu)建樣本數(shù)據(jù)發(fā)送至終端101。[0083]服務(wù)器102通過第一大語言模型生成初始問題指令,然后將初始問題指令作為首個輸入至第二大語言模型的問題指令,相當(dāng)于將初始問題指令作為多輪對話的起點,通過第二大語言模型與第三大語言模型進(jìn)行多輪對話,能夠得到多個對話輪次的目標(biāo)回答文本和目標(biāo)問題指令,然后通過初始問題指令、目標(biāo)問題指令以及目標(biāo)回答文本構(gòu)建樣本數(shù)據(jù),由于第一大語言模型能夠生成高質(zhì)量且多樣化的初始問題指令,而且第二大語言模型能夠生成高質(zhì)量且多樣化的目標(biāo)回答文本,以及第三大語言模型能夠生成高質(zhì)量且多樣化的目標(biāo)問題指令,因此,能夠通過聯(lián)合多個大語言模型來提升問題指令的復(fù)雜性和多樣性,從而高效地得到高質(zhì)量且多樣化的樣本數(shù)據(jù)。[0084]服務(wù)器102可以是獨立的物理服務(wù)器,也可以是多個物理服務(wù)器構(gòu)成的服務(wù)器集以及大數(shù)據(jù)和人工智能平臺等基礎(chǔ)云計算服務(wù)的云服務(wù)器。另外,服務(wù)器102還可以是區(qū)塊鏈網(wǎng)絡(luò)中的一個節(jié)點服務(wù)器。限于此。終端101以及服務(wù)器102可以通過有線或無線通信方式進(jìn)行直接或間接地連接,本申請實施例在此不做限制。[0086]本申請實施例提供的方法可應(yīng)用于各種場景,包括但不限于云技術(shù)、人工智能、智[0087]參照圖2,圖2為本申請實施例提供的樣本數(shù)據(jù)生成方法的一種可選的流程示意圖,該樣本數(shù)據(jù)生成方法可以由服務(wù)器執(zhí)行,或者也可以由終端執(zhí)行,或者也可以由服務(wù)器配合終端執(zhí)行,該文本類型確定方法包括但不限于以下步驟201至步驟203。[0088]步驟201:獲取用于提示第一大語言模型生成問題指令的第一提示文本,調(diào)用第一11大語言模型基于第一提示文本進(jìn)行問題指令預(yù)測,生成初始問題指令。[0089]其中,第一提示文本用于提示第一大語言模型生成問題指令,也就是說,第一提示文本能夠指導(dǎo)第一大語言模型生成特定的輸出,通過給定第一提示文本,可以影響第一大語言模型生成的文本內(nèi)容。[0090]其中,第一大語言模型是一個經(jīng)過預(yù)訓(xùn)練的大語言模型,大語言模型是使用大量文本數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)模型,可以生成自然語言文本或理解語言文本的含義;大語言模型一般采用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)或變種,如長短時記憶網(wǎng)絡(luò)(LSTM)和門控循環(huán)單元(GRU),以捕捉文本序列中的上下文信息,從而實現(xiàn)自然語言文本的生成、語言模型評估、文本分[0091]具體地,參照圖3,圖3為本申請實施例提供的第一大語言模型的第一種可選的結(jié)構(gòu)示意圖。[0092]其中,將第一提示文本輸入第一大語言模型,通過第一大語言模型生成初始問題指令,能夠提高初始問題指令的準(zhǔn)確性,具有較高的生成質(zhì)量,而且第一大語言模型生成的初始問題指令具有隨機(jī)性,相當(dāng)于第一大語言模型能夠生成高質(zhì)量且多樣化的目標(biāo)問題指[0093]步驟202:將初始問題指令作為首個輸入至第二大語言模型的問題指令,調(diào)用第二大語言模型與第三大語言模型進(jìn)行多輪對話;[0094]其中,第二大語言模型用于根據(jù)輸入的問題指令生成目標(biāo)回答文本,第三大語言模型用于根據(jù)目標(biāo)回答文本生成輸入至第二大語言模型的目標(biāo)問題指令;第二大語言模型是一個經(jīng)過預(yù)訓(xùn)練的大語言模型,因此,通過第二大語言模型生成目標(biāo)回答文本,能夠提高目標(biāo)回答文本的準(zhǔn)確性,具有較高的生成質(zhì)量;第三大語言模型也是一個經(jīng)過預(yù)訓(xùn)練的大語言模型,因此,通過第三大語言模型生成目標(biāo)問題指令,能夠提高目標(biāo)問題指令的準(zhǔn)確[0095]基于此,將初始問題指令作為首個輸入至第二大語言模型的問題指令,相當(dāng)于將初始問題指令作為多輪對話的起點,第二大語言模型在回答階段生成目標(biāo)回答文本,第二大語言模型生成的目標(biāo)回答文本具有隨機(jī)性,第三大語言模型在提問階段生成目標(biāo)問題指令,第三大語言模型生成的目標(biāo)問題指令具有隨機(jī)性,因此,在第二大語言模型和第三大語言模型的交互下,能夠生成高質(zhì)量且多樣化的目標(biāo)回答文本和目標(biāo)問題指令。[0096]具體地,第二大語言模型和第三大語言模型中的一個可以與第一大語言模型是相同的大語言模型。[0097]在一種可能的實現(xiàn)方式中,將初始問題指令作為首個輸入至第二大語言模型的問題指令之前,樣本數(shù)據(jù)生成方法還包括:獲取第一角色定義文本和第二角色定義文本,其中,第一角色定義文本用于提示第二大語言模型在多輪對話中作為針對目標(biāo)任務(wù)的回答方,第二角色定義文本用于提示第三大語言模型在多輪對話中作為提問方,目標(biāo)任務(wù)為基于樣本數(shù)據(jù)進(jìn)行訓(xùn)練的下游任務(wù);將第一角色定義文本輸入至第二大語言模型,將第二角色定義文本輸入至第三大語言模型。[0098]其中,目標(biāo)任務(wù)為特定應(yīng)用領(lǐng)域的下游任務(wù),例如,目標(biāo)任務(wù)可以為關(guān)于前端開發(fā)中JavaScript代碼生成,目標(biāo)任務(wù)可以為旅游規(guī)劃的方案生成;第一角色定義文本的內(nèi)容用于顯示定義第二大語言模型的角色,第二角色定義文本的內(nèi)容用于顯示定義第三大語言模型的角色。[0099]基于此,在將初始問題指令作為首個輸入至第二大語言模型的問題指令之前,將第一角色定義文本輸入第二大語言模型,以提示第二大語言模型在多輪對話中作為針對目標(biāo)任務(wù)的回答方,第二大語言模型能夠更好地理解多輪對話中的回答生成任務(wù),能夠提高目標(biāo)回答文本的生成質(zhì)量,而且第二大語言模型能夠生成與目標(biāo)任務(wù)相關(guān)的目標(biāo)回答文本,后續(xù)能夠得到與目標(biāo)任務(wù)相關(guān)的樣本數(shù)據(jù),利用與目標(biāo)任務(wù)相關(guān)的樣本數(shù)據(jù)訓(xùn)練大語言模型,實現(xiàn)對大語言模型進(jìn)行微調(diào),微調(diào)后的大語言模型能夠更好地適應(yīng)目標(biāo)任務(wù),有助于提高該大語言模型在特定應(yīng)用領(lǐng)域的性能;[0100]同時,將第二角色定義文本輸入第三大語言模型,以提示第三大語言模型在多輪對話中作為提問方,第三大語言模型能夠更好地理解多輪對話中的問題指令生成任務(wù),能夠提高目標(biāo)問題指令的生成質(zhì)量。[0101]示例性地,當(dāng)目標(biāo)任務(wù)為關(guān)于前端開發(fā)中JavaScript代碼生成時,第二角色定義文本可以為“系統(tǒng)角色:你是一個具有豐富經(jīng)驗的前端開發(fā)工程師,尤其擅長JavaScript編程,我會向你詢問一些關(guān)于前端開發(fā)中JavaScript代碼生成相關(guān)的問題,你需要詳細(xì)地給[0102]可見,通過將第一角色定義文本輸入至第二大語言模型,相當(dāng)于向第二大語言模型賦予回答者的角色,以及將第二角色定義文本輸入至第三大語言模型,相當(dāng)于向第三大語言模型賦予提問者的角色,第三大語言模型通過模擬相關(guān)人員的提問操作,與第二大語言模型進(jìn)行交互,實現(xiàn)調(diào)用第二大語言模型與第三大語言模型進(jìn)行多輪對話,在真實場景中,一個可靠的對話助手往往需要具備與對象進(jìn)行對輪對話的能力,并且能夠基于多輪對話理解并解決對象的問題,因此,通過第二大語言模型與第三大語言模型進(jìn)行多輪對話,構(gòu)造多輪對話的數(shù)據(jù),能夠較好地模仿真實的對話場景,后續(xù)能夠得到質(zhì)量較高的樣本數(shù)據(jù)。[0103]在一種可能的實現(xiàn)方式中,第二角色定義文本可以用于提示第三大語言模型在多輪對話中作為針對目標(biāo)任務(wù)的提問方,第三大語言模型能夠生成與目標(biāo)任務(wù)相關(guān)的目標(biāo)問題指令,后續(xù)能夠得到與目標(biāo)任務(wù)相關(guān)的樣本數(shù)據(jù),利用與目標(biāo)任務(wù)相關(guān)的樣本數(shù)據(jù)訓(xùn)練大語言模型,實現(xiàn)對大語言模型進(jìn)行微調(diào),微調(diào)后的大語言模型能夠更好地適應(yīng)目標(biāo)任務(wù),有助于提高該大語言模型在特定應(yīng)用領(lǐng)域的性能。[0104]在一種可能的實現(xiàn)方式中,將初始問題指令作為首個輸入至第二大語言模型的問題指令,調(diào)用第二大語言模型與第三大語言模型進(jìn)行多輪對話,具體可以是將初始問題指令輸入第二大語言模型進(jìn)行回答預(yù)測,生成首個對話輪次的目標(biāo)回答文本;構(gòu)建用于提示第三大語言模型每當(dāng)接收到目標(biāo)回答文本時根據(jù)目標(biāo)回答文本生成問題指令的第二提示文本;將第二提示文本和首個對話輪次的目標(biāo)回答文本輸入第三大語言模型進(jìn)行問題指令預(yù)測,生成下一個對話輪次的目標(biāo)問題指令;將下一個對話輪次的目標(biāo)問題指令輸入至第二大語言模型再次進(jìn)行回答預(yù)測,直至對話輪次的數(shù)量等于預(yù)設(shè)的數(shù)量閾值。[0105]其中,數(shù)量閾值是預(yù)先設(shè)定的對話輪次數(shù)量,例如,可以將數(shù)量閾值設(shè)定為5,或者設(shè)定為其他數(shù)值;將初始問題指令輸入第二大語言模型進(jìn)行回答預(yù)測,具體可以是將多個初始問題指令的集合作為種子指令集,種子指令集的初始問題指令可以視為種子指令,可以在種子指令集中依次選出輸入第二大語言模型的初始問題指令,也可以在種子指令集中隨機(jī)選出輸入第二大語言模型的初始問題指令。[0106]基于此,初始問題指令作為首個對話輪次的問題指令,將初始問題指令輸入第二大語言模型后,第二大語言模型對該初始問題指令作出回答,生成目標(biāo)回答文本,假設(shè)初始問題指令是針對特定的下游任務(wù)所提出的問題,目標(biāo)回答文本就是針對該下游任務(wù)所作出的回答;然后將第二提示文本和首個對話輪次的目標(biāo)回答文本輸入第三大語言模型,生成下一個對話輪次的目標(biāo)問題指令,由于第二提示文本能夠提示第三大語言模型根據(jù)目標(biāo)回答文本生成問題指令,所以目標(biāo)問題指令也是針對該下游任務(wù)所提出的問題,在后續(xù)對話輪次中,第二大語言模型所生成的目標(biāo)回答文本,以及第三大語言模型所生成的目標(biāo)問題指令可以認(rèn)為是針對相同下游任務(wù)的,后續(xù)能夠得到與該下游任務(wù)相關(guān)的樣本數(shù)據(jù),利用與該下游任務(wù)相關(guān)的樣本數(shù)據(jù)訓(xùn)練大語言模型,實現(xiàn)對大語言模型進(jìn)行微調(diào),微調(diào)后的大語言模型能夠更好地適應(yīng)該下游任務(wù),有助于提高該大語言模型在特定應(yīng)用領(lǐng)域的性能。[0107]具體地,在將首個對話輪次的目標(biāo)回答文本輸入第三大語言模型的同時,將第二提示文本輸入第三大語言模型,使得第三大語言模型能夠理解問題指令生成任務(wù),在將后續(xù)對話輪次的目標(biāo)回答文本輸入第三大語言模型時,可以再次輸入第二提示文本,由于第三大語言模型具備較強(qiáng)的上下文處理能力,第三大語言模型在生成新的目標(biāo)問題指令時會考慮之前輸入的第二提示文本,所以也可以不用再次輸入第二提示文本。[0108]示例性地,第二提示文本可以為“你需要結(jié)合對方的回復(fù)給出問題指令”,當(dāng)目標(biāo)任務(wù)為關(guān)于前端開發(fā)中JavaScript代碼生成時,第二提示文本也可以為“你需要結(jié)合對方的回復(fù)給出問題指令,比如,關(guān)于前端開發(fā)中JavaScript代碼生成相關(guān)的任意問題指令”。[0109]在一種可能的實現(xiàn)方式中,將第二提示文本和首個對話輪次的目標(biāo)回答文本輸入第三大語言模型進(jìn)行問題指令預(yù)測,生成下一個對話輪次的目標(biāo)問題指令,具體可以是將初始問題指令添加至第二提示文本,得到目標(biāo)提示文本;將目標(biāo)提示文本和首個對話輪次的目標(biāo)回答文本輸入第三大語言模型進(jìn)行問題指令預(yù)測,生成下一個對話輪次的目標(biāo)問題[0110]其中,目標(biāo)提示文本用于提示第三大語言模型根據(jù)各個輸入至第二大語言模型的問題指令,以及各個對話輪次的目標(biāo)回答文本生成問題指令;將初始問題指令添加至第二提示文本,相當(dāng)于對第二提示文本進(jìn)行更新,能夠得到目標(biāo)提示文本;將目標(biāo)提示文本輸入第三大語言模型,使得第三大語言模型在生成目標(biāo)問題指令時,需要參考各個歷史對話輪次的目標(biāo)回答文本和問題指令。[0111]具體地,參照圖4,圖4為本申請實施例提供的多輪對話的一種可選的結(jié)構(gòu)示意圖。[0112]其中,由于初始問題指令相當(dāng)于首個對話輪次的問題指令,第三大語言模型在生成第二個對話輪次的目標(biāo)問題指令時,初始問題指令屬于歷史對話輪次的問題指令,目標(biāo)提示文本需要包含初始問題指令,然后將目標(biāo)提示文本和首個對話輪次的目標(biāo)回答文本輸入第三大語言模型,第三大語言模型能夠根據(jù)初始問題指令和首個對話輪次的目標(biāo)回答文本,生成第二對話輪次的目標(biāo)問題指令;[0113]可見,假設(shè)初始問題指令是針對特定的下游任務(wù)所提出的問題,該初始問題指令對應(yīng)的目標(biāo)回答文本是針對該下游任務(wù)所作出的回答,第三大語言模型根據(jù)各個對話輪次的問題指令和目標(biāo)回答文本生成目標(biāo)問題指令,使得新生成的目標(biāo)問題指令也是針對該下游任務(wù)所提出的問題,新生成的目標(biāo)問題指令能夠更加接近相關(guān)人員的真實問題指令,后續(xù)能夠得到與該下游任務(wù)相關(guān)的樣本數(shù)據(jù),利用與該下游任務(wù)相關(guān)的樣本數(shù)據(jù)訓(xùn)練大語言模型,實現(xiàn)對大語言模型進(jìn)行微調(diào),微調(diào)后的大語言模型能夠更好地適應(yīng)該下游任務(wù),有助于提高該大語言模型在特定應(yīng)用領(lǐng)域的性能。[0114]示例性地,當(dāng)目標(biāo)任務(wù)為關(guān)于前端開發(fā)中JavaScript代碼生成時,初始問題指令可以為“如何使用JavaScript實現(xiàn)圖片輪播功能?”;將初始問題指令添加至第二提示文本,能夠得到目標(biāo)提示文本;[0115]目標(biāo)提示文本可以為“你有一個初始提問:如何使用JavaScript實現(xiàn)圖片輪播功能?你需要結(jié)合對方的回復(fù)給出問題指令;你需要結(jié)合對方的回復(fù)給出問題指令,比如:1、與之前問題指令相關(guān)的問題;2、針對之前對方回答作出進(jìn)一步提問;3、關(guān)于前端開發(fā)中JavaScript代碼生成相關(guān)的任意問題指令”;[0116]另外,還可以在目標(biāo)提示文本中限定新生成的目標(biāo)問題指令的格式,例如,在目標(biāo)[0117]步驟203:基于初始問題指令、多輪對話中的目標(biāo)問題指令以及多輪對話中的目標(biāo)[0118]基于此,通過初始問題指令、目標(biāo)問題指令以及目標(biāo)回答文本構(gòu)建樣本數(shù)據(jù),由于第一大語言模型能夠生成高質(zhì)量且多樣化的初始問題指令,而且第二大語言模型能夠生成高質(zhì)量且多樣化的目標(biāo)回答文本,以及第三大語言模型能夠生成高質(zhì)量且多樣化的目標(biāo)問題指令,因此,能夠通過聯(lián)合多個大語言模型來提升問題指令的復(fù)雜性和多樣性,從而高效地得到高質(zhì)量且多樣化的樣本數(shù)據(jù);[0119]因此,后續(xù)可以利用樣本數(shù)據(jù)訓(xùn)練大語言模型,實現(xiàn)對大語言模型進(jìn)行微調(diào),有助于提高該大語言模型在特定應(yīng)用領(lǐng)域的性能,激發(fā)出一個能正確理解各種各樣指令,又能高質(zhì)量回復(fù)的大語言模型。[0120]在一種可能的實現(xiàn)方式中,獲取用于提示第一大語言模型生成問題指令的第一提示文本,具體可以是獲取目標(biāo)任務(wù)的任務(wù)信息,其中,目標(biāo)任務(wù)為基于樣本數(shù)據(jù)進(jìn)行訓(xùn)練的下游任務(wù);基于任務(wù)信息,構(gòu)建用于提示第一大語言模型根據(jù)任務(wù)信息生成問題指令的第一提示文本。[0121]基于此,目標(biāo)任務(wù)為特定應(yīng)用領(lǐng)域的下游任務(wù),基于目標(biāo)任務(wù)的任務(wù)信息構(gòu)建第一提示文本,后續(xù)能夠得到與目標(biāo)任務(wù)相關(guān)的樣本數(shù)據(jù),利用與目標(biāo)任務(wù)相關(guān)的樣本數(shù)據(jù)訓(xùn)練大語言模型,實現(xiàn)對大語言模型進(jìn)行微調(diào),微調(diào)后的大語言模型能夠更好地適應(yīng)目標(biāo)任務(wù),有助于提高該大語言模型在特定應(yīng)用領(lǐng)域的性能。[0122]具體地,可以將任務(wù)信息所包含的任務(wù)內(nèi)容填入預(yù)設(shè)的第一提示模板,得到第一提示文本,例如,假設(shè)目標(biāo)任務(wù)的任務(wù)信息為“生成在前端開發(fā)時所使用的JavaScript代碼”,任務(wù)信息所包含的任務(wù)內(nèi)容包括代碼生成、前端開發(fā)和JavaScript,第一提示模板可以為“請?zhí)峁┮恍?lt;任務(wù)內(nèi)容>問題指令”,基于預(yù)設(shè)的提示構(gòu)造策略,對任務(wù)信息所包括的任務(wù)內(nèi)容進(jìn)行相應(yīng)的構(gòu)造,并將構(gòu)造結(jié)果填入第一提示模板中的<任務(wù)內(nèi)容>,得到第一提示文本為“請?zhí)峁┮恍╆P(guān)于前端開發(fā)中JavaScript代碼生成相關(guān)的問題指令”。[0123]在一種可能的實現(xiàn)方式中,基于任務(wù)信息,構(gòu)建用于提示第一大語言模型根據(jù)任務(wù)信息生成問題指令的第一提示文本,具體可以是根據(jù)任務(wù)信息,在預(yù)設(shè)的任務(wù)樹中確定與任務(wù)信息匹配的目標(biāo)節(jié)點,其中,任務(wù)樹包括多層節(jié)點,各個節(jié)點均攜帶有各自的候選關(guān)鍵詞;將目標(biāo)節(jié)點所攜帶的候選關(guān)鍵詞作為目標(biāo)關(guān)鍵詞,根據(jù)目標(biāo)關(guān)鍵詞,構(gòu)建用于提示第一大語言模型根據(jù)任務(wù)信息生成問題指令的第一提示文本。[0124]其中,任務(wù)樹包括多層節(jié)點,每個節(jié)點所攜帶的候選關(guān)鍵詞用于指示目標(biāo)任務(wù)的具體任務(wù)內(nèi)容,在任務(wù)樹中存在父子關(guān)系的兩個節(jié)點會相互連接,基于各個節(jié)點之間的連接關(guān)系,每個節(jié)點可以都對應(yīng)一個具體的下游任務(wù),若任務(wù)樹中的兩個節(jié)點存在父子關(guān)系,代表該兩個節(jié)點對應(yīng)的下游任務(wù)存在層級關(guān)系,不同層級的節(jié)點所對應(yīng)的任務(wù)粒度范圍通常是不同的,同一層級的節(jié)點所對應(yīng)的任務(wù)粒度范圍通常是相同的。[0125]具體地,參照圖5,圖5為本申請實施例提供的任務(wù)樹的一種可選的結(jié)構(gòu)示意圖。[0126]其中,假設(shè)作為父節(jié)點的節(jié)點nodel1所攜帶的候選關(guān)鍵詞為代碼生成,假設(shè)節(jié)點nodel1對應(yīng)的子節(jié)點包括節(jié)點node22,節(jié)點node22所攜帶的候選關(guān)鍵詞可以為數(shù)學(xué)推理,相當(dāng)于節(jié)點node11對應(yīng)的下游任務(wù)task11為代碼生成任務(wù),節(jié)點node22對應(yīng)的下游任務(wù)task22為關(guān)于數(shù)學(xué)推理的代碼生成任務(wù),可見,下游任務(wù)task22可以視為下游任務(wù)task11的子任務(wù),下游任務(wù)task22和下游任務(wù)task11之間存在層級關(guān)系,下游任務(wù)task22是一個比下游任務(wù)task11更具體的任務(wù),即下游任務(wù)task22的任務(wù)粒度范圍小于下游任務(wù)task11的任務(wù)粒度范圍,因此,不同層級的節(jié)點所對應(yīng)的任務(wù)粒度范圍是不同的;[0127]進(jìn)一步,假設(shè)節(jié)點node22對應(yīng)的子節(jié)點包括節(jié)點node32和節(jié)點node33,節(jié)點node32所攜帶的候選關(guān)鍵詞可以為初中數(shù)學(xué)題,節(jié)點node33所攜帶的候選關(guān)鍵詞可以為高中數(shù)學(xué)題,相當(dāng)于節(jié)點node32對應(yīng)的下游任務(wù)task32為關(guān)于初中數(shù)學(xué)題的數(shù)學(xué)推理的代碼生成任務(wù),節(jié)點node33對應(yīng)的下游任務(wù)task33為關(guān)于高中數(shù)學(xué)題的數(shù)學(xué)推理的代碼生成任務(wù),可見,下游任務(wù)task32和下游任務(wù)task33均可以視為下游任務(wù)task22的子任務(wù),下游任務(wù)task32和下游任務(wù)task33分別與下游任務(wù)task22之間存在層級關(guān)系,下游任務(wù)task32與下游任務(wù)task33的任務(wù)粒度范圍相同,因此,相同層級的節(jié)點所對應(yīng)的任務(wù)粒度范圍是相[0128]存在多種確定目標(biāo)節(jié)點的方式,下面對其中兩種方式進(jìn)行詳細(xì)描述。[0129]方式一:參照圖6,圖6為本申請實施例提供的任務(wù)配置界面的一種可選的界面示[0130]其中,任務(wù)配置界面可以配置有多個第一復(fù)選框控件610、多個第二復(fù)選框控件620、多個第三復(fù)選框控件630和第一配置確定控件640,任務(wù)配置界面中還可以配置有更多層級的復(fù)選框控件,本申請實施例不作限定;[0131]以三個層級的復(fù)選框控為例,各個復(fù)選框控件均有對應(yīng)的任務(wù)內(nèi)容,各個復(fù)選框控件的一側(cè)會顯示有對應(yīng)的任務(wù)內(nèi)容的文本,第一復(fù)選框控件610、第二復(fù)選框控件620和第三復(fù)選框控件630分別對應(yīng)于任務(wù)樹不同層級的節(jié)點,各個第一復(fù)選框控件610分別與各自對應(yīng)的位于第二個層級的節(jié)點存在關(guān)聯(lián)關(guān)系,各個第二復(fù)選框控件620分別與各自對應(yīng)的位于第三個層級的節(jié)點存在關(guān)聯(lián)關(guān)系,各個第三復(fù)選框控件630分別與各自對應(yīng)的位于第四個層級的節(jié)點存在關(guān)聯(lián)關(guān)系,因此,第一復(fù)選框控件610、第二復(fù)選框控件620和第三復(fù)選框控件630之間也具有層級關(guān)系。[0132]在終端的任務(wù)配置界面中,通常都會展示有多個第一復(fù)選框控件610,相關(guān)人員可以在任務(wù)配置界面中點擊任意一個已展示的第一復(fù)選框控件610,在一個時刻中,最多允許有一個第一復(fù)選框控件610處于復(fù)選狀態(tài),當(dāng)其中一個第一復(fù)選框控件610處于復(fù)選狀態(tài)時,該第一復(fù)選框控件610的下一個層級的各個第二復(fù)選框控件620會展示在任務(wù)配置界面[0133]相關(guān)人員可以在任務(wù)配置界面中點擊任意一個已展示的第二復(fù)選框控件620,在一個時刻中,最多允許有一個第二復(fù)選框控件620處于復(fù)選狀態(tài),當(dāng)其中一個第二復(fù)選框控件620處于復(fù)選狀態(tài)時,該第二復(fù)選框控件620的下一個層級的各個第三復(fù)選框控件630會展示在任務(wù)配置界面中;[0134]相關(guān)人員可以在任務(wù)配置界面中點擊任意一個已展示的第三復(fù)選框控件630,在一個時刻中,最多允許有一個第三復(fù)選框控件630處于復(fù)選狀態(tài);[0135]相關(guān)人員完成復(fù)選后,可以觸發(fā)第一配置確定控件640,相關(guān)人員可以在選擇第一復(fù)選框控件610后觸發(fā)第一配置確定控件640,也可以在選擇第一復(fù)選框控件610和選擇第二復(fù)選框控件620后觸發(fā)第一配置確定控件640;通過觸發(fā)第一配置確定控件640,使得終端能夠響應(yīng)于對第一配置確定控件640的操作,根據(jù)各個復(fù)選框控件的復(fù)選狀態(tài),在任務(wù)樹中確定目標(biāo)節(jié)點,將最后一個處于復(fù)選狀態(tài)的復(fù)選框控件所對應(yīng)的節(jié)點作為目標(biāo)節(jié)點,在圖6中,任務(wù)內(nèi)容為代碼生成的第一復(fù)選框控件610處于復(fù)選狀態(tài),任務(wù)內(nèi)容為前端開發(fā)的第二復(fù)選框控件620處于復(fù)選狀態(tài),任務(wù)內(nèi)容為前端JavaScript的第三復(fù)選框控件630處于復(fù)選[0136]方式二:參照圖7,圖7為本申請實施例提供的任務(wù)配置界面的另一種可選的界面示意圖。[0137]其中,任務(wù)配置界面可以配置有文本輸入控件710和第二配置確定控件720;[0138]在終端的任務(wù)配置界面中,相關(guān)人員可以通過文本輸入控件710輸入目標(biāo)任務(wù)的任務(wù)信息,然后相關(guān)人員可以觸發(fā)第二配置確定控件720,通過觸發(fā)第二配置確定控件720,使得終端能夠響應(yīng)于對第二配置確定控件720的操作,根據(jù)文本輸入控件710內(nèi)的任務(wù)信[0139]具體地,假設(shè)任務(wù)信息為“在前端開發(fā)中生成JavaScript的相關(guān)代碼”,可以參照圖5,先在任務(wù)樹的第二個層級的各個節(jié)點中確定與任務(wù)信息匹配的節(jié)點,假設(shè)第二個層級匹配的節(jié)點為節(jié)點nodel1,例如,節(jié)點nodel1所攜帶的候選關(guān)鍵詞為代碼生成,然后在節(jié)點node11的各個子節(jié)點中確定與任務(wù)信息匹配的節(jié)點,假設(shè)第三個層級匹配的節(jié)點為節(jié)點node21,例如,節(jié)點node21所攜帶的候選關(guān)鍵詞為前端開發(fā),然后在節(jié)點node21的各個子節(jié)點中確定與任務(wù)信息匹配的節(jié)點,假設(shè)第四個層級匹配的節(jié)點為節(jié)點node31,例如,節(jié)點node31所攜帶的候選關(guān)鍵詞為JavaScript,然后在節(jié)點node31的各個子節(jié)點中確定與任務(wù)信息匹配的節(jié)點,假設(shè)第四個層級沒有匹配的節(jié)點,將節(jié)點node31作為目標(biāo)節(jié)點。[0140]可見,在與任務(wù)信息匹配的各個節(jié)點中,目標(biāo)節(jié)點對應(yīng)的任務(wù)粒度范圍最小,將目標(biāo)節(jié)點所攜帶的候選關(guān)鍵詞作為目標(biāo)關(guān)鍵詞,目標(biāo)關(guān)鍵詞所指示的任務(wù)內(nèi)容最具體,由于第一提示文本是根據(jù)目標(biāo)關(guān)鍵詞構(gòu)建的,所以第一提示文本能夠較為具體地提示第一大語言模型針對目標(biāo)任務(wù)生成初始問題指令,例如,目標(biāo)節(jié)點攜帶的目標(biāo)關(guān)鍵詞為JavaScript,構(gòu)建的第一提示文本可以為“請?zhí)峁┮恍╆P(guān)于JavaScript相關(guān)的問題指令”。[0141]在一種可能的實現(xiàn)方式中,根據(jù)目標(biāo)關(guān)鍵詞,構(gòu)建用于提示第一大語言模型根據(jù)任務(wù)信息生成問題指令的第一提示文本,具體可以是:[0142]當(dāng)目標(biāo)節(jié)點所在層級為目標(biāo)層級時,根據(jù)目標(biāo)關(guān)鍵詞,構(gòu)建用于提示第一大語言模型根據(jù)任務(wù)信息生成問題指令的第一提示文本,其中,目標(biāo)層級為任務(wù)樹中根節(jié)點所在層級的后一個層級;[0143]其中,在任務(wù)樹中確定與任務(wù)信息匹配的目標(biāo)節(jié)點之后,判斷目標(biāo)節(jié)點所在層級是否屬于目標(biāo)層級,在目標(biāo)節(jié)點所在層級為目標(biāo)層級的情況下,任務(wù)信息只與任務(wù)樹中的目標(biāo)節(jié)點匹配,可以通過目標(biāo)關(guān)鍵詞較為準(zhǔn)確地表征任務(wù)信息,所以根據(jù)目標(biāo)關(guān)鍵詞構(gòu)建第一提示文本。[0144]或者,當(dāng)目標(biāo)節(jié)點所在層級為目標(biāo)層級之后的層級時,在任務(wù)樹中確定與目標(biāo)節(jié)點關(guān)聯(lián)的關(guān)聯(lián)節(jié)點,將關(guān)聯(lián)節(jié)點所攜帶的候選關(guān)鍵詞作為關(guān)聯(lián)關(guān)鍵詞,根據(jù)關(guān)聯(lián)關(guān)鍵詞和目標(biāo)關(guān)鍵詞,構(gòu)建用于提示第一大語言模型根據(jù)任務(wù)信息生成問題指令的第一提示文本,其中,關(guān)聯(lián)節(jié)點所在層級位于目標(biāo)節(jié)點所在層級之前。[0145]其中,在目標(biāo)節(jié)點所在層級為目標(biāo)層級之后的層級的情況下,任務(wù)信息會與任務(wù)樹中的多個節(jié)點匹配,需要確定與目標(biāo)節(jié)點關(guān)聯(lián)的關(guān)聯(lián)節(jié)點,然后將關(guān)聯(lián)節(jié)點的候選關(guān)鍵詞作為關(guān)聯(lián)關(guān)鍵詞,可以通過關(guān)聯(lián)關(guān)鍵詞和目標(biāo)關(guān)鍵詞的組合較為準(zhǔn)確地表征任務(wù)信息,所以根據(jù)關(guān)聯(lián)關(guān)鍵詞和目標(biāo)關(guān)鍵詞構(gòu)建第一提示文本。[0146]示例性地,目標(biāo)層級為任務(wù)樹中根節(jié)點所在層級的后一個層級,即目標(biāo)層級為第二個層級,假設(shè)目標(biāo)節(jié)點所在層級為第四個層級時,即目標(biāo)節(jié)點所在層級為目標(biāo)層級之后的層級,可以在第三個層級中確定與該目標(biāo)節(jié)點連接的節(jié)點為第一個關(guān)聯(lián)節(jié)點,可以在目標(biāo)層級中確定與第一個關(guān)聯(lián)節(jié)點連接的節(jié)點為第二個關(guān)聯(lián)節(jié)點,然后根據(jù)兩個關(guān)聯(lián)節(jié)點攜帶的關(guān)聯(lián)關(guān)鍵詞和目標(biāo)節(jié)點攜帶的目標(biāo)關(guān)鍵詞構(gòu)建第一提示文本,第一提示文本能夠較為更加具體地提示第一大語言模型針對目標(biāo)任務(wù)生成初始問題指令,例如,目標(biāo)節(jié)點攜帶的目標(biāo)關(guān)鍵詞為JavaScript,第一個關(guān)聯(lián)節(jié)點攜帶的關(guān)聯(lián)關(guān)鍵詞為前端開發(fā),第二個關(guān)聯(lián)節(jié)點攜帶的關(guān)聯(lián)關(guān)鍵詞為代碼生成,構(gòu)建的第一提示文本可以為“請?zhí)峁┮恍╆P(guān)于前端開發(fā)[0147]在一種可能的實現(xiàn)方式中,任務(wù)樹中根節(jié)點所在層級的后一個層級為目標(biāo)層級,位于目標(biāo)層級的節(jié)點攜帶有第三角色定義文本,將目標(biāo)節(jié)點所攜帶的候選關(guān)鍵詞作為目標(biāo)關(guān)鍵詞之前,樣本數(shù)據(jù)生成方法還包括:將與目標(biāo)節(jié)點關(guān)聯(lián)且位于目標(biāo)層級的節(jié)點作為目標(biāo)角色定義節(jié)點,將目標(biāo)角色定義節(jié)點所攜帶的第三角色定義文本作為目標(biāo)角色定義文本,其中,目標(biāo)角色定義文本用于提示第一大語言模型作為針對目標(biāo)任務(wù)的提問方;將目標(biāo)角色定義文本輸入至第一大語言模型。[0148]基于此,任務(wù)樹的目標(biāo)層級可以包含一個或多個節(jié)點,將任務(wù)樹中位于目標(biāo)層級的節(jié)點作為角色定義節(jié)點,由于不同角色定義節(jié)點所攜帶的候選關(guān)鍵詞是不同的,相當(dāng)于不同角色定義節(jié)點對應(yīng)的具體任務(wù)內(nèi)容是不同的,所以要為各個角色定義節(jié)點配置各自對應(yīng)的第三角色定義文本,第三角色定義文本的內(nèi)容用于顯示定義第一大語言模型的角色,而且由于任務(wù)樹中角色定義節(jié)點對應(yīng)的任務(wù)粒度范圍最大,角色定義節(jié)點所關(guān)聯(lián)的其他節(jié)點對應(yīng)的任務(wù)粒度范圍屬于角色定義節(jié)點對應(yīng)的任務(wù)粒度范圍的子范圍,所以目標(biāo)角色定義文本可以適配目標(biāo)角色定義節(jié)點以及目標(biāo)角色定義節(jié)點所關(guān)聯(lián)的其他節(jié)點,通過向第一大語言模型輸入該目標(biāo)角色定義文本,使得第一大語言模型能夠更好地理解目標(biāo)任務(wù),能夠提高初始問題指令的生成質(zhì)量。[0149]再次參照圖5,假設(shè)角色定義節(jié)點nodel1所攜帶的候選關(guān)鍵詞為代碼生成,角色定義節(jié)點node11所配置的第三角色定義文本可以為“系統(tǒng)角色:你是一個擅長代碼編程和問題相關(guān)的助手”,又例如,角色定義節(jié)點node12所攜帶的候選關(guān)鍵詞為旅游規(guī)劃,角色定義節(jié)點node12所配置的第三角色定義文本可以為“系統(tǒng)角色:你是一個擅長旅游規(guī)劃的虛擬[0150]假設(shè)角色定義節(jié)點nodel1為目標(biāo)角色定義節(jié)點,目標(biāo)角色定義文本為“系統(tǒng)角色:你是一個擅長代碼編程和問題相關(guān)的助手”,通過向第一大語言模型輸入該目標(biāo)角色定義文本,使得第一大語言模型能夠更好地理解代碼生成的目標(biāo)任務(wù),能夠提高初始問題指令的生成質(zhì)量。[0151]在一種可能的實現(xiàn)方式中,初始問題指令的數(shù)量為多個,將初始問題指令作為首個輸入至第二大語言模型的問題指令之前,樣本數(shù)據(jù)生成方法還包括:從多個初始問題指令中隨機(jī)采樣出第一問題指令;基于預(yù)設(shè)的擴(kuò)展策略構(gòu)建用于提示第一大語言模型按照擴(kuò)展策略進(jìn)行指令擴(kuò)展的第三提示文本;將第三提示文本和第一問題指令輸入第一大語言模型,對第一問題指令進(jìn)行指令擴(kuò)展,生成第一擴(kuò)展問題指令,將第一擴(kuò)展問題指令作為初始問題指令。[0152]具體地,參照圖8,圖8為本申請實施例提供的第一大語言模型的第二種可選的結(jié)構(gòu)示意圖。[0153]其中,多個初始問題指令中隨機(jī)采樣出第一問題指令,具體可以是將第一大語言模型生成的多個初始問題指令的集合作為種子指令集,種子指令集的初始問題指令可以視為種子指令,在種子指令集中隨機(jī)采樣出第一問題指令;擴(kuò)展策略可以是問題指令復(fù)雜化的策略文本,擴(kuò)展策略用于提示第一大語言模型如何進(jìn)行問題指令復(fù)雜化,擴(kuò)展策略可以用于對第一大語言模型生成的第一擴(kuò)展問題指令作出要求,例如,擴(kuò)展策略可以對第一擴(kuò)展問題指令作出字?jǐn)?shù)要求、用詞要求、推理步驟數(shù)量要求或者復(fù)雜度要求等等,不同的下游任務(wù)所需求的擴(kuò)展策略通常是不同的,因此,需要預(yù)設(shè)多種擴(kuò)展策略,以應(yīng)對不同的下游任[0154]基于此,基于擴(kuò)展策略構(gòu)建第三提示文本,第三提示文本能夠提示第一大語言模型處理問題指令復(fù)雜化任務(wù),將第三提示文本和第一問題指令輸入第一大語言模型,使得第一大語言模型能夠?qū)Φ谝粏栴}指令進(jìn)行問題指令復(fù)雜化,第一大語言模型能夠基于模型輸入生成第一擴(kuò)展問題指令,第一擴(kuò)展問題指令的數(shù)量可以是一個或多個,本申請實施例在此不作限定;第一擴(kuò)展問題指令可以視為第一問題指令的問題指令復(fù)雜化結(jié)果,由于相關(guān)人員可能會輸入比較復(fù)雜的問題指令,所以相對于復(fù)雜度較低的第一問題指令,通過復(fù)雜度較高的第一擴(kuò)展問題指令通常更加接近真實場景中相關(guān)人員所輸入的比較復(fù)雜的問題指令,后續(xù)下游任務(wù)中利用第一擴(kuò)展問題指令訓(xùn)練大語言模型時,能夠有效地提高該大語言模型的訓(xùn)練效果。[0155]具體地,將初始問題指令作為首個輸入至第二大語言模型的問題指令之前,可以通過多個復(fù)雜化輪次生成多次第一擴(kuò)展問題指令,在每個復(fù)雜化輪次中,都需要從多個初始問題指令隨機(jī)采樣出第一問題指令,使得部分初始問題指令能夠進(jìn)行問題指令復(fù)雜化,將問題指令復(fù)雜化所得到的第一擴(kuò)展問題指令作為初始問題指令,能夠進(jìn)一步提升初始問題指令的多樣化,后續(xù)能夠提高大語言模型的訓(xùn)練效果。[0156]以關(guān)于前端開發(fā)中JavaScript代碼生成的下游任務(wù)為例,可以通過多種方式得到第一擴(kuò)展問題指令,下面以其中一種方式為例,對得到第一擴(kuò)展問題指令的過程進(jìn)行詳細(xì)描述。[0157]方式一:假設(shè)隨機(jī)采樣出的第一問題指令為“如何使用JavaScript實現(xiàn)圖片輪播功能?”,假設(shè)擴(kuò)展策略為“在原始指令中添加新的約束和要求該擴(kuò)展策略所構(gòu)建的第三提示文本可以為“請?zhí)岣呓o定問題指令的復(fù)雜度,可以使用以下方法來提高問題指令的復(fù)雜度:方法1:在原始指令中添加新的約束和要求,增加指令的內(nèi)[0158]將第三提示文本和第一問題指令填入第二提示模板,得到的第一輸入文本為“請?zhí)岣呓o定問題指令的復(fù)雜度,可以使用以下方法來提高指令的復(fù)雜度:方法1:在原始指令中添加新的約束和要求,增加指令的內(nèi)容長度。原始指令:如何使用JavaScript實現(xiàn)圖片輪[0159]然后將第一輸入文本輸入第一大語言模型,第一大語言模型生成第一擴(kuò)展問題指[0160]其中,第四角色定義文本的內(nèi)容用于顯示定義第一大語言模型的角色,在將第一輸入文本輸入第一大語言模型之前,將第四角色定義文本輸入第一大語言模型,以提示第一大語言模型作為針對目標(biāo)任務(wù)的提問方,例如,在前端開發(fā)中JavaScript代碼生成的下游任務(wù)中,第四角色定義文本可以為“系統(tǒng)角色:你是一個擅長代碼編程和問題相關(guān)的助手”,通過向第一大語言模型輸入第四角色定義文本,第一大語言模型能夠更好地理解問題指令復(fù)雜化任務(wù),能夠提高第二擴(kuò)展問題指令的生成質(zhì)量。[0161]在一種可能的實現(xiàn)方式中,擴(kuò)展策略的數(shù)量為多個,對第一問題指令進(jìn)行指令擴(kuò)展,生成擴(kuò)展問題指令,具體可以是:對第一問題指令進(jìn)行多次的指令擴(kuò)展,得到每一次指令擴(kuò)展生成的第一擴(kuò)展問題指令;其中,每當(dāng)對第一問題指令進(jìn)行指令擴(kuò)展時,按照多個擴(kuò)展策略中的至少一個對第一問題指令進(jìn)行指令擴(kuò)展。[0162]基于此,將第三提示文本和第一問題指令輸入第一大語言模型之后,第一大語言模型會對第一問題指令進(jìn)行多次的指令擴(kuò)展,因此,通過對同一個第一問題指令進(jìn)行多次問題指令復(fù)雜化,能夠得到多個第一擴(kuò)展問題指令,而且每次進(jìn)行指令擴(kuò)展時,會隨機(jī)選擇其中一個或多個擴(kuò)展策略對第一問題指令進(jìn)行指令擴(kuò)展,能夠提高第一擴(kuò)展問題指令的隨機(jī)性和多樣性,將各個第一擴(kuò)展問題指令均作為初始問題指令,能夠進(jìn)一步提升初始問題指令的多樣化。[0163]具體地,假設(shè)預(yù)設(shè)有四個擴(kuò)展策略,擴(kuò)展策略a為“在原始指令中添加新的約束和要求,增加指令的內(nèi)容長度”,擴(kuò)展策略b為“對原始指令中常見的概念替換為更具體但不常見的概念”,擴(kuò)展策略c為“增加原始指令的推理步驟”,擴(kuò)展策略d為“增加原始指令的時間復(fù)雜度或空間復(fù)雜度”,基于該擴(kuò)展策略所構(gòu)建的第三提示文本可以為“請?zhí)岣呓o定問題指令的復(fù)雜度,同時保證問題指令的完整性,提高問題指令復(fù)雜度的方法包括但不限于:方法1:在原始指令中添加新的約束和要求,增加指令的內(nèi)容長度;方法2:對原始指令中常見的概念替換為更具體但不常見的概念;方法3:增加原始指令的推理步驟;方法4:增加原始指[0164]在一種可能的實現(xiàn)方式中,初始問題指令的數(shù)量為多個,將初始問題指令作為首個輸入至第二大語言模型的問題指令之前,樣本數(shù)據(jù)生成方法還包括:從多個初始問題指令隨機(jī)采樣出第二問題指令;構(gòu)建用于提示第一大語言模型參照第二問題指令生成問題指令的第四提示文本,將第四提示文本和第二問題指令輸入第一大語言模型進(jìn)行問題指令預(yù)測,生成第二擴(kuò)展問題指令,將第二擴(kuò)展問題指令作為初始問題指令。[0165]具體地,參照圖9,圖9為本申請實施例提供的第一大語言模型的第三種可選的結(jié)構(gòu)示意圖。[0166]其中,從多個初始問題指令隨機(jī)采樣出第二問題指令,具體可以是將第一大語言模型生成的多個初始問題指令的集合作為種子指令集,種子指令集的初始問題指令可以視為種子指令,在種子指令集中隨機(jī)采樣出預(yù)設(shè)數(shù)量個問題指令,得到第二問題指令,因此,構(gòu)建用于提示第一大語言模型參照第二問題指令生成問題指令的第四提示文本,相當(dāng)于將第二問題指令視為問題指令生成任務(wù)的參考示例,將第四提示文本和第二問題指令輸入第一大語言模型,第一大語言模型能夠基于模型輸入生成第二擴(kuò)展問題指令,然后將第二擴(kuò)展問題指令作為新的初始問題指令,再將新的初始問題指令添加至種子指令集,第二擴(kuò)展問題指令的數(shù)量可以是一個或多個,本申請實施例在此不作限定。[0167]基于此,在第四提示文本的作用下,將第二問題指令視為參考示例,通過以演示形式組織的若干個參考示例來使第一大語言模型學(xué)習(xí)任務(wù),將第二問題指令所蘊含的知識臨時插入到第一大語言模型中,使得第一大語言模型能夠更好地理解當(dāng)前的問題指令生成任務(wù),從而生成質(zhì)量較好的第二擴(kuò)展問題指令,由于第一大語言模型是基于第二問題指令所蘊含的知識生成第二擴(kuò)展問題指令,所以第二擴(kuò)展問題指令與第二問題指令所蘊含的知識相近,相當(dāng)于第二擴(kuò)展問題指令與第二問題指令可以用于處理相同的下游任務(wù),因此可以將第二擴(kuò)展問題指令作為新的初始問題指令,而且第一大語言模型生成的第二擴(kuò)展問題指令通常與第二問題指令是不同的,即第一大語言模型能夠輸出泛化的指令,實現(xiàn)對初始問題指令進(jìn)行有效地擴(kuò)展,能夠增加初始問題指令的多樣性。[0168]具體地,將初始問題指令作為首個輸入至第二大語言模型的問題指令之前,可以通過多個生成輪次生成多次第二擴(kuò)展問題指令,在每個生成輪次中,都需要從多個初始問題指令隨機(jī)采樣出第二問題指令,由于第二擴(kuò)展問題指令會作為新的初始問題指令,因此當(dāng)前生成輪次采樣得到的第二問題指令有可能是前一個生成輪次所生成的第二擴(kuò)展問題[0169]以關(guān)于前端開發(fā)中JavaScript代碼生成的下游任務(wù)為例,可以通過多種方式得到第二擴(kuò)展問題指令,下面以其中兩種方式為例,對得到第二擴(kuò)展問題指令的過程進(jìn)行詳細(xì)描述。[0170]方式一:假設(shè)隨機(jī)采樣出兩個第二問題指令,第二問題指令a為“如何使用JavaScript實現(xiàn)圖片輪播功能?”,第二問題指令b為“如何使用JavaScript創(chuàng)建計時器?”,構(gòu)建的第四提示文本可以為“下面是一些與前端開發(fā)中JavaScript代碼生成相關(guān)的問題指[0171]將第四提示文本和第二問題指令填入第三提示模板,得到的第二輸入文本為“下面是一些和前端開發(fā)中JavaScript代碼生成相關(guān)的問題指令。樣例1:指令:如何使用JavaScript實現(xiàn)圖片輪播功能?樣例2:指令:如何使用JavaScript創(chuàng)建計時器?樣例3:";[0172]然后將第二輸入文本輸入第一大語言模型,第一大語言模型生成第二擴(kuò)展問題指令,假設(shè)第一大語言模型的輸出為“指令:如何使用JavaScript實現(xiàn)點擊事件檢測?”,則第[0173]方式二:假設(shè)隨機(jī)采樣出兩個第二問題指令,第二問題指令a為“如何使用JavaScript實現(xiàn)圖片輪播功能?”,第二問題指令b為“如何使用JavaScript創(chuàng)建計時器?”,構(gòu)建的第四提示文本可以為“請參照下面與前端開發(fā)中JavaScript代碼生成相關(guān)的問題指[0174]將第四提示文本、第二問題指令a和第二問題指令b依次拼接,得到的第一拼接文本為“請參照下面與前端開發(fā)中JavaScript代碼生成相關(guān)的問題指令,生成新的問題指令。如何使用JavaScript實現(xiàn)圖片輪播功能?如何使用JavaScript創(chuàng)建計時器?”;[0175]然后將第一拼接文本輸入第一大語言模型,第一大語言模型生成第二擴(kuò)展問題指令,假設(shè)第一大語言模型的輸出為“如何使用JavaScript實現(xiàn)點擊事件檢測?”,則第二擴(kuò)展[0176]在一種可能的實現(xiàn)方式中,調(diào)用第一大語言模型基于第一提示文本進(jìn)行問題指令預(yù)測之前,樣本數(shù)據(jù)生成方法還包括:獲取目標(biāo)采樣溫度值;將第一大語言模型的溫度參數(shù)配置為目標(biāo)采樣溫度值,其中,目標(biāo)采樣溫度值用于指示第一大語言模型輸出結(jié)果的隨機(jī)[0177]其中,第一大語言模型的溫度參數(shù)為超參數(shù),超參數(shù)是一種在第一大語言模型開始學(xué)習(xí)之前為第一大語言模型配置的參數(shù),超參數(shù)不是通過模型訓(xùn)練得到的,通常是基于現(xiàn)有經(jīng)驗進(jìn)行賦值來為第一大語言模型配置超參數(shù),由于第一大語言模型生成的初始問題指令通常是基于概率分布對詞表進(jìn)行采樣而得到的,溫度參數(shù)是用于調(diào)整該概率分布,目標(biāo)采樣溫度值可以是人工輸入的,也可以是預(yù)先設(shè)置的。[0178]基于此,當(dāng)目標(biāo)采樣溫度值越高,概率分布越平滑,相當(dāng)于對詞表中各個詞元的初始概率進(jìn)行平滑,增加初始概率較低的詞元的生成概率,增加初始問題指令的隨機(jī)性,使得初始問題指令更加多樣,但是初始問題指令更有可能存在質(zhì)量問題,例如,語法不準(zhǔn)確或者內(nèi)容不準(zhǔn)確等等;反之,當(dāng)目標(biāo)采樣溫度值越低時,概率分布越尖銳,降低初始概率較低的詞元的生成概率,使得第一大語言模型通常生成初始概率較高的詞元,可以提高初始問題指令的質(zhì)量,但是降低初始問題指令的隨機(jī)性;通常情況下,在確保質(zhì)量的前提下,需要選擇較高的目標(biāo)采樣溫度值,提高第一大語言模型生成初始問題指令的多樣性,能夠得到由初始問題指令所形成的多樣高質(zhì)量的種子指令集。[0179]具體地,調(diào)用第一大語言模型基于第一提示文本進(jìn)行問題指令預(yù)測之前,將第一大語言模型的溫度參數(shù)配置為目標(biāo)采樣溫度值,相當(dāng)于第一大語言模型在生成初始問題指令時所對應(yīng)的溫度參數(shù)為目標(biāo)采樣溫度值,假設(shè)第一大語言模型在生成第一擴(kuò)展問題指令所對應(yīng)的溫度參數(shù)為第一采樣溫度值,第一大語言模型在生成第二擴(kuò)展問題指令所對應(yīng)的溫度參數(shù)為第二采樣溫度值,目標(biāo)采樣溫度值、第一采樣溫度值和第二采樣溫度值可以是相同的,也可以是部分相同的或者完全不同的,本申請實施例在此不作限定,通常情況下,也需要選擇較高的第一采樣溫度值和較高的第二采樣溫度值,提高第一大語言模型生成

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論