版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
質(zhì)量大模型及其在接口測試場景下的實(shí)踐1.
大模型如何解決質(zhì)量域問題2.
質(zhì)量大模型的構(gòu)建路徑3.
質(zhì)量大模型在接口測試中的實(shí)踐4.
未來展望目
錄CONTENTSPA
RT
01大模型如何解決質(zhì)量域問題大模型具有賦能軟件研發(fā)全流程的能力軟件設(shè)計(jì)環(huán)境搭建軟件開發(fā)質(zhì)量測試?
原型圖?
UML圖?
流程圖?
……?
依賴樹?
版本沖突?
……?
類與函數(shù)?
數(shù)據(jù)結(jié)構(gòu)?
復(fù)雜度?
……?
驗(yàn)收測試?
單元測試?
Bug處理?
……軟件需求文檔(PRD)Li
B,Wu
W,
Tang
Z,et
al.
Devbench:
A
comprehensive
benchmark
for
software
development[J].
arXiv
preprint
arXiv:2403.08604,
2024.大模型在質(zhì)量域下的應(yīng)用場景測試用例生成故障定位/修復(fù)質(zhì)量知識查詢問答線上問題總結(jié)分析測試斷言生成測試輸入生成……Wang
J,
Huang
Y,
Chen
C,et
al.
Software
testing
with
large
language
models:
Survey,
landscape,
and
vision[J].
IEEE
Transactions
onSoftwareEngineering,
2024.大模型能夠解決質(zhì)量測試領(lǐng)域的哪些問題?覆蓋率要求高自動化難度大人工成本高質(zhì)量測試全面、準(zhǔn)確地發(fā)現(xiàn)各種特殊情況與邊界問題經(jīng)驗(yàn)密度大、業(yè)務(wù)特異性高,難以自動化或手段難復(fù)用測試用例撰寫、質(zhì)量問題分析等工作需要大量人工1
嚴(yán)謹(jǐn)、全面2
知識、經(jīng)驗(yàn)階段能力繼續(xù)預(yù)訓(xùn)練微調(diào)/對齊對話/服務(wù)領(lǐng)域知識注入多任務(wù)能力獲取拓寬應(yīng)用邊界質(zhì)量測試領(lǐng)域呼喚質(zhì)量大模型知識中心執(zhí)行中心基礎(chǔ)質(zhì)量概念問答端到端任務(wù)執(zhí)行…………語言理解質(zhì)量知識服務(wù)中心業(yè)務(wù)經(jīng)驗(yàn)LLMs
asBrains質(zhì)量工具調(diào)度外部知識增強(qiáng)問答……PA
RT
02質(zhì)量大模型的構(gòu)建路徑質(zhì)量大模型的構(gòu)建路徑更新迭代評測指標(biāo)問題歸因數(shù)據(jù)飛輪部署應(yīng)用端到端對話檢索增強(qiáng)問答工具調(diào)用與執(zhí)行Continue
Pre-trainingInstruction
Tuning多任務(wù)能力
Prompt設(shè)計(jì)模型訓(xùn)練數(shù)據(jù)構(gòu)建專業(yè)知識注入語言模型非結(jié)構(gòu)化數(shù)據(jù)業(yè)務(wù)文檔結(jié)構(gòu)化數(shù)據(jù)線上系統(tǒng)回流
歷史數(shù)據(jù)沉淀質(zhì)量知識繼續(xù)預(yù)訓(xùn)練——知識注入訓(xùn)練材料:知識構(gòu)建語言模型知識訓(xùn)練對象:開源模型底座知識處理知識質(zhì)量*不完全列舉指令微調(diào)——技能培訓(xùn)關(guān)鍵問題:質(zhì)量域中的許多任務(wù)都是以結(jié)構(gòu)化數(shù)據(jù)為基礎(chǔ),如何用基于非結(jié)構(gòu)化對話形式的大模型完成結(jié)構(gòu)化數(shù)據(jù)任務(wù)?——解法在于如何針對特定任務(wù)設(shè)計(jì)指令并進(jìn)行微調(diào)流程任務(wù)選取數(shù)據(jù)獲取微調(diào)兩大類任務(wù)選?。簝纱箢悢?shù)據(jù)基礎(chǔ)知識:指令構(gòu)建技巧:明確任務(wù)需求微調(diào)注意事項(xiàng):數(shù)據(jù)分布質(zhì)量/業(yè)務(wù)知識問答清晰描述任務(wù)的推理邏輯、執(zhí)行步驟向模型提供基礎(chǔ)的質(zhì)量問答能力包括外部基礎(chǔ)知識與內(nèi)部的文檔積累平衡各任務(wù)的數(shù)據(jù)分布,避免過擬合格式規(guī)約特定質(zhì)量任務(wù)執(zhí)行對格式進(jìn)行嚴(yán)格規(guī)約,降低工程難度任務(wù)數(shù)據(jù)訓(xùn)練成本指令泛化以端到端形式執(zhí)行的質(zhì)量任務(wù),如測試用例生成等于真實(shí)場景的特定任務(wù)數(shù)據(jù)多卡訓(xùn)練、LoRA微調(diào)等,節(jié)省時(shí)間與顯存成本增強(qiáng)魯棒性應(yīng)用方式——作為端到端Bot以端到端對話形式執(zhí)行質(zhì)量任務(wù)[1]
KangS,
YoonJ,
YooS.Large
language
modelsare
few-shot
testers:
Exploring
llm-basedgeneral
bugreproduction[C]//2023
IEEE/ACM
45th
International
Conference
onSoftwareEngineering(ICSE).
IEEE,
2023:
2312-2323.[2]
Fakhoury
S,Chakraborty
S,Musuvathi
M,
et
al.Towardsgenerating
functionallycorrect
codeeditsfrom
natural
language
issuedescriptions[J].
arXivpreprint
arXiv:2304.03816,
2023.應(yīng)用方式——作為工作流組件大模型作為質(zhì)量工作流當(dāng)中的組件,為質(zhì)量工具提供了豐富的泛化性和強(qiáng)大的生成能力,提升了質(zhì)量工具的能力上限。以一個(gè)測試賬號查詢工作流為例:數(shù)據(jù)表信息好的,id為幫我找一個(gè)余額寶持倉為0的測試賬號xxxx的測試賬號余額寶持倉為0數(shù)據(jù)源基于LLM實(shí)現(xiàn)SQL自動執(zhí)行大模型潤色回答/執(zhí)行失敗安撫與建議NL2SQL取數(shù)大模型通過接受用戶輸入與數(shù)據(jù)表(表名、字段名稱、字段描述、取值范圍等)信息既可實(shí)現(xiàn)NL2SQL,節(jié)省了小模型訓(xùn)練的成本PA
RT
03質(zhì)量大模型在接口測試中的實(shí)踐接口測試的特點(diǎn)與難題專業(yè)性場景化復(fù)雜性對專家知識和經(jīng)驗(yàn)要求高需要結(jié)合特定業(yè)務(wù)邏輯人工成本和時(shí)間成本較高質(zhì)量大模型應(yīng)用——校驗(yàn)點(diǎn)生成輸入輸出質(zhì)量大模型質(zhì)量大模型應(yīng)用——校驗(yàn)點(diǎn)生成Prompt組裝任務(wù)所需的必要信息輸入信息接口名稱入?yún)⒊鰠⒏鶕?jù)專家經(jīng)驗(yàn)總結(jié)的執(zhí)行該任務(wù)所需的推理過程推理步驟根據(jù)業(yè)務(wù)要求確定字段的取值范圍和校驗(yàn)方式識別出參中的關(guān)鍵字段撰寫校驗(yàn)點(diǎn)列表強(qiáng)調(diào)針對任務(wù)輸出格式、形式等規(guī)范的要求規(guī)范要求每個(gè)校驗(yàn)點(diǎn)必須包含的特定字段……輸出必須遵循json格式質(zhì)量大模型應(yīng)用——業(yè)務(wù)知識問答接口測試知識增強(qiáng)問答爬取+切片幫我找一個(gè)風(fēng)測修改接口知識分片知識文檔工具向量庫用戶query嵌入模型向量檢索好的,風(fēng)測修改的接口名稱是……,調(diào)用方式……大模型回復(fù)Query向量質(zhì)量大模型應(yīng)用——工具執(zhí)行對話形式調(diào)用工具幫我執(zhí)行一個(gè)post請求,接口是……,入?yún)⑹恰ぞ呒嫌脩魆uery工作流開發(fā)執(zhí)行結(jié)果Function
Call大模型好的,執(zhí)行結(jié)果是……參數(shù)解析、工具調(diào)度工作流執(zhí)行回復(fù)大模型PA
RT
04未來展望總結(jié)產(chǎn)品內(nèi)容上圍繞質(zhì)量
+
大模型的提效工
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年公路運(yùn)輸與交通管理知識競賽題集及答案解析
- 道路工程招標(biāo)管理技術(shù)方案
- 安全作業(yè)許可證培訓(xùn)課件
- 道路綠化帶施工及驗(yàn)收方案
- 消防設(shè)備升級改造方案
- 施工現(xiàn)場揚(yáng)塵控制措施方案
- 垂直綠化技術(shù)應(yīng)用方案
- 隧道防水處理方案
- 三年級上冊英語Unit18詞匯結(jié)構(gòu)化教學(xué)方案
- 污水處理流程優(yōu)化技術(shù)方案
- 遼寧大學(xué)第八屆校學(xué)術(shù)委員會認(rèn)定的學(xué)術(shù)期刊分類標(biāo)準(zhǔn)及目錄
- 情緒反應(yīng)與身體健康的關(guān)系
- 游戲你來比劃我來猜的PPT
- 譯林版英語六年級上冊第八單元ChineseNewYear課件
- 《別惹螞蟻》劇本
- 典亮青春護(hù)航成長“民法典進(jìn)校園”主題講座
- ktv衛(wèi)生管理制度
- 黃沙、石子-水泥-磚采購合同
- 以學(xué)習(xí)項(xiàng)目構(gòu)建學(xué)習(xí)任務(wù)序列化嘗試(選必修第三單元) 論文
- 臨床檢驗(yàn)標(biāo)本的規(guī)范采集
- pcs-985ts-x說明書國內(nèi)中文版
評論
0/150
提交評論