版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
演講嘉賓CCF軟件工程專委會執(zhí)行委員/持續(xù)研究自動化軟件追蹤十余年持續(xù)研究軟件可追蹤性、代碼庫挖掘、程序理解等軟件開發(fā)相關(guān)方向,曾“智能基座”棟梁之師等獎項,《開發(fā)運維一體化成熟度模型》國家標準的主要起草人之一(產(chǎn)品與需求部分共發(fā)表論文20余篇,其中一作/通訊作者論文11篇(包含ICSE、FSE、ASE等頂尖軟工會議論文應(yīng)邀oDevOps/研發(fā)效能學(xué)術(shù)論?(260+)及專利(80+)中華人民共和國國家標準系統(tǒng)與軟件工程開發(fā)運維-體化能力成熟度模型目錄CONTENTS目錄CONTENTS引言:為何要在軟件項目開發(fā)中“溯源需求”??項目開發(fā)者視角:如何快速融入團隊?以下為親身經(jīng)歷?被某世界級通訊技術(shù)公司專家當面質(zhì)問:“你是大學(xué)老師?你們課上都在教些什么??”?大哥為何憤怒:招來的名校新人程序員“不指定具體PRD和單元測試就寫不出代碼”?假設(shè)我們的培養(yǎng)“完美無缺”:學(xué)生充分掌握數(shù)學(xué)基礎(chǔ)、編程范式、主流框架、實踐經(jīng)驗?但TA大概率仍無法全面快速“上手”主流項目:不了解(復(fù)雜)項目?氛圍良好、成熟穩(wěn)定的開發(fā)團隊可以緩解這一問題,但問題本質(zhì)是系統(tǒng)功能與實現(xiàn)之間缺乏明確關(guān)聯(lián)?項目管理者視角:如何治理、盤活已有項目資產(chǎn)??知名網(wǎng)游IP《魔獸世界》:“原汁原味”的懷舊服vs.“銳意創(chuàng)新”的私服?掌握全部項目資產(chǎn)的官方-直接上線包含所有缺點的經(jīng)典版本?自行破解還原的“同人”-推出多個廣受?為何?-項目代碼復(fù)雜冗余,開發(fā)團隊人員流失,項目退化為遺產(chǎn)代碼(只能運行,無法維護更新)?旁證:永遠16格的初始背包容量,官方解釋“相關(guān)代碼在整個游戲最底層,無法精準定位,貿(mào)然修改將導(dǎo)致無數(shù)BUG”?2018年7.3.5版本嘗試升級為20格,結(jié)果導(dǎo)致該版本在地圖、進度、角色、裝備等各個方面均涌現(xiàn)出嚴重錯誤需求可追蹤性:顯式標識需求以及其它軟件制品之間的聯(lián)系?這些關(guān)聯(lián)關(guān)系能夠隨時間的變化而得到維護RequirementTraceMatrix(RequirementTraceMatrix(RTM)需求可追蹤性的誕生求可追蹤性“出圈”需求可追蹤性成為軟件開發(fā)規(guī)范?愛國者導(dǎo)彈攔截失敗導(dǎo)致的海灣戰(zhàn)爭中美軍單次最大損失?“Youcannotmanagewhatyoucannottrace”?需求可追蹤性應(yīng)該在軟件系統(tǒng)中“普遍存在”[Gotel@RE1994]?仍是當前諸多關(guān)鍵領(lǐng)域軟件的強制要求,如DoD、FAA、FDA、NASA等機構(gòu)、核心網(wǎng)絡(luò)設(shè)備、金融企業(yè)的safe-critical軟件需求可追蹤性走入日常開發(fā)的價值、困難與挑戰(zhàn)?(普通新手)開發(fā)者通過軟件可追蹤性可獲取(至少)以下關(guān)鍵信息:代碼庫中需更改的代碼元userstory與測試用例,以及可咨詢的項目組內(nèi)開發(fā)者[Cleland-Huang@FOSE2014]?有效幫助理解已有代碼與開發(fā)任務(wù):“當前軟件開發(fā)人員閱讀代碼與編寫代碼的耗時比例超過10:1”?軟件維護任務(wù)在需求到代碼可追蹤性的支持下,正確率提高了60%,效率提高了20%[Maeder@ICSM2012]?在質(zhì)量保證[Rath@TSE2017]、系統(tǒng)安全[Moran@ICSE2020]、缺陷定位[Niu@ICSE2023]等研究中被廣泛應(yīng)用?挑戰(zhàn):如何使得需求(軟件)可追蹤性“廣泛存在”自動化需求追蹤在軟件工程領(lǐng)域研究中的發(fā)展近15年需求自動追蹤生成技術(shù)發(fā)展文獻綜述(2010-2024)數(shù)據(jù)庫名稱搜索范圍初步檢索結(jié)果ACMDigitalLibrary標題+摘要+關(guān)鍵詞IEEEXplore標題+摘要+關(guān)鍵詞WebofScience標題+關(guān)鍵詞ScienceDirect標題+摘要+關(guān)鍵詞SpringerLink標題+摘要+關(guān)鍵詞3488Scopus標題+摘要+關(guān)鍵詞包含包含標準1論文發(fā)表時間:2010.1–2024.6之間.包含標準2論文相關(guān)性:主題與軟件可追蹤相關(guān).包含標準3論文完整性:如會議論文,進一步擴展為期刊論文,只保留期刊論文版本,排除會議論文版本包含標準4論文權(quán)威性:經(jīng)過同行評審且已正式發(fā)表的論文,排除書籍章節(jié)、碩博論文等包含標準5論文語言:用英語撰寫的論文.包含標準6論文頁數(shù):大于等于5頁包含標準7論文等級:CCFA/B/C,或可追蹤相關(guān)會議TEFSE,SST剔除剔除標準1違反包含標準中的任意—條剔除標準2論?主題為軟件可追蹤的維護、管理、使?與應(yīng)?,??可追蹤?成技術(shù)相關(guān)文獻在高水平會議期刊上的分布長期研究熱點,重點分布于頂會ICSE、軟件維護主題的一流會議期刊、專題Workshop等自動追蹤技術(shù)演化趨勢314,,,信信33S器究自動追蹤目標制品:從傳統(tǒng)文檔到代碼庫制品rr需求UML...體系需求UML...代碼...測試...用戶...缺陷...LLM+需求自動追蹤后續(xù)工作展望檢索式+傳統(tǒng)制檢索式+傳統(tǒng)制需求可追蹤性對軟件開發(fā)的積極作用-知名軟件產(chǎn)品視角?某著名藍色支付軟件-安卓APP“瘦身”?某造車大成功的IoT生態(tài)公司-安卓OS社區(qū)被迫封閉?機型豐富加重“安卓碎片化”,被迫大幅弱化系統(tǒng)的?若有可追蹤性的支持,可在源碼層面?大模型出現(xiàn)后的時代需要-開發(fā)過程數(shù)據(jù)資產(chǎn)化是大模型助力軟件開發(fā)的前提?要充分利用大模型的對話式交互與超強文本歸納能力,必須有效治理、組織、利用開發(fā)過程中的各類數(shù)據(jù)?需求可追蹤性能夠在不同類型、不同格式的制品之間顯式建立追蹤線索,是開發(fā)數(shù)據(jù)資產(chǎn)化的關(guān)鍵需求可追蹤性在大模型時代對軟件開發(fā)的重要作用?對程序員的個體編碼能力提升較為明顯?但從軟件開發(fā)的人、過程、制品三個維度來看,整體效率并未大幅提升–“理解代碼”的難度要遠高于“寫出代碼”?基于系統(tǒng)功能顯式關(guān)聯(lián)各個軟件制品的軟件(需求)可追蹤性是程序理解的關(guān)鍵?如何更好地在特定領(lǐng)域項目開發(fā)上應(yīng)用LLM??ChatGPT類通用大模型是在海量數(shù)據(jù)上的一次“最優(yōu)化擬合”,難以直接回答特定問題,必須依賴有效的Prompt引導(dǎo)通用大模型“聚焦”2.有必要在通??模型的基礎(chǔ)上構(gòu)建專??模型3.構(gòu)建專??模型需要構(gòu)建?質(zhì)量數(shù)據(jù)集與驗證集4.將?模型與已有技術(shù)結(jié)合是值得去做的寶貴嘗試5.項?專家依然需要???項?微調(diào)專??模型,微調(diào)后的模型2.有必要在通??模型的基礎(chǔ)上構(gòu)建專??模型3.構(gòu)建專??模型需要構(gòu)建?質(zhì)量數(shù)據(jù)集與驗證集4.將?模型與已有技術(shù)結(jié)合是值得去做的寶貴嘗試5.項?專家依然需要???項?微調(diào)專??模型,微調(diào)后的模型?數(shù)據(jù)資產(chǎn)化的核心是軟件可追蹤性的高效實現(xiàn)?將軟件開發(fā)與LLM充分結(jié)合后的前景展望(代差)??有效應(yīng)對軟件開發(fā)的進一步復(fù)雜化?LLM時代會出現(xiàn)更多AI-Intensive系統(tǒng),代碼將不再是唯一關(guān)鍵制品(額外涉及AI模型與訓(xùn)練數(shù)據(jù))?對軟件(需求)可追蹤性也提出了更高要求?開發(fā)效率持續(xù)提升后增強企業(yè)業(yè)務(wù)創(chuàng)新能力BizDevOps需求追蹤的本質(zhì)問題:概念指派(ConceptAssignment)有了需求追蹤加持的軟件開發(fā)才能實現(xiàn)問題空間到解空有了需求追蹤加持的軟件開發(fā)才能實現(xiàn)問題空間到解空 已有自動追蹤技術(shù)的本質(zhì)與趨勢?輔助追蹤-構(gòu)造測試-基于信息檢索的自動追蹤生成技術(shù)概述基于信息檢索的自動追蹤生成技術(shù)概述?成詞項?檔矩陣n源制品?本預(yù)處理IR模型?成候選追蹤線索列表開發(fā)?員分析按IR值降序排列候選追蹤線索分析分類?成詞項?檔矩陣n源制品?本預(yù)處理IR模型?成候選追蹤線索列表開發(fā)?員分析按IR值降序排列候選追蹤線索分析分類?2.使?IR模型計算?本相似度,?成候選追蹤列表基于機器學(xué)習(xí)的自動追蹤生成技術(shù)概述自自未標記數(shù)據(jù)基于機器學(xué)習(xí)的自動追蹤生成技術(shù)概述自自未標記數(shù)據(jù)已標記數(shù)據(jù)提取特征提取特征分類器分類結(jié)果模型訓(xùn)練分類器分類器分類結(jié)果模型訓(xùn)練分類器追蹤線索預(yù)測基于深度學(xué)習(xí)的自動追蹤生成技術(shù)概述追蹤線索預(yù)測基于深度學(xué)習(xí)的自動追蹤生成技術(shù)概述模型訓(xùn)練候選追蹤線索步驟:型或為每類制品構(gòu)建單獨模型再聯(lián)合更好的進?上下?與語義模型本?可解釋較弱理解加深對?本的分析,減弱對??的依賴,逐步實現(xiàn)?具314加深對?本的分析,減弱對??的依賴,逐步實現(xiàn)?具314S138S107S119S127S1274信息檢索技術(shù)和傳統(tǒng)機器學(xué)習(xí)方法廣泛應(yīng)用于可追S118S104S136?基于大模型提示工程展開需求追蹤的問題?對不同抽象層級制品的語義關(guān)聯(lián)感到“難以接受”,需要強調(diào)制品來自于同一個系統(tǒng)?Prompt提示后有一定效果但不夠明顯(結(jié)果偏向高查全率)初步觀察結(jié)論:?模型具備?定的制品追蹤能?但有限,與已有?動追蹤技術(shù)結(jié)合可能是更好選擇?提示文本細節(jié)(單詞復(fù)數(shù)、詞組順序)對結(jié)果初步觀察結(jié)論:?模型具備?定的制品追蹤能?但有限,與已有?動追蹤技術(shù)結(jié)合可能是更好選擇?在詞嵌入方面也未體現(xiàn)出顯著優(yōu)勢LLM+需求自動追蹤展望:大語言模型的技術(shù)特性避免的出現(xiàn)“幻覺”與“編造”LLM+需求自動追蹤展望:如何更好地與大模型“共舞”?首先接受大模型的“不確定性”?因為這同時是大模型能力的“源泉”?融合多種輸入源以相互印證?結(jié)構(gòu)化模型輸出以方便快速展開分析?人在循環(huán)中不斷對系統(tǒng)輸出進行反饋?系統(tǒng)工具化時需構(gòu)建適合的交互界面LLM+需求自動追蹤:后續(xù)工作展望檢索式+傳統(tǒng)制檢索式+傳統(tǒng)制近十五年來自動追蹤研究分布與本人工作檢索式+傳統(tǒng)制檢索式+傳統(tǒng)制基于代碼依賴分析的檢索式方法增強:CLUSTER’[EMSE2022]?充分利用已有制品與其文本,在五個實驗系基于共識詞對的跨語言(中英)需求追蹤:AVIATE[ASE2024]基于增強預(yù)處理的學(xué)習(xí)式方法:SPLINT[FSE202①②?基于已知的Issue-Commit對進行自動化追蹤?提交Commit時往往會標記所解決的Issue?標簽嚴重不平衡,數(shù)據(jù)稀疏,影響分類效果?基于類別平衡和自學(xué)習(xí)技術(shù)預(yù)處理數(shù)據(jù)的分類優(yōu)化 initial modelpseudo/ps
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年內(nèi)科護理工作計劃
- 2025年多倍體樹木新品種項目合作計劃書
- 2025年糧食、棉花、化肥等農(nóng)產(chǎn)品倉儲服務(wù)合作協(xié)議書
- 糖尿病足的飲食護理
- 急性哮喘護理查房
- 垂體瘤的手術(shù)切除
- 嬰兒游泳水育護理方法
- 擁抱變化:口腔護理動態(tài)
- 兒童瘢痕患者的特殊考量
- 門診患者心理護理
- 75個高中數(shù)學(xué)高考知識點總結(jié)
- 《公共部門人力資源管理》機考真題題庫及答案
- 《數(shù)字影像設(shè)計與制作》統(tǒng)考復(fù)習(xí)考試題庫(匯總版)
- 國際學(xué)術(shù)交流英語知到章節(jié)答案智慧樹2023年哈爾濱工業(yè)大學(xué)
- DB14-T 2644-2023旅游氣候舒適度等級劃分與評價方法
- EVA福音戰(zhàn)士-國際動漫課件
- GB/T 37563-2019壓力型水電解制氫系統(tǒng)安全要求
- GB/T 25085.3-2020道路車輛汽車電纜第3部分:交流30 V或直流60 V單芯銅導(dǎo)體電纜的尺寸和要求
- GB/T 1182-2018產(chǎn)品幾何技術(shù)規(guī)范(GPS)幾何公差形狀、方向、位置和跳動公差標注
- DB37-T 5041-2015 城鎮(zhèn)供水水質(zhì)應(yīng)急監(jiān)測技術(shù)規(guī)范
- 帆船運動簡介課件
評論
0/150
提交評論