NASL領(lǐng)域大模型訓練_第1頁
NASL領(lǐng)域大模型訓練_第2頁
NASL領(lǐng)域大模型訓練_第3頁
NASL領(lǐng)域大模型訓練_第4頁
NASL領(lǐng)域大模型訓練_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

上海站上海站Al+-研發(fā)數(shù)字峰會擁抱AI重塑研發(fā)NASL領(lǐng)域大模型訓練劉東|網(wǎng)易數(shù)智2012年畢業(yè)于清華大學電子工程系,長期從事人的研發(fā)工作,參與過OCR、語音識別、機器翻譯V.模型訓練與評測VI.總結(jié)與展望·通過圖形化界面、拖拽組件、配置參數(shù)等方式來創(chuàng)建應用程序item=2item.□ICAPerResMa囚囚20252025Al+-研發(fā)數(shù)字峰會|擁抱Al重塑研發(fā)經(jīng)辦人經(jīng)辦人控制流事件事務索引Vue/ReactVue/ReactSpring20252025Al+-研發(fā)數(shù)字峰會|擁抱Al重塑研發(fā)導入導出導入導出查找引用重命名頁面設計器邏輯設計器數(shù)據(jù)定義設計器流程設計器代碼倉庫理20252025Al+-研發(fā)數(shù)字峰會|擁抱Al重塑研發(fā)20252025Al+-研發(fā)數(shù)字峰會|擁抱Al重塑研發(fā)可視化編輯器可視化編輯器增刪改查類型檢查撤銷重做實時編輯邏輯子語言數(shù)據(jù)定義子語言流程子語言數(shù)據(jù)查詢子語言作用域命名空間可視化編程語言(NASL,描述應用的領(lǐng)域特定語言)鏡像制品頁面制品企業(yè)運維體系頁面子語言批量添加復制粘貼自動補全重命名基礎語言查找引用發(fā)布翻譯器·算法需求:底層需要懂NASL語言的大模型驅(qū)動NASL領(lǐng)域模型訓練項目背景編輯距離(Levenshtein距離)計算(CodeWaveNASL語言)functionLevenshteinDistance(str1,str2){letm=length(str1);letdp=createArrayfor(letj=0;j<=n;j++){if(str1[1-1]==str2[//插入注意:此代碼假設CodeWaveNASL語言支持二維數(shù)組和基本的數(shù)組操作。如果實際平臺語法有所不同,可距離指的是兩個字符串之間,由一個字符串轉(zhuǎn)換成另一個字符串所需的最少編輯操作(插入、刪除、替換)次plaintext^plaintext^#計算編輯距離的函數(shù)functioneditDistance(#創(chuàng)建一個二維數(shù)組來存儲子問題的解for(letj=0;j<=n;j=j+1){}elseif(str1[i-1]dp[i][j]=1+Math.min(dp[i-1][j],dp[i][j-1],dp[i-1}}}}20252025Al+-研發(fā)數(shù)字峰會|擁抱AI重塑研發(fā)2025Al+-研發(fā)數(shù)字峰會|擁抱Al重塑研發(fā)NASL領(lǐng)域模型訓練prompt方案一定效果背景說明背景說明代碼生成要求用戶指令letlenA:LongletlenB:Longletdp:List<Long>=nasl.util.NewList<Long>(□);ForEach(nasl.util.ListRange(0,LenB+1),0,LenB+1,(i){ForEach(nasl.util.ListRange(1,LenA+letcurrent:List<Long>=nasl.util.NewList<Long>([i]);ForEach(nasl.util.ListRange(1,LenB+letcost:Long=(nasl.util.SubString(a,i-1,1)=letval1:Long=nasl.letval2:Long=nasl.util.ListGet(}}nasl.util.ListAdd(currreturnn} NASL領(lǐng)域模型訓練prompt方案評測 ·人工排除與web開發(fā)完全無關(guān)的問題,剩余問題改寫為中文模型claude-3.72025Al+-研發(fā)數(shù)字峰會|擁抱Al重塑研發(fā)空間力無法完全遵守占比進行中)不支持for(leti內(nèi)置函數(shù)不是通用姿勢多字段排序函數(shù)(待開始)多行l(wèi)ambda不支持for(leti問題220252025Al+研發(fā)數(shù)字峰會|擁抱Al重塑研發(fā)NASL領(lǐng)域模型(7/14B)通用模型(gpt/claud/deepseek)生成效果好一般生成速度快慢私有化部署支持除deepseek外均不支持部署成本低,單GPU卡高,GPU集群NASL領(lǐng)域模型訓練整體思路指令數(shù)據(jù)構(gòu)造基座模型選擇監(jiān)督微調(diào)偏好對齊·先從基礎語言部分入手,再逐步擴展邏輯、實體定義、數(shù)據(jù)查詢等子語言領(lǐng)域,,)logiclogic1(list:List<Integer>)=>result{}}functionlogic1(li}}2025Al+-研發(fā)數(shù)字峰會|擁抱Al重塑研發(fā)https://hf.co/deepseek-ai/deepseek-coder-1.3https:/hf.co/deepseek-ai/deepseek-coder-6.7https:/hf.co/deepseek-ai/deepseek-coder-33https://hf.co/deepseek-ai/DeepSeek-Coder-V2-Lithttps:/hf.co/deepseek-ai/DeepSeek-Coder-Vhttps://hf.co/Qwen/Qwen2.5-Codehttps://hf.co/Qwen/Qwen2.5-Codehttps://hf.co/Qwen/Qwen2.5-Cohttps:/hf.co/Qwen/Qwen2.5-Cohttps://hf.co/Qwen/Qwen2.5-Codhttps:/hf.co/Qwen/Qwen2.5-Codhttps:/hf.co/Qwen/CodeQwenhttps:/hf.co/bigcode/starcodhttps:/hf.co/bigcode/starcodhttps://hf.co/bigcode/starcode的核心因素是數(shù)據(jù)的質(zhì)量20252025Al+-研發(fā)數(shù)字峰會|擁抱AI重塑研發(fā)與解決方案NASL領(lǐng)域數(shù)據(jù)構(gòu)造目標數(shù)據(jù)20252025Al+-研發(fā)數(shù)字峰會|擁抱Al重塑研發(fā)·主要從開源數(shù)據(jù)中收集原始指令,如opencoder、wikisql等·對原始指令做中文改寫以及質(zhì)量過濾·對于開源數(shù)據(jù)不覆蓋的場景,人工借助Ilm做構(gòu)造·大部分指令包含對應的測試用例自然語言指令NASL說明書LLM代碼生成測試用例NASL說明書LLM代碼生成自然語言指令NASL沙箱測試用例合成數(shù)據(jù)成功→·合成成功率改進顯著(基礎語言部分60%+)領(lǐng)域數(shù)據(jù)構(gòu)造多輪反饋示例領(lǐng)域數(shù)據(jù)構(gòu)造多輪反饋示例//第1次生成//第2次生成//第3次生成functionquerylfunction}//第4次生成letresult:{list:List<{leaveRequest:app.dataSources.defaultDS.entities.LeaveReque>SELECT/AGGR_SEL{list:List<{L letcontractCountByMonth:List<{month:String,count:Long}>=}}首先,我需要使用NASL的數(shù)據(jù)查詢語法,特別是FRO根據(jù)項目上下文中的定義,用戶可能需要使用nasl.util.FormatDateTime函數(shù),但該函數(shù)是否可以在數(shù)據(jù)查詢中使用?根據(jù)限制,查詢鏈中禁止使用nasl.util的函數(shù),所以只能在應用層處理。可能的解決方案:1.查詢所有合同的createTime。2.歷每個合同,將createTime格式化為'yyyy-MM’字符串。3.按字符串分組統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論