大模型驅(qū)動(dòng)的研發(fā)新范式(百度)_第1頁
大模型驅(qū)動(dòng)的研發(fā)新范式(百度)_第2頁
大模型驅(qū)動(dòng)的研發(fā)新范式(百度)_第3頁
大模型驅(qū)動(dòng)的研發(fā)新范式(百度)_第4頁
大模型驅(qū)動(dòng)的研發(fā)新范式(百度)_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

大模型驅(qū)動(dòng)的研發(fā)新范式目錄01

AI編碼助手的行業(yè)發(fā)展02

新一代編碼工具能力及實(shí)現(xiàn)

03

領(lǐng)域案例及應(yīng)用場景04

人機(jī)協(xié)同新范式國外“卷”Copilot?歌猛進(jìn),與OpenAI各類模型深度整合

SourceGraph推出Cody,主打本地知識(shí)增強(qiáng)Codeium推出,率先?持私有化、VPC多種部署模型

Cosine推出,主打代碼庫知識(shí)增強(qiáng)Augment推出,主打?體積代碼知識(shí)增強(qiáng)Tabnine推出,主打代碼補(bǔ)全Cursor展露頭?,構(gòu)建AI原?IDEAutoGPT、

GPT-Engineer

MetaGPT等開源項(xiàng)?陸續(xù)推出

騰訊云AI助?

MarsCode

代碼?浣熊

CodeGeeX

iFlyCode

CodeFuse

通義靈碼ReplitAgentJetBrainsAIDevinBolt.newAI編碼助手的行業(yè)發(fā)展

——

從低谷到狂熱

百度

AI代碼生成占比33%Google

AI代碼生成占比25%亞馬遜

編碼速度提高57%文心快碼3.0在2024年11月12日正式發(fā)布,全系標(biāo)配智能體。AI助力研發(fā)提效初顯文心快碼百度內(nèi)全面落地,

2023

年10月24日正式對(duì)外發(fā)布。ChatGPT正式發(fā)布,

AI編碼助?成為?業(yè)關(guān)注焦點(diǎn)??快碼內(nèi)部?項(xiàng),啟動(dòng)模型訓(xùn)練Copilot正式收費(fèi),推出企業(yè)版推出Copilot,免費(fèi)公測智能體新賽道國內(nèi)“卷”參數(shù)規(guī)模決定模型下限,

千億參數(shù)的GPT

3.5模型是“奇點(diǎn)”,帶來質(zhì)變訓(xùn)練數(shù)據(jù)質(zhì)量和規(guī)模決定模型上限,代碼數(shù)據(jù)相對(duì)于任何自然語言都是質(zhì)量最高的“文本”,有極強(qiáng)的規(guī)

律可循因此,大模型首先在“編程”領(lǐng)域發(fā)起了變革Github

私域代碼

官方文檔文件大小過濾

哈希分片相似代碼去重行列字符數(shù)、圈復(fù)雜度安全敏感詞、密碼密鑰等過濾

知識(shí)點(diǎn)分類代碼格式化人工精標(biāo)策略

代碼格式化產(chǎn)品突破:

GitHub找到了一種絕佳的交互方式在IDE中通過幽靈字符向開發(fā)者展示預(yù)測結(jié)果,

使用Tab采納,

N秒后自動(dòng)消失未改變?nèi)魏伍_發(fā)流程,極其絲滑的將AI能力嵌入

到開發(fā)者的習(xí)慣AI編碼助手的行業(yè)發(fā)展

——

技術(shù)發(fā)展的必然

技術(shù)突破:

Scaling

Laws是通往AGI的銀彈文心快碼訓(xùn)練數(shù)據(jù)提取方式,極其規(guī)范化的高質(zhì)量數(shù)據(jù)全部基于各語言專家整理的規(guī)則池

+語法樹數(shù)據(jù)源數(shù)據(jù)清洗數(shù)據(jù)標(biāo)注預(yù)處理啟動(dòng)信息實(shí)體關(guān)系依賴框架高頻業(yè)務(wù)關(guān)鍵詞語言分布API定義構(gòu)建信息核心邏輯配置信息README????????????

1w+工程師,1k+業(yè)務(wù)團(tuán)隊(duì),10w+代碼庫

85%的需求一周交付,50%的研發(fā)資源云化

80%的應(yīng)用從開發(fā)到上線全流程在線

每天1w次代碼提交

每月1kw次流水線自動(dòng)化任務(wù)聚焦『流程』

+『協(xié)作』忽視了『個(gè)人』效率的提升工具支撐?

iCafe?iCode?

iPipe?

iScan?

iCov?

iTest?

工程能力底圖?

價(jià)值流、健康度?

一站式、云原生企業(yè)提效的必然

(以百度研效工具發(fā)展軌跡為例)?

iCafe?iCode?

iPipe?

iScan?

iCov?

iTest?

工程能力底圖?

價(jià)值流、健康度DOS/PC

PC(GUI)/客戶端-服務(wù)器Web/互聯(lián)網(wǎng)移動(dòng)/云AI/邊緣/量子…?

iCafe?iCode?

iPipe?

iScan?

iCov?

iTest?

iCafe?iCode?

iPipeSVNJenkins業(yè)務(wù)

復(fù)雜度流程支撐時(shí)期??

流程是是實(shí)踐后的經(jīng)驗(yàn)、教訓(xùn)等總結(jié),一定是『滯后的』

如,針對(duì)Prompt、數(shù)據(jù)集等在工程團(tuán)隊(duì)如何管理,目前沒有明確的范式

面對(duì)花樣繁多的項(xiàng)目管理流程,多數(shù)開發(fā)者更想聚焦于研發(fā)

過度在團(tuán)隊(duì)內(nèi)推廣研發(fā)流程,反而引起開發(fā)者的抗拒心理,大幅降低開發(fā)者的幸福感智能研發(fā)助手

=代碼自動(dòng)補(bǔ)全(Completions)

+理解私域知識(shí)(RAG)+獨(dú)立分析需求(Agent)企業(yè)提效的必然——單兵作戰(zhàn)

大模型催生了開發(fā)者個(gè)人提效的『銀彈』GithubCopilot

+ChatGPT的誕生,吹響了『開發(fā)者個(gè)人提效』

的號(hào)角,幾乎一夜之間所有組織都開始關(guān)注核心原因在于整個(gè)提效的設(shè)計(jì)不是站在開發(fā)者個(gè)人,而是站在組織上開發(fā)者的『iPhone』時(shí)刻文心快碼-構(gòu)建人機(jī)協(xié)同新范式

n

文心快碼

(BaiduComate)是基于文心大模型,結(jié)合百度積累多年的編程現(xiàn)場大數(shù)據(jù)和外部優(yōu)秀開源數(shù)據(jù),打造的新一代編

碼輔助工具。擁有代碼智能、場景豐富、創(chuàng)造價(jià)值、廣泛應(yīng)用等多重產(chǎn)品優(yōu)勢(shì),可實(shí)現(xiàn)“幫你想、幫你寫、幫你改”的場景應(yīng)用形

態(tài)。提升編碼效率,

釋放“十倍”軟件生產(chǎn)力。n

目前百度內(nèi)部“文心快碼”智能代碼助手整體采納率達(dá)到了

46%

,新增代碼中生成的比例已經(jīng)達(dá)到了

33%知識(shí):代碼大數(shù)據(jù)技術(shù)問答架構(gòu)梳理代碼解釋架構(gòu)梳理技術(shù)問答架構(gòu)梳理代碼解釋技術(shù)問答架構(gòu)梳理代碼解釋技術(shù)問答架構(gòu)梳理代碼解釋架構(gòu)梳理代碼解釋文心快碼-構(gòu)建人機(jī)協(xié)同新范式

反饋驅(qū)動(dòng)優(yōu)化企業(yè)私域知識(shí)增強(qiáng)本地代碼知識(shí)增強(qiáng)智能體應(yīng)用架構(gòu)企業(yè)開放平臺(tái)代碼評(píng)審代碼測試部署發(fā)布過程創(chuàng)造數(shù)據(jù)AI:文心大模型技術(shù)調(diào)研代碼開發(fā)代碼優(yōu)化技術(shù)問答技術(shù)問答代碼解釋網(wǎng)絡(luò)檢索網(wǎng)絡(luò)檢索網(wǎng)絡(luò)檢索網(wǎng)絡(luò)檢索網(wǎng)絡(luò)檢索網(wǎng)絡(luò)檢索X智能體時(shí)代六大智能體能力層Web端(百度搜索、星河社區(qū)等)

+

IDE端(目錄區(qū)、編輯區(qū)、

Console區(qū)等)框架層Agent

+開放平臺(tái)知識(shí)層代碼類(代碼片段、代碼依賴等)+文本類(技術(shù)文檔、API文檔

等)模型層推理調(diào)度

+代碼生成

+代碼續(xù)寫

+

Embedding文心快碼-實(shí)現(xiàn)思路

私域知識(shí)增強(qiáng)PALO

預(yù)訓(xùn)練數(shù)據(jù)VectorDB編排調(diào)試Token/

耗時(shí)

統(tǒng)計(jì)Log/

Trace.靜態(tài)編排(Chain)API網(wǎng)關(guān)

APIGateway

LL

MCache

SCS

for

Redis

文心快碼-整體架構(gòu)

Embedding數(shù)據(jù)處理

Pipeline文檔切分Prompt工程意圖拆解動(dòng)態(tài)編排(Agent)低俗涉政價(jià)值觀防中間劫持非代碼內(nèi)容規(guī)范插件應(yīng)用通用代碼能力ERNIE

Code20ERNIE

Code2.0客戶業(yè)務(wù)APIQianfanSDKEasyDAP安全服務(wù)領(lǐng)域文檔工具調(diào)用向量檢索Plugins請(qǐng)求響應(yīng)CPromERNIESQLBOSRDSCFCBESBLS數(shù)據(jù)清洗?高復(fù)雜度函數(shù)過濾?無效注釋過濾?測試框架過濾與分

(單測)?代碼格式化數(shù)據(jù)分析?語法解析?

函數(shù)調(diào)用關(guān)系分析?文件依賴關(guān)系分析?獨(dú)立函數(shù)提取數(shù)據(jù)生產(chǎn)?測試函數(shù)與被測函

數(shù)?代碼片段與注釋?代碼片段與代碼解

釋?代碼問答對(duì)數(shù)據(jù)源數(shù)據(jù)清洗文心快碼-模型層

?片段長度?

復(fù)雜度?語言分布?知識(shí)覆蓋?

FIM?

Git

hub?私域代碼?

Star數(shù)?

活躍度原始數(shù)據(jù)數(shù)據(jù)源清洗分布平衡結(jié)構(gòu)轉(zhuǎn)換內(nèi)容清洗文心快碼-模型層

預(yù)測推理SFT動(dòng)態(tài)圖預(yù)測模型訓(xùn)練線上服務(wù)轉(zhuǎn)化與量化SFT-WIN8量化模型!預(yù)測結(jié)果預(yù)訓(xùn)練模型導(dǎo)出的模型可直接部

署線上

訓(xùn)練數(shù)據(jù)

數(shù)據(jù)預(yù)處理Reader數(shù)據(jù)預(yù)處理Reader預(yù)測數(shù)據(jù)模型服務(wù)鏡像文心快碼-知識(shí)層

開發(fā)者XCopilot開發(fā)者XCopilot開發(fā)智能體代碼續(xù)寫技術(shù)問答問題修復(fù)單元測試安全加固任務(wù)編程文心快碼-智能體

智能體時(shí)代:委托自主完成任務(wù)獨(dú)立、自主完成單項(xiàng)任務(wù)直接呈現(xiàn)最終動(dòng)作,由人進(jìn)行確認(rèn)在各項(xiàng)任務(wù)上提供信息輔助

由人進(jìn)行實(shí)際操作委托確認(rèn)請(qǐng)求······續(xù)寫智能體單測智能體文心快碼-智能體

問答智能體安全智能體全棧編程智能體Debug智能體場景介紹-技術(shù)調(diào)研

全庫架構(gòu)梳理業(yè)務(wù)邏輯梳理網(wǎng)絡(luò)檢索分析場景介紹-技術(shù)調(diào)研

全庫架構(gòu)梳理業(yè)務(wù)邏輯梳理網(wǎng)絡(luò)檢索分析全庫架構(gòu)梳理業(yè)務(wù)邏輯梳理網(wǎng)絡(luò)檢索分析獲取最新的解決方案,擺脫

模型內(nèi)部壓縮數(shù)據(jù)不是實(shí)時(shí)

的限制。場景介紹-技術(shù)調(diào)研

實(shí)踐案例

——

AI

Native

Inline

Chat智能粘貼

智能采納

問題修復(fù)實(shí)踐案例

——

AI

Native

Inline

Chat智能粘貼智能采納

問題修復(fù)實(shí)踐案例

——

AI

Native

Inline

Chat智能粘貼智能采納問題修復(fù)實(shí)踐案例

——

AI

Native

Inline

Chat智能粘貼智能采納問題修復(fù)文本類知識(shí)實(shí)踐案例

——

企業(yè)知識(shí)增強(qiáng)生成

激活企業(yè)私域文檔,減少開

發(fā)過程中的代碼幻覺。業(yè)務(wù)接口文檔產(chǎn)品需求文檔測試用例文檔服務(wù)部署文檔實(shí)踐案例

——

智能體

全棧編程智能體安全智能體

單測智能體第一:創(chuàng)建項(xiàng)目實(shí)踐案例

——

智能體

全棧編程智能體安全智能體

單測智能體第二:修改項(xiàng)目實(shí)踐案例

——

智能體

全棧編程智能體安全智能體

單測智能體第三:美化項(xiàng)目實(shí)踐案例

——

智能體

全棧編程智能體安全智能體單測智能體實(shí)踐案例

——

智能體

全棧編程智能體

安全智能體單測智能體插件市場評(píng)分第一在VSCod

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論