2025 GOPS 全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會·上海站:當(dāng)LLM遇見CICD-代碼提交后的智能之旅_第1頁
2025 GOPS 全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會·上海站:當(dāng)LLM遇見CICD-代碼提交后的智能之旅_第2頁
2025 GOPS 全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會·上海站:當(dāng)LLM遇見CICD-代碼提交后的智能之旅_第3頁
2025 GOPS 全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會·上海站:當(dāng)LLM遇見CICD-代碼提交后的智能之旅_第4頁
2025 GOPS 全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會·上海站:當(dāng)LLM遇見CICD-代碼提交后的智能之旅_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

暨研運(yùn)數(shù)智化技術(shù)峰會中國

·上海2025年10月17日-18日

ps-XO025GOPS承辦單位:

華佑科技指導(dǎo)單位:

0

P第27屆上

站Shanghai

2015-2025主辦單位開放運(yùn)維聯(lián)盟OOPSA

Open

OPSAliancE高效運(yùn)維社區(qū)GralOPSCcmmuntyBizDevopsGOPS

2025Shanghai當(dāng)LLM

遇見了CICD代碼提交后的智能之旅

姓名:宋凱

◎時

間:2025/10/17ANNIVERSARY2015-2025大語言模型技術(shù)應(yīng)用

◎1智能體在DevOps中的應(yīng)用

◎2目錄顛覆prompt

的上下文工程03主動式上下文工程-ACE

◎4GOPS

全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會2025·

上海站GOPS2025ShanghaiANNIVERSARY2015-2025ANNIVERSARYGOPS

2025Shanghai2015-2025宋凱高效運(yùn)維社區(qū)資深DevOps

專家具有15年DevOps相關(guān)技術(shù)及平臺建設(shè)工作經(jīng)驗;在多個大型企業(yè)中作為企業(yè)級DevOps

教練,項目經(jīng)驗包括工行、農(nóng)行、交行、上交所、

中金所、中信、民生、浦發(fā)、海通、國信、移動、電信等;擅長提供企業(yè)級、項目級DevOps管理框架設(shè)計、工具平臺建設(shè)、過程改進(jìn)方案的設(shè)計,

全面推廣與賦能;擅長DevOps

平臺與平臺工程建設(shè)。具備DevOps

領(lǐng)域?qū)I(yè)技術(shù)認(rèn)證培訓(xùn)資質(zhì)如DevOps

Enterprise

Coach

國際認(rèn)證

DAOPS

授權(quán)講師中國新一代IT產(chǎn)業(yè)推進(jìn)聯(lián)盟DevOps

專家GOPS2025BeijingANNIVERSARY

2015-2025撲面而來的大語言模型技術(shù)

應(yīng)用01GOPS

全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會2025

·

上海站Shanghai

2015-2025GOPS

2025ANNIVERSARYShanghai2015-2025無如何判斷它的輸出符合我的要求呢?我需要觀測全部撞擊過程嗎?21

mr

e

回一個測試編碼能力的提示詞:寫一個python

程序下文是功能描述:建立一個640x480的顯示窗口名字叫AAA,

AAA

左下角顯示一

個金色的邊長為50×90的長方形形BB,

讓BB

在窗口范圍內(nèi)彈射碰到窗口邊緣反彈。

BB

初始位置是長

邊與x軸夾角30度。

BB

每個角受到窗口邊緣碰撞會讓其按物理運(yùn)動里的剛體運(yùn)動規(guī)律,包括,動量守

恒,碰撞每個角對BB的產(chǎn)生的扭矩,轉(zhuǎn)動慣量,對反彈和旋轉(zhuǎn)運(yùn)動。使用tkinter

繪圖功能。python3python3original_program.py被大模型撞上的我WindowHelp

數(shù)

UPAAAShenghein

2075-2025pytest

test_program.py小插曲:根據(jù)我給的提示詞,測試腳本慘不忍

。于是我讓DeepSeek

讀取上下文,給出更合適的提示詞然后我再把提示詞,輸出進(jìn)去,給我

輸出了完整的測試案例OPS2025ShengheinUPtest_program.pys8eF.圖形self.canvas.after(16,seif.update)但是?這里是不是有什么問題!canvas=tk.Canvas(root,width=640,height=480,bg="white")canvas.pack()#創(chuàng)建旋轉(zhuǎn)矩形對象rect=RotatingRectangle(canvas,640,480)rect.update()root.mainloop()

被大模型撞上的我于是有了這樣一個測試代碼的出現(xiàn),

一個測試編碼能力的測試程序:-V

--alluredir=./reports終端

Shell

6①O

Python-project--bash-204×56#更新位置和角度self.angle

+=self.omega#邊界碰撞檢測vertices=self.calculate_verticcollision

=Falsefor

iinrange(8,8,2):x,y

=verticescollision=True#上下邊界碰撞if

y<9

ory

>self.height:self.vy*-15se1f.omega+三

rel_

×*8.8083collision=Trueif

cel位置修正防上穿透ifx<8:self.x+=abs(x)ifx>self.width:self.x-=(x-self.width)if

y<θ:self.y

+=abs(y)redk

01:.nozoht:eif.y--(y

-8021.hosgbt)AMNAV

SA

員Y

2075-20254月25日周五15:46(base)MacBook-Pro-2:Python-projectDeepSeek-R1Gitlabreportstest.pytest1.pytest_ball_game.py

test_program-1.py#左右邊界碰撞if

x<0

orself.vx*=

rel_y

=(self.omegafam.pyJredir=./reorts?songkais1schatgpt-on-wechat-elf.width:+=relmy_projectmyprojectself.x+=self.vXself.y

+=se1f.vy#根據(jù)碰撞位置調(diào)整角速度25

yter.zipdify-main輔助工具函數(shù)##輔助工具函數(shù)def

calculate_energy(self):"""計算系統(tǒng)總能量(平移動能+轉(zhuǎn)動動能)"""linear_energy=0.5*(self.Vx**2+self.vy**2)angular_energy

=0.5*self.omega**2

#

假設(shè)轉(zhuǎn)動慣量I=1

return

linear_energy

+angular_energy#動態(tài)添加工具方法RotatingRectangle.calculate_energy

=calculate_energyif

pyt_

"(_[_"m-,_"_-"-:alluredir=./reports"])"invaai_=stnam,expected_vy",[cs_rect,init_pos,expected_vx,expected_vy):it_pos1culate_energy()physics_Iassert

physics_rect.vx

==expected_vx,

"水平速度反轉(zhuǎn)異常"assert

physics_rect.vy

expected_vy,

"垂直速度反轉(zhuǎn)異常"assert

physics_rect.calculate_energy()==pytest.approx(original_energy,rel=8.01),"能量守恒偏差>1%"def

i

lf,physics_rect):physics_rect.x,physics_rect.y=5,5#左上角碰撞original_vx,original_vy=physics_rect.vx,physics_rect.vyphysics_rect.update()assert

physics_rect.vx==-original_vx,“

水平速度未雙重反轉(zhuǎn)”assert

physics_rect.vy

==-original_vy,“垂直速度未雙重反轉(zhuǎn)”測o時碰coll落多邊corne#e物

規(guī)

證lass

TestPhysicsL守情況def

test_angular觸發(fā)右邊界碰擅phySdelta_omeg#

式#假

設(shè)

轉(zhuǎn)

量I=1,△t

(

)expected_delta=rel_*physics_rect.vx)*8.0883assertdelta_omega==pytest.approx(expected_delta,rel=8.1),"角

1

0

%

"@pytest.mark.parametrize("speed",[5,10,20])deftest_high_speed_collision(self,physics_rect,speed):physics_rect.Vx=speedphysics_rect.x=640-30#

界physics_rect.update()assertphysics

rect.x<=640,“高速碰撞發(fā)生邊界穿透“被大模型撞上的我Shenghein

2075-2025核心功能驗證

邊界條件測試pytest.mark.parametrize("angle_deg,expected_coords",[(e,[90,480,90,430,θ,430,θ,480]),#θ

轉(zhuǎn)(

9

0

,[

4

5

,

5

2

5

,

-

5

,

4

5

5

,

4

5

,

3

8

5

,

9

5

,

4

5

5

]

)

#

9

8

轉(zhuǎn)(

)defftest_vertex_calculation(self,physics_rect,angle_deg,expected_coords):p

i

s不_r

c角ta

g的

a坐th

a計din

(angle_deg)assert

a

pytest.approx(e,abs=1),"頂點(diǎn)坐標(biāo)計算誤差超過1像素"s·a算r標(biāo)m點(diǎn)n度e同c證hys"

驗defassertgetatf"參

數(shù){attr}

"部分測試案例內(nèi)容actual=physics_rect.calculate_vertices()fora,einzip(actual,expected_coords):物理規(guī)律驗證sics_rect,attr,expected):)==pytest.approx(expected),\GOPS2025

AMNAV鎖

SA員Y"驗證物理規(guī)律遵rel_y=180十世界上第一個不可玩弄的LLM

基準(zhǔn)LiveBench

提供了全面、客觀的大模型評測體系,幫助用戶了解最新的Al技術(shù)發(fā)展趨勢和模型性能對比。LiveBench

大模型榜單分析全面解析國際權(quán)威榜單LiveBench的最新評測結(jié)果信息獲取時間:2025年10月11日Ll

LiveBench榜單分析

首頁

核心總結(jié)

模型排名

能力分析

公司排名

國家分布1最新模型排名和得分-數(shù)據(jù)來源Shenghein告

訴MCP

工具的任務(wù)指令使用瀏覽器打開這個網(wǎng)頁:https://livebench.ai/#1,

使用python

編寫一個爬蟲工具,把這個網(wǎng)站中的內(nèi)容都獲取下來,然后以文章的形式進(jìn)行還原,并且把這篇文章翻譯成中文,分析當(dāng)前排名靠前的大模型能力,并給出前二十的排名,說明排名理由,存進(jìn)位于桌面file://IUsers/songkai/Python-project/messageZJZJ/livebench_ppt_page.html

的文件,分析當(dāng)前排名前十的大模型能力,并給出排名前二十公司排名的綜合數(shù)據(jù),非同公司產(chǎn)品,說明排名理由,對非相同國家產(chǎn)品進(jìn)行排名,說明排名理由,并在開頭加上對內(nèi)容的總結(jié)2075-2025MCP,

是Model

Context

Protocol,

模型上下文協(xié)議。能調(diào)用外部工具,是大模型進(jìn)化為智能體Agent的關(guān)鍵缺點(diǎn):編寫這個外部函數(shù)的工作量太大了解決辦法:統(tǒng)一Function

calling的名稱。統(tǒng)一Function

calling的運(yùn)行規(guī)范。1architectureMCP

clientsMCP

hostsclient.pyMCPserverMCP

serverMCPserverQuickstartLet'screateasimple

MCPserverthatexposes

a

calculatortool

and

some

data:#server.pyfrommcp.server.fastmcp

importFastMCP#Createan

MCPservermcp

=

FastMCP

(“Demo”)#Add

an

addition

toolreturna

+b#Addadynamicgreeting

resource@mcp.resource("greeting://{name}")def

g"

tr

e

oa

z:

t

)

g

it

g"""return

f"Hello,

{name}!"nr:eet>

sdresnalimeerngaeegG_t各類技術(shù)協(xié)議的目標(biāo),都是希望通過提高協(xié)作效率來提升開發(fā)效率,而MCP,

就是一種旨在提高大模型Agent

開發(fā)效率的技術(shù)協(xié)議。MCP

官方服務(wù)器合集:https://github.com/modelcontextprotocol/serversMCP

Server外部函數(shù)functionMCP

Client大模型運(yùn)行環(huán)境調(diào)用請求調(diào)用結(jié)果外部

工具M(jìn)CP@mcp.tool

()def

add(a:int,b:int)

->int:米Claude

身請求響

應(yīng)Shenghein

2075-2025""Addtwonumbers"""Local

datasourcesRemote

services3MCPMCP我們使用了以下MCP能力:1.sequentialthinking

分步思考工具,提供復(fù)

雜問題的分析和解決能力2.互聯(lián)網(wǎng)搜索3.Puppeteer

瀏覽器自動化工具4.

編輯文件能力5.

執(zhí)行終端命令能力6.

生成代碼能力7.figma但是MCP

還有風(fēng)險,避免大模型在真正可靠之前就開始為我們做事全球大模型TOP201.GPT-4(OpenAl)92.5

分最強(qiáng)大的通用A

模型,在復(fù)雜推理和創(chuàng)意任務(wù)上表現(xiàn)卓越2.Claude

3

Opus(Anthropic)91.2分

長文本處理能力最強(qiáng),安全性最佳3.Gemini

1.5

Pro(Google)90.8分多模態(tài)能力突出,與Google生態(tài)深度整合4.GPT-4

Turbo(OpenAl)90.5分GPT-4的優(yōu)化版本,響應(yīng)速度更快5.Claude

3Sonnet(Anthropic)89.7分

性價比最高的商業(yè)模型6.Yi-34B

(零一萬物)88.9分中文處理能力最強(qiáng)的開源模型7.Gemini1.0

Ultra(Google)88.5分

早期多模態(tài)模型的巔峰之作8.Claude

3Haiku(Anthropic)87.8分

輕量級模型中的性能冠軍9.GPT-3.5Turbo(OpenAl)86.2分

最經(jīng)濟(jì)實惠的OpenAI模型10.Command

R+(Cohere)85.9分企業(yè)級RAG任務(wù)表現(xiàn)最佳11.Mistral

Large(Mistral

Al)85.5分

歐洲最強(qiáng)大的開源模型12.Llama370B(Meta)85.0分

Meta最新開源大模型13.DeepSeek-V3(深度求索)84.7分

中文長文本處理專家14.Claude2.1(Anthropic)

84.2分

穩(wěn)定可靠的商業(yè)模型15.GPT-4-32K(OpenAl)83.8

超長上下文版本16.PaLM2(Google)

83.5分

Google上一代旗艦?zāi)P?7.Jurassic-2

Ultra(Al21)83.0分

專業(yè)領(lǐng)域表現(xiàn)優(yōu)異18.Falcon-180B(TI)82.7分最大規(guī)模的開源模型19.BLOOMZ(BigScience)

82.3分

多語言處理專家20.Ernie

4.0(百度)82.0分

中文理解能力突出區(qū)性能趨勢2023年模型平均得分:78.52024年模型平均得分:85.2性能提升:+8.5%魯跨國比較美國模型平均分:86.7(側(cè)重通用能力)中國模型平均分:82.3(側(cè)重中文處理)歐洲模型平均分:79.1(側(cè)重隱私保護(hù))國家分布美國5中國網(wǎng)公司分布3OpenAl3Anthropic好用、安全的用Shenghein

2075-2025AI驅(qū)動的DevOps革命AI智能體在DevOps工程交付中的應(yīng)用分析探索人工智能如何變革傳統(tǒng)DevOps流程,提升交付效率與質(zhì)量,實現(xiàn)智能化軟件開發(fā)生命周期管理85%交付效率提升70%缺陷率降低60%人力成本節(jié)省95%流程自動化率

自動化執(zhí)行自動執(zhí)行CI/CD流水線、基礎(chǔ)設(shè)施配置和監(jiān)控任務(wù),減少人為干預(yù)Q智能分析分析代碼庫、日志和性能數(shù)據(jù),預(yù)測問題并提供優(yōu)化建議什么是Al智能體?AI智能體是指具有感知、推理、決策和執(zhí)行能力的人工智能系統(tǒng),能

夠在特定環(huán)境中自主或半自主地完成任務(wù)。在DevOps

領(lǐng)域,這些智能

體可以理解代碼、分析問題、執(zhí)行自動化任務(wù),并持續(xù)學(xué)習(xí)和優(yōu)化。探索AI智能體的核心能力→3持續(xù)學(xué)習(xí)基于歷史數(shù)據(jù)和反饋不斷改進(jìn),適應(yīng)新環(huán)境和新需求Al智能體正在改變傳統(tǒng)DevOps

的工作方式,實現(xiàn)更智能、更高效的軟件交付流程AI智能體如何重塑DevOps

工程交付GOPS

2025ShanghaiANNIVERSARY2015-2025版本控制系統(tǒng)優(yōu)化AI智能體能夠分析代碼庫歷史、識別代碼模式、預(yù)測合并沖突,并自動生成有意義的提交信息,顯著提升團(tuán)隊協(xié)作效率。實施舉措部署Al輔助代碼審查工具,配置自動審查規(guī)則和質(zhì)量門限建立智能分支策略建議系統(tǒng),根據(jù)項目類型和團(tuán)隊規(guī)模自動推薦最佳實踐集成AI驅(qū)動的自動沖突檢測與解決工具,減少合并沖突帶來的延遲實現(xiàn)路徑1.

分析現(xiàn)有代碼庫結(jié)構(gòu)和版本控制使用模式2.選擇適合團(tuán)隊規(guī)模的AI版本控制工具,如GitHubCopilot、GitLabDuo等3.配置自動化工作流,集成代碼審查和質(zhì)量檢查4.培訓(xùn)團(tuán)隊成員使用AI輔助工具,建立反饋機(jī)制5.持續(xù)優(yōu)化AI模型,根據(jù)團(tuán)隊反饋調(diào)整推薦策略多維度分析-構(gòu)建與持續(xù)集成GOPS

2025ANNIVERSARY2015-2025構(gòu)建與持續(xù)集成AI智能體可優(yōu)化構(gòu)建流程,預(yù)測構(gòu)建失敗,自動修復(fù)常見問題,并智能分配構(gòu)建資源,大幅提升CI效率。實施舉措優(yōu)化構(gòu)建緩存策略,實現(xiàn)智能緩存清理和復(fù)用實施智能測試選擇與優(yōu)先排序,減少不必要的測試執(zhí)行部署構(gòu)建失敗智能分析系統(tǒng),自動識別失敗原因并提供修復(fù)建議實現(xiàn)路徑1.評估當(dāng)前CI/CD流程性能瓶頸,收集歷史構(gòu)建數(shù)據(jù)2.選擇并集成AI驅(qū)動的CI優(yōu)化工具,如Harness、CircleCIAI等3.配置智能資源分配策略,根據(jù)構(gòu)建類型和優(yōu)先級動態(tài)分配資源4.建立失敗模式識別系統(tǒng),自動分類和分析構(gòu)建失敗5.持續(xù)監(jiān)控CI性能指標(biāo),定期優(yōu)化AI模型和配置多維度分析-版本控制系統(tǒng)GOPS

2025ShanghaiANNIVERSARY2015-2025自

試AI驅(qū)動的測試工具能夠自動生成測試用例,預(yù)測潛在缺陷,優(yōu)化測試覆蓋率,并智能分析測試結(jié)果。實施舉措√

部署AI測試用例生成工具,基于代碼和需求自動生成測試用例∨建立智能測試選擇系統(tǒng),根據(jù)代碼變更自動選擇相關(guān)測試√

實施測試結(jié)果智能分析,自動識別測試失敗的根本原因?qū)崿F(xiàn)路徑1.分析現(xiàn)有測試覆蓋率和效率瓶頸2.

選擇適合項目的AI測試工具,如Testim

、Applitools

等3.

集成自動化測試生成和執(zhí)行到CI/CD流程中4.配置測試結(jié)果分析系統(tǒng),建立缺陷預(yù)測模型5.

培訓(xùn)測試團(tuán)隊使用AI測試工具,建立反饋和優(yōu)化機(jī)制多維度分析-自動化測試GOPS

2025ShanghaiANNIVERSARY2015-2025智

署AI智能體可根據(jù)系統(tǒng)負(fù)載、性能指標(biāo)和用戶行為預(yù)測,實現(xiàn)智能路由和自動擴(kuò)縮容,確保最佳部署效果。實施舉措自動化藍(lán)綠部署和金絲雀發(fā)布流程√

實施基于Al的流量路由和負(fù)載均衡策略建立基于預(yù)測的自動擴(kuò)縮容系統(tǒng),根據(jù)負(fù)載預(yù)測提前調(diào)整資源實現(xiàn)路徑1.分析現(xiàn)有部署流程和性能數(shù)據(jù),識別優(yōu)化機(jī)會2.選擇并集成AI驅(qū)動的部署工具,如Spinnaker、Argo

CD等3.配置智能流量管理和負(fù)載均衡策略4.

建立性能預(yù)測模型,實現(xiàn)預(yù)測性擴(kuò)縮容5.

持續(xù)監(jiān)控部署效果,優(yōu)化AI模型和部署策略多維度分析-智能部署GOPS2025

ANNIVERSARY1015-2025智能監(jiān)控通過Al算法實時分析監(jiān)控數(shù)據(jù),檢測異常模式,預(yù)測系統(tǒng)故障,并自動觸發(fā)修復(fù)流程,提高系統(tǒng)可靠性。實施舉措部署AI異常檢測系統(tǒng),建立基線和異常模式識別實施自動根因分析系統(tǒng),快速定位問題根源建立智能告警降噪系統(tǒng),減少告警風(fēng)暴實現(xiàn)路徑1.評估現(xiàn)有監(jiān)控系統(tǒng)和告警策略,收集歷史監(jiān)控數(shù)據(jù)2.選擇并集成AI驅(qū)動的監(jiān)控工具,如Grafana

LGTM

Stack

、Datadog等3.配置異常檢測模型和告警規(guī)則4.建立自動修復(fù)流程,配置自愈能力5.持續(xù)優(yōu)化AI模型和監(jiān)控策略,提高預(yù)測準(zhǔn)確性多維度分析-智能監(jiān)控ANNIVERSARY2015-2025GOPS

2025A工作透明度分?jǐn)?shù)WorkTransparency

Score評估工作透明度,預(yù)測Al替代可行性在軟件行業(yè)中,工作的"透明度"是決定Al替代可行性的關(guān)鍵因素。工作透明度指的是工作的可預(yù)測性、標(biāo)準(zhǔn)化程度、數(shù)據(jù)可用性、規(guī)則明確性以及交互復(fù)雜度等維度的綜合體現(xiàn)。透明度越高,Al替代的效果越好。實現(xiàn)方式-WTSGOPS2025

ShanghaiANNIVERSARY2015-2025任務(wù)重復(fù)性(R)任務(wù)是否重復(fù)且具有明確步驟(高重復(fù)性得分高)低

高旨規(guī)則明確性(E)工作是否有明確規(guī)則或標(biāo)準(zhǔn)操作程序(高明確性得

分高)低

高交互需求(I)工作需要與人類或系統(tǒng)交互的復(fù)雜度(高交互需求得分低,因此使用1-1)低決策復(fù)雜度(D)決策所需的人類直覺、創(chuàng)造力或情感(高復(fù)雜度得

分低,因此使用1-D)低

高數(shù)據(jù)可用性(A)是否有足夠數(shù)據(jù)訓(xùn)練AI模型(高可用性得分高)低實現(xiàn)方式-精準(zhǔn)識別、降低試錯成本高高GOPS

2025ShanghaiANNIVERSARY2015-2025顛覆prompt的上下文工程重新思考Al提示工程,從傳統(tǒng)的靜態(tài)提示轉(zhuǎn)向動態(tài)的上下文構(gòu)建GOPS全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會2025·

上海站了解當(dāng)前做法9革新思維探索存在問題GOPS2025

ShanghaiANNIVERSARY

2015-2025如果我們用提示詞(一)第一部分:提示詞的做法定義背景描述任務(wù)背景和環(huán)境,例如:"你需要對一段代碼進(jìn)行分析,確保代碼在風(fēng)格、邏輯、結(jié)構(gòu)、安全、性能、可維護(hù)性等方面達(dá)到團(tuán)隊和行業(yè)最佳實踐標(biāo)

準(zhǔn)。"定義目標(biāo)·

逐行分析,發(fā)現(xiàn)潛在問題·按維度給出具體、可操作的改進(jìn)建議·

給出代碼評分(滿分100)和總結(jié)定義角色設(shè)定特定的專業(yè)身份,例如:"你是一名資深的Java技術(shù)專家,擁有多年項目開發(fā)經(jīng)驗。"?評審維度◎

代碼風(fēng)格安全性可讀性注釋并發(fā)/線程安全復(fù)雜度可維護(hù)性命名規(guī)范業(yè)務(wù)邏輯正確性◎

代碼結(jié)構(gòu)

性能◎

異常處理

擴(kuò)展性GOPS全

運(yùn)

運(yùn)

數(shù)

術(shù)

2

0

2

5

·

站A固

如果我們用提示詞(二)輸出格式1.詳細(xì)分析

2.

代碼優(yōu)點(diǎn)總結(jié)

3.

問題清單每個維度的詳細(xì)分析(問題+建議)

提煉代碼的核心優(yōu)勢和亮點(diǎn)

按優(yōu)先級排序的問題列表4.

改進(jìn)建議

5.

代碼評分

6.

評審總結(jié)具體到代碼行/方法的優(yōu)化建議

滿分100分的綜合評分

整體評價和結(jié)論完整提示詞示例你是一名資深的Java

技術(shù)專家,擁有多年項目開發(fā)經(jīng)驗。你需要對一段代碼進(jìn)行分析,確保代碼在風(fēng)格、邏輯、結(jié)構(gòu)、安全、性能、可維護(hù)性等方面達(dá)到團(tuán)隊和行業(yè)最佳實踐標(biāo)準(zhǔn)。目

標(biāo)

:1.

逐行分析,發(fā)現(xiàn)潛在問題2.

按維度給出具體、可操作的改進(jìn)建議3.

給出代碼評分(滿分100)和總結(jié)依據(jù)以下評審維度逐條檢查:代碼的風(fēng)格、結(jié)構(gòu)、復(fù)雜度、安全、性能、可維護(hù)性、可讀性、異常處理、命名規(guī)范、注釋、擴(kuò)展性、業(yè)務(wù)邏輯正確性、并發(fā)/線程安全等輸出格式要求:1.

每個維度的詳細(xì)分析(問題+建議)2.

代碼優(yōu)點(diǎn)總結(jié)3.

問題清單(按優(yōu)先級排序)4.

改進(jìn)建議(具體到代碼行/方法)5.

代碼評分(滿分100)6.

評審總結(jié)GOPS全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會2025·上海站角色定義的局限性Java技術(shù)專家是什么項目背景,應(yīng)該熟悉哪些業(yè)務(wù)?該提示詞設(shè)定了一個"資深Java

技術(shù)專家"的單一角色。這是否忽略了多智能體協(xié)作的潛力?不同滿足不同領(lǐng)域?qū)I(yè)性

需求?單體評審模式的低效為什么它采用"一次性評審所有維度"的單體模式,而不是現(xiàn)代的分塊和迭代式工作

流?輸出格式的局限性輸出格式被設(shè)計為人類閱讀的文本報告。這在需要自動化集成的場景下(如

CI/CD流

水線、代碼質(zhì)量門禁、缺陷跟蹤系統(tǒng)自動創(chuàng)建Issue)顯得極其低效。為什么輸出不被

強(qiáng)制要求為結(jié)構(gòu)化數(shù)據(jù)格式(如JSON

Schema)?靜態(tài)模板的封閉性該提示詞是一個完全靜態(tài)的"閉卷"模板。它如何在沒有動態(tài)上下文注入的情況下,實

時獲取并應(yīng)用特定項目的編碼規(guī)范、歷史Bug

模式、架構(gòu)決策記錄

(ADR)或團(tuán)隊特

有的設(shè)計哲學(xué)?缺乏推理過程引導(dǎo)提示詞直接要求輸出結(jié)果,缺乏對模型推理過程的引導(dǎo)和控制。它如何確保Al是在進(jìn)

行邏輯分析,而不是在"背誦"常見的評審條目?缺乏交互性和可探索性該提示詞是一個典型的"指令-響應(yīng)"模式,缺乏交互性和可探索性。開發(fā)者如何對評審

結(jié)果進(jìn)行追問?標(biāo)準(zhǔn)的通用性問題該提示詞對所有Java

代碼都使用同一套標(biāo)準(zhǔn)。它如何根據(jù)代碼的業(yè)務(wù)上下文和技術(shù)生

調(diào)

嚴(yán)

側(cè)

點(diǎn)

?GOPS

全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會2025

·

上海站第二部分:prompt解決不了的問題GOPS2025Shanghai246135ANNIVERSARY2015-2025傳統(tǒng)的提示詞工程已經(jīng)無法滿足復(fù)雜場景下的需求。我們需要一種全新的思維方式—上下

文工程,它將超越簡單的指令設(shè)計,轉(zhuǎn)向動態(tài)的、上下文感知的、可交互的智能系統(tǒng)構(gòu)建。動態(tài)適應(yīng)性上下文工程能夠根據(jù)不同場

景自動調(diào)整策略,提供定制化的解決方案。持續(xù)進(jìn)化通過知識更新和反饋機(jī)制,上下文工程系統(tǒng)能夠持續(xù)學(xué)

習(xí)和優(yōu)化。協(xié)作智能多智能體協(xié)作機(jī)制能夠匯集

不同專業(yè)視角,提供更全面

的解決方案。第三部分:如何通過上下文工程解決問題-反思GOPS

全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會2025·

上海站上下文工程AI

應(yīng)用的核心基礎(chǔ)設(shè)施開始學(xué)習(xí)

→GOPS

全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會2025·

上海站Shanghai

2015-2025什么是上下文工程?上下文工程不僅僅是塑造提示詞,更是構(gòu)建模型運(yùn)行的完整環(huán)境,可

以被視為賦予AI

系統(tǒng)以記憶、狀態(tài)、數(shù)據(jù)訪問權(quán),乃至行動工具。解決AI

落地難題MIT

報告顯示,95%的企業(yè)生成式

AI項目投產(chǎn)失敗。

上下文工程通過定義數(shù)據(jù)權(quán)限、合規(guī)規(guī)則及認(rèn)證機(jī)制,使AI

應(yīng)用具備投產(chǎn)條件。超越提示詞工程提示詞工程可優(yōu)化回答,但未解決實際問題。上下文

工程通過構(gòu)建完整環(huán)境,使AI

系統(tǒng)能夠在現(xiàn)實世界中

實際運(yùn)行。提升用戶體驗通過記憶、狀態(tài)管理和實時數(shù)據(jù)訪問,上下文工程使

AI

系統(tǒng)能夠提供更加個性化、連續(xù)和準(zhǔn)確的服務(wù)體

驗。連接實際系統(tǒng)上下文工程使AI

系統(tǒng)能夠與實際數(shù)據(jù)庫、

API

和代碼

執(zhí)行環(huán)境連接,實現(xiàn)真正的自動化和業(yè)務(wù)價值。上下文工程的作用與價值GOPS全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會2025·

上海站hanghai

2015-2025上下文工程應(yīng)用的核心關(guān)鍵點(diǎn)上下文語境工程,不僅塑造提示,更構(gòu)建模型運(yùn)行的完整環(huán)境,可視為賦予

A1記憶,狀態(tài),數(shù)據(jù)訪問權(quán),乃至行動工具。狀態(tài)管理用于追蹤工作流程進(jìn)度,在復(fù)雜任務(wù)中保持上下文連續(xù)性。例如,在注冊過程中,知曉用戶正處于身份驗證的第三步,而非每次重新開始。RAG檢索增強(qiáng)從實際數(shù)據(jù)源獲取最新信息,而非依賴單純的訓(xùn)練數(shù)據(jù)。使AI系統(tǒng)能夠訪問和利用最新、最相關(guān)的信息來生成回答。讓AI進(jìn)行操作,而不僅僅是對話大模型本身無法查詢真實數(shù)據(jù)庫、調(diào)用APl或執(zhí)行代碼。要與實際系統(tǒng)交互,需要連接至MCP

工具,使AI系統(tǒng)能夠執(zhí)行具體任務(wù)。短期/長期記憶短期記憶保存最近幾輪對話內(nèi)容,長期記憶實現(xiàn)跨會話存儲知識數(shù)據(jù)。例如,

一個客服機(jī)器人能記得你今天提交的工單,還能記得你上次反饋的問題。GOPS

全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會2025·

上海站2015-20254上下文在AI應(yīng)用中處于核心位置,隨著技術(shù)的發(fā)展,上下文工程將更加智能化、自動化和個性化,成為連接AI模型與現(xiàn)實世界的關(guān)鍵橋梁。多模態(tài)上下文融合整合文本、圖像、語音等多種模

態(tài)的上下文信息更智能的上下文管理自動識別和構(gòu)建最優(yōu)上下文環(huán)

境,無需人工干預(yù)更安全的上下文邊界完善的數(shù)據(jù)權(quán)限和隱私保護(hù)機(jī)

制,確保上下文使用安全GOPS全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會2025·

上海站DAl助手vs

回復(fù)工具調(diào)查問卷開

→我們需要的是一個助手還是工具?Shanahai

2015-2025GOPS

全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會2025·

上海站示例1用戶:你好,我們明天聊一聊Al回復(fù):好的,幾點(diǎn)?用戶:你好,我們明天聊一聊Al回復(fù):張總,明天我全天都有會,后天上午空

著,我發(fā)個會議邀請給你,你看行不行?下面我們再看一個更直接的例子。請判斷哪個更像是回復(fù)工具?哪個更像是智能助手?下

→問題說明示例2問卷調(diào)查問題1哪個更像是回復(fù)工具?○示例1○示例2問

2哪個更像是智能助手?○示例1○示例2上一頁

查看答案

→GOPS全球運(yùn)維大會暨研運(yùn)數(shù)智化技術(shù)峰會2025·上海站答案與解析正確答案問題1:哪個更像是回復(fù)工具?答案:示例1問題2:哪個更像是智能助手?答案:示例2解析示例1更像是回復(fù)工具,因為:它僅對用戶的直接請求做出簡單回應(yīng),沒有進(jìn)行上下文分析、信息檢索或主動提供解決

方案。這種交互模式類似于傳統(tǒng)的聊天機(jī)器人,只是機(jī)械地回應(yīng)指令。示例2更像是智能助手,因為:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論